Text
                    ЭНЦИКЛОПЕДИЯ
ЭЛ ЕМЕ Н ТА Р Н О Й
МАТЕМАТИКИ
АЛГЕБРА


АКАДЕМИЯ ПЕДАГОГИЧЕСКИХ НАУК РСФСР ЭНЦИКЛОПЕДИЯ ЭЛЕМЕНТАРНОЙ МАТЕМАТИКИ ПОД РЕДАКЦИЕЙ П. С. АЛЕКСАНДРОВА, А. И. МАРКУШЕВИЧА и А. Я. ХИНЧИНА с" КНИГА ВТОРАЯ АЛГЕБРА ,.К>ШТЕКА 'iAIFMATM'-JECKOrO Колледжа НМУ ГОСУДАРСТВЕННОЕ ИЗДАТЕЛЬСТВО ТЕХНИКО-ТЕОРЕТИЧЕСКОЙ ЛИТЕРАТУРЫ МОСКВА 1951 ЛЕНИНГРАД
11-5-2 Речактор А. 3. Рывкин. Техн. редактор Н. Я- Муратова. Подписано к печати 11/ХИ 1950 г. Бумага 60Х921/1в. 13,25 бум. л. 26,5 печ. л. 29,63 уч.-изд. л. 44 700 тип. знак, в печ. л. Т-09189. Тиэаж 50 000 экз. Цена книги 10 р. 40 к. Переплет 2 р. Заказ Ке 886. 2-е типография «Печатный Двор» им. А. М. Горького Глапполиграфиздата при Совете Министров СССР. Ленинград, Гатчинская, 26.
ОГЛАВЛЕНИЕ Предисловие 6 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (А. И. Узкое) Глава I. Определители и решение линейных уравнений 11 § 1. Векторы па плоскости 11 § 2. Числовые векторы. Определители любого порядка 18 § 3. Свойства определителя, вытекающие из его определения. . 21 § 4. Перестановки. Выражение определителя порядка п 24 § 5. Дальнейшие свойства определителя 29 § 6. Разложение определителя по элемента ряда. Вычисление определителей 33 § 7. Решение систем ур^чнепиЧ 38 Глава II. Векторные пространства и исследование систем лине "- ных уравнений 42 8. Векторные пространства. Абстрактная точка зрения 42 9. Простейшие свойства операций над векторами 45 10. Линейная зависимость вектороп 49 11. Подпространства 55 12. Применение к системам уравнений 59 13. Базис пространства. Коордипаты 62 § 14. Рапг произвольной системы векторов ... 66 § 15. Решение произвольных систем линейных уравнений 70 § 16. Геометрическая интерпретация. Системы с тремя неизвест- неизвестными 73 § 17. Применение к системам уравнений высших степеней .... 78 § 18. Дополнительные замечания 81 Глава III. Линейные преобразования плоскости и трёхмерного пространства 81 § 19. Метрика. Скалярное произведение векторов 84 § 20. Преобразование координат 88 § 21. Операции над матрицами 92 § 22. Линейные преобразования 100 § 23. Представление линейных преобразований матрицами 105 § 24. Геометрические свойства линейных преобразований и свой- свойства представляющих их матриц ПО § 25. Симметрические преобразования. Случай плоскости 114 § 26. Симметрические преобразования трёхмерного пространства 117 § 27. Представление произвольного линейного преобразования произведением ортогонального и симметрического 122 § 28. Упрощение уравнений линий и поверхностей второго по- порядка 124 Литература 126 1*
4 ОГЛАВЛЕНИЕ КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ {Л. Я. Окунев) Глава I. Кольцо многочленов от одного неизвестного 129 § 1. Кольцо многочленов 129 § 2. Свойства делимости многочлепов от одного неизвестного . 142 § 3. Деление на линейный двучлен х—а. Корни многочленов. . 159 § 4. Многочлены над полем рациональных чисел 168 § 5. Разложение многочлепов на пеприводимые множители над полем рациональных чисел. Признак неприводимости .... 174 § 6. Основная теорема алгебры 188 § 7. Проблема решения уравнений в радикалах. Двучленные уравнения 202 § 8. Уравнения второй и третьей степеней 205 § 9. Уравнение четвёртой степени 220 § 10. Алгебраическое расширение и другая постановка проблемы решения уравнений в радикалах 225 Глава II. Кольцо многочленов от нескольких неизвестных и поле рациональных функций 235 § 11. Кольцо многочленов от нескольких неизвестных ...'.... 235 § 12. Поле алгебраических дробей 244 § 13. Симметрические многочлены 254 § 14. Некоторые приложения теории симметрических многочленов 261 Глава III. О решении алгебраических уравнений в радикалах. . 269 § 15. Подстановки 269 § 16. О неразрешимости уравнений выше четвёртой степени в ра- радикалах 273 § 17. Группа алгебраического уравнения 281 § 18. Уравнепия с симметрической группой 294 § 19. О разрешимости алгебраических уравнений в квадратных радикалах 300 § 20. О разрешимости в квадратных радикалах уравнений 3-й и 4-й степеней 304 Литература 310 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ (А. П. Доморяд) Введение '. . . . 313 5* лав а I. Решение алгебраических уравнений 317 1. Постановка задачи 317 2. Определение грапиц действительных корней 318 3. Отделение корней 324 4. Способ Горнера 332 о 5. Способ Лагранжа 336 § 6. Способ Лобачевского 343 Задачи к главе I 355 Глава II. Решение трансцендентных уравнений 357 § 7. Способ линейного интерполирования и способ Ньютона. . . 357 § 8. Обобщение способа Ньютона 363 § 9. Способ итерации 367 § 10. Различные способы извлечения корней из чисел 372 Задачи к главе II 378
ОГЛ\ВЛЕНИЕ О Глава III. Решение систем уравнений 380 § 11. Способ Ньютона 380 § 12. Способ итерации 383 § 13. Замечания о вычислении мнимых корней алгебраических уравнений 390 Задачи к главе III 391 Глава IV. Графические методы 392 § 14. Уравнения с одним неизвестным 392 § 15. Решение уравнений с помощью номограмм 399 § 16. Решение систем уравнений 405 Задачи к главе IV 410 Добавления 412 1. Краткие исторические сведения 412 2. Советы преподавателям и рекомендуемая литература 415 Алфавитный указатель 418
ПРЕДИСЛОВИЕ Школьный курс алгебры представляет собой своеобразное соеди- соединение сведений из различных отделов математики. Сюда входят: обобщение понятия числа (последовательное построение системы рациональных, действительных и, наконец, комплексных чисел), от- отнесённое нами к арифметике (см. статью И. В. Проскурякова в пер- первой книге); изучение кольца многочленов и поля рациональных функций (охватывающее так называемые тождественные преобразо- преобразования рациональных выражений) и решение алгебраических уравне- уравнений в простейших случаях, т. е. собственно алгебраический мате- материал, отнесённый к настоящей книге; сведения о некоторых элемен- элементарных неалгебраических функциях — степенной, показательной, логарифмической, о пределах, последовательностях и простейшем ряде (геометрическая прогрессия), т. е. материал из области анализа (см. третью книгу настоящего издания), и, наконец, элементы комбинаторики, отнесённые нами в шестую книгу, где читатель найдёт также и основные сведения из теории вероятностей. Таким образом, читатель, заинтересованный научными основами школь- школьного курса алгебры, должен знать, что он найдёт эти основы не в одной, а в нескольких книгах «Энциклопедии элементарной мате- математики» и именно в книгах первой, второй, третьей и шестой, озаглавленных «Арифметика», «Алгебра», «Анализ» и «Разные вопросы». Настоящая книга состоит из трёх статей. Статья А. И. Узкова даёт изложение основ того раздела математики (так называемой линейной алгебры), который вырос из теории систем алгебраиче- алгебраических уравнений первой степени (линейных уравнений). Раздел этот (включающий, в частности, теорию определителей) освещает с еди- единой и общей точки зрения ряд разрозненных фактов школьного курса и, кроме того, приводит к такому обобщению и углублению некоторых геометрических понятий (вектор, пространство, движе- движение и др.), которое уже успело завоевать себе широкую область приложений. Статья Л. Я. Окунева излагает теорию многочленов от одного и многих неизвестных и вопросы решения алгебраических уравнений в радикалах. В частности, здесь рассматривается важный для эле-
ПРЕДИСЛОВИЕ 7 ментарной математики вопрос об условиях разрешимости алгебраи- алгебраических уравнении в квадратных радикалах. В статье А. П. Доморяда, строго говоря, к алгебре относится лишь первая глава, включающая общий способ Н. И. Лобачевского для решения алгебраического уравнения любой степени с численными коэффициентами. В целом же статья представляет весьма полную сводку важнейших методов численного и графического решения алгебраических и трансцендентных уравнений, иллюстрированную конкретными примерами. Исторические сведения по развитию теории алгебраических урав- уравнений и других разделов алгебры не входят в эту книгу; они отне- отнесены к «Очерку истории математики», помещаемому в седьмой книге. Редакция
А. И. УЗКОВ ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ
ГЛАВА I ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ § 1. Векторы на плоскости Под вектором в элементарной геометрии понимают направ- направленный отрезок. Вектор обычно изображается на чертеже отрез- отрезком со стрелкой, указывающей его направление. Обозначать векторы мы будем, как правило, одной буквой жирного шрифта. Однако иногда будет применяться также и обозначение вектора двумя бук- буквами, указывающими его начало и конец (со стрелкой сверху). Два вектора мы будем называть равными, если они могут быть совмещены параллельным перемещением. Очевидно, что так опре- определённое равенство векторов обладает обычными свойствами ра- равенства: каждый вектор равен самому себе; если один вектор равен другому, то и второй равен первому; наконец, два вектора, порознь равные третьему, равны и между собою. При работе с векторами оказывается полезным следующее со- соглашение об операциях над ними: под умножением вектора на число понимают образование нового вектора, длина которого равна длине данного вектора, умноженной на абсолютную величину дан- данного числа, а направление либо совпадает с направлением данного вектора (если число положительно), либо противоположно этому направлению (если число, на которое умножаем, отрицательно). Кроме умножения вектора на число, определяют также сложение векторов. Его достаточно определить для двух векторов с общим началом. В таком случае суммой двух векторов АВ и АС называют вектор, являющийся диагональю AD параллелограмма, построенного на данных векторах (рис. 1). Эти операции позволяют составлять из данных векторов выра- выражения вида k1a1-\-k2a2-\- -\-knan с любыми (действительными) числовыми коэффициентами. Такие выражения называются линей- линейными комбинациями данных векторов. Мы будем называть векторами также «отрезки» нулевой длины, т, е. такие, у которых начало и конец совпадают. Все такие
12 ВЕКТОРНЫЕ ПРОСТРАНСТВ\ И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ «нулевые векторы» оказываются равными между собой в смысле уста- установленного выше определения. Нулевой вектор считается параллель- параллельным любому вектору. Операции над векторами, определённые выше, обладают многими свойствами действий над числами: сумма не зависит от порядка слагаемых и обладает свойством ассоциативности, т. е. (а-\-Ь)-\- -|- с = а -\- (Ь -\- с); если мы имеем сумму нескольких произведении векторов на числа, то одинаковые множители можно выносить за скобки (рис. 2) и т. д. Операция, обратная сложению (в ы ч и- т а н и е), также всегда выполнима: чтобы из вектора а вычесть вектор Ь,~ доста- достаточно образовать сумму о-\-(—1) • Ь. Эти основные свойства операции над векторами позволяют, как это делается" в элементарной алгебре, производить формальные преобразования равенств (переносить члены из одной части в другую, умножать обе части равенства на одно и то же число или прибавлять к ним один и тот же вектор; можно также складывать отдельно левые и правые части векторных равенств, получая при этом также справедливые равенства). Рис. 1. а Рис. 2. Если два век гора а и Ь параллельны одной и той же прямой и о^О (нулевому вектору), то вектор Ь всегда можно представить в виде b — ka, где k — число. Вектор, не параллельный вектору а, в этом виде представить нельзя, как это сразу следует из опреде- определения произведения вектора на число. Мы ограничимся пока рассмотрением векторов, лежащих в одной плоскости. В этом случае сделанное выше замечание позволяет любой вектор выразить в виде линейной комбинации двух задан-
ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ 13 ных векторов, не параллельных между собою: в самом деле, если а и Ь — данные векторы, а х — любой вектор той же плоскости, то можно, прежде всего, параллельным перенесением совместить начала всех трёх векторов (рис. 3), затем через конец вектора х провести прямые, параллельные векторам Ь и а, до пересечения с прямыми, на которых лежат векторы а и Ь. Тогда из чертежа видно, что x=OX1-\-OY1, а так как векторы OXt и О К, парал- параллельны, соответственно, векторам а и Ь, то можно так подобрать числовые множители х и у, чтобы было ха = ( Подставляя эти выражения в преды- предыдущее равенство, получим: х = ха-]~ -\-yb, т. е. выражение вектора х в виде линейной комбинации векторов а и Ь. При этом замечательно, что один и тот же вектор не может быть выражен двумя различными линей- линейными комбинациями данных векто- векторов', если бы было x^xa-\-yb = :=х'а-\-у'Ь, то равенство (х'¦—х)а = — (у'—у)Ь было бы также справедли- справедливым, вопреки тому, что векторы а и Ь не параллельны между собой. В сказанном по существу заклю- уж. чена идея метода координат, извест- известного из аналитической геометрии: если на плоскости заданы два вектора е1 и е.г, то возможность однозначного представления любого векгора х в виде линейной комбинации данных, т. е. в виде х = =xtet-\-xie.i, позволяет каждому вектору х поставить в соответ- соответствие два числа xt и х2, которые сами однозначно определяют дан- данный вектор. Эти числа называются координатами вектора х по от- отношению к паре векторов е1( е2. Иногда эту пару векторов назы- называют базисом (или координатной системой) на нашей плоскости. Из указанной выше однозначности представления вектора в виде линейной комбинации непараллельных векторов следует, что векторы равны тогда и только тогда, когда равны их координаты. Для дальнейшего будет удобно координаты вектора х записывать в виде столбца gj. Если заданы два вектора x = Xiet —}— Jfае2 и У=У\в\ ~\~У^о> то в силу упомянутых выше свойств операций над векторами будет также справедливо равенство x-\-y=^(xt -\-yi)el-\-(x2-\-yi)ei, озна- означающее, что координаты суммы двух векторов равны суммам соответствующих координат слагаемых. Аналогично получается также правило, связанное с умножением вектора на число: при
14 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБР43ОВ\НИЯ умножении вектора на число его координаты умножаются на то же число. Мы располагаем теперь уже достаточными знаниями, чтобы по- попробовать применить их к исследованию конкретного вопроса. В качестве объекта такого применения мы выбираем хорошо известное из школьного курса исследование системы двух уравне- уравнений первой степени с двумя неизвестными, т. е. системы уравне- уравнений вида a1x-]rb1y = t, ] где коэффициенты at, Ьь си а2, Ьъ с2 — данные числа, которые мы пока будем предполагать действительными. Задача решения системы уравнений A) состоит в определении таких значений «неизвестных» х и у, которые при подстановке их в уравнения A) обращали бы последние в верные числовые равен- равенства. Из школьного курса известно, что иногда система A) решается однозначно, т. е. существует только одна система значений хну, «удовлетворяющая» обоим уравнениям системы, иногда таких реше- решений вовсе нет, а иногда их бесконечное множество. То, что сказано выше о векторах, позволяет нам все эти слу- случаи видеть совершенно непосредственно. В самом деле, рассмотрим на плоскости некоторую координатную систему и три вектора: век- вектор а с координатами а, и а2, вектор Ъ с координатами Ъх и 62 и, наконец, вектор с с координатами с, и с2. Если пока считать х и у известными числами, то левые части уравнений A) будут коорди- координатами вектора ах-{-by. А так как эти координаты равны коорди- координатам Еектора с, то вектор ах-{-by должен быть равен вектору с. Наоборот, если нам удалось каким-либо образом подобрать такие числа х и у, чтобы выполнялось равенство ах-\-Ьу = с, то эти числа будут решением системы A). Таким образом, решение системы A) совершенно эквивалентно решению одного векторного уравнения ах-\-Ьу = с, B) т. е. отысканию представления вектора с в виде линейной комби- комбинации данных векторов а и Ь. Геометрическая картина сразу подсказывает нам те возможности, которые могут здесь представиться, а именно: 1. Если оказывается, что векторы о и ft не параллельны, то каждый вектор может быть представлен линейной комбинацией этих векторов, и такое представление однозначно [т. е. найдётся только одна пара значений хну, удовлетворяющая уравнению B)]. Это означает, что заданная система имеет в этом случае одно реше- решение, каковы бы ни были свободные члены сх и сг.
ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ ЛИНЕЙНЫХ УР\ВНЕНИЧ 15 2. Если векторы а и Ъ параллельны, то решение может суще- существовать только в том случае, когда вектор с параллелен векторам а и Ь; в противном случае нужных чисел х и у найти нельзя. 3. Если все три вектора а, Ь и с параллельны, причём хотя бы один из векторов а и Ь отличен от нулевого, то все решения по- получаются следующим образом (дальше для определённости считается, что не равен нулю вектор а): придаём неизвестному у произволь- произвольное значение и переносим вектор by в правую часть: ах = с— by. Так как вектор с — by параллелен вектору а, то оказывается воз- возможным подобрать так значе- значение х, чтобы было выполнено последнее равенство. Оставшийся неразобранным случай, когда оба вектора а и Ь равны нулю, совсем не составляет трудностей: реше- решение не может существовать, если вектор с отличен от ну- нуля. Если же вектор с также равен нулю, то решениями данной системы будут слу- служить любые пары чисел х и у. С помощью изложенных соображений можно даже по- получить формулы для решения системы A) в случае, когда векторы а и ft не параллель- параллельны. В самом деле, из рис. 4 видно, что значения х и у, удовлетворяющие системе, равны, соответственно, отношениям от- В, В, резков -Од и ОВ, OB Первое из этих отношений, как видно из того же рисунка, равно отношению высот параллелограммов ОСЕВ и OADB, у которых основанием считается вектор Ь. Но в силу того, что основание параллелограммов —¦ общее, отношение высот равно отношению пло- площадей, т. е. пи ОСЕВ , О Fi Аналогично, отношение =^: равно отношению площадей парал- C') лелограымов OCFA и OBDA, а значит. пл OCFB У' — пл OBDA- Теперь не составило бы труда вычислить площади этих фигур, рассматривая подразделение их на треугольники, и тем самым полу-
16 ВЕКТОРНЫЕ ПРОСТРАНСТВ\ И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ чить язные формулы, выражающие значения неизвестных через коэффициенты данных уравнений. Однако в нашем случае это делается гораздо проще с помощью обычной процедуры: умножая обе части первого из уравнений данной системы A) на Ь%, а обе части вто- второго— на —Ъх, а затем складывая, получим для определения х уравнение Точно так же, для определения у получается уравнение D') Легко заметить сходство этих формул с формулами C), C'): если образовать выражения для х и у, то у них окажется общий знаме- „ натель, как и в формулах C) и C'); ' - кроме того, этот знаменатель зависит только от коэффициентов ах, а2, Ь1>ш Ь», являющихся координатами.векторов а и ft, а в формулах C) и.(З') знаменате- знаменателем является площадь параллелограм- параллелограмма, построенного на этих векторах. Это наталкивает на мысль выяснить геометрическое значение выражения Й1&2 — афх. Выберем на плоскости базис, состоящий из двух взаимно перпендикулярных векторов е,, е2, длина каждого из которых равна единице (рис. 5), и построим век- векторы а = ахех -\-аге2 и Ъ=Ъхех-\- \. Тогда длины отрезков ОАХ, OBt, ОАг и OS2, взятые с надлежащими знаками, будут равны, соответственно, числам ах, Ъх, а2 и &2 (на чертеже все они предположены положительными). Тогда площадь параллелограмма ОАСВ будет, очевидно, выражаться так: J = ¦'ООЛВ " [•3OB1B-f- &BlAlAB '->OAlA\ , — афу. = 2 [*? (а, _ *,) - °ф] = Итак, оказывается, что эта площадь в точности равна интересую- интересующему нас выражению. .Правда, во всех наших геометрических построениях имеется одна неточность: площадь в элементарно-геометрическом смысле есть величина положительная; выражение же аф» — афх может быть и отрицательным. Мы не обратили внимания на это обстоятельство раньше только потому, что на наших чертежах значения всех инте- интересующих нас величин получались положительными. Этот недоста- недостаток можно устранить, приписав площади параллелограмма опреде-
ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ 17 ленный знгк: площадь параллелограмма, построенного на векторах а и Ь, обычно считается положительной, если при обхоле контура параллелограмма, начиная с его стороны а (в её направлении), об- обход совершается в ту же сторону, что и при обходе параллело- параллелограмма, построенного на векторах е^ и е2, начиная со стороны е,. Сделав несколько чертежей, аналогичных рис. 5, читатель без труда убедится, что определённый так знак площади всегда совпадает со знаком выражения albi — ajbu Заметим, что идея снабжать площади фигур определённым зна- знаком, в зависимости от направления обхода, применяется не только к параллелограммам, но и оказывается полезной в целом ряде вопро- вопросов, позволяя формулировать результаты наиболее общим и окон- окончательным образом. Выражение вида atb2 — афх называется определителем второю порядка и обозначается так: а, Ьг Этим обозначением подчёркивается, что наше выражение является функцией столбцов, состоящих из координат векторов а и Ь. Обра- Обращение этого выражения в нуль, как легко усмотреть из преды- предыдущего, указывает на то, что векторы а и Ь параллельны. Если а^ — афхф§, то решение системы A) даётся формулами E) a, a2 bt b, bt b. ; y= a, a2 a, a2 cz bt b* вытекающими из равенств D) и D')- Из выясненного нами геомет- геометрического смысла определителя вытекает, что эти формулы выра- выражают в точности то же самое, что и формулы C) и C'). Для дальнейшего нам понадобятся некоторые свойства опреде- определителей. При этом будет удобнее пользоваться ещё более сокра- й] bt щёнными обозначениями: мы будем обозначать определитель просто так: | а, Ъ \, явно рассматривая его как функцию двух векторов. А) Определитель есть функция, линейная по каждому аргу- аргументу. При этом под линейностью понимают наличие двух следующих свойств'): х) Термин «линейный» связан с тем обстоятельством, что этим свойством обладает «линейная» функция / (х) = kx, гце-k — постоянное, В этом Случае из правил действий над числами следует непосредственно, что f(x-\-y) — = k (x + у) = / (х) + / (у) и f(mx)=mj[x), т. е. что имеют место свойства 1) и 2), формулируемые ниже. 2 Отщиклопе яга, кн. 2.
18 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ 1) Если значение аргумента умножить на какое-либо число, то новое значение функции получается из первоначального умно- умножением на это лее число. 2) Если значение аргумента равно некоторой сумме, то зна- значение функции равно сумме её значений, получаемых при значе- значениях аргумента, равных отдельным слагаемым. Говоря о линейности по каждому аргументу, мы выражаем то обстоятельство, что свойства 1) и 2) имеют место в применении к лю- любому из двух аргументов нашей функции. Кроме линейности, определитель обладает ещё' двумя свойствами: Б) Если два вектора, из которых составлен определитель, равны между собою, то значение определителя равно нулю. В) Определитель, составленный из базисных векторов, т. е. из векторов с координатами I ) и I 1 (в этом порядке), равен единице. Наличие всех этих свойств проверяется непосредственным под- подсчётом. Их можно также получить геометрически. Для примера огра- ограничимся алгебраической проверкой второй половины свойства А: a, ft,-f ft, «2 ^+*s' г.,. Ь' к § 2. Числовые векторы. Определители любого порядка Теперь естественно посмотреть, как можно применить сказанное в предыдущем параграфе к решению и исследованию систем боль- большего числа уравнений первой степени с большим числом неизвест- неизвестных. Достаточно написать такую систему хотя бы с тремя неиз- неизвестными, чтобы усмотреть, что коэффициенты уравнений в этом случае группируются в столбцы, состоящие из трёх (или большего числа) чисел. Это делает невозможным в случае, если столбцы со- состоят более, чем из трёх чисел истолковать их как столбцы коор- координат вектора в обычном геометрическом смысле, причём такая трудность усугубляется ещё и тем, что иногда приходится рассмат- рассматривать системы уравнений с комплексными коэффициентами: ведь невозможно представить себе вектор, координаты которого ком- комплексны. Все эти затруднения, однако, можно обойти следующим путём, идея которого оказывается очень плодотворной и часто применяется в самых различных математических дисциплинах: элементарное по- понятие вектора можно обобщить так, что указанные выше трудности исчезнут сами собой, и в то же время существенные свойства век- векторов будут сохранены. К этому нужно добавить ещё и то, что сама геометрическая терминология будет подсказывать нам эти свойства, когда мы их будем разыскивать.
ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ 19 Конечно, все возникающие на этом пути понятия должны быть точно определены, т. е. сведены к известным уже нам математиче- математическим понятиям. Прежде всего о числах. Просмотр «алгебраической» части § I убеждает нас в том, что во всех проведённых там алгебраических вычислениях природа рассматриваемых чисел безразлична: важно только то, что над этими числами можно производить четыре основ- основных алгебраических действия, и эти действия подчиняются обычным законам. Это позволяет нам рассматривать каждый раз не все числа, имеющиеся в нашем распоряжении, а любые их совокупности, внутри которых можно выполнять указанные основные операции. Таким образом, мы приходим к понятию числового поля. Числовым полем мы будем называть любую совокупность чисел, обладающую тем свойством, что сумма, разность, произведение и частное (при рассмотрении частного предполагается, что делитель отличен от нуля) любых двух чисел этой совокупности являются числами той же совокупности *). Совокупность всех комплексных чисел удовлетворяет этому усло- условию и поэтому является числовым полем. Точно так же числовыми полями являются совокупность всех действительных чисел и сово- совокупность всех рациональных чисел. Эти три числовых поля наиболее часто встречаются в приложениях и поэтому наиболее важны. Однако существуют и другие поля: например, как читатель легко убедится, совокупность всех чисел вида а ~\- Ъ j/2, где а и Ь — любые рацио- рациональные числа, также является полем. Для нас в дальнейшем будег во многих случаях безразлично, какое именно числовое поле рассматривается. В таких случаях мы для удобства будем обозначать всё это поле одной буквой. Итак, пусть К—некоторое числовое поле, а п — некоторое натуральное число. п-меркым числовым вектором над полем К мы будем называть любой столбец, составленный из п чисел нашего поля. Как мы видели, векторам на плоскости соответствуют столбцы из двух действительных чисел. Теперь в смысле только что введённого определения сами эти столбцы являются двухмерными числовыми векторами над полем действительных чисел. В определённый таким образом оборот речи целесообразно ввести следующее упрощение: если рассматриваются векторы всё время над одним и тем же полем, то указание этого поля мы будем просто опускать. Точно так же будет опускаться и слово «числовые», так как никаких других векторов мы пока не будем рассматривать. Назвав столбец из чисел вектором, естественно назвать сами числа, из которых столбец составлен, координатами этого вектора. ') См. Э. э. м., кн. I, И. В. Проскуряков, Понятия множества, группы, кольца и поля. Теоретические основы арифметики. 2*
20 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ , После этого уже можно определить основные операции над векторами, пользуясь аналогией с рассмотренными в § 1 «геомет- «геометрическими» операциями. Суммой двух п-мерных векторов мы назовём п-мерный вектор, координаты которого равны суммам соответствующих координат слагаемых. Аналогично этому, произведением п-мерного вектора на число k (из поля К) назовём п-мерный вектор, координаты которого равны соотземствующим координатам данного вектора, умноженным на число k. Эти определения могут быть выражены формулами следующим образом: + a,\ lkay АА[ *+*\ Л а I I ~Г : В дальнейшем часто окажется удобным обозначать векторы одной буквой жирного шрифта, как это делалось в § 1; в таких случаях координаты вектора будут обозначаться той же буквой светлого шрифта с индексом, указывающим номер этих координат. Следующим 'определением мы придадим всей получающейся тео- теории в некотором смысле ещё" более геометрический характер: п-мерным числовым пространством над полем К называется сово- совокупность всех п-мерных числовых векторов над этим полем. Среди /г-мерных числовых векторов мы особо выделим векторы /0\ 1 о w Любой Еектор х однозначно представляется линейной комбинацией этих векторов: fx, х = = xtex-f х& Таким образом, векторы е,, ... , еп играют роль базиса в нашем «пространстве». Более точно мы определим смысл термина базис несколько позднее, когда нам в большей степени понадобятся его свойства.
ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ 21 Исходя из введённых определений, можно было бы развивать геометрию нашего пространства. Она в сильной степени напоминает обычную аналитическую геометрию. Некоторыми вопросами её мы ещё будем иметь случай заняться. Сейчас нашей целью является выяснение возможности обобщить понятие определителя так, чтобы можно было нгписать явные формулы, дающие решение системы уравнений с любым числом неизвестных. После того, что было сказано об определителях второго порядка, естественно обобщение проводить так, чтобы были сохранены, конечно, с естественными изменениями, обнаруженные свойства опре- определителей второго порядка. Необходимость изменений вызывается тем, что вместо двумерных векторов мы имеем дело с л-мерными. Это приводит к такому определению. Определителем порядка п называется функция \аи ait ... , ап\ от п п-мерных числовых векторов, обладающая следующими свой- свойствами: A) она линейна по отношению к каждому аргументу; Б) если значения двух её аргументов равны, то значение функ- функции обращается в нуль; B) \е1г е„, ... , еп 1=1. Таким образом, для того чтобы сохранить при обобщении нуж- нужные нам свойства определителей второго порядка, мы их просто кладём в основу этого обобщения. Ясно, что сформулированное определение само по себе не даёт уверенности ни в том, что такая функция существует, ни в том, что она только одна. Это может быть доказано только при даль- дальнейшем исследовании и*будет проведено в общем виде в § 5. § 3. Свойства определителя, вытекающие из его определения Предположим сначала, что функция \at, а%, ... , ап\, обладаю- обладающая свойствами А), Б), В), существует. Из этих свойств вытекает ряд других, которые, как мы увидим, позволяют написать явное выражение этой функции. Рассмотрим подробнее свойство А) (линейность). В применении к первому аргументу оно запишется так: \ааи а2, ... , an\ = a\at, a2, ... , ап\, 1 la; +a'i, а*, ... , аа\ = \а[, а„ ... , ап\-\-\а'{, а2, ... , ап\) (ср. сказанное о линейности на стр. 17—18). Подобные же формулы можно написать, поставив сумму двух векгоров на место не первого, а любого из аргументов.
22 ВЕКТОРНЫЕ ПРОСТРАНСТВЛ И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ Читатель легко заметит, что эти формулы по своему строению аналогичны формулам ... ап), 1 + < ... ап, J имеющим место для умножения чисел. Как известно, в случае чисел из формул (Г), справедливых по отношению к каждому множителю, вытекает известное общее правило умножения многочленных выра- выражений. Например, если два первых множителя являются суммами, то Из формул A) также вытекает, что с определителем можно поступать, как со своеобразным произведением: если значения одного или нескольких аргументов представляют собою суммы, то можно применять обычное правило раскрытия скобок и выно- выносить числовые множители за знак определителя. Известное читателю доказательство этого для обычных произве- произведений принимает в случае определителей такой вид (в качестве примера рассматривается случай, когда два первых аргумента являются суммами двух слагаемых, а числовые множители равны единице и в записи отсутствуют): = \a'v < + <', с3, ... , ап\ -Н<, < + =! a'v К' аз> ¦ • •. ап \ + I a'v К' д3. ¦••»«» I + 1<. a's, а3, ..., ап\-\-1а'^, а'^ а3, ... , ап|, Таково первое следствие из свойств А), Б), В). Следующим важ- важным следствием является такое: От перемены мест двух векторов, входящих в определитель, его значение меняет знак. В самом деле, пусть мы хотим переменить местами два первых вектора at и а2. Рассмотрим определитель |aj4-fl!2, ах-{-а2, а3, ... , а„|. Он равен нулю в силу свойства Б), так как в его выражение входят два одинаковых вектора. С другой стороны, применяя к нему только что доказанное свойство, его можно представить в виде суммы четырёх определителей: \alt а1г а3 ап\-\-\а„ а2, а3, ... , ап|-f- |а2, аиаг, .... ап\-\-\а2, а2, а3, ... , а„\.
ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ 23 Из этих четырех определителей первый и четвёртый равны нулю по той же причине, что и выше. Таким образом, из сказанного полу- получается, что |uj, а2, а3 ап\-\-\а2, аи а3, ... , ап| = 0, а это как раз и есть доказываемое свойство. Проведённое рассуждение в действительности является совер- совершенно общим и не зависит от того, какие именно векторы мы переставляем. Мы ограничились рассмотрением первых двух векто- векторов только для удобства записи. Доказанные свойства позволяют, как уже было отмечено, найти явное выражение определителя. Чтобы вначале не затруднять чита- читателя осложняющими деталями, связанными с общностью, мы пока- покажем идею дальнейшего исследования, возвратившись снова к опре- определителям второго порядка. Пусть даны произвольные двумерные числовые векторы: Посмотрим, что можно сказать о выражении \а, Ь\. Записывая это выражение в виде \а, Ь\ — \а^ -]-a2f»2, Vi +¦ h^iI и применяя доказанное выше правило «раскрытия скобок», получим: \а, b\ = \a1el, blel\-{-\axel, Ьгег \ +1 а2е2, Ьхех \-\-\ а2е2, Ъ^\. Вынося числовые множители за знак определителя, будем иметь выражение \а, &| = а,й, |ei, *i| + aAki, В стоящей справа сумме первое и последнее слагаемые равны нулю, так как в них два аргумента определителя равны. Поэтому, заметив ещё, что |е2, et] = — | е„ e2\ (правило перестановки аргументов!) и \е1г е2|=1, можно переписать полученное выражение так: Но это и есть наше исходное выражение определителя второго порядка. Читателю рекомендуется повторить тот же ход рассуждений в применении к определителю третьего порядка \а, Ь, с\, в ко- котором faA (ЬЛ ,Cl\
24 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ В этом случае применение правила раскрытия скобок к выра-^ жению | а, Ь, с | = | atet 4- а2е, -{- а3е3, Vi -\- V2 + *з*з. Ci*i + со_е2 -\- с3е31 даёт сумму 27 слагаемых, в каждом из которых будет стоять мно- множителем один из определителей вида |*1> *1> *ll> 1*1. *2» *з|. 1*2. *3» *ll> 1*1. *3> *2| и т. д.; 21 из этих определителей обращаются в нуль в силу нали- наличия равных значений аргументов, все остальные одной или несколь- несколькими перестановками аргументов легко сводятся к определителю | elt е2, e31, равному единице в силу свойства В). Например, |е2, е3, е,| = —\ev e8, eVi\ — \e1, e», е3[ = 1. Проводя всю выкладку подробно, читатель получит выражение \а, Ь, с| = а,й2с3 — ацй3с2-[-а2й3с, — аф^ + аф^ — a3b2cv B) Из проделанных выкладок следует, что в рассмотренных случаях свойства А), Б), В) приводят к однозначно определённым выражениям для определителя, т. е. что никакие выражения, кроме полученных, не могут обладать свойствами А), Б), В). По- Поэтому возможно только одно из двух: либо функции, обладающей свойствами А), В\ В), вообще не существует, либо существует только одна такая функция (для каждого рассматриваемого порядка). Последнюю альтернативу при п = 1 и л = 3 легко разрешить: достаточно проверить, обладают ли найденные выражения этими свойствами. В случае определителей второго порядка это уже было сделано раньше, а для выражения B) читатель может выполнить такую проверку сам по образцу проведённой на стр. 18. Так как проверка показывает, что все три свойства А), Б), В) для выра- выражения B) имеют место, то обнаруживается и существование опре- определителя третьего порядка. § 4. Перестановки. Выражение определителя порядка п Мы покажем теперь, что принятое нами определение даёт воз- возможность однозначно установить выражение определителя любого порядка. При этом окажется применимым в точности тот же путь, который был только что указан для определителей второго и третьего порядков. Прежде всего мы сообщим некоторые сведения о так называе- называемых перестановках. Если имеется некоторое конечное число каких-либо элементов (предметов), то любое расположение этих элементов в определён- определённом порядке следования называется перестановкой. Число возмож- возможных перестановок зависит только от числа имеющихся элементов.
ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ 25 Если число предметов равно п, то число возможных их перестано- перестановок составляет п\ = 1 • 2 п. Часто бывает, что для рассматриваемых предметов определён некоторый «нормальный» порядок следования. Так, если элементы являются целыми числами, то нормальным порядком считается рас- расположение их по возрастанию. Аналогично этому, если рассматри- рассматриваются векторы elt e%, ... , еп, то «нормальным» расположением считается как раз то, которое только что написано. Если дана некоторая перестановка' этих элементов, то естественно пытаться как-то указать, насколько она отличается от нормального располо- расположения. Это делается следующим образом: рассмотрим в такой пере- перестановке какие-либо два элемента; их расположение может либо быть таким же, как и при нормальном расположении, либо будет проти- противоположным нормальному расположению. В последнем случае говорят, что рассматриваемая пара элементов образует инверсию или бес- беспорядок. Можно подсчитать общее число инверсий, образуемых всевозможными парами элементов в перестановке. Это число равно нулю тогда и только тогда, когда перестановка сама является нор- нормальным расположением. В противном случае получается число, обязательно большее нуля. Поэтому естественно это число принять в качестве меры отклонения данной перестановки от нормального расположения. Поясним сказанное на нескольких примерах. Перестановки C, 2, 5, 4, 1), B, 5, 3, 4, 1), C, 5, 4, 1, 2) являются перестановками пяти чисел 1, 2, 3, 4 и 5. В первой из них пара чисел 3 и 2 образует инверсию, во второй эта же пара чисел инверсии не образует. Читателю предоставляется самому убедиться, что общее число инверсий в каждой из этих перестановок будет, соответственно, равно 6, 6 и 7. Перестановка называется чётнол, если число инверсий в ней чётное. В противном случае она называется нечётной. Из написанных выше перестановок первые две — чётные, а третья — нечётная. Если дана некоторая перестановка, то, поменяв в ней местами два элемента, мы получим некоторую новую перестановку. Такая пере- перемена мест двух элементоз в перестановке называется транспози- транспозицией этих элементов. Выполняя транспозиции несколько раз после- последовательно, мы будем получать всё новые и новые перестановки. Для нас является важным то обстоятельство, что из любой, дан- данной перестановки можно получить любую другую с помощью ряда последовательных транспозиций пар элементов. В самом деле, для перестановок двух элементов утверждение очевидно, так как таких перестановок всего две, и каждая из них получается из другой одной транспозицией. Это обстоятельство
26 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ позволяет для доказательства нашего утверждения в общем случае использовать индукцию по числу элементов в перестановке. Предположим, что утверждение уже доказано для перестановок из л — 1 элементов. Пусть даны две любые перестановки из п элементов (конечно, одних и тех же!) (/„ г2, ... , in) и (/„/2, ... , /„). Требуется рядом транспозиций вторую из них перевести в пер- первую. Прежде всего находим среди элементов ju ys, ... ,./"„ элемент /,. Пусть это будет jk. Если jk ф]у, то производим во второй переста- перестановке транспозицию элементов jk и _/,. Получаем перестановку (Л> А» • • • > Jk-v Ju Jk+i> • • •)• Если сравнить её с первой из данных перестановок, то мы увидим, что её элементы, начиная со второго, образуют некоторую переста- перестановку элементов /2, г3, , in. Так как число этих элементов равно п—1, то согласно сделанному предположению можно рядом транс- транспозиций превратить эту перестановку в /9, /3, ... , г"„, а это и нужно. Исключённый из рассмотрения случай jk=jt ещё проще, так как в нём не требуется подготовительной транспозиции. Вторым важным для нас фактом является то, что при транс- транспозиции двух элементов перестановки её чётность меняется на противоположную. В самом деле, если транспозиция производится над сосед- соседними элементами перестановки, — это очевидно, так как может появиться или исчезнуть лишь одна инверсия между переставляемыми элементами: расположение этих элементов относительно других элементов перестановки и других элементов между собою не изме- изменяется. В общем случае, когда транспонируемые элементы лежат не рядом, перемена мест указанных элементов может быть получена транспозициями соседних элементов следующим образом: сначала меняем местами первый из данных элементов со следующим за ним, затем во вновь полученной перестановке снова меняем местами первый из данных элементов со следующим за ним и т. д. до тех пор, пока первый из данных элементов не займёт места второго из данных. После этого второй из данных элементов переставляем с предшествующими элементами, несколько раз до тех пор, пока он не займёт первоначального места первого из данных элементов. Легко усмотреть, что если между данными элементами находилось т элементов перестановки, то для «перенесения» первого элемента на место второго потребуется т -\-1 транспозиция соседних эле- элементов, а для того, чтобы после этого перенести второй элемент на место первого, нужно т транспозиций соседних элементов. Всего для выполнения нужной нам транспозиции потребовалось 2т -\-1 транспозиций соседних элементов. А так как при каждой такой транспо-
ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ 27 зиции чётность перестановки менялась на противоположную, то в силу нечётности числа 2т-\-\ чётность полученной после пере- перемены мест указанных элементов перестановки будет противо- противоположна чётности данной. Применим изложенные соображения для получения выражения определителя произвольного порядка, предположив пока, что опре- определитель [т. е. функция, удовлетворяющая условиям А), Б) и В) оп- определения § 21 существует. Рассмотрим, прежде всего, частный случай: \eh> eH'---' ejj> A) т. е. случай, когда определитель составлен из базисных векторов ev..., еп. Здесь ясно, что значение будет равно нулю, коль скоро хотя бы два из векторов еу , еу- , ..., еу- совпадают [в силу свой- свойства Б)]. Таким образом, остаётся рассмотреть только значение определителя A), когда все векторы е,- различны. Но тогда ряд векторов еу,, еу2> ..., еу- является перестановкой векторов в,, е», , еп, а поэтому рядом последовательных транспозиций его можно обратить в ряд еи е2, ..., еп. При этом данный определитель обратится в определитель \еи е»,..., еп\, равный 1, в силу усло- условия В). Учитывая теперь, что при каждой транспозиции входящих в определитель векторов определитель только меняет знак(см. § 3), мы получаем следующий результат: Определитель \ ejv e^, ...,еу |, в котором все векторы еу^ву ,... ..., еу- различны, равен -\-1 или —1, смотря потому, является ли перестановка еу , еу ,...,е;- векторов ех, е2, ..., еп чётной или нечётной. Если два из векторов еу , еу , , значение определителя равно нулю. Конечно, чётность перестановки е}1, еу , ...,ejn рассматриваемых векторов е1г eit , еп совпадает с чётностью перестановки их индек- индексов у„ j2, ...,/„. Пусть теперь даны произвольные векторы аи а2, , ап. Их координаты целесообразно обозначать ещё одним индексом, поме- помещаемым перед номером вектора. Так, вторая координата третьего вектора будет обозначаться ап, четвёртая координата первого век- вектора будет а4, и т. д. Таким образом, е, совпадают, то J п / »\ 1ап\ Нч. /м a9 > а, = \aj л2' T-nJ
28 ВЕКТОРНЫЕ ПРОСТРАНСТВА. И ЛИНЕЙНЫЕ ПРЕОБРЛЭОВ\НИЯ Эти векторы, как однажды было замечено, выражаются через век- векторы ev e% еп так: +... + епапп- Поэтому определитель |аи Щ ап\ может быть переписан сле- следующим образом: | е1аи -f- • • • + епап1, екам +... + enani,..., е,а1я +... + епапп |. B) Используя указанную в § 3 возможность оперирования с опре- определителем как со своеобразным «произведением», можем переписать это выражение в виде \аи а2, ..., а„ 1 = 2I^, е/я, ..., eJn \ aJj} aj^...ajnn, где стоящая справа сумма распространяется на все комбинации индексов y'j, у, , /'„. Однако в силу сделанного выше замечания определители \ej , е} е;- |, в которых хотя бы два индекса ju Jt> •••• Jn совпадают, равны нулю. Поэтому среди членов в пра- правой части остаются только те, в которых все эти индексы j раз- различны, причём стоящие там определители \ в/ , е^ ,..., е;- | равны -+-1. Поэтому мы окончательно имеем выражение | а„ а2, ..., а„ | = 2 ± fl/,i ai# • • • а/>> C) в котором знак -(- приписывается тем членам, у которых переста- перестановка индексов ju j2, ..., jn чётная, а знак — приписывается членам, у которых эта перестановка нечётная. Ясно, что число членов в сумме C) равно числу различных перестановок из п элементов,т. е. равно п\ То, что наши рассуждения приводят к совершенно однозначному выражению, позволяет сформулировать следующую теорему: Если существует функция av a2,..., ап\ от п п-мерных числовых векторов, удовлетворяющая условиям А), Б), В) нашего определения, то её значения определяются выражением C). Другими словами, требования А), Б), В) однозначно опреде- определяют нашу функцию. Естественно, возникает вопрос о том, насколько эта функция будет определена, если некоторые из указанных требований отбро- отбросить. Оказывается, что в таком случае однозначность уже не будет иметь места. Особенно интересен результат, который получается при отбрасывании условия В). Так как этот результат нам будет полезен в дальнейшем, мы его сформулируем и докажем.
ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ 29 Если дана функция F (аи а2, ..., ап) от п п-мерных числовых векторов а1г а2, , ап, удозлетворяющая условиям А) н Б), то её значения выражаются формулой F(alt а», ...,а„) = |а„ а,,..., ап\F(е1г е.2,...,еп), где | at, а2,..., ап | означает определитель, составленный аз век- тороз аи ai7 ..., ап, т. е. выражение C). Таким образом, достаточно знать только одно значение F(eiy-.., еп) нашей функции, чтобы однозначно определить все её значения. ¦ Для доказательства достаточно заметить, что в предыдущих рассуждениях мы пользовались свойством В) только в случаях, когда требовалось указать значение |еи ег, ..., еп\. Поэтому аналогия с умножением многочленов и свойство менять знак при перемене мест векторов сохраняются и для рассматриваемой функции F(alta2, .... ап): достаточно в проведённых выше доказательствах заменить | аи а%,..., ап | на F(al, a2,..., ап). Но если такую замену сделать в доказательстве формулы C), мы вместо неё получим: F (а„ а,,..., ап) = F (еи е2, ..., еп) У ± а^, а^ ... а]пП, т. е. как раз то, что требуется. § 5. Дальнейшие свойства определителя Мы должны теперь изучить свойства выражения C) предыдущего параграфа. При этом окажется, что сами свойства А), Б), В) для этого выражения имеют место. Тем самым впервые обнаружится существование определителя. Ряд других свойств позволит сравни- сравнительно просто вычислять определители любого порядка и, как уви- увидим дальше, применить определители для решения систем уравне- уравнений с любым числом неизвестных. Чтобы не вводить новых терминов, будем называть «определи- «определителем» само выражение C) предыдущего параграфа и примем для него более развёрнутое обозначение: вместо | ау, at,..., ап \ будем писать: ап а12... а1п а21 anl как это уже делалось для определителей второго и третьего порядков.
30 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВ\НИЯ Рассмотрим более подробно выражение C): ап .. • а 1п ап1 ani...an (*) Из самой записи правой части видно, что в каждый член стоящей там суммы входит ровно по одному множителю из каждого столбца. Вспоминая теперь, что индексы j\, /2, , jn образуют просто некоторую перестановку индексов 1, 2, ..., п, можем сказать также, что каждый член суммы содержит ровно по одному мно- множителю из каждой строки, написанной выше квадратной таблицы. Важно также обратить внимание на то, что знак -j- или — зависит только от чётности перестановки jlt /2, ,/„, т. е. только от тех мест в таблице, на которых стоят множители рассматриваемого члена. Из этих наблюдений немедленно обнаруживается свойство линей- линейности А). Если все элементы одного из столбцов нашей таблицы умножить на некоторое число k, то, поскольку все члены стоящей справа суммы содержат точно по одному элементу из рассматри- рассматриваемого столбца, вся сумма просто умножится на число k, и мы получаем первое условие линейности: От умножения всех элементов одного из столбцов определи- определителя на число k значение определителя умножается на это число. Другими словами, общий множитель всех элементов одного из столбцов можно вынести за знак определителя. Представим себе теперь, что нам задан определитель ап at!l ... a'lh-f-a"lk ... ain nk -\-a" nk ...an = \at, Применяя к нему равенство (*), замечаем, что в каждом слагаемом полученной суммы будет содержаться один из множителей a'Jk-\-a"jk. Раскрывая в каждом слагаемом скобки, разобьём сумму на две суммы, которые будут отличаться от исходной только тем, что в них вместо элемента k-ro столбца стоят элементы одного из двух столбцов или а ь=
ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ ЛИНЕЙНЫХ S'PABHEHHH 31 Таким образом, значения этих частичных сумм будут равны, соот- соответственно, определителям |а.и а2, ..., a'k, ..., ап| и |в„ а2, ..., a"k, .... ап\, а исходный определитель равен сумме этих определителей. Рассмотрим теперь выражение (*) в случае, когда два из столб- столбцов в„ а2, ..., ап совпадают. Для определённости предположим, что совпадают первые два столбца (рассуждения, которые приво- приводятся ниже, не зависят от номеров этих столбцов). Возьмём какой- либо член ± uj , a.j з ,.. aJnn суммы (¦*). Он содержит множитель a.j , из 1-го столбца и множитель a.j 2 из 2-го столбца. Поменяв местами индексы у, и у2, получаем новый член ± О/ , ау- 2 ... ау-п„, суммы (*). Знаки этих членов определяются перестановками j\,j\,.. .,у'„ и А> Л» •"> Jn- А так как эти перестановки получаются одна из другой транспозицией индексов у\ и у2, то они неизбежно различ- различной четности, так что знаки в обоих случаях необходимо различны. Что касается самих произведений а^ „ aj 2... а/п„ и a;jl ау- а ... ау-пП, то они совпадают, так как в силу равенства столбцов а1 и а2 будет: ay а = <2у , и а;- s = aj j. Итак, в случае совпадения двух столбцов определителя [а^ аг, ..., ап\ в его выражении каждому члену будет соответствовать такой же член с противоположным знаком, т. е. в этом случае значение определителя равно нулю. Таким образом, свойство Б) также имеет место. Остаётся проверить свойстио В). Для этого рассмотрим опреде- определитель 1 0 0. . .0 О 1 0. . .0 0 0 1 . . .0 0 0 0. . . 1 Применяя к нему равенство (*), видим, что в сумме остаётся только один член, отличный от нуля, — это произведение стоящих по диагонали единиц. Соответствующая этому члену перестановка индексов, как легко видеть, есть 1, 2, 3, , п. Так как эта пере- перестановка не содержит инверсий, то она чётная, а следовательно, значение нашего определителя равно -\- 1. С этого момента мы можем утверждать, что смысл термина «опре- «определитель», который мы ввели в начале этого параграфа, сов- совпадает с первоначальным смыслом, установленным определением § 2. Одновременно, конечно, обнаружено, что выражение (*) обладает и свойствами, доказанными в начале § 3. К уже известным нам свойствам полезно добавить ещё два свойства, важные для вычисления определителей и вытекающие из уже доказанных:
32 ВЕКТОРНЫЕ ПРОСТРАНСТВ\ И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ Значение определителя не меняется, если к элементам одного из его столбцов прибавить элементы другого столбца, умножен- умноженные на одно и. то же число. При доказательстве удобно воспользоваться нашими старыми обозначениями. Пусть, например, к элементам первого столбца определителя |в„ а2, а3, ..., ап\ мы прибавим соответствующие элементы третьего столбца, умноженные на число k. Тогда полу- получается определитель | at ~\- ka3, а2, а3, ..., ап \. Пользуясь линей- линейностью определителя по первому аргументу, получаем: |at-f-ka3, a.2,a3,...,an\ = \alta2,a3, ...,an\-\-k\а3, а2,а3,...,ап\. Но второе слагаемое в правой части равно нулю в силу свойства Б). Этим всё доказано. Значение определителя не изменится, если его столбцы заме- заменить соответствующими строками. Операция замены столбцов соответствующими строками назы- называется транспонированием таблицы определителя. Рассмотрим определитель ... а п1 а1п аы...ап получающийся из данного транспонированием. В полученной таблице первый индекс служит уже номером столбца, а второй — номе- номером строки. Поэтому, применяя для явного выражения определи- определителя сумму (*), мы должны записать: alk •' • ank • (**) Переставим теперь в каждом произведении ati aik ...ank множители таким образом, чтобы в них вторые индексы шли в порядке возрастания. Конечно, при этом расположение первых. индексов нарушится, и мы получим запись того же произведения в виде «у^ a/s ... aJnn. Чётность перестановки ju j\, ..,, jn будет той же, что и чётность перестановки klt kit , kn, так как при проделанной выше операции приведения вторых индексов к нор- нормальному расположению мы должны выполнить столько же транс- транспозиций первых индексов, сколько их было выполнено над вто- вторыми. Таким образом, мы обнаружили, что член ± alkl а^... ankn суммы (**) попросту совпадает с членом суммы (*), полученным перестановкой множителей. Но так как это совпадение имеет место для каждого члена, то сумма (**) равна сумме (*), что и нужно. Доказанное свойство определителя показывает равноправность его столбцов и строк. Отсюда следует, что те свойства, кото-
ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ 33 рые мы выше формулировали а доказали для столбцов определи- определителя, имеют место также и для его строк. Это относится вообще ко всем свойствам, которые присущи выражению (.'¦¦), если только в формулировке их участвуют столбцы нашей квадрат- квадратной таблицы целиком. § 6. Разложение определителя по элементам ряда. Вычисление определителей Рассмотрим произвольный определитель аП • • • al,*-l alk а1,й+1 • • • а D = аП — а %п ani • • • an.k-l ank an,k+l и выберем в нём какой-либо столбец, например &-й. Этот столбец можно представить в виде суммы п столбцов и переписать задан- заданный определитель так: «и <2oi , ...а. + ----Га«ь an,k+i •••ап Пользуясь теперь свойством А) определителя, можно представить данный нам определитель в виде суммы п определителей, у которых в k-м столбце имеется самое большее один отличный от нуля эле- элемент. Вынося этот элемент за знак определителя в качестве мно- множителя, получаем представление данного определителя в виде такой суммы: и аы an,k-l 0 a гпк ¦ьпп • a\,k-l ln an,k-l l an,k+l Определители, стоящие в правой части равенства, получаются из данного определителя заменой всех элементов &-го столбца нулями, кроме одного элемента, который заменяется единицей. Условимся называть каждый из таких определителей алгебраи- алгебраическим дополнением того элемента, который был заменен еди- '6 Энциклопедия, ив. 2.
34 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ницей. При этом условии равенство A) позволяет высказать такое утверждение: Определитель равен сумме произведений элементов одного из его столбцов на их алгебраические дополнения. Этот результат позволяет свести вычисление определителей к вычислению определителей низших порядков, так как мы сейчас установим, что алгебраические дополнения с точностью до знака совпадают с некоторыми определителями более низкого порядка, просто получаемыми из данного определителя. Назовём минором данного определителя, соответствующим эле- элементу a.jk, определитель, получаемый из данного вычёркиванием строки и столбца, на пересечении которых лежит рассматриваемый элемент. Вычислим сначала алгебраическое дополнение элемента опреде- определителя, стоящего в верхнем левом углу, т. е. элемента ап. Это алгебраическое дополнение по определению равно определителю а1п ain О ani ... а Мы не изменим значения этого определителя, если прибавим ко второму его столбцу первый столбец, умноженный на — ati, к тре- третьему столбцу — первый столбец, умноженный на —ап, и т. д. После этого получим определитель B) 1 0 0 0 «22 «32 0 «23 «33 ... 0 ... a. ... as О а„ "пЗ Отсюда видно, прежде всего, что алгебраическое дополнение эле- элемента зависит только от столбцов / аз C)
ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЯ и поэтому можег рассматриваться как функция этих столбцов. Сами написанные выше столбцы, конечно, являются (я—-1)-мерными числовыми векторами. В силу известных нам свойств определителей наш определитель B), очевидно, будет обладать следующими свойствами: 1. Если умножить один из столбцов C) на число k, то значение определителя B) умножится на то же число. 2. Если один из столбцов C) является суммой других столбцов, то определитель C) будет равен сумме таких же определителей, полученных из данного заменой рассматриваемого столбца отдель- отдельными слагаемыми. 3. Если два из столбцов C) совпадают, то определитель B) обращается в нуль. 4. Если столбцы C) равны, соответственно, столбцам О О О 1 / то определитель B) равен единице, так как он обращается в опре- определитель, диагональными элементами которого являются единицы, а остальные элементы раины нулю. Короче говоря, наш определитель является функцией от п— 1 (п—1)-мерных числовых векторов, удовлетворяющей условиям А), Б), В), т. е. будет определителем порядка п — 1, составленным из столбцов C), а этот определитель и есть минор данного опре- определителя, соответствующий элементу аи. Теперь нетрудно вычислить и алгебраическое дополнение любого элемента <zyfc данного определителя. Для этого в рассматриваемом алгебраическом дополнении 0 0 \ о / 0 1 0 • о / О altl a,_i,i ... a/_i,ft_i 0 a,_ul аП 1 а, а\п aJn О а, n, ft-t-1 будем последовательно переставлять k-й столбец с предыдущими столбцами, пока он не окажется на первом месте, а затем будем аналогичным образом переставлять у-ю строку. При этом общео 3*
36 ВЕКТОРНЫЕ ПРОСТРАНСТВа И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ число транспозиций столбцов будет k—1, а число транспозиций строк равно /—1. Таким образом, для того чтобы компенсировать изменение знака определителя при каждой транспозиции строк и столб- столбцов, мы должны умножить полученный в конце концов опреде- определитель на (— iy+ft~2, т. е. на (— l)y+fe. Этим способом мы находим, что рассматриваемое алгебраическое дополнение равно определителю (-1/ +fe 0 « aJ-l.fc-l 0 a. nl п, fc-1 Для того чтобы свести его вычисление к вычислению определителя более низкого порядка, осталось только применить к нему форму- формулированную выше теорему. Согласно ей этот определитель равен сумме произведений элементов первого столбца на их алгебраиче- алгебраические дополнения. При этом в сумме фактически остаётся один член, соответствующий первому элементу столбца, так как остальные его элементы равны нулю. Но алгебраическое дополнение первого эле- элемента первого столбца, как мы видели выше, равно минору, соот- соответствующему этому элементу. Поэтому окончательно получаем, что рассматриваемое алгебраическое дополнение равно (-1)** аи H,k-i /_l,fe_l «/-l.fe + l fc + 1 Этот результат можно выразить совсем короткой формулой, если условиться обозначать алгебраическое дополнение элемента aJk через A/k, а соответствующий этому элементу минор — через Mjk. В таком случае наш результат запишется в виде Сама теорема, которая была формулирована в начале параграфа, может быть теперь записана в виде формулы л D — 21 aJbAJk = аиАЧг + аЫАШ + • • • + апИ»й» D) ИЛИ D')
ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ ЛИНЕЙНЫХ S'PARHFHHfl 37 где k означает номер того столбца, по элементам которого разла- разлагается определитель. Равенство D') может быть использовано для вычисления опре- определителей в любом случае. Однако наиболее легко его применять в случаях, когда в рассматриваемом столбце многие элементы равны нулю. При вычислении определителей это условие само по себе редко бывает выполненным, и поэтому бывает полезно искусственно создавать нулевые элементы в определителе, пользуясь тем, что к его столбцам можно, не изменяя значения определителя, приба- прибавлять другие столбцы, умноженные на произвольные числа. Этим мы уже пользовались выше при вычислении алгебраического дополнения элемента аи. Следует заметить, что данное выше определение алгебраического дополнения по форме несимметрично: в нём строки и столбцы играют внешне различную роль. Однако, полученное выражение Луй = = (—\)+kMjk показывает, что алгебраическое дополнение элемента определителя на самом деле не изменяется при замене строк столб- столбцами, так как при этом не изменяются ни сумма номеров строки и столбца, содержащих данный элемент, ни дополнительный минор. Отсюда следует, что найденные для столбцов результаты можно и в этом случае применять к строкам определителя. Например, формула п D) переписывается для строк так: D = У, aik^jk- Многочисленные примеры вычисления определителей собраны в задачнике Фаддеева и Соминского, указанном в помещённом ниже списке литературы. В этом задачнике приведены подробные указания, упрощающие вы- вычисления, в частных случаях. В заключение приведём ещё одно свойство определителя, выте- вытекающее из доказанной теоремы: Сумма произведений элементов одного из столбцов определи- определителя на алгебраические дополнения соответствующих элементов другого столбца равна нулю. В самом деле, пусть речь идёт о k-м и 1-м столбцах. Тогда в силу формулы DJ будем иметь: Подставляя сюда вместо элементов 1-го столбца элементы А-го столбца, получим выражение л 2 ajkAjl- E) Так как изменение здесь заключается только в том, что элементы
38 ПРКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕ^НЫР ПРЕОБРАЗОВАНИЯ 1-го столбца заменены элементами k-ro столбца (а элементы послед- последнего оставлены на месте!), то выражение E) будет равно опреде- определителю, получаемому из D путём указанной замены. Но при этом, так как вместо 1-го столбца нужно подставить k-й столбец, оставляя k-Pi на месте, в новом определителе будут два одинаковых столбца. Это означает, что выражение E) будет равно нулю, что и требо- требовалось доказать. Аналогичный результат для строк даёт формулу = G ПРИ ft=l § 7. Решение систем уравнений Теперь у нас подготовлен вспомогательный аппарат для того, чтобы получить общие формулы, дающие решение системы п уравне- уравнений с п неизвестными. Рассмотрим такую систему: 0) ¦•• -\-аппхп = Ъп. Определитель «11 «12 \аи ... , ап\= ап1 = D, B) составленный из коэффициентов при неизвестных в системе A), называется определителем этой системы уравнений. Возьмём алгебраические дополнения элементов первого столбца определителя B): Ап, Ailt ..., Ап1, помножим на них, соответ- соответственно, обе части каждого из уравнений системы и сложим левые и правые части всех полученных уравнений. Пользуясь тем, что сумма произведений элементов любого столбца определителя на алгебраические дополнения элементов другого столбца равна нулю, замечаем, что коэффициенты при неизвестных xt (i — 2, 3, ... , п) в уравнении, полученном в результате указанного сложения, обра- обращаются в нуль. Поэтому полученное уравнение будет иметь вид C)
ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ ЛИНЕЙНЫХ УР\ВНЕНИЙ 39 Коэффициент при х1 будет равен определителю системы A). Но, замечая теперь, что правая часть уравнения C) отличается от коэффициента левой части только тем, что вместо элементов ап в неё входят элементы bt, видим, что правая часть также может быть записана в виде определителя: этот определитель получается из определителя системы заменой первого столбца столбцом свободных членов. Если полученный в результате такой замены определитель обозначить Du то уравнение C) перепишется в виде Аналогично, если умножить обе части каждого из уравнений соот- соответственно на алгебраические дополнения элементов некоторого &-го столбца определителя D, то после сложения получим уравнение где Dk означает определитель, полученный из D заменой &-го столбца столбцом свободных членов. В итоге, делая такие преобразования при всех k=l, 2 п, получим систему уравнений Dxh = Dk (*=1, 2, ..., п). D) Эта система, как показывает сам процесс её получения, является следствием данной системы, т. е. любое решение системы A) будет удовлетворять также и системе D). Но значения неизвестных, удовлетворяющие системе уравнений D), однозначно определяются из этой системы, если только опре- определитель D отличен от нуля. Именно, ** = % D=1. 2,..., я). E) Таким образом, исходная система в этом случае может удовле- удовлетворяться только указанными значениями неизвестных, и мы по- получаем следующий промежуточный результат: Если определитель системы п уравнений Q п неизвестными отличен от нуля, то эта система не может иметь более одного решения. Предшествующие рассуждения не могли гарантировать, что и уравнения A) являются следствиями уравнений системы D). В общем случае это неверно. Однако если определитель D системы A) отли- отличен от нуля, то можно непосредственной проверкой показать, что значения неизвестных, определяемые формулами E), удовлетворяют исходной системе.
40 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРЛЗОВЛНИЯ В самом деле, разлагая определитель Dk по элементам столбца, можно записать формулы E) в виде у. - j- .к i - -- д т • • • Т "n^nk ¦**~ 5 ~ 5 • Подставляя теперь эти выражения вместо неизвестных в какое- нибудь /-е уравнение системы A), получим в левой чисти этого уравнения выражение л л я i=l ^=j 7 = 1 D Раскрывая теперь скобки и группируя отдельно члены, содержащие различные коэффициенты bx, b%, .., Ъп, получим выражение п п 2 «уИ»)+ ••• +*„( 2 а Теперь легко видеть, что только одна, именно /-я, сумма в скобках будет отлична от нуля: она будет равна определителю системы как сумма произведений элементов /-й строки определителя на их алге- алгебраические дополнения, остальные суммы обратятся в нуль как суммы произведений элементов у-й строки определителя на алге- алгебраические дополнения другой строки. Эти замечания дают возмож- возможность переписать предыдущее выражение в виде что после сокращения на D дает bf-, т. е. наше выражение равно правой части у'-го уравнения системы. Так как номер j уравнения может быть любым, мы обнару- обнаружили, что значения E) неизвестных хх, ... , х„ удовлетворяют всем уравнениям системы. Тем самым показано существование решения. • Полученный результат, будучи объединён со сформулирован- сформулированной выше теоремой единственности решения, даёт следующую теорему. ' Основная теорема о системах уравнений. Система п уравнений с п неизвестными, определитель которой отличен от нуля, всегда имеет решение. Это решение единственно и опре- определяется следующим правилом: значение каждого из неизвестных равно дроби, знаменателем которой является определитель си-
ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ ЛИНЕЙНЫХ УР1ВНЕПИЙ 41 стемы, а числитель получается из определителя системы заменой столбца коэффициентов при искомом неизвестном столбцом сво- свободных членов. Приведённое правило решения системы носит название правила Крамера. Полученная основная теорема ничего не говорит ни о суще- существовании, ни о единственности решения в случае, если определи- определитель системы равен нулю. Использованные нами соображения могут дать только условие, при котором решения заведомо не существуют (это будет, например, в случае, когда определитель D равен нулю, а хотя бы один из определителей Dk не равен нулю). Подобного рода чисто отрицательные результаты недостаточны, и поэтому, минуя их, мы сразу перейдём к подробному исследованию систем уравнений, составляющему содержание следующей главы.
ГЛАВА II ВЕКТОРНЫЕ ПРОСТРАНСТВА И ИССЛЕДОВАНИЕ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ § 8. Векторные пространства. Абстрактная точка зрения Введённое в предыдущей главе понятие /г-мерного числового пространства по существу является не обобщением, а только ана- аналогом понятия векторного пространства элементарной геометрии. Для того чтобы получаемые нами результаты можно было при- применять как к тому, так и к другому пространству, целесообразно отказаться от каких-либо ограничений природы тех объектов, кото- которые мы называем векторами. Это можно сделать, исходя из такого определения: Любая совокупность L каких-либо элементов называется век- векторным пространством над данным числовым полем К, если: 1. Установлено некоторое правило, ставящее в соответствие каждым двум элементам а и Ь нашей совокупности некоторый третий элемент а-\-Ь той же совокупности, называемый суммой данных элементов а и Ь. 2. Установлено некоторое другое правило, ставящее в соот- соответствие каждому элементу а нашей совокупности и каждому числу k из поля К некоторый элемент ka совокупности L. 3. Оба эти правила удовлетворяют следующим требованиям (аксиомам): I. Для любых элементов а, Ь и с совокупности L имеют место соотношения: а) а-\-Ь = Ь-\-а (коммутативность), б) (а -\- Ь) -\- с = а -\- (Ь -\- с) (ассоциативность). II. В совокупности L существует элемент 0 (нулевой элемент) такой, что а-|-0 = а для любого элемента а из нашей сово- совокупности. III. Для каждого элемента а из L существует такой элемент — а, называемый ^противоположным-» для а, что а~\-(—а) = 0.
ВЕКТОРНЫЕ ПРОСТРАНСТВА 43 IV. Для любых элементов а и Ь совокупности L и любых чи- чисел k1 и А2 поля К имеют место соотношения: а) kt (k^a) —(k,k.2)a, б) (k1-\-ki)a = k1a-\-kia, в) kj (a-\-b) = k1a-\-k1b. V. Для любого элемента а из L имеет место соотношение \а = а, т. е. умножение на число 1 не изменяет элемента нашей совокупности L. При таком определении естественно называть любой элемент рассматриваемой совокупности L вектором. По поводу введенного определения следует заметить следующее: Мы не случайно не указали, какие именно правила опреде- определяют сумму векторов и произведение вектора на число. Эти правила могут быть любыми, лишь бы были выполнены наложенные выше требования. Также не случайно, что у нас на первый план выдвинулось понятие векторного пространства, а не понятие вектора. Причина этого в том, что интересующие нас свойства векторов проявляются не на отдельных экземплярах этих объектов, а в поведении их, так сказать, в коллективе, во всей рассматри- рассматриваемой совокупности. Что касается употребления в формулировке аксиом знака равен- равенства, то мы раз навсегда условимся, что равенство обозначает лишь то, что предметы, стоящие по обе его стороны, просто совпадают: это — один и тот же предмет. При таком употреблении знака ра- равенства свойства транзитивности, симметрии и рефлексивности ста- становятся чисто логическими его свойствами и не нуждаются в установлении особых соглашений. Прежде чем переходить к более подробному изучению свойств векторных пространств, мы покажем на нескольких примерах, на- насколько большую свободу даёт нам введённое только что опреде- определение. Легко видеть, прежде всего, что как совокупность «геометрических» векторов плоскости, так и совокупность «-мерных числовых вектороч (при любом заданном п) являются векторными пространствами во введённом нашим определением смысле. Однако теперь уже можно указать весьма большое число других примеров векторных пространств. Пример 1. Обозначим через Fn совокупность многочленов а0-\-atx-)-...-)-апхп, степень каждого из которых не превосходит данного числа п, а коэффициенты берутся из рассматриваемого число- числового поля К. Для таких многочленов в элементарной алгебре опре- определена операция сложения и указано правило умножения многочлена на любое число. При этом сложение и умножение на числа из поля К
44 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРКОГ.ГЛЧОВЛНИЯ не выводят нас за пределы рассматриваемой совокупности F. Кроме того, те требования, которые были сформулированы в виде аксиом I—V, в рассматриваемом случае выполнены. Это означает, что совокупность F при указанных операциях сложения и умножения на число является векторным пространством над полем К, а сами многочлены степени не выше п можно рассма- рассматривать как векторы этого «пространства». Отметим, что если мы ограничимся только рассмотрением много- многочленов, степень которых в точности равна п, то мы не получим векторного пространства: сумма таких многочленов может иметь меньшую степень, так что не будет элементом нашей совокупности.' Пример 2. Матрицей с т строчками и п столбцами назы- называется любая таблица чисел, имеющая вид а1п а2п «m-2 ••• «n Если все входящие в эту таблицу числа берутся из поля К, то мы будем говорить о матрице над этим полем. Для матриц приняты такие определения операций: произ- произведением матрицы на число называется матрица, получаемая из дан- данной умножением всех входящих в неё чисел на это число; суммой матриц называется матрица, получаемая из данных двух матриц сложением соответствующих (т. е. стоящих в них на одинаковых местах) чисел. Сумма матриц определена только тогда, когда обе рассматриваемые матрицы имеют одинаковое число строк и одинаковое число столбцов. При этих соглашениях совокупность всех матриц с т строками и п столбцами над данным полем К будет векторным пространством над этим полем, ибо, как легко проверить, все требования сформу- сформулированного выше определения здесь опять выполнены. Пространство /и-мерных числовых векторов над полем К является частным случаем определённого только что «пространства матриц»: наши матрицы обращаются в числовые векторы, если п=1, т. е. если в них имеется только один столбец. Пример 3. Обозначим через С совокупность всех непрерыв- непрерывных функций f(x), определённых на некотором отрезке [а, Ь] зна- значений х и принимающих действительные значения. В математиче- математическом анализе определяется, что значит «сложить» две данные функ- функции или «умножить» данную функцию на действительное число. При этом оказывается, что сумма двух непрерывных на данном отрезке функций будет также непрерывна на этом отрезке, и это же отно- относится к произведению непрерывной функции на действительное число. Кроме того, хотя это редко доказывается в явной форме, опреде-
СЕКТОРНЫЕ ПРОСТРАНСТВА 45 лённые так сложение и умножение па число удовлетворяют требо- требованиям, выраженным в аксиомах I—V. Но сказанное означает, что совокупность С при введённых так операциях над функциями является также векторным пространством над полем действительных чисел. Пример 4. Совокупность Fco всех многочленов с коэффициен- коэффициентами из данного поля К также является векторным пространством, если считать сумму многочленов и произведение многочлена на число определёнными обычным образом. Этими примерами далеко не исчерпываются не только все вообще существующие векторные пространства, но даже те из них, которые оказываются наиболее важными в современной ма- математике. Полезность введённого в этом параграфе аксиоматического или «абстрактного» определения векторного пространства состоит именно в том, что оно позволяет изучать одновременно очень большое ко- количество различных «конкретных» пространств. В самом деле, все результаты, которые удаётся получить, исходя только из введён- введённого определения, необходимо будут верны в любом случае, когда условия определения выполнены. Нужно добавить, что на самом деле связь между «абстрактными» и «конкретными» результатами здесь не только в том, что из общих теорем абстрактной теории получаются конкретные следствия, но и в том, что известные результаты в случае отдельных частных «конкретных» пространств, например совокупности векторов на пло- плоскости или в обычном трёхмерном пространстве, позволяют пред- предвидеть факты, имеющие место в общем случае. Тем самым мы получаем средство устанавливать связи иногда даже между очень отдалёнными на первый взгляд разделами математики. Развитие математики в течение конца XIX в. и те работы, которые ведутся в настоящее время, указывают много таких связей. Их про- простое перечисление не может принести пользы, а более подробное выяснение существа дела завело бы нас слишком далеко от основной темы. Поэтому мы ограничимся сделанными замечаниями и перейдём к систематическому исследованию свойств векторных пространств, начиная с простейших. § 9. Простейшие свойства операций над векторами Мы начнём с того, что выведем простейшие следствия из опре- определения векторного пространства, относящиеся к операциям над векторами. Из нашего соглашения об употреблении знака равенства и из того, что сумма двух векторов однозначно определена, выте- вытекает следующее хорошо известное правило оперирования с ра- равенствами:
46 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ К обеим частям векторного равенства можно прибавить один- и тот же вектор, не нарушая справедливости равенства. В самом деле, равенство а = Ь выражает, что буквами а и Ъ обозначен один и тот же вектор. Поскольку сумма а-\-с однозначно определена, она будет одним и тем же вектором независимо от того, как обозначено первое слагаемое: а-\-с = Ь-{-с. , По той же причине обе части векторного равенства можно умножать на один и тот же числовой множитель без нарушения равенства. Правило сложения векторов ставит в соответствие любым двум векторам а и Ь их сумму а -\- Ь. Если нам нужно сложить не два, а несколько векторов, то мы вынуждены эту операцию проводить в несколько приёмов, каждый из которых состоит в сложении двух векторов. Например, если мы имеем три вектора а, Ь и с, то можно представить себе такие различные комбинации при их сложении (а-\-Ь)-\-с, где скобки, как обычно, показывают порядок выполнения операций. Законы коммутативности и ассоциативности, содержащиеся в ак- аксиоме I, позволяют утверждать, что во всех этих случаях мы получим один и тот же результат. Действительно, для первых двух из напи- написанных выражений это очевидно в силу самой формулировки аксио- аксиомы I, а для третьего наше утверждение следует из такой цепочки равенств: каждое из которых получается однократным применением равенств а) или б) аксиомы I. Естественно посмотреть, будет ли это сохраняться и в случае сложения большего числа векторов. Методом математической индукции может быть доказано, что имеет место следующий общий закон: Сумма любого числа векторов не зависит от того порядка, в котором производится операция сложения данных вектороз. Этот результат даёт право при записи суммы вообще не пи- писать скобок или расставлять скобки произвольно, если это почему-либо выгодно для дальнейшего оперирования с рассматри- рассматриваемой суммой. Доказательство сформулировапного выше утверждения может бить проведено следующим образом: Рассмотрим сначала суммы такого специального вида: (... (((at + а,) + Ъ) + а,) +... + а„_,) + а„, т. е. такие, в которых сначала складываются два первых слагаемых, затем к их сумме прибавляется третье слагаемое, затем к сумме этих слагаемых прибавляется четвёртое и т. д. Будем называть эти суммы каноническими и при выписывапии таких сумм вовсе пе будем писать скобок. Заметим,
ВЕКТОРНЫЕ ПРОСТРАНСТВА 47 прежде всего, что каноническую сумму «слагаемых ai--\-as + ¦ • • +о„ можно но самому её определению представить в следующем пиде: (at -(-¦¦• + -|- а^) + ак+1 + ¦ ¦ • + ап, т. е. как каноническую сумму п — k-\-\ слагаемых, из которых первое само является канонической суммой первых к слагаемых дайной суммы. Покажем, что в канонической сумме можно произвольно менять поря- порядок слагаемых. В самом деле, для сумм из двух элементов справедливость утверждения гарантируется аксиомой I. Пусть утверждение доказано для канонических сумм, состоящих из п—1 элементов, и пусть дана сумма di -\- #2 4" • ¦ ¦ 4~ а„, для которой требуется показать, что она равна сумме ait -\- а1а + • • • + Я/ п, где lu (<.,...,(„— какая-либо перестановка индексов 1, 2,..., п. Представим первую и вторую суммы, соответственно, в виде (<*! + ...+ал-1) + ал и (ah + ... + ainl) + a!n. Если in = n, то видпо, что дело сводится к перестановке члепов в сумме а( -|- ... 4~#п-ь т. е. для этого случая всё доказано. В противном случае вектор а,- содержится среди векто- векторов ait..., an_i, причём его в сумме я—1 слагаемых можно переставить на последвее место, не изменяя суммы at -+-.. ¦ + e,j-i- Поэтому можпо счи- считать, что этот вектор уже стоит на последпем месте, т. е. что in = n—1. Векторы а,- ,...,а,- , a-t в этом случае образуют перестановку векторов ai,...,а„^, а„. Поэтому в скобках второй суммы можно (опять по предпо- предположению индукции!) переставить слагаемые так, чтобы они стояли в порядке аи..., а„_2, а„. Таким образом, остаётся только установить, что равны суммы (ai + ... + an_i) + an и (at + -• • + «л-2 + «л) + «л-i- Этот последний шаг может быть проведён так: первая сумма по определению равна (at -)-••• + Ч" an-s) -\~an-i Ч" ai.y так что е^ можно рассматривать как сумму трёх сла- слагаемых (at -(-•-¦+ Я/г-2, а„_! и а„). Поэтому скобки могут быть переставлены, и мы можем написать: „_а) + «я-1 + «я = («1 + • • • + «л-*) + («л-1 + ап). После этого в силу коммутативности двух слагаемых можно написать равенство (al + ... + an_s) + (an_i + an) = (al + ... + an_s) 4- (an 4- «n-i)- Теперь можно снова воспользоваться законом ассоциативности для трёх слагаемых и написать: (at 4- • • • 4- «л-2) 4- («я 4- «л-i) = ((«14- • • • 4- ««-*) 4- ап) + an_t. Но правая часть последнего равепства есть не что иное, как сумма at +... 4- 4- Яр-а 4" о-п 4" «я-1. или («1 + • • • + «я-2 4" «я) 4- о„_1. Равенство доказано. Теперь покажем, что сужжв йбух канонических сумм, равна канониче- канонической сумме всех их слагаемых. Действительно, если вторая сумма содержит лишь одно слагаемое, то утверждение следует просто из определения канонической суммы. Пусть утверждение верно в случае, если второе слагаемое содержит п — 1 слагае- слагаемых, и пусть дапа- сумма (at + •• • + am) 4-(*i 4" ••• + */?), в которой вторая из написанных канонических сумм содержит п слагаемых. Тогда написанную сумму можно переписать в виде (а, 4- • • • 4~ ат) 4~ ((*i 4~ • • ¦ + ^я-i) 4~ Ь„), т. е. рассмотреть как сумму трёх слагаемых (at 4- • • • 4- ат), (fti + • • • + ^я-i) и Ьп. В таком случае мы имеем право переставить скобки так: ((ai + • ¦ • 4~ ат) + 4- (fti 4~ ¦ • • 4~ bn_i)) 4- Ьп. При этом в наружных скобках оказывается сумма двух канопических сумм, вторая из которых содержит уже п—! слагаемых. В силу сдеданпого предположения выражение в наружных скобках может быть переписано в виде (at 4- ¦ • ¦ 4~ ат 4~ *i 4" • • • 4" bn-i), а всё написанное выражепие в виде (ау -\-... -\- ат -\- Ьу -\-...-{- ft,,_i) -f- Ь„. Но получеппое выражепне есть просто капоническая сумма всех слагаемых обеих сумм.
48 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ Остаётся рассмотреть произвольные суммы и показать, что любым образом записанная сумма равна канонической сумме ев слагаемых. Это утверждение тривиально для сумм двух векторов, так как сумма двух векторов сама является капопической. Предположим, что утверждение уже доказано для сумм, состоящих из п — 1 или меньшего числа слагаемых. Если дана сумма п слагаемых ai,...,an с какой-либо расстановкой скобок, то её можно представить как сумму двух слагаемых (для этого нужно только усмотреть, какое из указанных сложений производится последним). Каж- Каждое из слагаемых является само суммой части слагаемых данной суммы. Поскочьку число слагаемых обеих частичных сумм мепыие п, каждая из них равна канонической сумме входящих в неё слагаемых. Поэтому вся рассматриваемая сумма как сумма двух каиопичеСких сумм будет канони- канонической суммой всех её слагаемых. Этим доказательство закончено. Подобным же образом можно рассмотреть и произведения векто- векторов на числа. Например, произведение (А, -[-•'- + kn) (<*i -r~•••"!"ат) равно сумме всевозможных попарных произведений вида kfl, при различных i и у. Доказывается это индукцией по числу т слагаемых векторов, а для т = I — индукцией по числу п. Детали рассуждения не пред- представляют труда, и мы оставляем его читателю. Для большего удобства мы условимся ещё писать множители в таких произведениях в произвольном порядке, приняв по определению, что ka — ak для любого вектора а и любого числа k из поля К. Тогда правила действий над векторами примут обычный вид, хорошо известный из элементарной алгебры. Нужно только следить, чтобы в каждом рассматриваемом произведении все множи- множители, кроме одного, были числовыми. Следует особо остановиться на содержании аксиом III и V. Первая из них утверждает существование хотя бы одного эле- элемента 0 (нулевого вектора), удовлетворяющего условию а-{-0 = а при любом векторе а. Легко, однако, видеть, что такой вектор может быть только один: если бы были два таких вектора О и 0', то сумма 0 -f- 0' = 0' -f- 0 равнялась бы одновременно 0 и О'. Поэтому векторы 0 и 0' были бы равны, вопреки первоначальному предположению, что они различны. Аналогично этому можно установить, что для каждого вектора х существует только один противоположный вектор: если бы та- таких векторов было два (—х) и (—х)', то мы имели бы такую цепочку равенств, каждое из которых вытекает из принятых аксиом: (- х) = (- х) + 0 = (- х) + (х + (- *)') = ((- х) + х) + (- х)' = = (х + (- х)) + (- хI = 0 + (- хУ = (- х)' + 0 - (- х)\ Теперь можно легко установить, что если какой-либо вектор х удовлетворяет условию а-\-х = а, хотя бы при одном векторе а, то дг = О. В самом деле, прибавляя к обеим частям первоначаль- первоначального равенства вектор (—а), получим х — 0.
ВЕКТОРНЫЕ ПРОСТРАНСТВА 49 Обнаруженное свойство нулевого вектора даёт возможность по- показать, что произведение любого вектора а на число 0 равно ну- нулевому вектору. Действительно, в силу аксиом IV и V имеем: а-\-0 ¦ а = 1 -а-\- -j-0 ¦ а = A -\-0) ¦ а = а. Это означает, что вектор 0-а обладает указанным свойством, а значит, он равен нулевому вектору. Сделанное замечание позволяет не опасаться путаницы от того, что число нуль и нулевой вектор мы обозначаем одинаковым обра- образом. Их свойства аналогичны, а в каждом отдельном случае сразу видно, с числом или с вектором мы имеем дело. Если имеется векторное равенство, одна из частей которого содержит слагаемым вектор а, то, прибавляя к обеим частям проти- противоположный вектор —а, получим равенство, отличающееся от перво- первоначального только тем, что вектор а «перенесён» из одной его части в другую с противоположным знаком. Подобного рода формальными преобразованиями равенств мы будем далее пользоваться без особых оговорок. § 10. Линейная зависимость векторов Доказанные н предыдущем параграфе свойства операций над векторами позволяют действовать с ними так же свободно, как с обычными числами или с многочленами. Мы больше не будем возвращаться к этим элементарным свойствам и обратимся к понятию, играющему в дальнейшем основную роль, — понятию линейной зави- зависимости. Уже в § 1 мы пользовались термином «линейная комбинация» векторов. При рассмотрении любого векторного пространства L мы будем также называть выражения вида kxax -\- А2а2 -\-... -\- knan линейными комбинациями векторов а1г а8,..., ап, если только коэффициенты klt kit...,kn принадлежат числовому полю К, над которым рассматривается наше пространство. Обратим внимание читателя на то, что при этом не исключается случай, когда все коэффициенты равны нулю. Поэтому нулевой вектор всегда можно представить линейной комбинацией любых заданных векторов. Пусть теперь М — произвольная система векторов нашего про- пространства. Эта система называется линейно независимой, если линейная комбинация векторов, принадлежащих системе, может быть равна нулю только в том случае, когда все коэффициенты равны нулю. В случае, если можно указать хотя бы одну линейную комбинацию векторов системы, коэффициенты которой не все равны нулю и которая тем не менее равна нулю, говорят, что данная си- система линейно зависима. Легко видеть, что если на плоскости взять любые два непарал- непараллельных вектора, то они будут линейно независимы: никакая их линейная комбинация с отличными от нуля коэффициентами не может 4 Энциклопедии, кн. 2.
50 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ быть равна нулю. Такое же положение будет, если в «обычном» трёхмерном пространстве взять три вектора, не параллельные одной плоскости. Наоборот, если на плоскости взять любую систему из трёх векторов, то она уже будет линейно зависимой: в этом случае хотя бы один из трёх векторов будет линейной комбинацией двух других, например a = klb-\-kic. Но, перенося все члены этого равенства в одну часть, мы получим la — ktb — k%c^0. А это означает, что нашлась линейная комбинация данных векторов, кото- которая равна нулю, несмотря на отличие от нуля её коэффициентов (коэффициент 1 при векторе а, очевидно, отличен от нуля). Только что проведённое рассуждение позволяет доказать сле- следующую простую, но важную теорему. Теорема. Система векторов, содержащая более одного эле- элемента, линейно зависима тогда и только тогда, когда хотя бы один из её векторов представляется линейной комбинацией остальных. Таким образом, содержащееся в формулировке этой теоремы условие почти эквивалентно первоначальному определению линейной зависимости. Некоторым дефектом этого условия является лишь то, что оно не может быть применено к одному вектору: если система состоит из одного вектора, то говорить о его выражении через «остальные» нельзя без некоторой натяжки; в то же время гово- говорить о линейной зависимости или линейной независимости такой системы в смысле нашего определения можно, так как можно рас- рассматривать линейные комбинации векторов, состоящие из одного слагаемого. Именно, возможность применять первоначальное определение без каких-либо оговорок делает его более удобным, чем принятие в ка- качестве определения линейной зависимости условия, указываемого нашей теоремой. Доказательство. Пусть система М линейно зависима. Тогда по определению линейной зависимости можно указать линейную ком- комбинацию klal -|- A2a2 -["••• + knan некоторых векторов а„ а2,..., а„ системы, которая равна нулю и в которой хотя бы один коэффи- коэффициент отличен от нуля. Не ограничивая общности, можно считать, что ktrjt0 (в противном случае можно было бы изменить нумера- нумерацию рассматриваемых векторов). Тогда из равенства kl -\- -)- knan = 0 умножением обеих его частей на k~l = г- полу- чим: О| = — -^ а-ч,-—•¦• — т^ап> т- е- один из векторов системы выражается линейной комбинацией остальных. Наоборот, если какой-либо вектор а1 данной системы предста- представляется комбинацией остальных векторов, например ai=k^a»-\- -f- ...-J- knan, то перенос всех членов в одну часть приводит к
ВЕКТОРНЫЕ ПРОСТРАНСТВА 51 линейной комбинации, равной нулю и имеющей отличный от нуля (хотя бы) один из коэффициентов. Из определения сразу следует, что если система векторов со- содержит нулевой вектор, то она обязательно линейно зависима: в этом случае выражение kO представляет собою линейную комби- комбинацию векторов системы, содержащую лишь одно слагаемое. Эта линейная комбинация будет равна нулю при любом значении коэф- коэффициента k, в частности при k 9^ 0. Точно так же получается сразу, что любая часть линейно не- независимой системы векторов будет линейно независимой системой. В самом деле, если бы эта часть была линейно зависимой, то было бы возможным составление линейной комбинации её векторов, равной нулю и содержащей хотя бы один отличный от нуля коэф- коэффициент. Но эта линейная комбинация была бы также линейной комбинацией векторов всей системы, что, очевидно, противо- противоречит линейной независимости последней. Условимся называть две системы векторов эквивалентными, если каждый вектор любой из них можно выразить линейной комби- комбинацией векторов другой системы. Так, если на плоскости взять три вектора х, у, г, связанные соотношением z = x-\-y, то системы векторов {х, у}, {X, у, z}, а также и {у, z\ будут эквивалентными. Например, эквивалентность первых двух из этих систем следует из справедливости равенств х=\х, х== 1х, у=1у, содержание которых сводится именно к тому, что каждый вектор одной из этих двух систем является линейной комбинацией векто- векторов другой системы. Определённая так эквивалентность обладает следующими свой- свойствами: Любая система векторов эквивалентна самой себе. Если одна система векторов эквивалентна другой системе, то и другая система эквивалентна первой. Если каждая из двух данных систем векторов эквивалентна одной и той же третьей системе, то две первые системы также эквивалентны друг другу. Убедиться в справедливости этих утверждений предоставляется самому читателю. Важное свойство линейно независимых систем векторов указы- указывает следующая Теорема о замене. Пусть конечная линейно независимая система ait cs, .... ап векторов такова, что каждый её вектор 4*
52 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНРПНЫЕ ПРЕОБРЛЗ'ОВЧИИЯ является линейной комбинацией векторов некоторой другой си- системы М. Тогда число векторов в системе М не может быть меньше п, причём можно произвести замену п векторов систе- системы М векторами аи а2, , а„ так, чтобы полученная после этой замены система М была эквивалентна первоначальной системе М. Доказательство. Поскольку в формулировку теоремы вхо- входит натуральное число п — число элементов рассматриваемой конеч- конечной системы, естественно для доказательства воспользоваться индукцией. Начнём со случая /7=1, когда первая система состоит лишь из одного вектора. Из того, что имеет место линейная независимость, следует, что вектор ак ф 0. С другой стороны, также по условию теоремы, можно выразить вектор ах линейной комбинацией неко- некоторых векторов /м1; щ, ..., ms системы М: al=k1tnl-\-k,jni-\- -J- ... -J- ksms. Отсюда уже следует, что в системе М должен быть хотя бы один вектор, т. е. что первое утверждение теоремы в данном случае справедливо. Кроме того, так как аг ф 0, хотя бы один из коэффициентов kv kit , ks, например klt должен быть отличным от нуля (в противном случае линейная комбинация равня- равнялась бы нулю, а не вектору а,). Если А, ф 0, то записанное выше 1 ks ks равенство можно переписать так: mi = 1Га1 — -jr т%—... — т ms. Но теперь видно непосредственно, что система М', полученная за- заменой в системе М вектора т1 вектором а,, будет эквивалентна системе М. В самом деле, если мы возьмём любой вектор системы М, то могут представиться два и только два случая: а) Выбранный вектор X отличен от т{, но тогда он принадле- принадлежит также и системе М', так как мы его не выбрасывали при за- замене. Равенство jc=1jc показывает, таким образом, что вектор х является линейной комбинацией векторов системы М. б) Выбранный вектор х = т1. Но в этом случае имеющееся в нашем распоряжении равенство т. = 1г а1 — -?- т„ —... — — ms к1 к1 «! также показывает, что он является линейной комбинацией векторов системы М'. Наоборот, если взять любой вектор х системы М', то опять возможны два случая: а) хфах и б) x=at. В этих случаях выра- выражение вектора х в виде линейной комбинации векторов системы М даётся, соответственно, равенствами х = х и je = a, =k1ml-\- -)-... -J- kstns. Доказательство эквивалентности систем М и М за- закончено. Переходя к случаю произвольного и^>1, предположим, что наша теорема уже доказана в случае, когда данная линейно независимая
ВЕКТОРНЫЕ ПРОСТРАНСТВА 53 система содержит п — 1 векторов. В этом предположении докажем справедливость обоих утверждений для системы п векторов. В самом деле, если исключить из данной системы аи..., an_t, an последний сектор ап, то останется система из л— 1 векторов, кото- которая попрежнему будет линейно независимой и такой, что каждый её вектор будет линейной комбинацией векторов системы М. Отсюда в силу предположения индукции следует, что число векторов си- системы М^п—1 и что п—1 векторов этой системы можно заме- заменить векторами alt ... , an_t так, что полученная после такой за- замены система М" будет эквивалентна системе М. Рассмотрим теперь вектор ап. Он является линейной комбинацией векторов системы М по условию теоремы, так как системы М и М" эквивалентны, он будет также линейной комбинацией векторов последней системы. В число этих векторов могут войти и векторы а„ ... , ап_и так что а„ = /г,а, + • • • + K-ian-i + Л*", + • ¦ • + lsms, где т1г..., ms — могущие присутствовать в этом выражении векторы первоначаль- первоначальной системы М. Покажем, что хотя бы один такой вектор должен входить в выражение ап с коэффициентом, отличным от нуля. В самом деле, если все коэффициенты 11У ... , ls равны нулю (или векторов /и, ms вообще нет), то вектор а„ оказывается линейной комбинацией векторов аи ... , an_lt вопреки линейной независимости системы av ... , un_lt an. Доказанный факт обнаруживает, что в системе М" найдётся хотя бы один вектор т, отличный от векторов а,, ... , fln_j. Но это означает, что число векторов в системе М было ^ п. Кроме того, повторение доказательства для случаяи=1 даёт, что один из век- векторов mt системы М" может быть заменён вектором ап так, чтобы полученная после такой замены система М была эквивалентна системе М". Учитывая теперь, что системы М и М" эквивалентны и что система М' в конечном счёте получена из системы М заме- заменой п её векторов векторами at, , ап, убеждаемся в справедли- справедливости и второго утверждения теоремы. Подчеркнём, что в теореме не утверждается возможность замены любых векторов системы М векторами а,, ... , ап. Из доказа- доказательства видно, что при каждом этапе замены можно заменять только тот вектор, который входит в рассматриваемое соотноше- соотношение с отличным от нуля коэффициентом. Что касается того, какие именно векторы будут обладать этим свойством, то это в общем случае заранее предсказать нельзя. Проводимые в доказательстве рассуждения обнаруживали только, что хотя бы один такой вектор обязательно существует. Содержание доказанной теоремы раскрывается теми следствиями, которые могут быть из неё получены. Прежде всего укажем такое: Если каждый вектор системы М является линейной ком- комбинацией конечного множества векторов Ьх, Ь%, , ... , Ьт, то
54 ВЕКТОРНЫЕ ПРОСТРАНСТВ\ И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ никакая линейно независимая часть системы М не может содер- содержать больше т векторов. В самом деле, если ах, ... , ап — линейно независимая часть системы М, то к ней и к системе векторов bv ..., Ьт может быть применена теорема о замене, из которой следует, что п =s т. Этот результат может быть применён, в частности, к простран- пространству числовых векторов: в § 2 мы видели, что каждый и-мерный числовой вектор может быть представлен линейной комбинацией фиксированных векторов ег, ... , еп. Следовательно, в силу только что отмеченного следствия теоремы о замене никакая линейно не- независимая система п-мерных числовых векторов не может содер- содержать более п векторов. Другим важным следствием теоремы о замене является следую- следующее предложение: Если две конечные системы векторов 6, Ьт и сг, ... , ср линейно независимы и эквивалентны, то число элементов в обеих системах одно и то же: т=р. В самом деле, эквивалентность систем и линейная независимость каждой из них позволяют использовать теорему о замене дважды: один раз первая из систем принимается за множество аи ..., ап, а другая за М, а другой раз — наоборот. Это даёт два неравен- неравенства /ra=sp и р-^т для чисел элементов в системах. Доказываемое равенство из них следует непосредственно. Рассмотрим теперь какое-либо множество векторов данного нам пространства и будем выбирать из него всевозможными спосо- способами конечные линейно независимые части. При этом логически возможны два случая: либо можно выбрать линейно независимые части, содержащие сколь угодно большое число векторов, либо же число векторов в каждой из таких частей никогда не б.удет пре- превосходить некоторого числа п. Сделанное только что замечание об и-мерном числовом пространстве показывает, что в случае число- числовых векторов будет иметь место как раз второй случай. То, что и первый случай не является только логической возможностью, можно увидеть, например, в случае простран- пространства всех многочленов Fco (см. пример 4 § 8). Степени х: х, х2, ... , хп, , являются «векторами» этого пространства. Их линейными комбинациями являются многочлены k^-^-k^x'*-f- ... Ц-^х", при- причём коэффициенты линейной комбинации являются просто коэффи- коэффициентами этих многочленов. Отсюда видно, что нулевой многочлен (нулевой вектор нашего пространства!) мы можем получить, только взяв все коэффициенты равными нулю. Следовательно, «векторы» х, ... , х", .. — линейно независимы, и мы можем из них выбрать конечную линейно независимую систему, содержащую сколь угодно большое число элементон. Мы примем такое определение: j|
ВЕКТОРНЫЕ ПРОСТРАНСТВА 55 Рангом множества М векторов называется максимальное число векторов в линейно независимых частях этого множества. Если ранга в смысле этого определения не существует (как в только что рассмотренном пространстве F^, то мы будем гово- говорить, что ранг бесконечен. Пусть М — какое-либо множество векторов пространства L (может быть, М совпадает со всем пространством) и пусть а1г , ап — какая-либо конечная линейно независимая система секторов множества М. Будем называть её максимальной линейно независи- независимой системой во множестве М, если добавление к ней любого вектора нашего множества лишает её свойства быть линейно не- независимой. Для таких систем имеет место следующая Теорема. Линейно независимая система at, a2 а„ век- векторов тогда и только тогда является максимальной линейно независимой системой во множестве М, когда она эквивалентна всему множеству. Если аи ... , пп и Ь1У ... , Ьт — две максималь- максимальные линейно независимые системы векторов ясножества М, то они содержат одно и то же число элементов: т = п. Легко видеть, что второе утверждение непосредственно выте- вытекает из первого в силу доказанного выше следствия теоремы о за- замене, относящегося к эквивачентным линейно независимым системам. Доказательство же первого утверждения можно провести так: 1) Пусть система аи , ап является максимальной линейно независимой системой векторов множества М; все её векторы линейно выражаются через векторы множества М. С другой стороны, если х — любой вектор из М, то система векторов av ... , ап, X будет уже линейно зависимой. Поэтому должна существовать равная нулю линейная комбинация этих векторов имеющая хотя бы один отличный от нуля коэффициент. Но легко видеть, что k не может равняться нулю, так как в этом случае был бы отличным от нуля один из других коэффициентов и векторы а,, ... , ап были бы линейно зависимыми, вопреки предположению. Это же в свою очередь означает, что вектор Так как X — произвольный вектор из М, то векторы из М линейно выражаются через векторы системы Cj, — , ап. 2) Наоборот, пусть линейно независимая система векторов а,,.... а„, множества М эквивалентна всему множеству. Тогда любой вектор X множества М будет некоторой линейной комбинацией векторов данной системы: или \х — kYa.Y — ••• — knan = V>.
56 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕПНЫЕ ПРЕСМ5РЛЗОП \НИЯ Так как эта линейная комбинация равна нулю, а не все её коэффи- коэффициенты равны нулю, то система а1г ... , а,;, х не может быть линейно независимой, что и требовалось доказать. Понятие ранга множества векторов приобретает особенно на- наглядный смысл в случае множеств векторов на плоскости или в обычном трёхмерном пространстве. Как легко видеть, в этих слу- случаях ранг равен, соответственно, 2 и 3, т. е. совпадает с тем числом, которое обычно называют числом измерений. Рассматривая сово- совокупность векторов, лежащих на одной прямой линии, мы без труда увидим, что её ранг равен 1, т. е. опять-таки совпадает с числом измерений, которое обычно приписывается прямой. i Разобранный пример делает естественным следующее определе- определение размерности произвольного векторного пространства: Размерностью векторного пространства называется число элементов в максимальной линейно независимой системе векто- векторов этого пространства. Доказанная выше теорема позволяет утверждать, что это число не зависит от выбора максимальной линейно независимой системы векторов. Замечая, что векторы е,, , еп числового л-мерного простран- пространства образуют, очевидно, максимальную линейно независимую систему, можем утверждать теперь, что размерность этого пространства в только что определённом смысле равна п. Этим оправдывается применявшееся нами раньше название «л-мерное» пространство. § 11. Подпространства Если мы рассмотрим векторы обычного трёхмерного простран- пространства, лежащие на какой-либо плоскости, то немедленно обна- обнаружим, что суммы этих векторов и произведения их на действи- действительные числа являются снова векторами т о й ж е плоскости. Это обстоятельство наводит на мысль придать нашей терминологии, относящейся к общему случаю любых векторных пространств, ещё ббльшую геометричность, введя такое определение: Подпространством данного векторного пространства назы- называется любое множество L векторов этого пространства, обла- обладающее двумя следующими свойствами: 1. Если векторы а и Ь принадлежат этому множеству, то и их сумма также принадлежит L. 2. Если вектор а принадлежит множеству L, то и его про- произведение ka на любое число из поля К также принадлежит L. Нетрудно видеть, что каждое подпространство само является векторным пространством в смысле общего опре- определения, введённого в § 8: для двух его элементов определена их сумма, определено произведение любого из его элементов на число из поля К и свойства этих операций, выраженные аксиомами I—V,
ВЕКТОРНЫЕ ПРОСТРАНСТВА 57 также выполнены, так как они выполняются со всём пространстве. Таким образом, всё, что мы выше говорили о векторных простран- пространствах, автоматически относится и к их подпространствам. Однако при рассмотрении подпространств обнаруживается целый ряд новых явлений, связанных с их, так сказать, «взаимным распо- расположением». Пусть Ll и Ljj — два подпространства одного и того же вектор- векторного пространства L. Пересечением этих подпространств естественно назвать совокупность векторов пространства, принадлежащих одновременно обоим подпространствам. Это наименование нахо- находится в согласии как с наглядными геометрическими представле- представлениями, так и с общим определением теории множеств, в которой, как известно, пересечением любых множеств называют сово- совокупность их общих элементов. Если мы рассмотрим совокупности векторов обычного трёхмерного пространства, лежащих на двух плоскостях, как подпространства, то пересечением их в нашем смысле будет совокупность векторов, лежащих на прямой, по которой пере- пересекаются эти плоскости. Эта совокупность оказывается сама под- подпространством. Если аналогичным образом рассмотреть совокупности векторов, лежащих на пересекающихся прямой и плоскости, то пересечение этих подпространств будет состоять только из одного нулевого вектора: только нулевой вектор можно рассматривать как лежащий одновременно на нашей плоскости и на прямой. Однако нулевой вектор сам по себе образует подпространство: ведь сло- сложение нулевого вектора с самим собой и умножение его на любое число дают снова нулевой вектор. Эти совершенно наглядные соображения приводят к предположению о справедливости следую- следующей общей теоремы. Теорема. Пересечение двух подпространств любого простран' ства само является подпространством. Действительно, пусть Lt и L2 — данные подпространства про- пространства L. Если векторы а и Ь содержатся в пересечении этих подпространств, то они будут содержаться также и в каждом из них в отдельности, например в Lv Но так как Ll есть подпро- подпространство, то сумма этих векторов а -\-Ь и произведение ka одного из них на любое число также принадлежит подпространству. Из тех же соображений следует, что эти сумма и произведение принадле- принадлежат также и другому подпространству Ъг, а значит, и пересечению этих подпространств. Наше утверждение доказано. Конечно, можно говорить также и о пересечении любого числа подпространств. Оно будет также подпространством рассматриваемого пространства. Подпространства могут содержаться одно в другом: это выражение будет означать просто, что каждый вектор, принад- принадлежащий первому из них, является также и вектором второго. Например, пересечение двух или большего числа подпространств
58 ВЕКТОРНЫЕ ПРОСТРАНСТВ V И ЛИНЕЙНЫЕ ПРЕОБРЛЗОВЛНИЯ содержится в каждом из первоначально заданных подпространств. Ясно, что если подпространство L, пространства L содержится в дру- другом подпространстве L2 того же пространства, то Z, может рас- рассматриваться так же, как подпространство L2- Отметим также, что любое пространство может рассматриваться как подпро- подпространство в себе самом: это вполне согласуется с принятым нами определением. Если нам нужно подчеркнуть, что рассматриваемое подпространство не совпадает со всем пространст- пространством, то мы будем называть его собственным подпростран- подпространством. Легко видеть, что если задано произвольное множество М век- векторов пространства L, то совокупность всех их линей- линейных комбинаций образует уже подпространство в L: ведь сумма двух линейных комбинаций векторов множества М и произ- произведение любой из этих линейных комбинаций на любое число рас- рассматриваемого поля К будут снова линейными комбинациями век- векторов множества М. Это подпространство называется подпростран- подпространство и, порождаемым данным множеством векторов. Наибольший интерес для нас будут представлять случаи, когда рассматриваемое множество векторов конечно. В случае векторного пространства элементарной геометрии под- подпространство, порождаемое одним вектором, является сово- совокупностью векторов, лежащих на определяемой этим вектором пря- прямой линии. То же самое подпространство порождают и два вектора этой прямой, если хотя бы один из них отличен от нуля. Однако если мы возьмём два вектора, не лежащих на одной прямой, то порождаемое ими подпространство будет уже плоскостью. Нако- Наконец, если мы возьмём три вектора, не лежащих на одной плоскости, то порождаемое ими подпространство будет попросту совпадать со всем пространством. Можно указать ряд подпространств в тех пространствах, кото- которые были определены в примерах 1—4 § 8. Например, в простран- пространстве Fa,, уже рассматривавшемся в предыдущем параграфе, в качестве подпространства содержится созокупность многочленов, не содер- содержащих нечётных степеней х. Легко видеть, что размерность этого подпространства так же бесконечна, как и размерность самого про- пространства: ведь 1, х*, ... , x'in, ... линейно независимы (см. § 10). Однако в том же пространстве имеются и подпространства конечной размерности. Так, пространство Fn многочаенов, степень которых не превышает п, содержится в F^ в качестве подпространства. То, что размерность этого подпространства конечна, ясно из того, что все многочлены степени п или меньше представляются линейными комбинациями «одночленов» 1, х, х1, ... , Xй, также являющихся «векторами» нашего пространства. Доказанные в предыдущем параграфе теоремы дают возможность во многих случаях просто определить, какова размерность того или
ВЕКТОРНЫЕ ПРОСТРАНСТВА 59 иного пространства, как это сделано выше в случае пространства л-мерных числовых векторов. Например, размерность пространства Fn многочленов степени =ёл равна и-{- 1, так как «векторы» этого пространства 1, х, ... , хп линейно независимы и любой вектор (т. е. любой многочлен ука- указанной степени) представляется их линейной комбинацией. Между размерностями пространства и его подпространства имеет место такое соотношение: Размерность любого подпространства не превосходит размер- размерности пространства. Если размерность пространства конечна, то размерность любого собственного подпространства строго мень- меньше размерности пространства. В самом деле, первое утверждение очевидно, так как всякая линейно независимая система векторов по дпростра нства будет также линейно независимой системой векторов всего простран- пространства. Для доказательства второго утверждения предположим про- противное. Возьмём некоторую максимальную линейно независимую систему векторов подпространства. Число входящих в неё век- векторов равно в точности размерности подпространства, а следова- следовательно, и размерности пространства, так как эти размерности пред- предположены равными. По этой причине она будет также макси- максимальной линейно независимой системой векторов всего про- пространства. Но в таком случае эта система, по доказанной в предыдущем параграфе теореме должна быть эквивалентна всему пространству. Это, в частности, означает, что любой вектор про- пространства является линейной комбинацией векторов нашей систе- системы, которые все принадлежат подпространству. Принимая теперь во внимание, что любая линейная комбинация векторов подпространства принадлежит к этому же подпространству, получаем, что любой век- вектор пространства принадлежит рассматриваемому подпространству, так что подпространство не будет собственным. § 12. Применение к системам уравнений Мы сделаем сейчас небольшое отступление от изложения общей теории, чтобы дать понять, каким образом развиваемые здесь сообра- соображения могут оказаться полезными для исследования систем уравнений. Пусть дана некоторая система линейных уравнений | • • • + аЧтХт = Ь2> }¦
60 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫВ ПРЕОБРАЗОВ \НИЯ Здесь мы не предполагаем, что число уравнений системы рапно числу неизвестных: оно может быть как больше, так и меньше этого числа. Требуется найти способ узнать, имеет ли данная система ре- решения и (если она их имеет) каково число решений. Наконец, желательно также указать способ нахождения всех решении системы. Все эти вопросы, как мы увидим, легко сводятся к некоторым вопросам о векторах, тесно примыкающим к только что рассмо- рассмотренным. Действительно, будем рассматривать каждый столбец коэф- коэффициентов при одном и том же неизвестном, а также и столбец свободных членов как и-мерные числовые векторы. Обозначим эти векторы, соответственно, через а, ат и Ь. Тогда система A) может быть записана в виде одного уравнения а1х1-\га^сч,-\-...-\гатхт=^Ь. B) Любое решение системы A), т. е. любая совокупность значений неизвестных, удовлетворяющая системе A), будет также удовле- удовлетворять, уравнению B), и наоборот. Это следует просто из того, что уравнение B) является лишь иной записью системы A). Это может быть сформулировано другими словами так: Система уравнений A) имеет решение тогда и только тогда, когда вектор Ь является линейной комбинацией векторов alt a2, ... , ат. Как мы увидим дальше, особенно важной для нас будет сле- следующая формулировка того же по существу результата: Система уравнений A) тогда и только тогда имеет решение, когда ранги систем векторов аи at, ... , ат ч а„ а2 ат, Ь равны. Действительно, ранг системы векторов есть число векторов максимальной линейно независимой части этой системы. Если ранги систем ах, а2, ... , ат и alt a2 ат, Ь равны, то максималь- максимальная линейно независимая часть системы alt a2, ... , ат будет также максимальной линейно независимой частью системы at, а2, , ат, Ь. Но по доказанной в предыдущем параграфе теореме максимальная линейно независимая часть любого множества эквива- эквивалентна этому множеству векторов. Так как в нашем случае она будет эквивалентна обеим рассматриваемым системам, то эти послед- последние будут эквивалентны между собой, а следовательно, вектор Ь будет линейной комбинацией векторов alt a.2> - ¦ • > ат> и система имеет решение. Наоборот, если решение системы A) существует, то вектор Ь оказывается линейной комбинацией секторов системы alt a2, ... , ат. Отсюда сразу видно, что кажцый из векторов любой из рассматри-
ВЕКТОРНЫЕ ПРОСТРАНСТВА 61 ваемых систем будет линейной комбинацией векторов другой си- системы (сомнения могли бы возникнуть лишь в отношении вектора Ь), т. е. эти системы эквивалентны. Полученное условие существования решения системы A) может быть формулировано и в терминах подпространств. При этом резче бросится в глаза совпадение полученного результата с тем, который был формулирован в § 1 для случая системы двух уравнений с двумя неизвестными. Разница состоит лишь в том, что здесь мы одной формулировкой охватываем все возможные случаи. Эта формулировка такова: Система A) тогда и только тогда имеет решение, когда вектор Ь содержится в подпространстве, порождаемом векто- векторами с„ с2, ... , ат. Читателю предлагается самому установить справедливость этой формулировки и привести её в связь с формулировкой, данной в § 1. Исходя из изложенных соображений, можно получить также условие единственности решения системы A). Решение системы A) будет единственным в том и только в том случае, когда векторы alt ... , ат линейно независимы (мы предполагаем здесь, что решение существует). В самом деле, пусть векторы с,, ... , ат линейно независимы. Если бы система A), значит и уравнение B), имела бы два раз- различных решения xlt ... , хт и х[, ... , х'т, то из равенств • • • + а-тХт = Ъ' alx[-\-...-{-amx'm=b получалось бы равенство с, (х1 — х[)-\-...-\-ат(хт —х'т) = 0. Но линейная комбинация линейно независимых векторов может быть равна нулю только в том случае, когда её коэффициенты (xt— x'i), (лг2 — х-д, ••• . (хт — х'т) равны нулю. Это противоречит тому, что взятые нами решения различны. Наоборот, если векторы с,, ... , пт линейно зависимы, то найдётся их линейная комбинация, не все коэффициенты которой равны нулю, равная нулю: с^, -]- a2k2 -j-... -\- o.mkm = 0. Тогда из любого решения х„... , хт уравнения B) можно образовать новое решение J^-f&i. *2 + &2, ••• , xm-\-km, отличное от первона- первоначального. В самом деле, = a1xl-\-...-\-amxm=b,
62 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕ0БРА30В\НИЯ т. е. вновь образованная система значений неизвестных действи- действительно удовлетворяет уравнению B). . Мы ограничимся пока этими результатами. Их мы будем в со- состоянии ещё уточнить, после того как найдём способ вычисления ранга систем векторов. § 13. Базис пространства. Координаты В конце § 11 мы видели, что любая максимальная линейно не- независимая система векторов какого-либо множества эквивалентна всему этому множеству. В частности, максимальная линейно неза- независимая система еи ... , е„ векторов пространства L эквивалентна всему пространству. Это означает, что любой вектор х простран- пространства может быть представлен в виде линейной комбинации векто- р'ов нашей системы: -...-\-еях„ A) где xt—некоторые числа рассматриваемого числового поля. Но равенство A) можно рассматривать как уравнение относи- относительно неизвестных коэффициентов хи , хп. Полученное в пре- предыдущем параграфе условие единственности решения та- такого уравнения в рассматриваемом случае выполнено, так как век- векторы е,, , е„ линейно независимы. Подобное положение, замеченное нами в § 1 в случае векторов плоскости, дало возможность ввести для векторов плоскости коор- координаты. Это же может быть теперь сделано в случае произволь- произвольного векторного пространства L над числовым полем К. Будем называть любую максимальную линейно независимую систему векторов ех е„ пространства L его базисом (или базой). Если задан такой базис, то равенство A) сопоставляет с каждым вектором систему чисел хи , хп. Эти числа мы будем называть координатами вектора х относительно базиса еи ... , е„. Ясно, что любые значения координат будут соответствовать некоторому вектору пространства L (конечно, если они берутся из того числового поля, на котором определено наше пространство). Введение координат, как и в обычном случае, даёт возможность сводить исследование систем векторов к исследованию систем чисел. Однако, в случае обычной аналитической геометрии, мы получаем таким образом только аппарат, помогающий часто более просто решать задачи, которые могут быть решены и другим геометрическим способом. В общем же случае такое сведение к чи- числам будет единственным способом, которым мы вообще в со- состоянии решать задачи, так как никаких «геометрических» методов в нашем распоряжении нет.
ВЕКТОРНЫЕ ПРОСТРАНСТВА 63 Следует отметить, что термином координаты мы уже пользовались выше для числовых векторов: координатами вектора с = W были названы сами числа аи , ап, составляющие вектор. Вспо- Вспоминая, что в этом случае вектор может быть представлен в виде а = а1е1 -\- -(- апеп и что «единичные» векторы еи , еп линейно независимы, можно сказать, что теперь было бы правильнее на- назвать числа <21( ап координатами вектора а по отношению к ба- базису еи ... , еп /г-мерного числового пространства. Такая оговорка действительно необходима, так как мы можем рассматривать вместо базиса еи .. , е„ любой другой базис е\ е'п (в нём, конечно, содержится то же самое число векторов), причём координаты того же вектора по отношению к новому базису будут иметь уже другие значения. То обстоятельство, что координаты вектора не являются чем-то абсолютным, а зависят от выбора базиса, тотчас же ставит перед нами такие вопросы: 1) Как узнать, можно ли данную систему векторов принять за базис пространства? 2) Как связаны между собою координаты одного и того же вектора относительно двух разных базисов пространства? Рассмотрим, прежде всего, первый вопрос. Пусть в простран- пространстве L задан какой-либо базис et е„ и пусть дана некоторая система векторов е[, е%, , е'т. Каждый из векторов этой си- системы может быть однозначно представлен линейной комбинацией векторов заданного базиса. Коэффициенты полученных линейных комбинаций мы будем обозначать одной и той же буквой ctj с двумя индексами, второй из которых соответствует номеру вектора е), а первый — тому из векторов е,-, при котором коэффициент стоит. Таким образом, , , , , е, = е,си + е.гс21 + • • • + епсп1, 4- • • • + е„сп2, е'2 = е,с ,с12 е'т = e,cIm 4" ^ Коэффициенты су, естественно, таблицу, или матрицу m \~ • • • ~T~encnm- располагаются в B) прямоугольную C)
64 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ которую будем называть матрицей перехода от базиса el7 ... , еп к системе е\, ... , е'т. Иными словами, матрицей перехода от базиса е,, е2, ... , еп к системе е\, е'ъ , е'т мы назвали матрицу, столбцы которой составлены из координат векторов системы ej, ... , е'п относи- относительно данного базиса. Эта матрица однозначно определена при заданной системе е\, , е'т и сама определяет эту систему (конечно, при заданном базисе еи ... , е„). Стоящий перед нами вопрос может быть теперь формулирован точнее следующим об- образом: как по матрице перехода C) узнать, является ли си- система векторов е\, ... , е'т базисом пространства L? Ответ па этот вопрос даётся такой теоремой: Теорема. Для того чтобы система е\, е'ч, ..., е'т была ба- базисом пространства L, необходимо и достаточно, чтобы матрица перехода C) быЛп квадратной и чтобы составленный из неё опре- определитель был отличен от нуля. В самом деле, система е[, ... , е'т только тогда может быть базисом пространства L, когда число векторов этой системы равно п (ведь число элементов векторов в любых базисах простран- пространства L одно и то же). Для доказательства того, что определитель матрицы C) отличен от нуля, если т = п и система е[, ... , е'т является базисом, воспользуемся соображениями § 2—4. Для любых векторов i = е,*,, + е.2х.г1 -\-... + епхп1, A) пространства L положим: г (ДГ|, д:2, ... , лт„) = -+-•¦¦ + епХ„„, J ¦^11 -^12 • • • Х\п ¦Лп) jCaa * ¦ • -А-п.) Knl ... Х„ E) Этим определена некоторая функция от п векторов пространства, не равная тождественно нулю, так как её значение F(elt ... , е„)= 1 по самому определению этой функции. С другой стороны, если положить jc,=ei хп = е'п, то значение функции F обратится в интересующий нас определитель матрицы C). Обратим теперь внимание на то, что наша функция обладает свойствами А) и Б) определения, сформулированного в § 2. Поэтому для неё будут верны также и следствия этих свойств, доказанные в § 2, в част- частности распределительный закон и свойство менять знак при пе- перестановке аргументов. Если система е[, , е'п является базисом пространства, то эти свойства позволяют получить другое вираже-
ВЕКТОРНЫЕ ПРОСТРАНСТВА 65 ние той же функции: векторы xlt ... , хп запишутся в выражении через базис е\, ... , е'п таким образом: ATj = в\Х\\ —f- вчХух -J— - -. |— епхп\, х,_ = е\х'п + e'ix'n -\-., е'пх'п Хп = в\Х\п - Подставляя эти выражения в F'{хх, х%, ... , хп) и пользуясь рас- распределительным законом и правилом перестановки аргументов, по- получим, как и в § 4, выражение г (х1, хя) — х\п Хп\ Х„ F{e\,ei, ...е,',). G) Нужный нам результат следует из самой возможности такого выражения: если бы значение нашего определителя, т. е. значение F[е[, ... , е'п), было равно нулю, то выражение G) давало бы тождественный нуль для любых векторов xv ... , хп, вопреки определению функции F(хи ... , хп). Таким образом, оба условия теоремы являются необходи- необходимыми для того, чтобы система векторов е[, , е'п была базисом пространства L. Предположим теперь, что эти условия выполнены: число векто- векторов е) равно п и указанный определитель не равен нулю. Система е\, , е'п могла бы не быть базисом пространства L только в том случае, когда один из её векторов был бы линейкой комби- комбинацией остальных, например «=2 По в этом случае получаем равенство / п F(e\, е'ь ... , e'n)~F [У k 'i, е'ъ . еп = противоречащее сделанному предположению. Теорема доказана. Второй из поставленных выше вопросов также легко решается: пусть некоторый вектор х имеет относительно базиса е\, ... , е'п координаты х[, x'i, ... , х'п. Тогда x = e[x'i-\-e'iX2-\-...-\-e'nx'n. Б 8ицв«ло:'СД1!!1, кв. 2.
66 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ Подставляя сюда выражения B) для векторов нового базиса через старый, получим равенство х = {ехсп -}-...-}- епсп1) х\ -]-...-]- (е,е,„ ~\-... -\- е„с„„) х'п = = е, (сих[ -\- спх2 -f... + с1пх'п) -f • • ¦ -f- еп (cnlx[ +... + сппх'п). Сравнивая это выражение с первоначальным выражением A) век- вектора х через векторы базиса еи ... , еп и учитывая, что коор- координаты вектора определены (при заданном базисе) однозначно, по- получим систему равенств Х2 == >-21л1 "Г <'22-л'2 ~Т~ • • • ~Г ь2плЛ1 I /-g-) Хп ^l-^I "Г CniX2 "Т " * * "Г СППХП> .выражающих «старые» координаты лг, хп вектора х через его «новые» координаты х[, ... , х'п. Равенства (8) при заданных «старых» координатах xlt ... , хп можно рассматривать как систему п уравнений с п неизвестными. Определитель этой системы есть определитель матрицы C) и по- поэтому отличен от нуля, так что система (8) допускает единственное решение (в силу доказанной в главе I основной теоремы о систе- системах линейных уравнений). Таким образом, знание координат век- вектора относительно любого из рассматриваемых базисов доста- достаточно для определения их относительно другого базиса, если известна матрица перехода, связывающая базисы. § 14. Ранг произвольной системы векторов Полученный в предыдущем параграфе результат даёт возмож- возможность узнавать, равен ли ранг системы векторов размерности рас- рассматриваемого пространства. Этот результат может быть теперь обобщён так, что в нашем распоряжении окажется способ, позво- позволяющий вычислить ранг произвольной системы векторов. Рассмотрение любых систем векторов сводится к рассмотрению базиса пространства с помощью простой теоремы, непосредственно получающейся из доказанной выше теоремы о замене. Теорема. Если е,, , еп есть базис п-мерного простран- пространства L, а е\, е'ъ ... , е'т — произвольная линейно независимая си- система векторов того же пространства, то эта система может быть дополнена некоторыми из векторов еи ... , е„ до базиса пространства L. Действительно, векторы е\, , е'т являются линейными комби- комбинациями векторов базиса elt ... , еп. Поэтому в силу того, что векторы е\, ... , е'т линейно независимы, и в силу теоремы о за- ыене часть векторов базиса ех, ... , еп (если /и = я, то ьсе
ВЕКТОРНЫЕ ПРОСТРАНСТВА 67 векторы базиса) может быть заменена векторами е[, , е'т так, что вновь полученная система векторов будет эквивалентна перво- первоначальному базису. Это значит, что любой вектор пространства может быть записан в виде линейной комбинации векторов вновь полученной системы. Если бы эта система не была линейно не- независимой, то из неё можно было бы удалить хотя бы один век- вектор без потери только что указанного свойства. Однако векторы /г-мерного пространства не могут быть все выражены линейными комбинациями меньшего числа векторов, чем п. Таким образом, векторы системы, полученной после замены, должны быть все л и- нейно независимы, и эта система будет базисом про- пространства. Как видно из проведённого построения, полученную систему можно рассматривать так же, как систему ej, ... , е'т, к которой, быть может, добавлены некоторые из векторов заданного базиса еи ... , еп. Следует отметить, что если бы система eit ... , ет была ли- линейно зависимой, то добавление к ней других векторов не может дать базиса пространства: любая часть базиса, как и любой ли- линейно независимой системы векторов, должна быть сама линейно независимым множеством. Доказанную теорему и сделанное замечание применим к произ- произвольной системе векторов ei — elcli-\-...-)rencra, е'т = е1с1т -]-... -\-епспт (т^п). A) Матрица перехода от базиса ех, ... , еп к системе е\, ... , е'т за- запишется так: C2m B Присоединим теперь к системе векторов е[ е'т ещё п — т произвольных различных векторов базиса е,, ... , е„. Полученная система п векторов будет соответствовать матрице перехода, обра- образующейся из матрицы A) приписыванием к ней ещё п — т столб- столбцов, в каждом из которых все элементы, кроме одного, равны нулю, а этот единственный элемент равен единице (разложение любого из векторов базиса имеет вид ei = el • 0 -\- -\- е,- • 1 —]—... —|— —1— е„ • 0). Следует подчеркнуть, что единицы будут стоять в раз- различных строчках матрицы. 6*
68 ВЕКТОРНЫЕ ПРОСТР\НСТВ\ И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ Согласно результату предыдущего параграфа векторы расши- расширенной системы будут образовывать базис пространстоа в том и только в том случае, если определитель новой матрицы перехода отличен от нуля. Но если учесть то, что было сказано о строении матрицы пере- перехода, мы сразу замечаем возможность разложить определитель этой матрицы по элементам последнего столбца (так как в последнем столбце имеется только одна единица, а остальные элементы равны нулю). Эту операцию можно продолжить и дальше, пока не дойдём до столбцов первоначальной матрицы B). В результате мы полу- получаем, что интересующий нас определитель совпадает, с точностью до знака, с определителем, полученным из матрицы B) вычёрки- вычёркиванием тех строк, в которых стояли единицы приписываемых к этой матрице дополнительных столбцов. Ко это в связи с доказанной только что теоремой сразу даёт такой результат: Теорема. Векторы A) линейно независимы тогда и только тогда, когда из матрицы B) можно так вычеркнуть п — т строк, чтобы определитель оставшейся квадратной матрицы был отличен от нуля. Действительно, если можно таким образом вычеркнуть строки, то, добавляя к векторам е,, ... , ет векторы eit номера которых совпадают с номерами вычеркнутых строк, мы согласно доказанному получим систему векторов, для которой определитель соответствую- соответствующей матрицы перехода отличен от нуля. Эта система будет в силу результата предыдущего параграфа базисом пространства, а следо- следовательно, исходная система линейно независима. Наоборот, если при вычёркивании любых п — т строк ма- матрицы B) получаются квадратные матрицы, определители которых равны нулю, то, как бы мы ни добавляли к заданной системе векторы базиса е,, ... , ет, ни одна из получаемых систем п век- векторов не будет базисом пространства. Это возможно только в слу- случае, когда векторы системы еи ... , еп линеЛно зависимы. Нам остаётся только освободиться от сделанных ограничений, связанных с числом векторов системы е,, ... , ет. Результат, от- относящийся к любому числу этих векторов, получается из преды- предыдущего без всякого труда. Однако для его формулировки полезно ввести один вспомогательный термин. Пусть дана произвольная матрица •-22 • - • Нт I C) Она может не быть квадратной, причём число её столбцов может
ВЕКТОРНЫЕ ПРОСТРАНСТВА С9 быть как больше, так и меньше чиста строк. Из матрицы C) можно, вычёркивая некоторое число строк и некоторое число столбцов, раз- различными способами образовать квадратные матрицы. Определи- Определители получаемых таким образом матриц называются минорами ма- матрицы C). Некоторые из этих миноров могут быть отличны от нуля, другие, наоборот, равны нулю. Рангом матрицы C) мы будем называть наибольший порядок отличного от нуля минора этой матрицы. Ранг любой матрицы можно вычислить: для этого достаточно, например, вычислить все миноры матрицы и посмотреть, миноры какого порядка отличны от нуля. Вычисление может быть ещё упрощено, так как обращение всех минороз какого-либо порядка в нуль влечёт за собою обращение в нуль и всех миноров более высокого порядка (эти миноры, как и любые определители, могут быть выражены через миноры более низкого порядка!). Это делает ненужным вычисление всех миноров: достаточно обнаружить, что все миноры какого-либо порядка равны нулю, а миноры порядка на единицу меньшего не все равны нулю. Дальнейшие упрощения вычисления ранга будут указаны ниже. Вычисление ранга произвольной системы векторов может быть теперь проведено, основываясь на следующей теореме: Теорема. Если е\, ... , е'т есть система любого числа век- векторов пространства L, то её ранг равен рангу матрицы пере- перехода, связывающей эту систему с любым базисом нашего про- пространства. В самом деле, если ранг матрицы перехода равен г, то суще- существует минор этой матрицы, отличный от нуля и имеющий поря- порядок г. Пусть в этот минор входят элементы некоторых столбцов матрицы перехода. Взятые столбцы сами образуют матрицу пере- перехода от базиса е,, ... , еп к системе векторов е)х, , е)г, но- номера которых соответствуют номерам рассматриваемых столбцов. А так как из этих столбцов можно образовать отличный от нуля минор г-го порядка, то по доказанному выше векторы е)х, ... , е)г линейно независимы. Наоборот, если мы возьмём любую часть системы векторов el, ... , е'т, содержащую большее число элементов, чем г, то при- применение к этой части только что доказанного критерия линейной независимости даёт отрицательный результат, так что эта часть системы будет линейно зависимой. Таким образом, максимальное число линейно независимых век- векторов, которое может быть выбрано из системы е\, ... , е'т, точно равно рангу матрицы перехода. Доказанная теорема позволяет получить одно любопытное след- следствие: до сих пор, говоря о числовых векторах, мы понимали под этими словами столбцы, составленные из чисел рассматриваемого
70 ВЕКТОРНЫЕ ПРОСТРАНСТВ \ И ЛИНЕЙНЫЕ ПРЕОБР \ЧОВ \НИЯ поля; но легко видеть, что в совокупности всех строк, содержащих по т чисел данного поля К, можно ввести такие же операции сложения и умножения на число, как и в случае столбцов. Тем самым множество строчек делается векторным пространством, и мы получаем право говорить о линейной независимости строк. В част- частности, можно говорить о линейной независимости строк некоторой матрицы. То обстоятельство, что миноры матрицы не изменяются от замены их строчек столбцами, позволяет на основании только что доказанной теоремы утверждать следующее: Максимальное число линейно независимых столбцов, которое молено выбрать из данной матрацы, равно максимальному числу её линейно независимых строк. § 15. Решение произвольных систем линейных уравнений Теоремы, доказанные в двух последних параграфах, позволяют не только придать окончательную форму результатам, полученным в § 12, но и получить приём, позволяющий фактически получать все решения любой системы линейных уравнений. В самом деле, пусть дана система п уравнений с т неизвест- неизвестными аих1-]г...-\-ашхт = Ь1, аПх1 Л~ • • • 4~ aimxm = ^2> ап1х1 -}-...-\- аптхт = Ьп. A.) Столбцы коэффициентов при неизвестных и столбец свободных членов этих уравнений являются, как мы знаем, столбцами коорди- координат числовых векторов, обозначенных в § 12 через Cj,..., am и Ь (координаты относятся к базису из «единичных» векторов ех е„ числового пространства). Пользуясь тем, что необходимым и достаточным условием существования решения системы A) является равенство рангов систем векторов at, са,..., ат и av..., ат, Ь (см. § 12), и связью между рангом системы векторов и рангом ма- матрицы, можно иначе формулировать полученный в § 12 ре- результат. Будем называть матрицу, составленную из коэффициентов при неизвестных, просто матрицей системы, а матрицу, получае- получаемую из неё приписыванием к ней столбца свободных членов,— расширенной матрицей системы. Тогда необходимое и достаточное условие существования решения системы A) примет такую форму: Теорема1). Для того чтобы система A) имела хотя бы одно решение, необходимо и достаточно, чтобы ранг матрицы системы был равен рангу расширенной матрицы. *) Эта теорема пазывается иногда теоремой Кропекера-Капедли.
ВЕКТОРНЫЕ ПРОСТРАНСТВА 71 Если указанное условие выполнено, то следующий приём даёт возможность найти все решения системы A). Пусть ранг матрицы системы и ранг расширенной матрицы равны г. Так как, в силу замечания в конце предыдущего параграфа, число г есть также максимальное число линейно независимых строк расширенной ма- матрицы, то все её строки будут линейными комбинациями некото- некоторых г строк. Но это означает, другими словами, что все уравне- уравнения системы A) являются следствиями некоторых г уравнений системы A) (все уравнения могут быть получены из уравнений, соответствующих линейно независимым строкам, умножением обеих частей каждого из последних уравнений на подходящие числовые множители и сложением соответствующих частей). Таким образом, в рассматриваемом случае достаточно получить решение этих г уравнений, ибо любое их решение будет также решением остальных. Так как нумерация уравнений произвольна, можно предположить, что упомянутыми уравнениями являются первые уравнения системы , , апх,-\-...-\-а,тхт = Ь1, aiIx1-\-...-{-a2mxm = bi, arixx-\-...-\-armxm*=br. . B) Из существования решения всей данной системы вытекает, что ре- решения такой «укороченной» системы подавно существуют. Поэтому ранг матрицы коэффициентов при неизвестных в новой системе будет также равен г. Последнее в свою очередь означает, что из столбцов этих коэффициентов можно выбрать г столбцов так, что- чтобы составленный из них определитель был отличен от нуля. Но нумерация столбцов зависит от нумерации неизвестных, которой мы можем распоряжаться по своему усмотрению. Следовательно, мы можем опять предположить, что такими столбцами являются пер- первые г столбцов. Если число неизвестных равно г, то взятые столб- столбцы исчерпывают все столбцы матрицы системы. В таком случае система B) будет системой г уравнений с г неизвестными, опреде- определитель которой отличен от нуля. Но из § 7 мы знаем, что такого рода система всегда имеет единственное решение, определяемое формулами Крамера.Из проведённых рассуждений вытекает, что это ре- решение и будет решением (также единственным) системы уравнений A). Если же г меньше числа неизвестных, то мы перенесём члены с неизвестными лгг+1, ..., хт в правую часть уравнений систе- системы B). Получим систему а1гхг — "\ al. r+J -*V+1 • • • alm-xm> = Pg Qjj, r+j Xr+i . . . C!^mXm, C)
72 BFKTOPKblE ПРОСТРАНСТВА И ЛКИНЧНЫЕ ПРЕОБРАЗОВАНИЯ Перенесённые направо неизвестные называются свободными неиз- неизвестными, так как мы можем придать каждому из них произволь- произвольное значение, подставить в систему C) и решить её относительно неизвестных х1г..., хг (так как определитель этой системы отличен от нуля). Таким образом, возникает бесконечное множество реше- решений системы A), получаемых изменением значений свободных неизвестных. Легко видеть, что таким образом получаются все решения системы C), а следовательно, и системы A). В самом деле, если х\,..., х'п х'г+1,..., х'т есть какое-либо решение системы C), по- положим в системе C): хг+1=х'г+1 хт~х'т. При этих условиях система C) должна однозначно определить значения неизвест- неизвестных хи..., хг, удовлетворяющие системе B). Но такие значения нам уже известны: они равны х\,..., х'г, следовательно (в силу однозначности!), именно их мы и получим, решая систему C) по ука- указанному выше правилу. Резюмируя сказанное, получаем такой результат: Теорема. Если общее значение ранга матрицы системы A). и расширенной матрицы той же системы меньше числа неизве- неизвестных, то система имеет бесконечное множество решений. Если же общее значение рангов указанных матриц разно числу не- неизвестных, то система A) имеет единственное решение. Отметим один важный частный случай этого результата. Система A) называется однородной, если все езободные члены уравнений равны нулю. В случае однородной системы ранг расши- расширенной матрицы никогда не может отличаться от ранга матрицы коэффициентов при неизвестных: добавление к системе векто- векторов нулевого вектора не меняет ранга системы. Поэтому решение однородной системы должно всегда существовать (хотя бы одно). Такой результат ясен сразу: если мы в однородной системе урав- уравнений положим значения всех неизвестных равными нулю, то мы удовлетворим системе. Это нулевое решение обычно не представ- представляет интереса (хотя бы уже потому, что оно никак не связано с коэффициентами уравнений, а следовательно, и с постановкой за- задачи, приведшей к этой системе). Интересными являются только решения, отличные от нулевого. Сформулированная только что тео- теорема позволяет высказать следующее условие существования таких решений. Теорема. Для того чтобы система однородных уравнений обладала решением, отличным от нулевого, необходимо и доста- достаточно, чтобы ранг матрицы системы был меньше числа неизвестных. В самом деле, в таком случае должно существовать бесконечное множество решений данной системы. Так как нулевое решение — только одно, то должны существовать и ненулевые решения. Эта полезная теорема принимает особенно простую форму в случае системы п уравнений с п неизвестными:
ВЕКТОРНЫЕ ПРОСТРАНСТВА 73 Теорема. Для того чтобы однородная система п уравнений с п неизвестными имела ненулевое решение, необходимо и доста- достаточно, чтобы определитель этой системы равнялся нулю. Действительно, из матрицы коэффициентов при неизвестных мож- можно составить в этом случае только один минор «-го порядка — определитель системы (в матрице всего п строк и п столбцов). Поэтому обращение единственного минора порядка п в нуль необ- необходимо и достаточно для того, чтобы ранг матрицы был меньше п. § 16. Геометрическая интерпретация. Системы с тремя неизвестными Используем теперь наш геометрический аппарат для того, чтобы получить обзор всей совокупности решений рассматрива- рассматриваемой системы линейных уравнений. Для этого будем рассматривать любую комбинацию значений неизвестных х{, хг,..., хт как вектор /и-мерного числового пространства. Если рассматриваемая комбина- комбинация будет решением системы уравнений, то мы будем говорить, что этот вектор есть решение данной системы. Так как в общем случае отнюдь не каждый вектор будет ре- решением интересующей нас системы уравнений, то решения будут заполнять собою только некоторую часть всего пространстве. Наша задача будет состоять в том, чтобы охарактеризовать эту часть. Начнём со случая однородной системы: апх1 + aioX2 + • • • + aimxm = О, • + аптхт = 0. Простой подстановкой легко убедиться в том, что если векторы х'=:(х\, х>,... ,х'т) и х" = (х", x'i,..., х'п) (мы их пишем для удоб- удобства в виде строк) являются решениями этой системы, то векторы Х-\-у = (х[-\-х'{ Хт-\- Хт) И kx = {kx\, kx'% ..., kx'm) (при любом числовом множителе К) также будут решениями этой систе- системы. Таким образом, совокупность решений содержит вместе с лю- любым вектором и все его числовые кратные, а вместе с любыми двумя векторами — их сумму. Другими словами (ср. § 11): Совокупность решений однородной системы уравнений всегда является подпространством т-мерного числового пространства, где т — число неизвестных в системе. Легко определить также и размерность этого подпространства. Именно, имеет место Теорема. Размерность подпространства решений однородной системы уравнений с т неизвестными равна т — г, где г — ранг матрицы системы. В самом деле, пусть мы уже выбрали г независимых уравнений данной системы, как это было сделано в предыдущем параграфе,
74 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ и выбрали подходящим образом т — г «свободных неизвестных» хг+1,..., хт. Тогда все решения исходной системы мы получим, придавая свободным неизвестным произвольные значения и опреде- определяя остальные неизвестные из системы уравнений • • • -\~ а1гхг — — Gl,r+J-*V+1 а\\х\ • — а\тхт> arlxj -f аг„хг -f... -\- arrxr = — ar,r+lxr+1 —... — armxm. При этом в силу доказанного в § 15 каждой комбинации значе- значений свободных неизвестных будет соответстзовать в точности одна комбинация значений остальных неизвестных, а следова- следовательно, и одно единственное решение первоначальной системы. Придадим теперь свободным неизвестным последовательно сле- следующие комбинации значений (число их равно т — г): X, r+2 = 0, 1 0, хт =0, 0 1. Этим комбинациям значений будут соответствовать векторы I х\\ /х\'\ Хг 1 0 W X = vfm—r) 2 0 0 1 A) являющиеся решениями первоначальной системы. Покажем, что они образуют базис подпространства решений. Тем самым будет уста- установлено, что размерность этого подпространства равна т — г (чи- (числу базисных векторов). Для доказательства нужного утверждения достаточно обнару- обнаружить, что векторы A) линейно независимы и что любой вектор, являющийся решением данной системы, представляется их лилейной комбинацией.
ВЕКТОРНЫЕ ПРОСТРАНСТВА 75 Первое обстоятельство очевидно: линейная комбинация рассма- рассматриваемых векторов имеет вид \ k\ B) km-r\ где в столбце точки означают г первых чисел. Очевидно, что эта линейная комбинация может оказаться нулевым столбцом только в том случае, когда все числа А,, ?2,..., km_r равны нулю. Пусть теперь имеется произвольное решение данной однород- однородной системы хх х„ C) Почьзуясь выражением B), легко видеть, что можно образовать линейную комбинацию решений A), в которой свободные неизвест- неизвестные будут иметь те же значения, что и в решении C): для этого достаточно взять k1=xr+l, kt = xr+«,..., km_r = xm. Почученная так линейная комбинация решений A) догжна оказаться также ре- решением заданной системы (ибо множество решений является под- подпространством). Замечая теперь, что у рассматриваемой системы может быть только одно решение с данными значениями свобод- свободных неизвестных, заключаем отсюда, что полученная линейная комбинация должна совпасть с решением C), а это и нужно. Полученный результат охватывает и случай, когда г = т, т. е. когда свободные неизвестные отсутствуют: в этом случае сущест- существует только одно нулевое решение, само по себе образующее под- подпространство, которое не содержит ни одного линечно независи- независимого вектора и которое поэтому естественно называть нульмерны^..
76 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ Теперь мы в состоянии рассмотреть случай произвольной не- неоднородной системы [система A) предыдущего параграфа]. Усло- Условимся называть систему однородных уравнений, получаемую из дан- данной системы приравниванием нулю ей левых частей, соответствую- соответствующей (данной системе) однородной системой. Для этой системы [си- [система A) этого параграфа] совокупность всех решений является некоторым подпространством /л-мерного числового пространства. Рассмотрим случай, когда данная система имеет хотя бы одно решение xlfj, xifj,..., хт0. Имеет место следующий основной результат: Теорема. Совокупность решений неоднородной системы по- получается, если к каждому вектору подпространства решений соответствующей однородной системы прибавить (одно и то1 же для всех векторов) решение данной неоднородной системы уравнений. Для доказательства введём обозначение *1 =Xl ~~Г*1о> *а == *2 -р *2о хт == *'« Г -'"ото1 где х\, x'i х'т — новые неизвестные. Подставляя эти выраже- выражения xlt х%,..., хт через х[, х'ъ..., х'г1 в уравнения системы A) § 15, получим систему равенств «n*i 4- «i + («11*10 4" «12*so "f ¦ • • + «im*mo) = I «л 1*1 4" «n2*2 4" • • • 4" anmx'm 4" | 4- • • • Л-пптХто) = Ьп- \ Так как xi0, xifj,..., хт есть решение исходной системы, то сто- стоящие в скобках суммы в левых частях будут попросту равны пра- правым частям уравнений. Поэтому система D) совершенно равносиль- равносильна такой: апх\ 4" а^ЛГг 4- • • • + &1тх'т — Ьи ««1*1 4- «1.2*2 4- • • • + аптХ'т = Ьп, т. е. оказывается однородной системой, соответствующей данной системе. Проведённое преобразование показывает, что вектор (xlt х%,..., хт) будет решением первоначальной системы в том и только в том случае, когда вектор (х\, х'ч,..., х'т) будет решением соот- соответствующей однородной системы. Но это и есть требуемый результат. Сказанное становится совершенно наглядным в случае систем уравнений с тремя неизвестными, так как в этом случае трехмерные
ВЕКТОРНЫЕ ПРОСТРЛНСТПЛ 77 числовые векторы можно себе представлять в виде обычных «гео- «геометрических» векторов, имеющих те же координаты (в какой- либо координатной системе), что и данные числовые векторы. При этом рассмотрении мы можем сразу оставить в системе только не- независимые уравнения, число которых, как всегда, равно рангу дан- данной системы. Так как ранг не может превышать число неизвестных, то возможны только следующие четыре случая: А) Ранг системы равен нулю. Независимых уравнений нет, т. е. все уравнения являются тождествами: коэффициенты при неизвест- неизвестных и свободные члены равны нулю. В этом случае, очевидно, ре- решения заполняют всё пространство. Связь между решениями неод- неоднородной системы и решениями соответствующей однородной системы не имеет смысла рассматривать, так как возможны только однородные системы, удовлетворяющие поставленным условиям. Б) Ранг системы равен единице. Независимое уравнение одно «i A + а13х3 = bt. E) Соответствующая однородная система также состоит из одного уравнения + «12*2 + «13*3 = °- F) В качестве свободных неизвестных можно выбрать любые два, но так, чтобы коэффициент при третьем неизвестном был отличен от нуля. Если таким коэффициентом является ап, то можно пере- переписать уравнение E) в виде Пространство решений для уравнения F) — двумерное. Его базис мы получим, придавая лг2 и х3 следующие комбинации значений: 1, О и 0, 1. Соответствующие решения однородного уравнения будут: и ( —, О, Если изобразить эти решения в виде векторов обычного трёхмер- трёхмерного пространства, то совокупность всех решений однородного уравнения представится множеством векторов плоскости Ls, «натя- «натянутой» на построенные так векторы. Чтобы построить совокупность всех решений неоднородного уравнения, достаточно изобразить вектором х0 одно из его решений. Тогда, согласно изложенному выше, прибавляя этот век- вектор ко всем векторам построенной только что плоскости, мы по- получим требуемое. Легко усмотреть, что концы всех построенных таким образом векторов (если считать, что их начала все располо- расположены в начале координат) располагаются на плоскости, проведён- проведённой через конец вектора х0 параллельно плоскости ?2.
78 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ В) Ранг системы равен двум. Независимых уравнений два. Про- Пространство решений соответствующей однородной системы будет одномерное, т. е. будет являться совокупностью векторов, лежащих на некоторой прямой Llt проходящей через начало координат. Если х0 — любое решение неоднородной системы, то совокупность всех её решений геометрически представится множеством векторов, концы которых располагаются на прямой, проведённой через конец вектора х0 параллельно прямой Lv Г) Ранг системы равен трём. В этом случае однородная система имеет только нулевое решение. Данная система будет иметь также только одно решение, так что «совокупность всех решений» пред- представится одним единственным вектором. Геометрический смысл этого становится ещё проще, если вместо векторов говорить о точках с теми же координатами, что и векто- векторы, о которых шла речь. При этом становится привычным говорить о геометрическом месте решений. Содержание результа- результатов, полученных в только что рассмотренных случаях, может быть высказано в этих терминах так: Геометрическое место решений совместной системы линейных Уравнений с тремя неизвестными будет всем пространством, если система тождественная, плоскостью, если система содержит лишь одно независимое уравнение, прямой, если в системе два независи- независимых уравнения, наконец, точкой, если в данной системе имеется три независимых уравнения. Читатель без труда узнает в этом факты, устанавливаемые в аналитической геометрии. В заключение следует заметить, что всё предыдущее изложение можно было бы провести, всюду пользуясь понятием «точка» вме- вместо понятия «вектор». Однако необходимость пользоваться такими алгебраическими операциями, как сложение, делает это не очень удобным: непривычность оборотов речи вроде «сложение точек» только затруднила бы читателя и не позволила бы ему глубже раз- разглядеть геометрическое содержание излагаемых фактов. § 17. Применение к системам уравнений высших степеней Последняя теорема § 15 играет во многих случаях исключитель- исключительно важную роль и находит применение иногда в самых неожидан- неожиданных вопросах. В качестве примера такого применения рассмотрим решение системы двух уравнений с двумя неизвестными в случае, когда степени этих уравнений совершенно произвольны. Пусть дана такая система x.y) = 0. J Q(x. где F(x, у) и С (х, у) — произвольно заданные многочлены от
ВЕКТОРНЫЕ ПРОСТРАНСТВА 79 неизвестных х и у. Требуется определить значения х и у так, чтобы они удовлетворяли обоим уравнениям. Если бы значение одного из неизвестных было известно, то определение значения другого сводилось бы к решению уравнений уже с одним неизвестным. Для этого достаточно подставить изве- известное значение в оба уравнения, решить их каждое отдельно и после этого посмотреть, какие значения второго неизвестного будут общими в обоих случаях. Таким образом, если заниматься только вопросом, специфическим для системы уравнений с двумя не- неизвестными, остаётся лишь найти те значения одного из неиз- неизвестных, при которых уравнения A) могут иметь общие корни (относительно другого неизвестного). Для этого перепишем уравнения A), объединяя в них члены с одинаковыми степенями у и вынося эти степени за скобки в каж- каждой группе членов. В скобках останутся многочлены от одного неиз- неизвестного х, и система A) примет вид ао(х)ут-\-а1(х)ут-1-\-...+ат(х)=О, B) Пусть л:0, у0 — одно из решений этой системы. Тогда будут иметь место равенства «о С*о)У? + ai ь0 (*о)лп 4- *i ( • • • + а»! С*о) = ° а вместе с ними и ряд равенств, получаемых из написанных умноже- умножением левых частей соответственно на у%—\ .У?~2. ••¦• .У2== 1 и на \ у-п -п-2 о) У о = 0. ™ = 0. о)У" = 0, C) Заметим теперь, что число написанных равенств т-\-п в точности совпадает с числом встречающихся в них степеней у0 от нулевой д0 (от_|_я—i).fi включительно. Равенства C) означают, что эти i
80 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ степени составляют решение следующей однородной системы линей- линейных уравнений: «о С*о) "т+п + а, (хв) ит ,.„_, -f • • • + ат (х0) и„ = 0, 1 тн„_, +... + ат (л:0) гг„_! = 0, D) (х0) ит • • • 4- а Um = °» ^о) «„+1 + • • • + Ьп = 0- Решение щ = 1, и.^=у0,..., ит+п—у™±'1-1 отлично от нулевого, так как значение неизвестного щ равно 1. Но дчя существования такого решения необходимо, чтобы определитель системы D) был равен нулю, т. е. а0 (х„) 0 0 b0 (хв) 0 al {Xq) . . ao(xo). . 0 . . 0 . . .... ft. с • bo(xo) . . 0 am (xo xn) 0 ... 0 ) . . . 0 a (x ... 0 bn (x, = 0. E) Результат справедлив, какое бы решение хй, у0 данной системы ни было взято, а это даёт следующий путь отыскания всех значе- значений х = х0, которые могут входить в решения системы A): по данным уравнениям системы составляем уравнение п строк т строк а0 (х) а, (лг) . . . ат (х) 0 . . . 0 Ь. (х) Ьх (х) . . . Ьп {х) 0 . . .0 0 0 . . . Ь0(х). . . Ъп (х) = 0. F) В силу доказанного любое значение .v0, входящее в какое-либо решение системы A), будет его корнем. Поэтому дальнейшее сво- сводится к тому, что мы находим все возможные корни уравнения F), подставляем их последовательно в систему A) и находим, какие общие корни (для неизвестного у) они при этом имеют. Таким образом, задача сведена к решению систем уравнений с одним
ВЕКТОРНЫЕ ПРОСТРАНСТВА 81 неизвестным и конечному числу подстановок раз тачных значе- значений неизвестного х. Следует, впрочем, отметить, что равенство E) является лишь необходимым условием для того, чтобы значение х—хй вхо- входило в решение системы A): хотя при любом значении х, удовле- удовлетворяющем уравнению F), система однородных уравнений D) и будет иметь решение, нельзя ручаться, что при этом значения не- неизвестных будут соответствующими степенями одного и того же числа. Более детальное исследование показывает, однако, что «лиш- «лишними» могут оказаться только те значения х, при которых оба коэффициента ай (х) и Ьй (х) в уравнениях B) обращаются в нуль одновременно. Определитель, стоящий в левой части уравнения F), называется результантом данной системы уравнений. § 18. Дополнительные замечания 1. Эквивалентность систем линейных уравнений. Две системы уравнений (в частности, линейных) называются эквивалентными, если каждое .решение одной из них является также решением дру- другой, и наоборот. В случае систем линейных уравнений имеет место весьма про- простое соотношение между уравнениями эквивалентных систем: Если две системы линейных уравнений эквивалентны, то каж- каждое из уравнений любой из этих систем получается из уравнений другой системы, умножением обеих частей каждого из них на некоторое число и последующим сложением. Для краткости в таких случаях говорят, что уравнение является линейной комбинацией уравнений системы. Доказательство этого можно легко получить из основной тео- теоремы о совместности систем. В самом деле, если две системы эквивалентны, то соединением ич получим снова систему, эквива- эквивалентную обеим данным. У новой системы будет то же самое общее решение, а следовательно, и то же самое число свободных неизвестных. Но это означает, что при таком соединении систем ранг расширенной матрицы не изменяется. Другими словами, все уравнения наших систем будут линейными комбинациями уравнений некоторой максимальной линейно независимой системы. Так как эту последнюю всегда можно выбрать из уравнений одной из данных систем (опять-таки в силу равенства рангов), то наше утвер- утверждение доказано. 2. О вычислении ранга матрицы. Способ вычисления ранга мат- матрицы, основанный на самом определении ранга, весьма утомителен: приходится вычислять очень большое число миноров. Трудность уменьшается, если в рассматриваемой матрице значительное число элементов обращается в нуль, так как при этом равенство многих 6 Энциклопедия, кв. 2,
82 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ миноров нулю становится очевидным, и остаётся провести вычисле- вычисление лишь относительно небольшого числа определителей. Следующее замечание позволяет искусственно упрощать рас- рассматриваемую матрицу, если это оказывается необходимым: Если к одному из векторов системы е\, .... в'т прибавить любую линейную комбинацию других векторов той же системы, то ранг системы не изменится. В самом деле, рассмотрим системы е\, .... е'и .... в'т и е\,...,е\ -f- По построению вторая из этих систем оказывается линейно зави- зависящей от первой. Столь же очевидно, что векторы первоначальной системы могут быть выражены линейными комбинациями векторов второй системы; мы видим, таким образом, что обе системы экви- эквивалентны, а следовательно, они имеют один и тот же ранг. Переводя содержание сделанного замечания на язык матриц и учитывая, что в этом случае «векторами» можно называть по же- желанию строки или столбцы данной матрицы, получаем теорему: Теорема. Ранг матрицы не изменится, если к одному из её столбцов (или к одной из строк) прибавить линейную комбина- комбинацию других столбцов (строк) той же матрицы. Следующий пример показывает, насколько эффективным оказы- оказывается иногда пользование этим простым предложением: Пусть нужно вычислить ранг матрицы 12 3 4 5' 6 7 8 9 10 11 12 13 14 15 J6 17 18 19 20. Если из каждой строки матрицы вычесть предыдущую строку (это, как легко видеть, не изменит ранга), то получим матрицу 12 3 4 5 5 5 5 5 5] B) 5 5 5 5 5 .55555 Здесь уже видно, что любой минор третьего порядка будет содер- содержать хотя бы две одинаковые строки и поэтому обращается в нуль. А так как отличный от нуля минор второго порядка в матрице B) 1 2 существует (например, минор равен 2. 5 5 ), то ранг данной матрицы
ВЕКТОРНЫЕ ПРОСТРАНСТВА 83 3. О существовании решений систем уравнений в различных числовых полях. Одной из причин, вызвавших появление в мате- математической теории различных числовых (и не только числовых) полей, являлось то обстоятельство, что существуют уравнения, ко- которые в одних полях имеют решения, а в других — нет. Так, напри- например, известно, чго уравнение jc2 -}- 1 = 0, коэффициенты которого принадлежат полю действительных чисел, не имеет решений в этом поле, а в поле комплексных чисел у того же уравнения имеются решения / и —/. Причиной, заставившей рассматривать поле ком- комплексных чисел, было именно желание добиться того, чтобы всякое алгебраическое уравнение (первоначально с действительными коэф- коэффициентами) имело решения. Подобное появление решений при расширении поля не может иметь места в случае линейных уравнений: Если система линейных уравнений с коэффициентами из поля К не имеет решений в этом поле, то она не может иметь ре- решений ни в каком другом, более широком, поле. В самом деле, существование или несуществование решений свя- связано с соотношением между рангом матрицы системы и расширен- расширенной матрицы. Но эти ранги не могут измениться при расширении рассматриваемого числового поля, так как не меняются даже значе- значения миноров матриц (ибо вычисление определителей сводится к действиям сложения, вычитания и деления). Это обстоятельство объясняет, почему вопрос о расширении поля чисел не мог возникнуть исторически раньше, чем начали за- заниматься задачами, приводящими к уравнениям второй и более вы- высоких степеней.
ГЛАВА III ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЛОСКОСТИ И ТРЁХМЕРНОГО ПРОСТРАНСТВА § 19. Метрика. Скалярное произведение векторов •На общие векторные пространства, являющиеся естественным обобщением векторного пространства элементарной геометрии, можно распространить ряд важнейших свойств последнего. Сюда относятся, прежде всего, метрические свойства, связанные с возможностью измерения длин отрезков и величин углов. Понятия длины вектора и угла можно ввести в случае вектор- векторных пространств любой размерности над любым числовым полем. Однако мы предпочитаем ограничиться в дальнейшем изложении рассмотрением обычного трёхмерного пространства и обычной плоскости. При этом в качестве основного поля, над которым определены наши пространства, принимается поле действительных чисел. Для того чтобы связать длину вектора и угол между двумя век- векторами с выражением векторов через их координаты, удобнее всего ввести понятие о так называемом скалярном произведении векторов. Скалярным произведением двух данных векторов называется произведение их длин, умноженное на косинус угла между ними. Скалярное произведение векторов а и Ь мы будем обозначать (а, Ь). Удобство применения скалярного произведения при рассмо- рассмотрении метрических свойств пространства обусловлено тем, что через него можно выразить как длину вектора, так и угол между двумя векторами. Если обозначить длину вектора обычным знаком абсолютной величины, то из выражения скалярного произведения (a, b) — \a\-lb\cosa A) легко видеть, что имеют место формулы: |«|« = («,а), ««,= <«'»> А. B) \' (fit а){.Ь, Ь)
ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЛОСКОСТИ И ПРОСТРАНСТВА 85 сводящие вычисление длин и углов к вычислению скалярных произведений. После этих замечаний легко получить аналитическое выражение скалярного произведения векторов через их координаты. Рассмо- Рассмотрим сначала выражение длины вектора. При этом в качестве ба- базиса пространства удобно принять систему трёх (а в случае пло- плоскости — двух) взаимно перпенди- перпендикулярных векторов в|, ег, е3, длина каждого из которых равна единице. В таком случае координатами про- произвольного вектора х будут взя- взятые с надлежащими знаками дли- длины отрезков ОХи ОХ% и ОХ3, служащих проекциями вектора х Рис. 6. на направления векторов elt eit e3 (рис. 6). Поэтому в случае, если х = e1xl -f- е2лг2 -j- e3x3, длина вектора х определяется (как длина диагонали прямоугольного параллелепипеда) формулой C) (В случае плоскости получается формула ]x\*=x]-\-xl, отли- отличающаяся от предыдущей только отсутствием третьего члена.) Чтобы получить координатное выражение скалярного про- произведения двух векторов х = еххх -j- е2лг2 -\- е3хь и у = е1у1-{- + ечУъ + ^зЗ'з. рассмотрим их сумму х -\~ у = е, (xt-\- yj -f- e2 (x% -{- _|_ у2) _|_ es (x3 -\-у3). Длина вектора х -\-у может быть выражена двумя способами: с одной стороны,- по формуле C) имеем: =¦*!+*:+¦*; +у1 +у! f у; -г з (^л +
86 ВЕКТОРНЫЕ ПРОСТРАНСТВ Л И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ с другой стороны (рис. 7), квадрат длины диагонали параллело- параллелограмма равен т =¦*!+¦*:+¦*: л-у\+у\ -\-у\+2 (х, у). Сравнивая оба полученных выражения, видим, что (х, у) = х,у, + *ьУа+¦*&*• D) Таково выражение скалярного произведения в из- избранной нами системе координат. Выражение D) позволяет непосредственно усмо- усмотреть ряд свойств скалярного произведения, часть из которых, впрочем, легко усматривается также и из самого его определения. 1. Скалярное произведение не зависит от по~ Рис. 7. рядка сомножителей. 2. Числовой множитель можно выносить из-под знака скалярного произведения: (ka, b) = k(a, b), каковы бы ни были векторы а и b и число k. 3. Для скалярного произведения имеет место распределитель- распределительный закон: (а, Ь4- с) = (а, Ь)-\~{а, с). E) Доказательство всех этих свойств можно провести прямой про- проверкой, пользуясь полученным выражением скалярного произведе- произведения. Например, в случае третьего свойства эта проверка происхо- происходит так: пусть a = elal-\-e.ia%-\-e3a3, b = e1bl-\-eibi-\- e3b3, с=е1с1-\- e2c2 -j-' е3сг. Тогда b-{-c=el(b1 + c,) -J- e.2 (ft8 -j- c2) -f e3 (ft3 -f c3), а значит, в силу формулы D) (a, b-\- с) = Oj (/>| -\- Cj) -\- а2 (^2 ~\~ сг) ~\~ аз (^з ~\~ сз)' С другой стороны, по той же формуле D) (а, 6) = а,&,-)-а2й2 + аз^з; (а, с) — atct -J- aLc2 -J- a3cs, откуда Совпадение полученных выражений доказывает равенство E). Про- Проверка остальных свойств проходит ещё проще, и мы оставлчем ее читателю. Распределительный закон применим также и в случае сумм, состоящих из многих слагаемых, причём доказательство этого не требует нового обращения к формуле D), а может быть проведено 1
ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЛОСКОСТИ И ПРОСТРАНСТВА 87 на основе уже доказанных свойств. Способ, которым всё сводится к свойствам 1 и 3, — такой же, как в случае элементарной алгебры. Он яснее всего виден на таком примере: (a-\-b, c-\-d) = {a-\-b, с) 4-(а 4-ft, d) = (c, a4-ft) + (d, e-f-ft) = = (с, а)-\-(с, ftL-(d, a) + (d, b) = = (а, с) 4- (b, с) 4- (a, d) -f (b, d), в котором произведение (a-\-b, c-\-d) сначала рассматривается как произведения одного вектора а-\-Ь на сумму векторов end, затем используется возможность перестановки множителей, снова применяется формула E) и, наконец, делается обратная переста- перестановка множителей. Доказательство в случае любых сумм прово- проводится индукцией. Свойства 1—3 позволяют получить выражение скалярного про- произведения в любой системе координат, т. е. в случае базиса, состоящего из трёх произвольных векторов е\, е'ь е'3, не лежащих в одной плоскости: если х = е\х\ 4- ечх'ч, 4- е'гх'г, у = е\у\ 4- е-гу2 + <?з>з, то (х, у) = (е'и е\)х\у[-\-[е\, е2) х{/2 4- (е'2, е[)хгУ{-\- 'з, е\)х'гу[4-(еъ е2)х2у'ч-\- е'з)х'3у'3. F) Выражение, стоящее в правой части равенства F), замечательно тем, что в каждый его член входит одна из координат каждого из рассматриваемых векторов х и у, причём точно в первой степени. Подобного рода выражения называются билинейными формами от координат х\, х'% х'3 и у{,у'ъу'г. В случае, если векторы е\, е2, е'г взаимно перпендикулярны, то все скалярные произведения любого из них на остальные обращаются в нуль (косинус утла между мно- множителями в этом случае равен нулю), и формула F) принимает вид (х, у) = {е[, е[)х[у[ 4- (ei ei)x2'y2 4- {е'ъ, в'г) xiy'3. G) В случае, когда, кроме того, длина каждого из векторов е\, е'% е'з равна единице, формула ещё более упрощается и обращается в такую: (х, у)=х[у[ + xiy2 4- xiyl (8) как, впрочем, и следовало ожидать, ибо в сущности именно от этой формулы мы и отправлялись. Сравнение формул F), G) и (8) делает очевидным, что при решении любых метрических задач, т. е. задач, связанных с изме- измерением или вычислением любых длин и углов, наиболее удобно
88 Векторные пространства и линейные преобразования пользоваться базисом, состоящим из взаимно перпендикулярных еди- единичных векторов. Такие базисы (или системы координат) называются ортонормальнымп. Не повторяя для плоскости всех приведенных рассуждений, ограничимся тем, что приведём формулы, соответствующие форму- формулам D), F) и (8): -\-(е^,е!Цх^ [D') I (х,у) = (е\, е[)х[у\ +(e,f, е2)х[у'2-\- К е[)х^у[-\-(е^,е!Цх^ [D') (х, у)= I Последняя формула даёт выражение скалярного произведения в лю- любом ортонормальном базисе плоскости. § 20. Преобразование координат Хотя, как было только что отмечено, при решении метрических задач всегда оказывается наиболее удобным пользование ортонор- мальным базисом, довольно часто возникает необходимость в про- процессе решения задачи изменить координатную систему. При этом изменяются также и координаты векторов. Задача преобразования координат состоит в установлении связи между координатами про- произвольного, но одного и того же вектора относительно различных базисов пространства. Эта задача решается совершенно одинаково в обоих интересую- интересующих нас случаях — плоскости и трёхмерного пространства: отличие состоит лишь в числе векторов базиса и числе координат. Сначала получим явные формулы в случае пространства. Пусть задан произвольный базис е1з е2, е3, относительно кото- которого координаты некоторого произвольно заданного вектора х будут: х1г х2, х3, т. е. *=e,j;1-f «Л + еЛ- Если ei> е'ъ е'з — не- некоторый другой базис пространства и х[, х%, х'з — координаты вектора х по отношению к этому базису, то для установления за- зависимостей между «старыми» и «новыми» координатами можно по- поступить следующим образом: векторы е\, въ ?з> как и векторы пространства, однозначно представляются линейными комбинациями векторов еу, е2, е3 «старого» базиса. Удобно коэффициенты этих линейных комбинаций, как это мы часто делали, обозначить одной и той же буквой и различать только индексами, характеризующими роль каждого из коэффициентов. Таким образом, соотношения между векторами е\, е'ъ е'ъ и еи е2, е3 запишутся в виде eacsl, | lia\%ai\e3c3i, ь A)
ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЛОСКОСТИ И ПРОСТРАНСТВА 89 (первый индекс соответствует вектору «старого» базиса, а второй — вектору «нового»). Матрица С11 С12 С13 \ C21 С22 С23 h B) С31 С32 С33 / составленная из коэффициентов формул A), уже была названа раньше (см. § 13) матрицей перехода от базиса et, е2, ея к ба- базису е[, е'2, е'ъ. В силу линейной независимости векторов е[, e!i, е'3 ее определитель должен быть отличным от нуля. Подставим теперь выражения A) в выражение вектора х через новый базис. Тогда получим: х=е\х\ Л- е'чх'ч + е'зх'3 = е, спх'2 + cwx'3) -f es (csix\ + с32Х2 ~\- c3sx'3). C) Последнее из выражений представляет собою не что иное, как представление вектора х линейной комбинацией векторов ех, е2, е3 старого базиса. Но так как любой вектор представляется линейной комбинацией векторов базиса только одним способом, то выра- выражение B) должно совпадать с исходным выражением х=е1х1-\- -j- е%Хъ -\- esxs вектора х. Таким образом, должны выполняться ра- равенства x1 = cux'i-\-clix'2-\-c13x3, | D) которые и связывают «старые» координаты xlt лг2, х3 вектора х с «новыми» координатами х\, х\, х'3. Из равенств D) можно полу- получить однозначно выражения новых координат через старые, так как определитель матрицы B) отличен от нуля. Обратим внимание на то, что коэффициентами в выражениях D) служат те же элементы матрицы перехода, что и в выражениях A) векторов нового базиса. Ниже мы увидим, что это даёт возможность ввести очень простую и наглядную символическую запись формул A) и D). Обращаясь к случаю плоскости, на которой заданы два различ- различных базиса е1У е2 и е\, е% связанных соотношениями 2 J с матрицей перехода * ' " " ' B') 21
90 ВЕКТОРНЫЕ ПРОСТРАНСТВ\ И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ легко найдем, что координаты вектора х = е1х1 -)- esx2 = е\х\ -\- е'^х'ч связаны соотношениями = спх\-\-спХ2, \ В § 19 уже было отмечено, что при решении метрических задач особенно удобны ортонормальные базисы. Поэтому важно за- заметить особенности строения формул преобразования координат при переходе от одного ортонормального базиса к другому. Нач- Начнём со случая плоскости. Если векторы еи е2 составляют орто- нормальный базис (т. е. взаимно перпендикулярны и имеют длины, равные единице), то скалярные прбизведения векторов нового ба- базиса е\, е'2 будут выражаться по формуле D') § 19: (е\, e[) = cu -f-ей, {е\, е'2) = спсп-\-с^с^, (е2, е'2) — с\2 4- с|2. Поэтому для того, чтобы векторы е\, е\ нового базиса были еди- единичными и взаимно перпендикулярными, необходимо и достаточно выполнение соотношений С\\ -\- «21 = 1, СиСп -f C2i<?22 = 0, Ch + 42 = 1 E') между элементами матрицы перехода B'). Таким же образом в случае пространства получаем соотношения спс 12 -\- с21с22 + с31с32 = 0, cnc13-f cnci3-\-cMcS3 = 0, 2С23 -\- СюС33 — 0 между элементами матрицы перехода от одного ортонормального базиса к другому. Преобразования координат, при которых совершается переход от одного ортонормального базиса к другому, называются ортого- ортогональными преобразованиями. Матрица перехода, соответствующая такому преобразованию, называется ортогональной матрицей. Ортогональные преобразования особенно просты в случае пло- плоскости: если вектор е\ нового ортогонального базиса образует с вектором ?| старого базиса угол 9. то вектор е2 должен образо- образовать с вектором «! один из двух углов -к-\~9 или —у -j- ср (рис. 8). Рассматривая проекции векторов е\ и е'г на направления векторов ?| и е2, легко усмотреть, что векторы нового базиса будут выражаться в этих двух случаях так: е\ = ?| cos 9 + eisin 9» ) e'i = — в! sin 9 4" e2 cos 9 /
ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЛОСКОСТИ И ПРОСТРАНСТВА 91 P. J F') е\ = el cos 9 -|- е2 sin ф, е\ = el sin 9 — е2 cos 9, а матрицы перехода будут: /cos 9 -— sin ф\ /cos 9 sin 9\ \sin9 cos 9/ \si119 —cos 9-Г Геометрическое различие между двумя отмеченными случаями состоит в том, что в первом из них базис е[, е'2 может быть полу- Рис. 8. чен из базиса elt ег вращением последнего (в плоскости), а во вто- втором базис в,, е2 никаким вращением не может быть переведён в базис е\, е-?. если повернуть плоскость так, чтобы вектор е1 совпал с вектором е\, то после этого поворота вектор е2 окажется не совпадающим, а противоположным вектору e'i нового базиса. Это геометрическое различие аналитически выражается в том, что определитель матрицы перехода G) в первом случае оказывается равным -)-1, а во втором случае — равным —I1). Аналогичные два класса ортогональных преобразований можно заметить и в случае пространства: геометрически ясно, что враще- вращением пространства можно привести вектор еу к совпадению с век- вектором е[; после этого можно продолжать вращение, сохраняя ') Достаточно убедиться в этом простым подсчётом: например, cos<p —sin 9 I « ... , I = cosa <p + sina 9 = 1. sin 9 cos 9 i
92 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ постоянной ось е'и и заставить вектор е2 совпасть с вектором е'2. Что касается вектора е3, то он после указанных вращений либо совпа- совпадает с вектором е'з, либо окажется противоположным ему. В по- последнем случае уже никаким поворотом векторы е1г е2, е3 нельзя заставить совпасть с соответствующими векторами е\, e'i и е'з. Ана- Аналитическое различие между этими двумя случаями оказывается таким же, как и для плоскости, но подметить это значительно труднее. Мы займемся ещё этим вопросом после того, как подго- подготовим в следующем параграфе нужный вспомогательный аппарат. § 21. Операции над матрицами Многие соотношения, в частности те, которыми мы занимались в предыдущем параграфе, приобретают особенно отчетливый вид, если воспользоваться некоторыми формальными правилами действий с матрицами. В предыдущей главе уже было определено сложение матриц, а также умножение матрицы на число. Эти определения оказались такими, что совокупность всех матриц, имеющих данное число строк и данное число столбцов, образует векторное пространство. Мы введём ещё две операции над матрицами. Первая из них, называе- называемая транспонированием, по существу нам уже встречалась. Если дана матрица а\п п21 а22 • • • С2л то транспонированной матрицей для данной матрицы называется матрица /с„ а81 ... ат1 о т2 столбцами которой являются соответствующие строки данной матрицы. Мы часто будем обозначать матрицу не таблицей, как это сделано только что, а одной буквой (для этого будут всегда использоваться большие латинские буквы). В таком случае матрица, транспонированная для матрицы А, будет обозначаться значком Т сверху: Ат. В частности, если данная матрица состоит всего из одного столбца
ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЛОСКОСТИ И ПРОСТРАНСТВА 93 то транспонированная матрица ХТ=(х1, x:i, ..., хп) состоит из одной строки. Кроме транспонирования, мы определим ещё умножение матриц. Определение умножения подсказывается видом формул A), D), D') предыдущего параграфа. Оно гласит: Если заданы две матрицы А и В, причём число столбцов первой из них равно числу строк второй, то произведением их называется матрица АВ, число строк которой совпадает с числом строк матрицы А, а число столбцов — с числом столбцов ма- матрицы В, и такая, что на пересечении любой 1-й строки и j-го столбца матрицы АВ стоит сумма произведений соответствую- соответствующих элементов 1-й строки матрицы А и j-го столбца матрицы В. В случае, если число столбцов матрицы А не равно числу строк матрицы В, произведение не определено. Из приведённого определения следует, в частности, что произведением одной строки на любую матрицу будет являться строчка, а произведением любой матрицы А на матрицу, состоящую из одного столбца, будет являться также матрица, состоящая из одного столбца. Ещё более частный случай — умножение одной строчки на столбец — даёт в результате матрицу, состоящую лишь из одного элемента. Целесообразность такого определения умножения матриц будет видна дальше. Сейчас же мы ограничимся тем, что на нескольких примерах поясним высказанное определение. Прежде всего фор- формулы D) и D') предыдущего параграфа записываются в виде 'J W Wl cJW*)' а если для матриц перехода B), B') ввести сокращённое обозначе- обозначение одной буквой С, то эти формулы запишутся ещё короче и единообразней: U, =с Ы и W \-*з/ Читателю предоставляется самому проверить, что ниженаписанные произведения образованы согласно сформулированному определению:
94 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ Последний пример показывает, что квадратные матрицы ъида 1 0 0 0 0 1 0 0 0 . 0 . 1 . 0 . . .0 . .0 . .0 . . 1 «ведут себя» подобно числу единица: если умножение на них воз- возможно (т. е. если выполнено требование о числе строк и столбцов множителей), то от умножения на такую матрицу умножаемая матрица не изменяется. Однако первый пример показывает, что один из основ- основных законов действий — коммутативность или переместительность умножения — не имеет места для умножения матриц. Тем не менее оперировать с матрицами оказывается почти так же удобно, как с обычными числами, ибо дьа других закона операций — сочетательный закон умножения и распределительный закон, связывающий сложение с умножением, — остаются справедливыми при введённых нами определениях операций. Иными словами, каковы бы ни были матрицы А, В и С, имеют место соотношения (А^-В)С=АС-\-ВС; А(В-\-С) = АВ~\-АС; (АВ)С = А(ВС). A) . Убедиться в этом можно прямой проверкой, вычисляя отдельно правые и левые части написанных равенств. Например, если матрицы А, В и С равны, соответственно, /оп а12\ lbn 612\ / \аи ass)' \fc2i boj \ TO lan-\-bn -f (c12 -f bn) c2\ \te21 + ?2,^ ct -|- (a22 -f- 622) cj' АГ I an ./1С —t— ?3O \ Совпадение результатов показывает справедливость в данном слу- случае равенства (А-\-В)С = АС-\-ВС. В общем случае проверка имеет тот же характер, но усложняется и запись делается более гро- громоздкой. Для сочетательного закона (АВ)С = А{ВС) мы проведём
ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЛОСКОСТИ И ПРОСТРАНСТВА 95 общее доказательство в силу его меньшей очевидности и той роли, которую он играет во всём дальнейшем. Пусть матрицы А, В и С равны, соответственно, 1ап ап . . . alm\ /bn b12 ... а-п а22 ... аш \ [ Ьи Ь^ ... \, .il ар2 • • • арт' \Ьт1 Ьт2 • • (Напомним ещё раз, что для возможности умножения необходимо, чтобы число столбцов первой матрицы равнялось числу строк вто- второй, а число столбцов второй — числу строк третьей.) Тогда на пересечении любой i-й строки и /-го столбца произведения АВ будет стоять число на пересечении же i-й строки и А-ro столбца произведения (АВ) С — число п п т p=l a=l С другой стороны, на пересечении /'-й строки и А-ro столбца произведения ВС будет стоять: а следовательно на пересечении г-й строки и А-го столбца произ- произведения А (ВС) будет расположено число т т п fik = 2j a*«^'«fe = ^j ?j ai* Так как это выражение совпадает с числом, стоящим на пере- пересечении г-й строки и k-ro столбца произведения (АВ)С, то будет: (АВ)С-А(ВС), что и нужно. Весьма полезно заметить влияние операции транспонирования на сумму и произведение матриц. Правила транспонирования сумм и произведений имеют вид (А-\-В)Т=АТ+ВТ и (АВу=ВТАт, или словами: а) транспонированная матрица для суммы матриц равна сумме транспонированных слагаемых; б) транспонированная матрица для произведения равна произведению транспонирован- транспонированных сомножителей в обратном порядке.
96 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ Первое из этих правил очевидно. Что касается второго, то оно легко получается из определения умножения. Мы ограничимся про- проверкой его справедливости в двух частных случаях: а) (а„ ea) ^j = (а А + афг); (*i. *«) М = («1*1 + «А); «, «, =(«Ai р21 с22; Доказательство в общем случае может быть проведено подобно тому, как это было сделано выше для сочетательного закона. Умножение квадратных матриц одного и того же порядка (т. е. с одним и тем же числом строк и столбцов) замечательным образом связано с определителями этих матриц. Имеет место такая Теорема. Определитель произведения двух квадратных ма- матриц равен произведению определителей сомножителей. Мы проведём. доказательство для случая матриц третьего по- порядка, но читатель может заметить, что дословно то же рассужде- рассуждение можно - проьести и в случае любого порядка матриц-сомножи- матриц-сомножителей. Пусть даны матрицы •33/ V>bl ^32 Vs Их произведение будет: bn, aub12 -f- a AB= + «22^23 + «23^33 I * B) + «32^23 + «33^33/ Определитель этой последней матрицы мы будем рассматривать как функцию столбцов матрицы В. Обозначив указанные столбцы (которые мы будем рассматривать как трёхмерные числовые век- хоры) через Ьи 681 Ьъ> можем записать определитель матрицы B) как F(bv 62> 63). C) Обратим теперь внимание на свойства функции C). Прежде всего очевидно, что если умножить один из столбцов матрицы В на
ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЛОСКОСТИ И ПРОСТРАНСТВА 97 некоторое число, то на это же число умножится и соответствующий столбец матрицы B), а следовательно, на то же число умножится значение определителя последней матрицы. Таким образом, на- например, F(kblt b,, b.i) = kF(b1, b.it 63). Далее, если один из столбцов матрицы В, например первый, будет суммой двух столбцов Ь\ и Ь\', то соответствующий столбец матрицы B) будет суммой столбца «31^11 + «32^21 +О33^31 и такого же столбца, содержащего Ъ" вместо Ъ'. Пользуясь свой- свойствами определителей, мы можем написать поэтому, что Наконец, если два из столбцов матрицы В окажутся совпадаю- совпадающими, то будут совпадающими и соответствующие столбцы ма- матрицы B), а следовательно, определитель этой матрицы, т. е. зна- значение F(b1, 62, 63), обратится в нуль. Но эти свойства суть не что иное, как свойства А) и Б), использованные при введении понятия определителя. Поэтому к функции F(bL, b2, b3) применима теорема, доказанная в конце § . Эта теорема даёт равенство F{bu Ь 13 ^22 b31 b 33 F{eu e2, e3), C') где F(elt eo_, е3) есть значение нашей функции, когда столбцы ма- матрицы В обращаются, соответственно, в Но в этом случае матрица B) совпадает с матрицей А, а следова- следовательно, её определитель F(eu eit eB) обращается в определитель матрицы А, т. е. F(elt 7 Энциклопедия, кн. 2. i3
98 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ^11 ^12 1 2 b3l fc32 ^23 ^33 • an a an a asl a 12 a13 22 a23 32 a33 Подставляя это в выражение C'), получим равенство F(bu bit b3 выражающее доказываемую теорему. В заключение этого параграфа введём понятие об обратных матрицах. Мы уже заметили выше, что квадратные матрицы вида '1 0 0 ... 0\ О 1 0 ... О Е=\ 0 0 1 ... О 0 0 ... при умножении на них не изменяют умножаемую матрицу. Матрица Е называется единичной матрицей (конечно, для каждого порядка имеется своя единичная матрица). По аналогии со случаем чисел матрица В называется обратной по отношению к матрице А, если оба произведения АВ и ВА равны единичной матрице. Отнюдь не все матрицы имеют обратные: из доказанной только что теоремы следует сразу, что матрица А, определитель которой равен нулю (вырожденная матрица), не может иметь обратной; в самом деле, если матрица имеет обратную матрицу В, то произ- произведение определителей обеих матриц должно равняться определи- определителю единичной матрицы, т. е. числу 1, а такое равенство невоз- невозможно, если хотя бы один из определителей матриц А и В равен нулю. Однако любая матрица fan о12 . . . aln\ а21 а22 • • • определитель которой отличен от нуля, имеет обратную матрицу. Для того чтобы убедиться в этом, достаточно написать явное вы- выражение для обратной матрицы. Именно, каждый элемент aik дан- данной матрицы имеет в её определителе своё алгебраическое допол- дополнение Aik. Так как определитель матрицы А отличен от нуля, все эти алгебраические дополнения можно разделить на значение d определителя всей матрицы. Расставим эти частные таким образом: Ai d Ащ d d A,n d • • • d Ann • • ' d D)
ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЛОСКОСТИ И ПРОСТРАНСТВА 99 (обращаем снимание читателя на то, что —— стоит на псщ;сечении /г-й строки и i-ro столбца новой' матрицы). При образовании произ- произведения матриц А и В можно заметить следующее: на пересечении i-й строки и j-ro столбца произведения АВ будет стоять сумма т. е. делённая на d сумма произведений элементов /-ft строки ма- матрицы А на алгебраические дополнения соответствующих элементов у-й строки той же матрицы. В силу известного свойства определи- определителей такая сумма произведений равна нулю, если номера строк различны, и равна определителю, если номера строк совпадают. В последнем случае деление на d даёт единицу, так что в произ- произведении рассматриваемых матриц на диагонали оказываются повсюду единицы, а все элементы, стоящие вне диагонали, — будут нулями. Иными словами, при умножении мы получаем единичную матрицу. Предоставляем читателю проверить, что единичная матрица полу- получается и при умножении в другом порядке. Во всём дальнейшем обратная матрица для матрицы А будет обозначаться (там, где она существует) через А~1. В наших новых обозначениях приобретают особую простоту свойства ортогональных матриц, рассмотренные в предыдущем па- параграфе. В рассмотренных там случаях плоскости и трёхмерного пространства ортогональные матрицы оказались такими, у которых суммы произведений соответствующих элементов различных столбцов равны нулю, а сумма квадратов элементов любого столбца равна единице. Если С есть такая матрица и если рассмотреть её транс- транспонированную матрицу Сг, то мы легко убедимся, что произве- произведение СТС равно единичной матрице: умножать элементы /-й строки транспонированной матрицы на соответствующие элементыу-го столбца матрицы С означает то же самое, что и перемножать со- соответствующие элементы г-ro и j-ro столбцов матрицы С. Так как единицы получаются при этом в случае одинаковых номеров, а нули — в случае различных, то мы получаем указанный резуль- результат: СТС = Е. Понятие ортогональной матрицы переносится на случай квадратных матриц любого порядка: такая матрица называется ортогональной, если её обратная матрица совпадает с транспониро- транспонированной: СТ=С~1. Выше было обнаружено в случае плоскости, что определитель ортогональной матрицы может иметь только значения -\-1 или —1. Это — свойство всех ортогональных матриц: если матрица С ортогональна, то из равенства СТС = Е следует, в силу только что доказанной теоремы об определителе произведения матриц, равен- равенство \С\ ¦ |С|= 1, где \С'Г\ v \С\ суть определители матриц Ст и С. 7*
100 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ Но по одному из основных свойств определителя | С \ = \ С \, а сле- следовательно, |С|2—1, т. е. |С| = ±1. Добавим к сказанному, что определение умножения матриц можно использовать более широко, чем это было сделано выше: можно, например, составлять матрицу из векторов и умножать её на числовую матрицу. Правила действия, имеющие место для ма- матриц, при этом полностью сохраняются. Этим обстоятельством мы дальше будем пользоваться. Например, формулы A) предыдущего параграфа, связывающие базисы е\, еъ e's и еи е2, е3 пространства, запишутся в этом обозначении так: / сп е12 с13 \ (е'и е'ъ е'3)=^(еи е2, еъ) ( сп с22 с23 1. E) \ С31 С32 С33 / Нужно только помнить, что умножение двух матриц, соста- составленных из векторов, не имеет смысла, а также то, что сло- сложение может быть осуществлено только в случае однородных по своему характеру слагаемых. § 22. Линейные преобразования Идея преобразования или отображения является одной из руко- руководящих идей не только геометрии, но и всей математики. Её зарождение можно проследить уже на первых рисунках первобыт- первобытного человека, в которых, несмотря на их примитивность, можно отчётливо увидеть стремление сопоставить каждой детали изо- изображаемого предмета некоторый её «обра з» на рисунке. Эта же идея многократно используется в школьном курсе геометрии, когда для доказательства ряда теорем и при решении задач используется движение фигур или переход от одной фигуры к другой, ей по- подобной. Определение отображения в его наиболее общей и в то же время наиболее отчётливой форме может быть сформулировано так: пусть М и TV—множества, состоящие из предметов (элементов) совершенно произвольной природы. Будем говорить, что нам задано некоторое отображение множества М в множество N, если указано правило, относящее каждому элементу множества М некоторый вполне определённый элемент множества N, называемый образом рассматриваемого элемента первого множества. Для обозначения отображений часто применяется то же обозна- обозначение, что и для функций в математическом анализе: говорят, например, что задано отображение F, а образ элемента х множе- множества М при этом отображении обозначают F(x). Такое совпадение обозначений не случайно, так как обычные функции являются просто частными примерами отображений: каждая такая функция есть отображение некоторого множества чисел, на котором
ЛИНЕЙНЫЕ ПРЕОБРЛЗОВЛНИЯ ПЛОСКОСТИ И ПРОСТРАНСТВА 101 она определена, на некоторое другое множество чисел. Напри- Например, функция _у = arcsin JC ставит в соответствие каждому числу, содержащемуся между —1 и -f-1, некоторое вполне определённое число, содержащееся между —о" и Т- Когда мы в элементарной геометрии говорим о движении той или иной фигуры, то при этом имеем в виду, что заданная нам первоначальная фигура пере- переведена в некоторую другую фигуру, причём эта новая фигура обла- обладает тем свойством, что каждая точка на ней определённым обра- образом соответствует некоторой точке исходной фигуры. Хотя в школь- школьном курсе и не говорится явно о таком соответствии, его наличие на самом деле используется буквально во всех доказательствах, в которых применяется движение (достаточно вспомнить хотя бы доказательства признаков равенства треугольников, проводимые с помощью совмещения фигур). Для наших целей необходимо в двух отношениях отклониться от элементарного представления о соответствии, используемого в школьном курсе: 1) когда мы будем говорить об отображении, то будем предполагать, что оно определено во всём рассматри- рассматриваемом пространстве, т. е. что каждый элемент пространства (а не только элементы какой-либо фигуры) имеет определенный образ, и 2) в качестве элементов, между которыми устанавливается соответствие, берутся не точки, а векторы. Таким образом, мы будем говорить, что задано отображение А векторного пространства Lx в векторное пространство L2, если каждому вектору х первого пространства поставлен в соответствие определённый вектор второго пространства, обозначаемый А (х) или просто Ах. В соответствии с применённой выше терминологией вектор Ах будет называться образом вектора х. Мы будем говорить также, что отображение А переводит вектор х в вектор Ах. Так как при заданном отображении А каждая система векторов преобра- преобразуется в некоторую другую систему, то отображения называются также преобразованиями рассматриваемого пространства. Среди отображений векторных пространств особенно простыми и наиболее часто встречающимися в различных приложениях являются так называемые линейные отображения (или преобразования). Отображение А векторного пространства Lt в векторное пространство L2 называется линейным, если оно обладает следую- следующими двумя свойствами: 1) образом суммы двух любых векторов является сумма их образов и 2) образом произведения вектора на любое число является произведение образа этого вектора на то же самое число. На языке формул эти свойства записываются таким образом; у, A) B)
102 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ Приведём несколько примеров линейных преобразований: Пример 1. Поставим в соответствие каждому вектору трёх- трёхмерного пространства (в смысле обычной элементарной геометрии) его проекцию на одну из плоскостей (рис. 9). Этим, очевидно, х+у Рис. 9. определяется отображение всего пространства на двумерное про- пространство L2 векторов рассматриваемой плоскости. То, что опреде- определённое так отображение является линейным, следует из хорошо известных теорем о пропорциональных отрезках и из того, что проекции иараллельных отрезков параллельны между собой. а) Рис. 10. Пример 2. Отнесём каждому вектору плоскости другой век- вектор, получаемый из первого поворотом на постоянный угол о (в одну и ту же сторону для всех векторов). Линейность получае- получаемого таким образом отображения очевидна сразу. Пример 3. Будем представлять себе плоскость реализованной в виде бокового среза книги (рис. 10), неподвижно лежащей на столе. Если мы слегка нажмём справа налево на корешок книги, то происходит сдвиг отдельных листов книги друг относительно друга. Такой сдвиг осуществляет линейное преобразование на нашей плоско- плоскости, как видно из сравнения рис. 1C, аи о. Наш пример, строго
ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЛОСКОСТИ И ПРОСТРАНСТВА 103 говоря, является лишь грубой иллюстрацией того, что следует называть сдвигом, так как из-за наличия отдельных листов книги наша «плоскость» приобретает дискретный характер. Однако полу- получающееся наглядное представление весьма точно соответствует тому, что понимается под сдвигом в строгом геометрическом смысле слова. Пример 4. Будем считать, что каждому вектору плоскости отнесено его «зеркальное отражение» в некоторой фиксирован- фиксированной прямой, т. е. вектор, расположенный симметрично с дан- данным относительно этой прямой. Этим опять-таки определяется линейное отображение плоскости на ту же самую плоскость (рис. 11). В трёх последних примерах имело место следующее частное обстоятельство: рассматриваемое векторное пространство отобра- отображалось в себя самого, т. е. исходные векторы и их образы оказались при- принадлежащими одному и тому же про- пространству. Этот частный случай с алге- алгебраической точки зрения является наи-- более интересным (и общий случай к нему легко сводится). Поэтому во всём дальнейшем, говоря о линейных преобразованиях, мы будем иметь в виду только линейные отобра- отображения пространства в себя. Связь введённых геометрических понятий с алгеброй устанавливается тем, что из заданных линейных пре- преобразований можно создавать новые линейные преобразования с помощью формальных операций (имеющих, впрочем, вполне конкретное гео- геометрическое содержание). После введения операций над преобразо- преобразованиями последние становятся естественным объектом изучения алгебры. Рассмотрим сначала сложение линейных преобразо- преобразований. Пусть А и В—два линейных отображения некоторого векторного пространства L в себя. Эти преобразования ставят в соот- соответствие каждому вектору х нашего пространства его образы Ах и Вх. Так как любые векторы пространства мы можем сложить, то можно образовать вектор Ах-\-Вх и считать его соответ- соответствующим вектору х. Этим устанавливается некоторое но- новое отображение нашего пространства в себя, так как век- вектор Ах-\-Вх определён для каждого вектора х. Обозначим полу- полученное отображение через С. Оно будет линейным отображением. Для доказательства достаточно проверить наличие у него двух основных свойств A) и B) таких отображений. Но эти свойства Рис. П.
104 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ очевидны почти сразу: по определению отображения С мы имеем для любых векторов х и у такие соотношения: С (kx) = A (kx) + В (kx) = kAx-\- kBx = k (Ax -f- Bx), = Ax-{-Bx, Cy = Ay-\-By, откуда видно, что имеют место равенства C(kx) = kCx, содержание которых совпадает с содержанием равенств A) и B). Определённое указанным образом отображение С называется суммой отображений А и В. Для обозначения суммы отображений применяется обычный знак: С = А-\- В. Знак равенства применяется здесь опять в смысле совпадения стоя- стоящих по обе стороны объектов (два преобразования естественно считать совпадающими, если они переводят каждый вектор пространства в один и тот же вектор). Умножение отображений вводится следующим образом: если А и В — два данных отображения, то, взяв не- некоторый вектор х пространства, мож- можно перевести его сначала в вектор Вх, а затем к полученному вектору Вх применить преобразование А. По- Получим вектор А (Вх). Описанный про- процесс ставит в соответствие каждо- каждому вектору х вектор А (Вх) того же пространства, т. е. определяет некоторое отображение рассматриваемого пространства в себя. Это отображение и называется произведением заданных отображений А и В. Оно обозначается АВ, причём важно обращать внимание на порядок множителей. Существенность этого замечания показы- показывается хотя бы таким примером: пусть отображение А является вращением плоскости на угол ц> (против часовой стрелки), а ото- отображение В — зеркальным отражением в оси Ох (рис. 12). Чита- Читатель без труда убедится, что вектор х, если к нему сначала при- применить вращение А, а затем отражение В, обратится в вектор В (Ах). Наоборот, если сначала к вектору х применить отражение В, а затем вращение А, то мы получим вектор А (Вх), отличный от В (Ах). Произведение преобразований часто определяют короче и более выразительно, но менее точно, как преобразование, эквивалентное последовательному выполнению заданных преобразований. Нужно Рис. 12.
ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЛОСКОСТИ И ПРОСТР\НСТВА 105 подчеркнуть только (выше это было сказано явно), что сначала выполняется преобразование, стоящее в произведении вторым множителем. Произведение линейных отображений также является линейным отображением. Как и в случае матриц, отмеченная выше некоммутативность умножения является единственным отступлением правил дей- действий с преобразованиями от обычных алгебраических правил. Все остальные из основных законов алгебры полностью сохраняются: для любых преобразований А, В, С имеют место формулы . А(В-\-С) — АВ-{-АС, (А-\-В)С = АС-\-ВС, (АВ)С = А(ВС). Эти соотношения могут быть выведены из соответствующих со- соотношений для матриц с помощью приёма, которым мы займёмся в следующем параграфе. Однако для закона ассоциативности умно- умножения полезно здесь привести прямое доказательство. Именно, каков бы ни был вектор х, имеет место равенство (АВ) Сх = (АВ) (Сх) = А(В (Сх)). (Здесь мы воспользовались только определением умноже- умножения преобразований: чтобы получить результат действия преобра- преобразования (АВ) С на вектор х, мы применяем к нему сначала пре- преобразование С, а затем преобразование АВ; далее, для получения результата действия на вектор Сх преобразования АВ сначала при- применяем к вектору Сх преобразование В, & затем — преобразование А.) Пользуясь этими же соображениями, для вектора А(ВС)Х полу- получаем такое выражение: А (ВС) х=А ((ВС) х) = А(В (Сх)), которое, как сразу видно, совпадает с приведёнными выше. Таким образом, результат действия преобразований (АВ)С и А (ВС) на любой вектор х будет одним и тем же, т. е. эти преобразования совпадают. § 23. Представление линейных преобразований матрицами Хотя в предыдущем параграфе и были определены операции над линейными преобразованиями, их выполнение в конкретных случаях не столь легко, как выполнение обычных арифметических действий над числами. Чтобы получить способ просто выполнять эти операции, необходимо свести их к действиям над числами, а для этого, прежде всего, необходимо иметь способ аналитиче- аналитической записи самих линейных преобразований-
106 ВЕКТОРНЫЕ ПРОСТРЛНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ Ключ к получению такой записи даёт следующее замечание: линейное преобразование вполне определено, если известно, в какие векторы оно переводит векторы базиса пространства. В самом деле, если известны образы Аеи ..., Аеп векторов базиса еи ..., еп пространства L, то для любого вектора х = е1х1-\- ... -\-епхп этого пространства его образ будет вполне определён: в силу основных свойств линейных преобразований должны иметь место соотношения Ах = А(е1х1-\- ... +е„хп) = Ае1-х1+ ... -\-Аеп-хп. Рассмотрим для определённости случай пространства трёх изме- измерений. В этом случае векторов базиса всего три: elt e2, е3. Их образы Аеи Ле2, Ае3 будут также векторами пространства, а сле- следовательно, они представляются линейными комбинациями самих векторов базиса: Л<?! = etan -\- e.2an -f- e3a31, | При этом для любого вектора х мы будем иметь: з Ах=Ае, • Xj -\- Ле2 • х.2 -{- Ае3 • х3 = У eiaikxk- B) Таким образом, преобразование Л будет вполне определено, если известна матрица >ап д12 д13\ si аш а23 ]> C) составленная из коэффициентов aik формул A). Она называется ма- матрицей линейного преобразования А относительно базиса elt e2, es. Введённые в § 21 операции над матрицами позволяют ещё упростить нашу запись и сделать работу с ней совершенно авто- автоматической. Для этого условимся под результатом действия линейного преобразования на любую строку, составленную из векторов, понимать строку, составленную из образов заданных векторов, т. е., выражая это формулой, условимся в том, что А(еи е2, e3) = Тогда формулы A) запишутся так: A(ev e2, e3) = {elt е2, е3) аш а22 а23 ]» A') \а31 аш дм/ если ещё ввести сокращение, обозначая матрицу C) через МЛ
ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЛОСКОСТИ И ПРОСТРАНСТВА 107 (здесь А указывает то преобразование, матрица которого обозна- обозначена МА), то получим ещё более простую запись А(еи е2, е3) = (е1У е.2, е3) МА. (Г) Преимущества введённой записи обнаружатся ещё ясней, когда применим её к формуле B). Она может быть теперь переписана в виде ( ГЛ\ (*' Ax=AUelt е3, е3) ( -*а I ) = (ev еа, е3) МАI х2 \ \xj I \х3 А если обозначить столбец, составленный из координат вектора х через X, то в виде Ах=А((е1г еа, е3)Х)^={е1, <?„, е3)МАХ. D) Последнее соотношение остаётся справедливым также и в том случае, когда X означает любую матрицу: в этом случае, если через Xlt X%, Х3 обозначить отдельные столбцы этой матрицы, произведение строки (elt e.2,' е3) на X означает строку, составлен- составленную из отдельных произведений (е1г е%, е3) Х1г (elt e2, e3)X%, (elt e2, е3)Х3. Действие линейного преобразования А на такую строку сводится к его действию на каждый из векторов строки, что приводит к системе векторов (elt e2, ea)MAXu (e1( e2, e3) MAXit (eu е2, е3)МАХ3, которая в свою очередь может быть записана в виде (elt e2, е3) МАХ. Заметим теперь, что матрица МА, входящая в формулу A"), однозначно определена линейным преобразованием, так как её столбцы являются коэффициентами линейных комбинаций векторов базиса, выражающих образы этих векторов; коэффициенты же в выражении любого вектора через базис определены однозначно. Это замечание позволяет совершенно автоматически получить выражения для матриц суммы и произведения двух данных линей- линейных преобразований. Действительно, по определению суммы и про- произведения преобразований, пользуясь введёнными в § 21 действиями с матрицами, получим формулы (А-\-В)(е1, е2, е3) = А(еи е2, еь)-\-В(еи е2, е3) = ")= (еи е2, е3)(МА-\-Мв) E) (АВ)(еи е.2> е3) = А(В(еи е.2, е3)) = = А({еи е.г, е3)Жв) = (е„ е2, еь)МАМв. F) Но матрицы преобразований Л -\- В и АВ суть такие матрицы,
108 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ которые удовлетворяют соотношениям (А-\-В)(еи е2, еа) = (еи е2, е3)МА + в, (АВ)(е1у е2, е,) —(е„ е2, е3)МАв. Сравнивая эти соотношения с формулами E) и F), получим: и Мав=МаМв. Таким образом, получается основное правило: матрицы суммы и произведения линейных преобразований равны, соответственно, сумме и произведению матриц данных преобразований. Этим все действия с линейными преобразованиями сведены к со- соответствующим действиям с матрицами, т. е. в конечном счёте с числами. Мы рассмотрели случай трёхмерного пространства. Но на самом деле, как это легко видеть из изложенного, все полученные резуль- результаты могут быть приложены к пространству любого числа из- измерений: изменится только число строк и столбцов рассматриваемых матриц. В качестве иллюстрации рассмотрим выражение некоторых линей- линейных преобразований плоскости, на которой в качестве базиса выбраны два взаимно перпендикулярных вектора еи е2 длины 1. Рассмотрим сначала вращение плоскости на угол ср (против часо- часовой стрелки). Если обозначить это вращение через А, то легко видеть, что образами Аех и Ле2 векторов ех и е2 будут векторы е\ и е'а (см. рис. 8, а). Принимая во внимание выражение этих векто- векторов через базис ех, е2, получим соотношение /cos 9 — sin ш\ А (е,, е„) = (е,, е9) . , \ \' и \ i> 2/ysm? cos 9/' показывающее, что матрицей преобразования А будет матрица /cos ср — sin ш\ MA==\sin<t cos?/' Другим линейным преобразованиям будут соответствовать дру- другие матрицы. Например, отражению В плоскости в прямой, на ко- которой лежит вектор е1з будет соответствовать матрица /1 О' ибо В(ех, ei) = (el, — efi) = (e1 Наши соображения дают возможность ещё раз убедиться в том, что произведения АВ и ВА преобразований А и В различны; этим
ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЛОСКОСТИ И ПРОСТРАНСТВА 109 произведениям соответствуют матрицы /cos9 —sin qp\ /1 0\ /cos9 sin аз\ \sin9 coS9/\0 —1/ \sin 9 —cos 9/ и /1 0\/coS9 —sin9\ / cos ф —sin 9х, \0 ¦—l/\sin9 cos9/ \—sin 9 —cos 9/' так что преобразования АВ и ВА не могут совпадать. Рассмотрим ещё один пример: возьмём то же отражение В пло- плоскости в прямой, содержащей вектор ех (см. рис. 8, а), но в каче- качестве базиса плоскости возьмём векторы е\, е[, изображённые на этом рисунке. Эти векторы преобразованием В переводятся в век- векторы Ве[, Ве2, изображённые на рис. 8, а пунктиром. Их выражения через векторы е\ и е'2 будут: Ве[ = е[ cos 29 — е'а sin 29, Ве'2 = — е\ sin 2ф —е'2 cos29- Отсюда видно, что матрица преобразования В в нашем новом базисе будет: / cos29-sin29\ \—sin 29 ¦—cos 29/ Она отличается от матрицы того же преобразования, полученной относительно базиса е1; е2. Таким образом, одно и то же линей- линейное преобразование может выражаться различными матрицами в зависимости от выбора базиса пространства. Однако между матрицами, выражающими линейное преобразова- преобразование В в различных базисах, существует простая связь. Её вывод не представляет трудности, и мы проведём его в общем случае, неза- независимо от размерности пространства. Пусть е„ е2 еп и е[, ..., е'п — два различных базиса пространства L и А — некоторое линейное преобразование этого пространства. Тогда матрицы, выра- выражающие это линейное преобразование относительно данных базисов, определяются из соотношений А(еи ..., еп) = (еи ..., еп) МА, 1 1 ) А (е,, ..., en) = (elt ..., еп) МА. Вспомним теперь, что переход от базиса et en к базису е'х, ..., е'п характеризуется матрицей перехода С: (е[ е;) = (е, еп)С Применяя преобразование А к первой из этих формул, мы полу- получим соотношение А(е\, .... е'п) — АAеи ..., еп)С) = (е1, .... еп)МАС
ПО ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (последнее равенство написано на основании формулы D), в кото- которой роль матрицы X играет матрица С). Подставляя теперь выражение (еи ..., еп), даваемое второй из формул (8), получим соотношение А(е[, .... еп) = (е[, ..., е'п)С^МАС. Сравнение его со второй формулой G) даёт равенство ' С-1МАС, (9) устанавливающее связь между матрицами М\ и Жд. Отметим в заключение этого параграфа ещё следующее: как мы видели, при заданном базисе пространства каждому линейному пре- преобразованию соответствует определённая матрица; остаётся вопрос, каждая ли матрица соответствует некоторому линейному преобразо- преобразованию? Оказывается, что это действительно так. Чтобы убедиться в сказанном, достаточно определить отображение пространства в себя таким образом: если МА — любая матрица, то примем фор- формулы A) в качестве определений образов векторов е^ еп при нашем преобразовании. После этого образ любого вектора X определим с помощью формулы B). Определённое таким образом преобразование пространства будет линейным, так как координаты суммы двух векторов равны суммам координат слагаемых, а координаты произведения вектора на число равны произведениям координат данного вектора на это число. Матрица нашего преобразования, по его определению, совпадает с матрицей § 24. Геометрические свойства линейных преобразований и свойства представляющих их матриц После того как каждому линейному преобразованию поста- поставлена в соответствие некоторая матрица, естественно посмотреть, какая связь существует между свойствами преобразования и свой- свойствами представляющей его матрицы. Линейное преобразование пространства L в себя называется вырожденным, если оно обращает пространство в некоторую его часть. Например, преобразование, состоящее в проектировании всех векторов трёхмерного пространства на некоторую плоскость, является вырожденным, так как при этом совокупность всех векто- векторов пространства превращается в совокупность векторов только одной плоскости. Наоборот, преобразование, которое переводит пространство во всё пространство, называется невырожденным. Примерами невырожденных преобразований являются такие преобра- преобразования, как вращение трёхмерного пространства или плоскости, сдвиг (см. пример 3 § 22) и многие другие.
ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЛОСКОСТИ И ПРОСТРАНСТВА 111 Вырожденность или невырожденность линейного преобразования может быть очень легко обнаружена по его матрице: Преобразование А тогда и только тогда является невыро- невырожденным, когда соответствующая ему матрица имеет опреде- определитель, не равный нулю. В самом деле, если преобразование А вырожденное, то векторы Aev ..., Аеп не могут быть линейно независимыми, так как в этом случае любой вектор у пространства можно было бы представить их линейной комбинацией Ае^х^ -j- -\-Аепхп, а это означает, что вектор у является образом вектора х = е1х1-\- ... -\-е„хп, так что совокупность образов векторов пространства заполняет всё пространство, вопреки предположению. В силу доказанного в главе II условия линейной независимости векторов в таком слу- случае определитель матрицы, составленный из коэффициентов выра- выражений векторов Аех, ..., Аеп через базис е„ ..., еп, должен быть равен нулю. Но этот определитель и является определителем матрицы преобразования А. Наоборот, если определитель матрицы Ма равен нулю, то в силу того же условия линейной зависимости, векторы Ае1г ..., Аеп будут линейно зависимыми, а следовательно, их линейные комби- комбинации не могут заполнять всё рассматриваемое пространство. Если теперь заметить, что образ любого вектора х=^еххг -\- ... -\- -\-епхп является такой линейной комбинацией, то станет ясным, что это и означает вырожденность преобразования А. Невырожденные преобразования обладают ещё одним свойством, которое, подобно только что указанному, является для них харак- характеристическим: Преобразование А тогда и только тогда является невыро- невырожденным, когда единственным вектором, обращающимся после преобразования в нулевой вектор, является сам нулевой вектор. В самом деле, если векторы Aev ..., Аеп линейно зави- зависимы, то найдутся некоторые числа xt, , хп, не все равные нулю, для которых Аех • xt -[- • • • -|- Аеп • хп = 0. Но это озна- означает, что образ отличного от нуля вектора х=е1х1-\- ... -\- епхп равен нулевому вектору. Наоборот, если векторы Aev, ..., Аеп линейно независимы, то образ А(х) = Ае1х1-\- ... -\-Аепхп любого вектора д: = еххх -j-... -j- enxn, отличного от нуля, сам не ра- равен нулю. Простейшим из всех преобразований является тождественное преобразование Е, т. е. такое, которое оставляет все векторы прост- пространства неподвижными: Ех = х. Из соотношений 10 0 ... еп) = (е1, ..., еп) j \0 0 0 ... 1;
112 ВЕКТОРНЫЕ ПРОСТР\НСТВА. И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ следует, что тождественное преобразование во всяком базисе выражается единичной матрицей. В случае невырожденного преобразования А (и только в этом случае) можно говорить об обратном преобразовании: это — такое преобразование, которое переводит образ Ах любого вектора х, полученный при преобразовании А, снова в вектор л:. Другими сло- словами, обратным преобразованием для преобразования А называется такое преобразование А~1, для которого произведение А~1А яв- является тождественным преобразованием. Установленное раньше правило образования матрицы произведения преобразований пока- показывает, что матрицей обратного преобразования является обратная матрица матрицы данного преобразования, так как должно быть: MA-iMA =MA-iA =МЕ = Е. Ограничимся снова рассмотрением преобразований плоскости и обычного трёхмерного пространства. В этих случаях, как мы отме- отмечали выше, естественно пользоваться ортонормальными базисами (т. е. базисами, состоящими из взаимно перпендикулярных единичных векторов). При пользовании такими базисами в совокупности всех линейных преобразований естественно выделить некоторые частные их типы. Формальным основанием такого выделения могут послужить свойства матриц, представляющих эти преобразования. Важнейшими из определяемых таким путём классов преобразо- преобразований являются следующие: 1. Ортогональные преобразования, т. е. линейные преобразова- преобразования рассматриваемого пространства, которые в некотором орто- нормальном базисе выражаются ортогональными матрицами. 2. Симметрические преобразования, представляемые в таком базисе симметричной матрицей (т. е. такой, которая не меняется при транспонировании: МА=МА). Первый вопрос, который возникает в связи с таким определе- определением: может ли преобразование представляться симметричной или ортонормальной матрицей в одном ортонормальном базисе и в то же время в другом базисе выражаться матрицей какого-либо другого характера. Ответ на этот вопрос —¦ отрицательный: Если некоторое линейное преобразование А представляется в ортонормальном базисе симметричной (или ортогональной) матрицей, то такой же матрицей оно представляется и в любом другом ортонормальном базисе. В самом деле, переход от одного ортонормального базиса к дру- другому даётся ортонормальной матрицей перехода С (см. § 21). Поэтому С~1:=СТ. Пользуясь теперь правилом, связывающим матрицы Ма и М'А преобразования А в двух рассматриваемых базисах, будем иметь: М а = С1М А С = СТМА С
ЛИНЕЙНЫЕ ПРЕ0БР\30В\НИЯ ПЛОСКОСТИ И ПРОСТРАНСТВА 113 Если матрица МА была симметричной, т. е. если МА-=^МА, го матрица М'А будет симметричной, ибо 1 = {СТМАС) т = СТМ ГАСГТ = СТМА С (здесь мы пользовались образованием транспонированной матрицы для произведения матриц, указанным в § 21, а также тем обстоя- обстоятельством, что транспонированная матрица для транспонированной матрицы совпадает с самой данной матрицей). Если же матрица МА была ортогональной, то из равенства М АМА=Е, являющегося определением ортогональной матрицы, и из ортогональности матрицы С вытекают равенства (O^1 МаС) = (СТМАС)Т(СТМАС) = = СТМТАССТМАС= СГЛ4ТАМАС= СТС=Е, т. е. ортогональность матрицы М'А. Ортогональные преобразования могут быть охарактеризованы геометрически: Теорема. Преобразование А тогда и только тогда является ортогональным, когда оно не меняет длин векторов, т. е. когда для любого вектора х (Ах, Ах) = (х, х). В самом деле, если преобразование А является ортогональным, то для любых векторов е{ и е;- ортонормального базиса имеют место равенства (Aeit Ле,)=1 и (Ли,-, Ле;) = 0 при (ведь именно эти равенства и выражаются условиями ортогональ- ортогональности матрицы). Отсюда следует, что для любого вектора х=е1х1+ ... -\-е„хп будет: (Ах, Ах) = х\-\- ... -\-х\ = (х, х). Доказательство обратного утверждения несколько сложнее. Заметим, прежде всего, что преобразование, не изменяющее ска- скалярных произведений любых векторов, будет ортогональным: если (Ах, Ау) = (дг, у) для любых векторов х и у, то, в частности, (Aet, Aej) = (e;, e;), т. е. будет ргвно нулю или единице, смотря по тому, будет ли i ф j или i=j. Но это и означает ортогональность матрицы преобразования. Для полного доказательства формулированной теоремы остаётся доказать лишь такое утверждение: Если линейное преобразование А не меняет длин векторов, то оно не меняет и их скалярных произведений. 8 Энциклопедия, кн. 2.
114 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ В самом деле, если преобразование А не меняет длин векторов, то для любых векторов х и у должны выполняться равенства (А(х+у), А(х+у)) = (х+у, х+у). (Ах, Ах) = (х, х), (Ау, Ау) = (у, у). Пользуясь теперь тем, что (А (х+у), А(х+у)) = (Ах + Ау, Ах + Ау) = = (Ах, Ах) + 2 (Ах, Ау)-\-(Ау, Ау) и (х+у, х+у) = (х, х) + 2(х, у) + (у, у), из этих равенств получим (Ах, Ау) = (х, у), т. е. скалярное про- произведение любых векторов равно скалярному произведению их обра- образов. А это и нужно было доказать. Легко убедиться теперь в том, что любое ортогональное пре- преобразование пространства сводится к вращению и, может быть, ещё зеркальному отражению. Ограничимся рассмотрением трёхмерного пространства. Если еи е2, еа — исходный ортонормальный базис и е[, е'„, е'3 — образы его векторов, то очевидно следующее: 1) Можно произвести вращение пространства около начала коор- координат так, чтобы вектор е, перешёл в е\ (длины этих векторов равны). При этом векторы е2 и еа также повернутся и станут перпендикулярными к е\. 2) После этого можно вращать пространство вокруг вектора е[ так, чтобы вектор е% перешёл в е'г Так как при этом вектор е3 перейдёт в вектор, перпендикуляр- перпендикулярный к векторам е[ и е'а, то возможны только два случая: либо по- повёрнутый таким образом вектор совпадёт с е'3> либо окажется про- противоположным ему. В последнем случае для достижения совпадения нужно произвести зеркальное отражение в плоскости, натянутой на два первых вектора. Таким образом, всегда можно достигнуть того, чтобы в результате вращения и некоторого зеркального отражения (если последнее нужно) векторы е1г е%, еа перешли в е\, e's и е3. Так как вращение и зеркальное отражение являются линейными преобразованиями, то результирующее преобразование будет линей- линейным. А так как его действие на векторы базиса е,, е.2, е3 таково же, что и в случае заданного преобразования А. то это результирующее преобразование будет совпадать с А. § 25. Симметрические преобразования. Случай плоскости Геометрическая характеристика симметрических преобразований получается несколько сложнее, хотя результаты здесь столь же наглядны. Начнём со случая линейных преобразований плоскости, так как нужные нам вычисления здесь легко проводятся.
ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ГПОСКОСТИ И ПРОСТРАНСТВА 116 Пусть дано симметрическое преобразование А плоскости. Выби- Выбирая в качестве базиса два взаимно перпендикулярных единичных вектора, е,, es, выразим наше линейное преобразование матрицей A(elt e2) = | При этом в силу симметричности преобразования als = a31. Поста- Поставим вопрос: не существует ли на плоскости такого вектора х = etxt -\~ е2лт2, который при преобразовании не меняет своего направления? Предполагается, что этот вектор отличен от нуля, так как в противном случае не имеет смысла говорить о его на- направлении. Поставленное условие означает, что вектор Ах должен получаться из вектора jc умножением на некоторое число А. Запи- Записывая равенство Ах=1х в матричной форме по нашим правилам, получим: -* О- Отсюда следует, что должны соблюдаться такие числовые равенства: 1, (п I\п% ,\ или > A) —I— G*22~^2 "' '' *k*^2» ^12*^" 1 —I— \^22 ) *^2 Последние представляют собою систему линейных однородных урав- уравнений с неизвестными хи х%. Для того чтобы такая система имела отличное от нуля решение, как мы знаем, должно выполняться равенство определителя системы нулю j — X Это даёт уравнение для определения возможных значений числа X: = 0. B) Обращая теперь внимание на то, что коэффициенты этого уравне- уравнения действительны (мы рассматриваем обычную плоскость элемен- элементарной геометрии, так что все координаты векторов выражаются действительными числами) и что дискриминант уравнения (ап -]- gs2J + 4g^s — 4ana2S = (ап — gS2J + 4cfs Ss0, можем утверждать, что корни уравнения B) всегда действительны. Рассмотрим теперь отдельно два случая: а) Корни уравнения B) равны между собой. Это происходит тогда, когда дискриминант уравнения равен нулю, т. е. когда {аи—ап)% -}- 4^5 = 0. Но последнее равенство означает, что 8*
116 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВ \НИЯ аи — a?S! = 0 и а12 = 0. Таким образом, наше преобразование в рас- рассматриваемом случае задаётся матрицей /«и 0\ \0 ап]- Оно сводится к тому, что оба вектора базиса умножаются на одно и то же число аи. Но в таком случае, как легко видеть, для любого вектора д: будет: Ах = апх. Выражаясь геометрически, это озна- означает, что А есть преобразование подобия с коэффициентами по- подобия аи. б) Корни уравнения B) различны. Пусть они равны, соответ- соответственно, Xj и Х2. Выражая коэффициенты уравнения через его корни, будем иметь: all + a22=>-l + ^S. Подставим в уравнения A) сначала одно из значений X, например Xi- Так как определитель системы уравнений A) при этом обращается в нуль, система должна сводиться к одному уравнению, например к первому. Решение системы поэтому будет даваться значениями xt = a,s и Хо = Xj — ап (или любыми значениями, им пропорцио- пропорциональными). Таким образом, мы находим один вектор который под действием преобразования А только умножается на число X]. Этим свойством будет обладать также любой другой век- вектор, совпадающий по направлению с вектором л;,. Аналогичным образом находим и другой вектор х», обладающий тем свойством, что Axi = ).ixi. Таким вектором будет, например, xi = elal%-\- -j-e2(X2 — ап)- Легко усмотреть, что найденные векторы взаимно перпендикулярны, так как их скалярное произведение а„ + < = О О- Чтобы резюмировать полученные результаты, введём одно новое понятие: вектор х, обладающий тем свойством, что Ах=Ух, называется собственным вектором преобразования А. Число X называется собственным значением преобразования А, которому принадлежит собственный вектор д:. Если использовать введённое понятие, то просмотр получен- полученных выше результатов убеждает нас в справедливости следующей теоремы: Теорема. Каково бы ни было симметрическое преобразование плоскости, для него существуют два взаимно перпендикулярных *) Последнее получается применением формул C).
ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЛОСКОСТИ И ПРОСТР\НСТВА 117 собственных вектора, принадлежащих одному и тому же или различным собственным значениям. Учитывая теперь возможность произвольно изменить длину соб- собственного вектора, можем составить ортонормальный базис плоскости из собственных векторов заданного симметрического преобразова- преобразования. Если обозначить векторы этого базиса через е[ и е'о, а соб- собственные значения, к которым они принадаежат, — через X, и \it то для рассматриваемого линейного преобразования получим такое матричное выражение: А(е[, е'2) = {)пе\, he:) = (e[, e Написанное выражение показывает, что симметрическое пре- преобразование сводится всегда к растяжению (или сжатию) пло- плоскости в двух взаимно перпендикулярных направлениях. Правда, это должно пониматься в несколько расширенном смысле, так как значения \х и Хя могут быть отрицательными, а следовательно, направление одного или обоих векторов е\ и е'3 при нашем преоб- преобразовании может измениться на противоположное. Растяжение или сжатие в обычном смысле получается в том случае, когда оба собственных значения Xj и Xs положительны. § 26. Симметрические преобразования трёхмерного пространства Обратимся к случаю трехмерного пространства. Здесь возможен тот же путь исследования, что и выше, но из-за большего числа координат векторов возникают некоторые осложнения. Чтобы за- запись нужных нам формул не была слишком громоздкой, приходится вводить некоторые вспомогательные средства формального характера. Прежде всего введём понятие сопряжённого преобразования: если в некотором ортонормальном базисе задано преобразование А, матрица которого есть Мд, то преобразованием, сопряжённым к А, называется преобразование, матрицей которого будет Мд, т. е. транспонированная матрица преобразования А. Преобразование, со- сопряжённое преобразованию А, обозначается через А*. Это определение не зависит от выбранного ортонормального базиса: если перейти от заданного базиса к другому с помощью ортогональной матрицы перехода С, то матрица исходного преобра- преобразования А обратится в СГМДС, а матрица преобразования А* — в матрицу СТМ\С (С =СТ и матрица перехода — одна и та же для всех преобразований). Но последняя матрица есть не что иное, как транспонированная новая матрица преобразования А: (СГА1АС)Т = = Стм\С. Таким образом, каким бы ортонормальным базисом мм ни воспользовались, мы получаем одно и то же преобразование А*.
118 ВЕКТОРНЫЕ ПРОСТ?<ШСТВЛ И ЛИНЕЙНЫЕ ПРЕ0БР,\30В\НИЯ Сопряжённое преобразование Л* может быть также охаракте- охарактеризовано следующим способом: Преобразование Л* является сопряжённым с А в том и только в том случае, когда (Aet, ej)=(e{, Aej) для любых век- векторов ортонормального базиса ег, е.2, е3. В самом деле, пусть преобразования Л и Л* заданы матричными соотношениями /«и Л (е,, е%, е3) = (е1, е%, е3)[ а21 а22 а23 \«31 «32 «33 I I Из этих соотношений видно, что Aet = etau -J- е%аи -f- e3a3i j ,a^ (/, y=I, 2, 3), а следовательно, (Aet, e/) = a/?- и (е:, A*ej) = a]j. Отсюда видно, что указанное в формулировке доказываемого предложения равенство эквивалентно равенству atl = a\j, т. е. условию, чтобы матрица пре- преобразования А была транспонированной матрицей преобразования А. Эта характеристика может быть ещё несколько изменена и освобожде- освобождена от какой бы то ни было зависимости от базиса пространства: Преобразование А* тогда и только тогда является сопряжён- сопряжённым к преобразованию А, когда для любых векторов имеет место равенство (Ах, у) = (х, Ау*). В самом деле, если это равенство имеет место для любых век- векторов, то оно, в частности, справедливо для векторов базиса е,, е%, es, и мы приходим к доказанному предложению. Наоборот, если имеют место все равенства (Ле,-, е,-) = (е{, Л*е;), то для любых век- векторов x=e1xt-\~eixi-\-e3x9 и у = егух -\- е^у% -f- ?3.Уз в СИЛУ основ- основных свойств линейных преобразований и свойств скалярного про- произведения будут выполняться равенства (Ах, у) = (Л (eLxt -\- егхг -\- е9х3), е^ + ъу% -f ез-Уз) = (х, A*y) = (e1x1-\-eixs-\-e3x3, Л* (etyt -f в>уя з
ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЛОСКОСТИ И ПРОСТРАНСТВА 119 Отсюда следует, что если имеют место все равенства (Ае1у ej) = = (е,-, Л*ву), то должно быть: (Ах, у) = (х, А*у). Связь введённых определений с симметрическими преобразова- преобразованиями очевидна: само определение симметрического преобразования показывает, что оно эквивалентно такому: Линейное преобразование А называется симметрическим, если оно совпадает со своим сопряжённым преобразованием: А = А*. Ортогональные преобразования могут быть также определены с помощью понятия сопряжённого преобразования: Преобразование А будет ортогональным тогда и только тогда, когда его обратное преобразование совпадает с сопряжён- сопряжённым, т. е. когда А*А = Е. В самом деле, в этом случае для матриц преобразований А и А* будет справедливо соотношение МА*МА = МАМА = Е, т. е. ма- матрица МА будет ортогональной. Всё сказанное относится также и к случаю плоскости. Одна- Однако в этом случае нет особой необходимости во введённых по- понятиях, так как имеющие здесь место соотношения достаточно просты, и их можно исследовать непосредственно, как это было сделано выше. Рассмотрим теперь произвольное симметрическое преобразование трёхмерного пространства, заданное в некотором ортонормальном базисе матричными соотношениями (aik = aki). Сохраняя прежнее определение собственного вектора и собственного значения, можем получить в координатной форме условия того, чтобы вектор x = e1xi-\-eixi-\-e3x3 был собственным вектором преобразования А, принадлежащим собственному значению I. Эти условия будут иметь вид ^8/ I «21 «22 «23 I '. "*a \a3, aai G33/ \лг3 = (ei, eit ea)
120 BEKTOPHblF ПРОСТР\НСТВ\ И ЛИНЕЙНЫЕ ПРЕОБР130ВАНИЯ и приводятся к системе уравнений т. е. аЫХ1 4~ Й32-*Г2 4~~ «ЗЗ-^З ''-^З' (а,, — >„) хх 4- ашхг + «IЛ = °. 22 A) «зЛ 4-«32*2+ («зз — >0^з = 0- j Для того чтобы последняя система имела решение, отличное от нулевого, необходимо и достаточно обращение определителя её и нуль: |«И * «J2 «13 «si Go, «S2 ^ а, о S3 = 0. B) Это — уравнение третьей степени. Но известно, что уравнение третьей степени с действительными коэффициентами имеет хотя бы один действительный корень (многочлен третьей степени принимает значения разных знаков при больших положительных и больших по абсолютной величине отрицательных значениях неизвестного). Таким образом, найдётся хотя бы одно значение X, удовлетворяющее урав- уравнению B). При этом значении вторая из систем уравнений B) допускает решение, отличное от нулевого, и значения xv xit xA, удовлетворяющие этой системе, будут координатами некоторого собственного вектора д: нашего преобразования. Таким образом, получаем следующую лемму: Лемма. Любое симметрическое линейное преобразование трёх- трёхмерного пространства имеет по крайней мере один собственный вектор. Это позволяет немедленно обнаружить существование трёх взаимно перпендикулярных собственных векторов следующим образом. Обозначим найденный собственный вектор (будем пред- предполагать, что он сделан по длине равным единице) через е[. Рас- Рассмотрим совокупность всех векторов, перпендикулярных к вектору е\. Они заполняют некоторую плоскость, которую мы будем теперь рассматривать как самостоятельное двумерное векторное про- пространство. Эта плоскость замечательна тем, что её векторы при применении к ним преобразования А остаются перпендику- перпендикулярными к вектору е\, т. е. остаются лежащими на нашей плоскости. В самом деле, если х—вектор плоскости, т. е. если U, е[) = 0, то {Ах, е[) = (х, А*е\) = (х, Ае[) = (х, >.,<?;) = 0, так
ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЛОСКОСТИ И ПРОСТРАНСТВА 121 как в силу симметрии преобразования А*=А. Но равенство ска- скалярного произведения (Ах, е[) нулю означает, что вектор Ах пер- перпендикулярен к вектору е\ (может быть, впрочем, и Ах —0, но это не меняет нашего общего вывода, так как нулевой вектор лежит на плоскости). Полученный результат означает, что наше преобразование можно рассматривать также как преобразование упомянутой плоскости в себя. Оно будет линейным, так как оно линейно во всём про- пространстве. Кроме того, это преобразование плоскости будет симме- симметрическим: равенство (Ах, у) — (х, Ау), вытекающее из условия А = А*, имеет место даже для всех векторов пространства, а не только для векторов плоскости. Но выше мы доказали, что для любого симметрического преобразования плоскости на ней найдутся два взаимно перпендикулярных собственных вектора e's, e'% (их также можно предполагать равными единице по длине). Таким образом, в пространстве найдены три взаимно перпенди- перпендикулярных собственных единичных вектора е[, е\, е'3 преобразова- преобразования А. Их можно принять за базис пространства. В этом базисе преобразование А задаётся соотношением А(е[, e's, е3) = показывающим, что преобразование снова сводится по существу к простому растяжению пространства в трёх взаимно перпен- перпендикулярных направлениях (с возможным изменением этих напра- направлений на противоположные). Растяжения пространства в собственном смысле выделяются среди всех симметрических преобразований тем, что для них все соб- собственные значения X,, >2> Х3 положительны. Этого же можно до- достигнуть с помощью понятия о положительно определённом пре- преобразовании: преобразование А называется положительно опреде- определённым, если ни один вектор не образует со своим образом тупого угла, т. е. если для любого вектора л: имеет место соотношение (Ах, *MгО. Собственные значения положительно определённого симметри- симметрического преобразования не отрицательны. В самом деле, если е{ — собственный вектор преобразования А, то из неравенства (Aev e1) = (X,e1, e,)^0 и из того, что скаляр- скалярное произведение (е,, et) как квадрат длины вектора е1 положи- положительно, вытекает, что Х,^0. Таким образом, растяжения пространства характеризуются тем, что они являются положительно определёнными спмметри ческимп преобразованиями,
122 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ § 27. Представление произвольного линейного преобразования произведением ортогонального и симметрического Из результатов предыдущего параграфа вытекает следующая теорема, показывающая, что произвольное линейное преобра- преобразование пространства (или плоскости) сводится к последователь- последовательному выполнению растяжения в трёх взаимно перпендикулярных направлениях, вращению и, может быть, отражению в некоторой плоскости. Теорема. Любое невырожденное линейное преобразование является произведением симметрического преобразования и не- некоторого ортогонального. Доказательство этой замечательной теоремы удобно раз- разбить на несколько этапов. 1. Произведение линейного преобразования на его сопряжённое является симметрическим преобразованием, причём положи- положительно определённым. Если преобразованию А соответствует в некотором ортонор- мальном базисе матрица Ма, то преобразованию Л" в этом же базисе соответствует матрица Ма- Отсюда следует, что произведе- произведению А*А соответствует матрица Ма-Ма- Её транспонированная матрица (МтаМа)Т = МТа (Ма)т совпадает с ней, так что преобра- преобразование А*А симметрично. Чтобы доказать положительную определённость преобразова- преобразования А'*А, достаточно воспользоваться свойством сопряжённого пре- преобразования: если л: — произвольный вектор, то (х, А*Ах) = (Ах, Ах). Но скалярное произведение вектора на себя не может быть отри- отрицательным, так что (х, А*Ах)^0.. 2. Для любого симметрического положительно определённого преобразования существует другое положительно определённое преобразование, квадрат которого равен данному. Согласно доказанному в предыдущем параграфе в пространстве найдётся такой ортонормальный базис, в котором матрица данного симметрического преобразования имеет вид /х, о о- МА=\ 0 )., О \о о х3 Числа X], Х2, Х3 не могут быть отрицательными в силу положитель- положительной определённости данного преобразования. Поэтому можно
ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПТОСКОСТИ И ПРОСТРАНСТВА 123 образовать матрицу / /Tt 0 0' О которая, как и всякая матрица, будет матрицей некоторого линей- линейного преобразования В. В силу того, что эта матрица симметрична, преобразование В будет симметрическим. Квадрат преобразования В будет совпадать с данным преобразованием, так как произведение матрицы В на себя даёт матрицу МА. 3. Сопряжённое преобразование для произведения двух или нескольких преобразований равно произведению их сопряжённых в обратном порядке. Это утверждение просто следует из рассмотрения матриц: если А и В — данные преобразования, а Ма и Mb—матрицы, соответст- соответствующие им в некотором ортонормальном базисе, то М аМв будет матрицей преобразования АВ, а (МаМв)г—-матрицей сопряжённого преобразования (АВ)*. Но (МаМв)т — МтвМта, а это есть не что иное, как произведение матриц Мв* и Ма* преобразований В* и Л*. После всего сказанного доказательство формулированной теоре- теоремы не представляет труда. Пусть А—данное невырожденное пре- преобразование. Образуем произведение А*А. Это преобразование бу- будет симметрическим, положительно определённым и невырожденным (последнее следует из теоремы об определителе произведения двух матриц). В силу только что доказанного, существует симметриче- симметрическое положительно определённое преобразование В, квадрат кото- которого равен А*А: В* = А*А; преобразование В будет также невырожденным. Поэтому существует обратное преобразование В~1, а следовательно, мы можем написать равенство А = (АВ'1) В. Формулированная теорема будет доказана, если мы обнаружим, что преобразование АВ~1 будет ортогональным. Но мы имеем: (AB~l)*AB~l = В-1 А* А В'1 = Вг1В2В~1 = Е'), откуда следует, что преобразование (ЛВ)* является обратным для преобразования АВ'1, а это и нужно (см. замечание об ортогональ- ортогональных преобразованиях в предыдущем параграфе). 1) Преобразование В~* будет также симметрическим: (Z?)* = Z?,
124 ВЕКТОРНЫЕ ПРОСТРАНСТВ\ И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ § 28. Упрощение уравнений линий и поверхностей второго порядка. Изложенная теория допускает важные приложения к исследо- исследованию линий и поверхностей второго порядка. Мы начнём с рассмотрения кривых, прич-ём ограничимся частным случаем, когда кривая имеет центр симметрии. Такие кривые назы- называются центральными. Если воспользоваться любой прямоугольной координатной систе- системой, начало которой расположено в центре симметрии кривой вто- второго порядка, то её уравнение запишется в виде ax*-\-2bxy-\-cyv-=d, A) где множитель 2 при произведении координат введён для удобства. Обозначим через ех и е% единичные векторы, направленные вдоль координатных осей. Они образуют базис рассматриваемой плоскости. Если х и у — координаты некоторой точки, то r = e1x-\-eiy — радиус-вектор. Рвссмотрим теперь линейное преобразование А плоскости, опре- определяемое в рассматриваемом базисе матрицей. Ь с) составленной из коэффициентов уравнения кривой. Легко видеть, что для вектора А{г) будем иметь выражение = (аех -f- tes) x + (bex -\- сег) y = ex (ax -f by) -f- e2 (bx + cy). Отсюда следует, что левая часть уравнения A) является скаляр- скалярным произведением векторов г и А(г), так что уравнение рас- рассматриваемой кривой может быть переписано в виде (г, Ar) = d. B) Такая запись позволяет легко судить о том, что происходит с уравнением кривой при переходе от одной координатной системы к другой. В силу того, что преобразование А является симметри- симметрическим, на плоскости существует ортонормальный базис, состоящий из собственных векторов е\ и е[ преобразования А. Если перейти к системе координат, определяемой этим базисом, то мы будем иметь соотношения г = е[х' -|- е\у\ А (е[) = > хе\,
ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЛОСКОСТИ И ПРОСТРАНСТВА 125 (е[, е[) = (el, <) = 1, (е[, е',) = 0. Поэтому уравнение B) перепишется в виде = d. C) Это и будет уравнением нашей кривой в новой системе координат. Простота формы уравнения C) даёт возможность по нему непо- непосредственно судить о форме кривой, что было бы затруднительным сделать, пользуясь первоначальным уравнением A). В частности, из уравнения C) сразу видно, что новые оси координат являются осями симметрии рассматриваемой кривой. Этим доказано существование у любой центральной кривой второго порядка двух взаимно пер- перпендикулярных осей симметрии. Можно было бы, несколько допол- дополнив приведённые соображения, получить полную классификацию всех кривых второго порядка. Однако это увело бы нас от основ- основной темы. Сила применённого метода станет ещё более наглядной при рас- рассмотрении случая центральных поверхностей второго порядка. Если начало координат находится в центре симметрии такой поверхности, то её уравнение будет иметь вид ах* + Ыху f су* + 2dxz + 2/уг -(- gz* = h. Читателю предоставляется самому проверить, что это уравнение может быть записано в виде (г, Л(г)) = /г, если через г обозна- обозначить радиус-вектор точки, а через А — симметрическое преобразо- преобразование, определяемое матрицей Если теперь найти ортонормальный базис пространства, состоящий из собственных векторов преобразования А, и перейти к системе координат, определяемой этим базисом, то повторение приведённых выше рассуждений показывает сразу, что в новой координатной системе уравнение нашей поверхности будет иметь вид Как и в случае кривых, полученное уравнение даёт возможность легко решать все вопросы, относящиеся к форме и расположению рассматриваемой поверхности. В частности, отсюда следует суще- существование трёх взаимно перпендикулярных плоскостей симметрии у любой центральной поверхности второго порядка.
126 ВЕКТОРНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ Литература 1. Шапиро Г. М., Высшая алгебра, изд. 4-е, дополненное, Учпед- Учпедгиз, 1938. 2. О кун ев Л. Я., Высшая алгебра, изд. 4-е, Гостехиздат, 1949. 3. Курош А. Г., Курс высшей алгебры, изд. 2-е, Гостехиздат, 1950. 4. С у ш к е в и ч А. К. Основы высшей алгебры, изд. 4-е, Гостехиздат, 1941. В этих четырёх книгах можно найти (вложение теории определителей, отлич- отличное от приведённого в настоящей статье. Наиболее доступной но своему изложению является книга Г. М. Шапиро. 5. Виноградов С. П., Основания теории детерминавтов, ГТТИ, 1933. Кроме лёгкости изложения, эта книжечка обладает ещё тем достоин- достоинством, что в ней собрано довольно много поучительных задач, снабжённых ответами и ипогда указаниями. 6. Каган В. Ф., Основы теории определителей, Одесса, 1922. Обширная монография по вопросам, связанным с теорией определителей. В ней содержится, в частности, изложение многих исторически имевших место подходов к введению определителей. 7. Фаддеев Д. К. и Соми некий И. С, Сборник задач по высшей алгебр,е, Гостехиздат, 1949. В книге даны многочисленные примеры вычисления определителей. В нужных случаях задачи снабжены указаниями, так что книга может быть рекомендована всем, кто хочет овладеть техникой вычисления опре- определителей. 8. Гельфанд И. М., Лекции по линейной алгебре, Гостехиздат, 1918. 9. Мальцев А. И., Линейная алгебра, Гостехиздат, 1948. В этих двух книгах читатель найдёт более подробное изложение самой теории линейных преобразований, причём во второй из них изложение сопро- сопровождается некоторым количеством задач, разбор которых способствует усвоению освещаемого в книге материала.
Л. Я. ОКУНЕВ КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ
ГЛАВА I КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО § 1. Кольцо многочленов В курсе элементарной алгебры понятия многочлена и рациональ- рациональной функции (алгебраической дроби) играют существенную роль. В средней школе часто приходится иметь дело с такими выраже- выражениями, как, например, и т. п. Возникает естественный вопрос: что понимать под этими вы- выражениями, в каком смысле следует понимать равенство, сложение и умножение подобного рода выражений? Обратимся, прежде всего, к конкретным примерам; они позволят нам лучше уяснить те трудности, с которыми связано обоснование понятий многочлена и алгебраической дроби. Возьмём многочлен jc3 —j— лг2. Этот многочлен можно рассматри- рассматривать как функцию переменного х, определённую на множестве дей- действительных или на множестве комплексных чисел. Однако такая функциональная точка зрения, характерная для математического анализа, в алгебре в ряде случаев оказывается неприемлемой. Обра- Обратимся хотя бы к целым числам; обозначим через 0 совокупность чётных и через 1 — совокупность нечётных чисел и рассмотрим ко- конечное множество Р, состоящее только из двух элементов, а именно из 0 и 1. Установим во множестве Р операции сложения и умно- умножения с помощью равенств 04-0 = 0, 0 4-Т= 1 4-0= 1, l-fl=0, 1 0-0 = 0, 0- Т=Л-0 = 0, Г-Т=Т. / Определяя так операции сложения и умножения, мы руковод- руководствовались тем, что сумма двух четных чисел есть число чётное, сумма чётного и нечётного есть число нечётное, сумма , двух, 9 Энциклопедия, кн. 2.
130 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ нечётных чисел есть число чётное, произведение двух чёт- чётных — чётное и т. п. Предоставляем читателю самому проверить, что относительно введённых операций сложения и умножения множество Р образует поле*), причём 0 является нулём, а 1 — единицей поля. Посмотрим теперь, что получится, если многочлен хг -\- х2 рас- рассматривать как функцию переменного х, определённую на множе- множестве Р. Нетрудно заметить на основании равенств A), что функция х3 -)- хг равна нулю на всём множестве Р. Следовательно, Отсюда JC3 -)- X* ~\- X = X, ДГ4 -(- X3 -{- Xs = JC4 и т. п. Итак, рассматривая многочлены как функции, определённые на множестве Р, мы пришли к правилам обращения с многочленами, резко отличающимся от обычных. В случае алгебраических дробей возникает еще' одно осложне- осложнение. Обратимся, например, к дробям Xs 1 t j- _i 1 \а 1 ( * 1А ~Т~ II •*;— v_, 1 g(x) — и будем их рассматривать как функции в области действительных чисел. Тогда f(x) и g(x) будут иметь различные области опреде- определения: функция f(x) определена для действительных значений х, отличных от 1, а функция g(x) определена для действительных значений х, отличных от ¦—1. Поэтому мы вынуждены рассматри- рассматривать f(x) и g(x) как различные функции: X—1 ^ Х+1 Точно так же v;3 J ^+1 Таким образом, при изложении общей теории многочленов и ал- алгебраических дробей целесообразнее отказаться от функциональной точки зрения, и мы соответствующие понятия будем вводить чисто алгебраически. Несколько ниже (в §§ 3, 11 и 12) мы установим, в каких случаях алгебраическая и функциональная точки зрения на многочлены и алгебраические дроби являются эквивалентными. Своё изложение мы начнём с многочленов от одного х. Что ка- касается многочленов от нескольких х1г , хп и алгебраических 1) Определение кольца и поля, а также основные свойства кольца и поля см. Э. э. м., кн. 1, И. В. Проскуряков, Понятия множества, группы, кольыа и поля. Теоретические основы арифметики.
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 131 дробей, то о них речь пойдёт лишь после изложения общей теории многочленов от одного х. Понятие многочлена от лг можно ввести следующим образом. Пусть R — некоторое коммутативное кольцо с единицей е ф 0. Элементы кольца R мы будем обозначать начальными буквами а, Ь, с, ... латинского алфавита. Многочленом от х над кольцом R мы назовём выражение вида c1jcfci4-a2^fc2+ ••- +арЛ E^1), B) где аи с2, ... , as—элементы из R, k1<^ki<^ ... <^ks—целые неотрицательные числа, лг° принимается равным единице е, а также принимается, что при любом целом неотрицательном к exk = =xke=xk. Следует обратить внимание на то обстоятельство, что мы здесь х, лг2, , лгй, , а также выражения CiJC*1, ..., as-A и знак -{-, соединяющий о^лг*!, ... , a^s, рассматриваем как символы, кото- которым не приписывается определённого значения. В соответствии с этим х будет называться неизвестным. В дальнейшем, после вве- введения понятия равенства многочленов и действий сложения и умно- умножения многочленов, мы придём ко вполне определённому истолкова- истолкованию неизвестного лг; символы xk совпадут со степенями х, а само выражение B) будет восприниматься как сумма произведений этих степеней на элементы из кольца R. Отметим, что элементы кольца R можно всегда рассматривать как многочлены над R, а именно как многочлены вида слг°. Очевидно, что выражение axk, где k — произвольное целое неотрицательное число, и, в частности, само -неизвестное х являются также много- многочленами над R. Элементы alt а%, ... , as, входящие в выражение B), обычно называются коэффициентами, а а1лг61, а2хк9, ... , asxks—членами многочлена B). В частности, asxks называется старшим членом и as — старшим коэффициентом многочлена. Для сокращения письма мы часто будем многочлены обозначать через /(лг), ^(лг), h(x) и т. п. Введём понятия равенства, суммы и произведения многочленов от х над кольцом R. Пусть /(лг) и g(x) — два произвольных многочлена над R. Эти многочлены мы считаем равными (тождественно равными) только тогда, когда многочлен f(x) состоит из тех же членов, что и мно- многочлен g(x), кроме членов с коэффициентами, равными нулю (если такие члены имеются). Например, многочлены равны. Напротив, многочлены , f(x) = x-\-xi-\-xs и g (лг)=лг -\- х* 4- Xs -\- х1 9*
132 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ не равны, так как g(x) обладает членом л;4, не входящим в со- состав членов /(лг). Из этого определения равенства многочленов вытекает, что мы можем всякий многочлен f(x) над R привести к виду (я — целое неотрицательное число), добавляя, в случае необходимости, члены с коэффициентами, рав- равными нулю. В таком виде мы часто будем записывать многочлен. Согласно определению равенства многочленов имеем, в частности, что многочлен /(лг) равен нулю (т. е. нулевому элементу кольца R) лишь в том случае, когда все коэффициенты f{x) равны нулю. Та- Таким образом, если многочлен f(x) не равен нулю, то по меньшей мере один из его коэффициентов должен быть отличен от нуля. Обратимся теперь к действиям сложения и умножения много- многочленов. Пусть /(лг) = а„-\- ахх -\- а^х* -\- ... -f <*„¦*", — два произвольных многочлена над R. Под их суммой f(x)-\-g{x) мы будем подразумевать многочлен do + dtx + diX*-\-... -\-dkxk, где k есть наибольшее из чисел пит, di = ai-\-b? при этом если я ]> т, то следует полагать: Ьт+1 = ... = Ьп = 0, а если п<^т, то следует полагать: ап+1 = ... = ат = 0. Под произведением f(x)g(x) мы будем подразумевать много- многочлен ) **+•¦• . (A) где ai = 0 при i^>n и Ь} = 0 при ^ Посмотрим теперь, что вытекает из этих определений суммы и произведения многочленов над R. Обозначим через R [х] множество всех многочленов от лг над кольцом R. Мы утверждаем, что введённые нами действия сложе- сложения и умножения подчиняются основным алгебраическим законам. Точнее, имеет место следующая Теорема 1. Множество R [лг] образует кольцо относительно сложения и умножения многочленов над R и притом кольцо ком- коммутативное. Доказательство. Очевидно, что, складывая или перемножая два каких-нибудь многочлена от неизвестного лг с коэффициентами из R, мы всегда получаем однозначно многочлен от лг с коэффи-
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 133 циентами из того же кольца R. Таким образом, сложение и умно- умножение многочленов от х над R являются алгебраическими опера- операциями, определёнными во множестве R [х]. Нетрудно, далее, проверить, что операции сложения и умноже- умножения многочленов из R [х] подчиняются переместительному, сочета- сочетательному и распределительному законам. Мы ограничимся выводом сочетательности умножения. Умножим /(*)g (*) = aobo 4- {ajbi + g,60) x + ... 4- anbmxn+m на многочлен Л(х) = со-|-с1лг + ... -j-e,**. Согласно определению проичведения многочленов получаем: lf(x)g(x)]h(x) = = aoVo + KVi+ao6Ico + «iVo)*+ ... -f" й«6*Л*"+т+'. C) С другой стороны, g (х) h (x) = boco + (Vi + Vo) *+•••+ bmctxm+l, откуда на основании того же определения произведения f{x)[g(x)h(x)] = ¦• +апЬтс1хп+т+1. D) Сравнивая коэффициенты многочленов C) и D) при одинаковых х1 и вспоминая определение равенства многочленов, видим, что [/(*) g(х)} h (x) =/(*) [g (x) h (x)], т. е. умножение многочленов над R подчиняется сочетательному закону'). Наконец, нетрудно убедиться, что во множестве R [х] сложение всегда обратимо: для любых двух многочленов ... +апхп из R [х] уравнение f (x)-\-z = g (х) всегда разрешимо в R [х]. В самом деле, легко проверить, пользуясь определением сложе- сложения многочленов, что при п = т х) Существенную роль в доказательстве теоремы играет то обстоятель- обстоятельство, что R есть кольцо. Например, при проверке сочетательного закона для умножения многочленов мы опирались на сочетательный и распределитель- распределительный закспш сложения и умножения элементов кольца R.
134 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ при п^>т и при Только что доказанная теорема позволяет сделать ряд заклю- заключений относительно многочленов над R. Отметим наиболее су- существенные. 1° Благодаря выполнимости сочетательного закона для операции сложения мы можем теперь многочлен f{x) = ao-\~alx-\- ... +а„*п рассматривать как сумму его членов а^1. При этом члены мно- многочлена /(лг) можно записывать в любом порядке следования, так как сложение подчиняется и переместительному закону. Например, мы могли бы многочлен /(лг) записывать также и в порядке убы- убывания индексов коэффициентов: / (х) = аХ + an_lXn-1 + • • • + «о- 2° Благодаря тому, что операция умножения подчиняется соче- сочетательному закону, мы теперь можем символы jc2, лг3, , хп рас- рассматривать как степени неизвестного лг, причём xsxt = xs+t. Каждый член ujX1 многочлена /(лг) можно рассматривать как произведение элемента at кольца R на степень лг' неизвестного лг. При этом в силу переместительности умножения aixi=xiai. 3° Произведение (ялт*) (Ьх1), где a, b — элементы кольца R, k и / — целые неотрицательные числа, равно abx4*1. Так как, сверх того, для операций сложения и умножения многочленов из R [х] имеет место распределительный закон, то /(лг) и^-(лг)можно пере- перемножать по обычному школьному правилу, состоящему в том, что каждый член многочлена f(x) умножается на каждый член много- многочлена ^(лг), в результате чего получаются выражения вида а;67-лг'+7, составляется сумма всех таких выражений и, наконец, производится приведение подобных членов *). 4° Уравнение f (x)-\-z=g(х), где /(лг) и ^(лг) — произвольные многочлены из R [лг], имеет на основании известного свойства кольца единственное решение. Это единственное решение z будет ') Законность приведения подобных членов основана на том, что опера- операция сложения многочленов из R [х] подчиняется переместительному и соче- сочетательному законам и что сложение и умножение многочлепов из /? [х] свя- связаны распределительным законом.
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 135 обозначаться через g(x)—f(x) и называться разностью многочле- многочленов g(x) и f(x). В частности, имеем f(x)-f(x) = 0, 0—/(*) =—/(*), где — /(лг)—многочлен, противоположный /(лг), т. е. такой много- многочлен, сумма которого с многочленом /(лг) равна нулю. Поскольку множество R [х] образует кольцо относительно сло- сложения и умножения многочленов над R, мы будем R [лг] называть кольцом многочленов от х над R. До сих пор неизвестное х рассматривалось как чистый символ. Теперь мы можем дать неизвестному лг некоторое истолкование. Для этой цели введём понятия подкольца, расширения кольца и трансцендентного элемента. Пусть К—произвольное кольцо (коммутативное или некоммута- некоммутативное — безразлично). Если некоторая часть К элементов кольца К образует в свою очередь кольцо относительно тех же самых опе- операций -J- и •, то мы эту часть назовём подкольцом кольца К, а само К—расширением кольца К. Например, кольцо чётных чисел является подкольцом кольца це- целых чисел, а кольцо целых чисел — расширением кольца чётных чисел. Другим примером может служить кольцо многочленов R [лг]: оно является расширением кольца R. Будем и в дальнейшем через R обозначать коммутативное кольцо с единицей е ^ 0. Пусть Q — некоторое коммутативное расширение кольца R, обладающее той же самой единицей е, что и R. Элемент 6 из Q мы назовём трансцендентным относительно R, если для любого целого неотрицательного я равенство где а0, alt ... , ап»—элементы из R, возможно лишь в том случае, когда ао = а1= ... =ап = 0. Из этого определения видно, что трансцендентный элемент 6 является по отношению к кольцу R внешним элементом: он не мо- может лежать в R. В самом деле, если бы 6 лежало в R, то 6 = а, где а — некоторый элемент кольца R, т. е. мы имели бы равенство 6 — а = 0 с коэффициентом е ^ 0, что противоречит трансцендент- трансцендентности 6. Исторически первым примером трансцендентных элементов были так называемые трансцендентные числа, т. е. комплексные числа, трансцендентные относительно кольца целых чисел. Впервые суще- существование трансцендентных чисел было установлено Лиувиллем в 1851 г. В 1873 г. Эрмитом была обнаружена трансцендентность числа е, основания натуральных логарифмов. В 1882 г. Линдеман показал, что и число тс, отношение длины окружности к диаметру,— также трансиендентно. Дальнейший существенный шаг вперёд в развитии теории трансцендентных чисел был сделан советским
136 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ учёным А. О. Гельфондом в 1929—1936 гг., установившим трансцен- трансцендентность одного замечательного класса чисел*). Возникает вопрос, существует ли для всякого кольца R транс- трансцендентный элемент. Ответ на этот вопрос даёт следующая Теорема 2 (о существовании трансцендентного элемента). Для всякого коммутативного кольца R с единицей ефО существует коммутативное расширение Q с той же самой единицей е, содержащее по меньшей мере один элемент, транс- трансцендентный относительно R. Мы опускаем доказательство этой теоремы2). Обозначим через R [6] множество элементов расширения Q кольца R, имеющих вид а0 -\- о^б -}-...-[- апЬп (я — произвольное целое неотрицательное число), где 6 — попрежнему элемент из 9, трансцендентный относительно R, а а0, аи ... , ап — произвольные элементы из R. Можно показать, что операции сложения и умножения элементов кольца Q являются алгебраическими операциями и для R [6]. В самом деле, пусть и предположим для определённости, что Обратимся к сумме а -\- р: m). E) В Q, как и во всяком кольце, сложение подчиняется сочетательному и переместительному законам. Следовательно, в правой части ра- равенства E) можно раскрыть скобки и сгруппировать слагаемые с одинаковыми степенями 6. В результате мы получим: или на основании распределительного закона: ') Более полные сведения о трансцендентных числах см. Э. э. м., кн. 1, А. Я- X и н ч и н, Элементы теории чисел. 2) Соответствующее доказательство см. в кн. И. В Проскурякова [в] на стр. 239—240, а также в книге Л. Я. Окувева [4] на стр. 330. Отметим по- попутно, что в теореме 2 говорится лишь о существовании расширения й, со- содержащего по меньшей мере одни трансцендентный элемент, но ничего не говорится о природе такого расширения. Поэтому было бы ошибочным пред- предполагать, что из теоремы 2 вытекает существование трансцевдентных чисед. г) Если пт^т, то члены «m+iSm+1i •¦¦ , ол9" отпадают.
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 137 Но ao-\-bo, a,4-*i. ¦•• , ат-\-Ьт, ат+1, ... , ап суть элементы R. Следовательно, а -\-13 есть элемент множества R [6]. Подобным же образом убеждаемся, что а[3 есть также элемент R [6] (здесь, кроме переместительности и сочетательности сложения и распределительного закона, придётся воспользоваться сочетатель- сочетательностью и переместительностью умножения элементов кольца 2). Но ещё существеннее следующее обстоятельство. Теорема 3. Множество R [6] и кольцо многочленов R [х] изоморфны. Доказательство. Поставим в соответствие каждому много- многочлену f(x)=za0-\-a1x-{- ... -}-апхп из R[x] элемент а = ао-\- -\-ui6-\- ... -\-aJ)n из R[b\ с теми же самыми а0, аи ... , ап, что и у многочлена f(x): ... -\-апЬп. F) (->- — знак соответствия). Мы сейчас покажем, что соответствие F) является изоморфиз- изоморфизмом между R [х] и R [6]. Прежде всего нетрудно убедиться, что соответствие F) не только однозначно, но и взаимно однозначно. Для этой цели возьмём из R [х] ещё один многочлен Тогда g( Если а = р, то а — р = 0. Но Отсюда, опираясь на основные алгебраические свойства операций, имеющие место во всяком коммутативном кольце и, в частности, в кольце 2, получаем, что при п = т при п и при Так как 6 трансцендентно относительно R, то получается, что при п = т со = 6о, а, = Ьи ... , а„ —?,„ при п^>т
138 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ при п<^т яо=А. а1=Ь1, ... , an = bn, bn+1=0, ... , bm = 0. Мы видим отсюда, что f(x) — Для завершения доказательства теоремы остаётся показать, что сумме и произведению любых двух многочленов из R [х] соответ- соответствуют сумма и произведение соответствующих элементов из R [6]. Пусть, например, /(*) = «о + aix + • • • + ап*п> и в^т. Тогда согласно определению сложения многочленов из R[x] где ci = ai-\-bl, причём при п^>т коэффициенты Ьт+1,...,.Ьп следует считать равными нулю. Этому многочлену f(x)-\-g(x) мы должны поставить в соответствие Но =co+Cle+...+C|Ie»=T. Следовательно, Аналогичным образом обнаруживается, что Теорема доказана. Из изоморфизма кольца многочленов R [х] с множеством R [6] вытекает, что R [6] есть также кольцо. Тем самым R [6] есть рас- расширение кольца R, содержащее элемент 6, и в то же время R [Щ есть подкольцо кольца Q. Оказывается, что R [6] является мини- минимальным в следующем смысле: никакое подкольцо кольца R [6], отличное от R [6] и являющееся расширением R, уже не может содержать элемента 6. В самом деле, пусть 5—некоторое подкольцо кольца R [6], содержащее элемент 6 и являющееся расширением R. Тогда, оче- очевидно, 5 будет содержать не только 6, но и любую целую неотри- неотрицательную степень 6fe элемента 6. Так как 5 является расшире- расширением R, то 5 должно содержать произвольный элемент а кольца R, а потому должно содержать и abk. Отсюда 5 должно содержать и всевозможные элементы вида
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 139 где ft—произвольное целое неотрицательное число, а0, аи ... , ~„—¦ произвольные элементы из R. Таким образом, 5 должно совпадать с R [6], и минимальность R [6] становится очевидной. Изоморфизм кольца многочленов R [х] с кольцом R [6] даёт нам право считать R [х] и R [б] неразличимыми с точки зрения их ал- алгебраических свойств относительно операций сложения и умноже- умножения, а само х рассматривать как элемент, трансцендентный отно- относительно R. Таково истолкование неизвестного лг. Введём теперь понятие степени многочлена от неизвестного лг. Возьмём из R [х] произвольный многочлен, не равный нулю. В та- таком многочлене по меньшей мере один коэффициент должен быть отличен от нуля. Назовём степенью этого многочлена наибольшую из степеней его членов, у которых коэффициенты не равны нулю. Например, /(лг) = 1 -f- 2лг -[- Злг2 -f- 0 • х3 -\- 2х* -\- 0 • хв есть многочлен от лг четвёртой степени над кольцом целых чисел. Если степень многочлена f{x) равна п, то, очевидно, мы его можем всегда записать в виде f{x) = an-\-alx-\- ... +апхп или в виде /(*) = апхп + ап_,хп-1 + ... + а0 со старшим коэффициентом ап, отличным от нуля, так как члены, содержащие лг в степени выше /z-й, равны нулю, и мы их можем отбросить. Всякий элемент а ф 0 кольца R можно рассматривать как мно- многочлен нулевой степени от неизвестного лг, потому что а = ах°. Что касается нуля кольца R, то мы его будем рассматривать как многочлен, не имеющий степени. Понятие степени позволяег весьма просто выразить 'условие ра- равенства двух многочленов от х. А именно, если — два многочлена из R [лг] соответственно степени п и т, то эти многочлены равны лишь в тм и только в том случае, когда их степени равны и равны < их коэффициенты при одинаковых степенях неизвестного: = т, ao = bo, al=bl, .... an = b n. Что касается многочлена, равного нулю, то, как мы знаем, все коэф- коэффициенты такого многочлена должны быть равны нулю. Из определения операции сложения многочленов от х легко усмотреть, что степень суммы /(лг) -j~ g {x) не превосходит степени
140 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ каждого из слагаемых/(лг) и g(x); она может оказаться и ниже степе- степеней f{x) и g{x). Например, если то будет уже многочленом первой степени. С первого взгляда на равенство (А) (см. стр. 132) может пока- показаться, что степень произведения многочленов /(лг) и ^(лг) равна сумме их степеней. Но это заключение в случае произвольного кольца R ошибочно. Дело в том, что существуют кольца R с дели- делителями нуля, т. е. кольца, в которых произведение элементов может равняться нулю и в том случае, когда сомножители отличны от нуля: ab = 0 и при а^?0, Ь^О. Такие элементы а ^ О и Ь^О, как известно, называются делителями нуля. Одним из простейших примеров кольца с делителями нуля может служить множество всех матриц второго порядка гп с с действительными элементами ап, а12, ailt aw. Нетрудно убедиться, что это множество образует кольцо относительно сложения и умно- умножения матриц *). Вместе с тем легко видеть, что в этом кольце роль нуля играет нулевая матрица второго порядка, т. е. матрица /ОСА все элементы которой равны нулю. Возьмём теперь следующие две матрицы: 0\ /0 о) Н Эти матрицы отличны от нуля, так как каждая из них содержит в качестве элемента число 1, не равное нулю. Однако их произве- произведение согласно правилу перемножения матриц будет равно нулю, т. е. будет нулевой матрицей. Таким образом, если кольцо R обладает делителями нуля и — многочлен я-й степени над R, а ') О действиях над матрицами см. в § 21 статьи А. И. У з к о в а «Векторные пространства и линейные преобразования».
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 141 .— многочлен т-й степени над R, причём старшие коэффициенты ап и Ьт являются делителями нуля: anbm = 0, то степень произве- произведения f(x)g(x) будет уже меньше п-\-т, так как член anbmxn + m равен нулю. Но если хотя бы один из старших коэффициентов ап или Ьт не является делителем нуля, то степень произведения f(x)g(x) будет в точности равна сумме степеней п-\-т сомно- сомножителей. В случае если R— область целостности (т. е. кольцо без дели- делителей нуля) и, в частности, поле1), то степень произведения f(x)g(x) многочленов f(x) и g(x) над R всегда равна сумме степеней сомножителей. Отметим ещё одно существенное свойство многочленов от х над областью целостности R. Теорема 4. Если кольцо R является областью целостности, то кольцо многочленов R [х] также является областью це- целостности. Доказательство. Пусть /(дг) и g(x) — два многочлена из /?[jc], не равные нулю. Эти многочлены должны иметь вполне опре- определённую степень. Пусть степень f{x) равна п, а степень g(x) равна т. Тогда степень произведения f(x)g(x) будет равна п~\-т, так как R по условию есть область целостности. Мы видим, что произведение f(x)g{x) имеет вполне определённую степень, в силу чего f(x)g(x) ф 0. Итак, в кольце R [х] не существует делителей нуля; кольцо R [х], следовательно, есть область целостности. В заключение введём понятие значения многочлена от неизвест- неизвестного х над R. Оно будет играть немаловажную роль. Пусть f(x) = а0 + щ х + ... -f an х" — произвольный многочлен из R [х]. Заменим в нём неизвестное х каким-нибудь элементом с кольца R. Мы получим элемент того же кольца R следующего вида: d = ao-\-a1c-\-...-\-ancn. Этот элемент d называется значением многочлена f(x) при значении неизвестного х = с и обозначается через /(с). Подчёркиваем, что под значением неизвестного х мы всегда будем подразумевать тот или иной элемент кольца R. Очевидно, что если f(x)=g(x), то f(c) = g(c) для любого с из R. Обратное утверждение вообще неверно: мы знаем, что много- многочлены f(x) и g(x) над. конечным кольцом могут быть и не равны, и тем не менее /(с) будет равно g(c) для любого с из R (см. хотя бы пример, приведённый на стр. 129). Впрочем, в § 3 мы увидим, ') Что попе не содержит делителей нуля, можно убедиться следующим образом. Пусть а6 = 0 и афЧ. Тогда a~lab = 0 или Ь = 0, так как аг^а — е — единица поля.
142 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ что для частного случая, когда R является бесконечной областью целостности '), обратное утверждение верно, и мы увидим, что для таких колец функциональная точка зрения на многочлен является оправданной. Это обстоятельство играет важную роль при изуче- изучении свойств многочленов над полем действительных и над полем комплексных чисел. Нетрудно проверить, что если то f(c) + g(c) = h(c), f(c)g(c) = k(c). G) Мы ограничимся проверкой первого равенства G). Пусть, например, степень многочлена f(x) больше или равна степени многочлена g(x): fix) = а0 + atx +... -f а„лг" (ап ф 0), и т^п. Тогда h(x) = co-\-c1x-\-...-\-cirxn, где с,- = at-\-bt, причём в случае п^>т надо считать &m+,,..., bn равными нулю. Найдём, чему равно h(c): Пользуясь переместительным, сочетательным и распределительным законами, имеющими место в R, мы можем последнее равенство преобразовать в следующее: .. • +апсп) + (b0 т. е. получилось, что Подобным же образом проверяется и второе соотношение- G). § 2. Свойства делимости многочленов от одного неизвестного Большой интерес в алгебре представляет кольцо многочленов с коэффициентами из того или другого поля; в этом случае наблюдается далеко идущая аналогия между свойствами дели- делимости многочленов и свойствами делимости целых чисел. В настоя- настоящем параграфе мы изложим в основных чертах теорию делимости ') То-есть областью целостности, состоящей из бесконечного множества элементов.
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 143 многочленов над произвольным полем Р. Единицу поля Р мы будем обозначать через 1. Ещё в определении поля под делением подразумевалось нахож- нахождение корня уравнения ах = Ь. Назовём в соответствии с этим многочлен f(x) из кольца Р[х] делящимся на многочлен g(x)^0 из того же кольца Р[х], если уравнение g(x)X—f(x) разрешимо в Р[х]. Иными словами, многочлен f(x) делится на многочлен g(x), если в том же кольце существует такой третий многочлен q (х), что f(x) = g (х) q (x). Не следует думать, однако, что в кольце многочленов Р[х] де- деление всегда выполнимо. Возьмём хотя бы многочлены f(x)—x-\- 1 и g(x)=±x2-\-1. Легко видеть, что f(x) не делится на g(x). В самом деле, если бы f(x) делилось на g(x), то в Р[х] нашёлся бы многочлен q (х), для которого имело бы место равенство Но это равенство невозможно, так как степень произведения (х2-}- l)q{x) выше степени х-\- 1. Таким образом, Р[х], подобно множеству целых чисел, есть область целостности, но не поле. Отметим, прежде всего, простейшие свойства делимости многочленов. 1°. Всякий многочлен /{х)фО из Р[х] делится на самого себя. Действительно, мы можем написать очевидное равенство f(x)=f(x)-l, а единицу 1 поля Р можно рассматривать как многочлен нулевой степени из P[jc]. 2°. Если f(x) и g(x)—многочлены из Р[х], и f(x) делится на g(x), a g(x) делится на f(x), то многочлены f(x) и g(x) отличаются друг от друга лишь множителем нулевой степени: f(x) = cg(x) (сфО), где с — некоторый элемент из поля Р. В самом деле, так как f{x) делится на g{x), a g(x) делится на f{x), то по определению делимости мы можем написать, что /(•*) = ? С*) Ч\ С*), g С*) =/(•*) ft (•*)• Подставляя выражение g (x) из второго равенства в первое, по- получаем: или, сокращая на f{x) '): 1) Законность такого сокращения основана на том, что Р [х] есть область целостности. В самом деле, если в некоторой области целостности имеет место равенство ас = Ьс (или ca = cb), причём сф-Q, то ас — be = 0 или (с — Ь)с = О. Отсюда, учитывая, что c^tO и что кольцо не содержит дели- делителей нуля, получаем: a~b = O, a = b.
144 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЯ В левой части последнего равенства находится 1, т. е. многочлен нулевой степени. Следовательно, для обеспечения равенства необ- необходимо, чтобы произведение qt (х) q% (х) было также многочленом нулевой степени, а это возможно лишь тогда, когда степени самих сомножителей qt (x) и q$(x) равны нулю. Таким образом, qt(x) = c, q^ (x) = d, где cud — элементы поля Р, отличные от нуля. Отсюда f(x) = cg(x), что и требовалось доказать. В дальнейшем мы будем два многочлена, отличающихся друг от друга множителем нулевой степени, называть многочленами, совпа- совпадающими с точностью до множителя нулевой степени. 3°. Если два многочлена /, (х) и /2 (х) из Р [х] делятся на третий многочлен g(x) из Р[х], то их сумма fi(x)-\-f%(x) и разность ft(x)—/г(-*0 делятся на g(x). Доказательство проводится сходным образом. А именно, по опре- определению делимости можно написать, что /i (¦*) =^W?. И, h С*)=g (¦*) q-г С*), где qt (х) и q%(x) — некоторые многочлены из Р[х]. Складывая и вычигая почленно оба эти равенства, получаем: где q (x) = qx (x) ± q% (х) — многочлен из того же кольца Р [х]. Мы видим отсюда, что /, (jc)±/2 (x) делится на g(x). Свойство 3° (делимость) можно обобщить следующим образом: 4°. Если многочлены fx(x), f%(x), ..., fk(x) из Р[х] делятся на многочлен g (х) из Р [х], то cjt (x) -\- с2/2 (х) -(-•¦• + c,Jk (x), где ct — произвольные элементы поля Р, делится на g(x). Доказательство этого свойства сходно с доказательством свойства 3°. 5°. Если /, {х), /2 (х), /3 (л:), ..., fk (х) — многочлены из Р [х] и /, (х) делится на многочлен g (х) из Р [х], то произведение /i (х)Л Iх) /з (х) ••• fk(х) делится на g(x). В самом деле, если fl (x) делится на g (x), то Л (¦*)=* (•*)?!(•*). (О где qt (х) — некоторый многочлен из Р [х]. Умножая обе части равенства (I) на f2(x)fs(x).. .fk(x), получаем: Л (х) /я (х)... Л (*) =g(x)q (х), где q(x) — qt (x)f3(x). ..fk(x) — также многочлен из Р[х]. Сле- Следовательно, /i(.*)/g (¦*)•¦ •/*(•*) делится на g(x). 6°. Если f(x), g(x) a h(x)—многочлены из Р[х] и f(x) де- делится на g(x), a g(x) делится на h (x), то f(x) делится на h(x). Для доказательства опять обращаемся к определению делимости многочленов. Пишем:
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 145 где qt (х) и q<z(x)— некоторые многочлены из Р[х]. Подставляя выражения g(x) из второго равенства в первое, получаем: f(x)=k(x)q{x), где q(x) = ql(x)qi(x) — многочлен из Р[х], т. е. f(x) делится на h (x). Наконец, следует указать ещё одно свойство. 7°. Многочлены нулевой степени из Р[х] являются делителями любого многочлена f (x) из Р[х]. Действительно, если с ф 0— элемент поля Р и — какой-нибудь многочлен из Р[х], то, очевидно, где есть снова многочлен из Р[х]- В кольце целых чисел имеют место аналогичные свойства дели- делимости. При этом числа 1 и — 1 играют роль, сходную с ролью мно- многочленов нулевой степени. А именно, если целое число а делится на целое число Ь, a b делится на а, то числа а и b отличаются друг от друга лишь множителем ± 1. Далее, всякое целое число а делится на dr 1. Делимость одного многочлена на другой можно обнаружить с помощью процесса, хорошо известного читателю из элементарной алгебры. Мы имеем в виду так называемый алгорифм деления с остат- остатком. Но этот процесс нуждается в обосновании, так как заранее не очевидно, что он должен иметь место для любого поля Р. Та- Такое обоснование будет дано при доказательстве следующей теоремы: Теорема 5 (о делении с остатком). Для любых двух многочленов f(x) и g(x)^0 из Р[х] существует такая единст- единственная пара многочленов q(x) и г(х) из того же кольца Р[х\, что (x) B) и при г(х) ф 0 степень г(х) Меньше степени g(x). Замечание. Обычно многочлен q(x) называется частным, а многочлен г(х)—остатком от деления f(x) на g(x). Доказательство. Пусть 10 Энциклопедия, i.h. 2.
146 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Если п <^ т, то равенство B) будет удовлетворяться при q (х) = О, г (*)=/(*)¦ Если п^т, то действуем следующим образом. Вычитаем из/(дг) многочлен g (х), умноженный на ~ х хт: В результате старший член аох" многочлена f(x) уничтожится и степень f(x) понизится: f 1(x) = a'axni-\~a[x'4-1-{-...-\-а'П1 {а'оф0, Kt</z). Если степень f^ (x) больше или равна степени g(x), то мы снова по- повторяем процесс понижения степени: I Кл) Ь &\Х) J4 \Х> и т. д. Так как степени п, и1( и„... не могут убывать безгранично, то в конце концов мы придём к многочлену г(х), у которого сте- степень будет ниже степени g(x). Таким образом, /(•*)-?*"-тг(*)=/1(*). /„ (X) — ^X»k-«g (X) = Г (*). Складывая эти равенства почленно, мы после очевидных упрощений получим: f{x) — [ fe хп~т+^ jc"i-m + ... + ^ x"k-A g(x)=r (х) или где ^ д:-т -4-... 4- -/ Коэффициенты многочленов q(x) и г(х) будут при этом принадле- принадлежать полю Р, так как мы их получили с помощью операций сложе- сложения, вычитания, умножения и деления, не выводящих за пределы поля. Для завершения доказательства остаётся убедиться, что частное и остаток определяются единственным образом.
КОЛЫЮ МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 147 Пусть, кроме q(x) и г{х), существует частное д1 (х) и остаток rt(x). Тогда (x). C) Из равенств B) и C) следует, что g (x) q(x)-\-r (x) =g (x) qt (x) -f r, (х) или g (х) [q (x) — qi (x)] = П (х) - г (х). D) Если q (х) ф qt (х), то q (x) — qt (x) ф О, вследствие чего и ri(x) — г(х)фО. Но тогда мы приходим к абсурду—в правой части равенства D) находится разность г, (х) — г(х) со степенью, меньшей, чем т, так как степени г, (х) и г(х) меньше т; в левой же части того же равенства мы имеем произведение g (х) [д (х) -—¦ — Qi(x)] с0 степенью не ниже т. Следовательно, q (x) = qt(x) и Процесс, с помощью которого мы получили в только что изло-- женном доказательстве частное и остаток, является не чем иным, как правилом деления расположенных многочленов, известным ещё из школьного курса алгебры. Таким образом, доказывая теорему 5, мы попутно дали и обоснование этого правила. С некотврым ограничением теорему 5 можно распространить и на случай произвольного коммутативного кольца R с единицей е ф 0. А именно, справедлива следующая Теорема 6. Если R — коммутативное кольцо с единицей ефО, f(x) и g(x) ф 0 — два многочлена из R [х], причём старший коэффициент g(x) равен единице, то существует такая един- единственная пара многочленов q (х) и г (х) из того же кольца R [х], что и при г (х) ф 0 степень г (х) меньше степени g (x). Доказательство ничем существенным не отличается от доказа- доказательства теоремы 5, и самый процесс нахождения частного и ос- остатка здесь проще в том отношении, что вместо ~ хп—т, ~- хп^т и-т. д. берутся в качестве множителей при g(x) выражения аохП—т, i~mПри доказательстве единственности частного и остатка надо учесть, что единица е кольца R не может быть делителем нуля '), в силу чего степень произведения g(x) [q (x) — qt (x)] должна быть в точности равна сумме степеней g (х) и q (х) — qx (x). Алгорифм деления с остатком позволяет обнаружить, делится ли данный многочлен f(x) из Р[х] на многочлен g(x) из Р[х] или ') Если бы единица е была делителем пуля, то существовало бы такое афО, что аефО. Но это противоречит равенству ае = афО.
148 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ не делится. Именно, f(x) делится на g(x) тогда и только тогда, когда остаток г(х) от деления f(x) на g(x) равен нулю. Действительно, если остаток г(х) равен нулю, то равенство B) превращается в = g(x)q(x), откуда ясно, что f(x) делится на g(x). Обратно, если / (х) делится на g(x), то f = g(x)q(x), где q(x) — некоторый многочлен из Р[х]. Отсюда в силу единст- единственности остатка и частного следует, что остаток г(х) равен нулю. Благодаря этой связи делимости с равенством нулю остатка получается, что делимость многочлена f(x) на многочлен g(x) не зависит от того, над каким полем рассматриваются многочлены f(x) и g(x). В самом деле, будем ли мы рассматривать поле Р или более обширное поле, содержащее Р как часть, мы получим при делении f(x) на g(x) одни и те же частное и остаток. Роль алгорифма деления с остатком этим, однако, не исчерпы- исчерпывается. Мы сейчас увидим, что на основании теоремы о делении с остатком можно провести дальнейший параллелизм между теорией делимости целых чисел и теорией делимости многочленов. К тому же в кольце целых чисел, как известно, имеет место теорема, ана- аналогичная теореме 5. Пусть f(x) и g(x) — два каких-нибудь многочлена из Р[х]. Назовём третий многочлен d(x) из того же кольца Р(х) общим делителем f(x) и g(x), если d(x) делит как f(x), так и g(x). В частности, общий делитель D (х) называется наибольшим, если D (х) делится на всякий общий делитель d (x) многочле- многочленов f(x) и g(x). Мы покажем, что для любых двух многочленов f(x) и g(x) из Р[х] наибольший общий делитель существует, а именно укажем вполне определённый способ, позволяющий находить наибольший общий делитель для каких угодно многочленов f{x) и g(x)j^0 из P[jc]. Этот способ, известный под названием алгорифма Евклида, заключается в следующем. Пусть степень f(x) не ниже степени g(x). Тогда делим f(x) на g(x); остаток и частное, полученные при делении, обозначим, соответственно, через г, (х) и ql (x). Затем делим g(х) на остаток г, (х); в результате получатся второй оста- остаток г2(дг) и частное q<i(x) и т. д. Вообще каждый раз делится пре- предыдущий остаток на последующий. Степени получающихся при этом процессе остатков г, (х), г2 (х), ... будут, очевидно, всё время убы- убывать. Но целые неотрицательные числа не могут убывать неограни- неограниченно. Следовательно, этот процесс деления не может быть беско- бесконечным— в конце концов мы должны притти к остатку rk(x), на который нацело разделится предыдущий остаток rft_! (x). Покажем,
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 149 что этот последний остаток rk (х) и будет наибольшим общим делителем многочленов f(x) и g(x). Запишем весь процесс деления следующим образом: g (х) = rj (х) qt (х) -f r2 {х), E) Гц (¦*) = 0*-i (x) qk (х) + rk (x). rk-i С*) = rk (x) дш (х). \ Прежде всего покажем, что rk(x) есть общий делитель много- многочленов f(x) и g(x). Обратимся к предпоследнему равенству системы равенств E): fft-a (¦*) = rk_i (x) qk (x) + rk (x). Его правая часть делится на rk (х), так как гй_, (x) делится на rk(x), a rk(x) делится на самого себя. Следовательно, левая часть также делится на rk (x), т. е. гА_2 (х) делится на rk (x). Обраща- Обращаемся, далее, к вышележащему равенству Гм С*) = r*-a (Jf) qk_t (x) -f rft_, (*). Здесь rk_i (x) и rk_i (x) делятся на rk (x), откуда ясно, что вся правая часть делится на rk (x). Следовательно, на rk (x) делится и левая часть, т. е. rk_3(x) делится на rk(x). Двигаясь таким образом по- постепенно вверх, мы, наконец, дойдём до многочленов g(x) и f(x) и убедимся, что g(x) и f(x) делятся на rk{x). Теперь остаётся показать, что rk(x) есть наибольший общий делитель. Для этой цели обратимся к первому равенству f(x)=g(x)q1(x)-)-ri(x) и посмотрим, что получается относительно некоторого общего де- делителя d(x). Так как f(x) и g(x) делятся на d(x), то разность f(x)—g(x)qi(x) = r1(x) должна делиться на d(x). Точно так же, рассматривая второе из равенств системы E) g (х) = г, (х) q^ (x) 4- г2 (х), находим, что г2(х) делится на -d(x) и т. д. Так, опускаясь посте- постепенно вниз, мы, наконец, дойдём до rk(x) и убедимся, что rk(x) делится на d (x).' Иными словами, мы обнаружим, что rk (x) есть наибольший общий делитель многочленов f(x) и g(x). Нетрудно убедиться, что наибольший общий делитель много- многочленов f(x) и g(x) является единственным с точностью до мно- множителя нулевой степени. В самом деле, если Dt(x) и D2(x) — два наибольших общих делителя многочленов f(x) и g(x), то по определению наибольшего Общего делителя Dx (x) должно делиться на D% (x) и ?J (х) должно
150 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ делиться на Dt(x), откуда по свойству 2° делимости Di(x) = cD1(x), что и требовалось показать. Наибольший общий делитель f(x) и g(x) может оказаться много- многочленом нулеиоЯ степени. В этом случае f(x) и g(x) называются взаимно простыми многочленами. Как и в случае целых чисел, условимся наибольший общий де- делитель многочленов f(x) и g(x) обозначать для сокращения письма символом (f(x), g(x)). Пример 1. Найти наибольший общий делитель многочленов / (х) = 2х* — 3jc4 — 5х3 + х3 -\- 6х -f 3, g (х) — 3xl -f 2jc3 — З*2 — 5х — 2 над полем рациональных чисел. Чтобы избежать дробных коэффи- коэффициентов, умножим предварительно f(x) на 3: — 6х3 — Юх2— 4х — 3jc2 —5jc —2 2х — 13а-4— Теперь, чтобы избежать дробных коэффициентов, умножим по- полученную разность на 3. Этим мы, правда, исказим частное, но остаток определится с точностью до множителя нулевой степени. Итак, продолжаем вычисления: — 39JC4 — 27дг3 + 39дг2 -f 66* + 27 Зх* — 5х — 13 Таким образом, мы нашли с точностью до множителя нулевой степени остаток r1(x) = xs—х— 1 от деления f(x) на g(x). Теперь надо g(x) делить на rt(x). Читатель может сам без труда убедиться, что g(x) делится без остатка на г1 (х). Следовательно, х3 — х— 1 \и есть наибольший общий делитель многочленов f(x) и g(x). Так как алгорифм Евклида сводится к последовательному при- применению алгорифма деления с остатком, то можно высказать сле- следующее важное заключение: наибольший общий делитель D (х) многочленов f(x) и g(x), найденный с помощью алгорифма Евклида, не зависит от того, будем ли мы рассматривать f(x) и g(x) над полем Р или над более обширным нолем Р'.
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 151 Так, в только что разобранном примере мы нашли, что наи- наибольший общий делитель многочленов f(x) = 2jcb — 3jc4 — 5х3 + jc8 + 6х -f 3, g (лг) = Злг4 -f- 2лг3 — Злг8 — 5лг — 2 над полем рациональных чисел равен лг3— х—1. Но эти же мно- многочлены и над полем действительных чисел будут иметь лг3—х—1 наибольшим общим делителем. Для нескольких многочленов Д(лг), Д(лг), ..., fk(лг) из Р[х] общий делитель и наибольший общий делитель определяются ана- аналогичным образом. Именно, многочлен d(x) из Р[лг] называется общим делителем Д (лг), Д (лг) Д (лг), если каждый из много- многочленов Д (лг), Д (лг), ... , Д (лг) делится на d (лг). Общий делитель ?)(лг) называется наибольшим, если D{x) делится на всякий общий делитель многочленов Д (лг), Д (лг), ... , Д (лг). Разыскание наибольшего общего делителя нескольких многочле- многочленов можно свести к нахождению наибольшего общего делителя двух многочленов. В самом деле, пусть Dx (лг) — наибольший общий де- делитель k — 1 многочленов Д (лг), Д (лг), ... , Д_, (лг). Легко убе- убедиться, что если D(x) — наибольший общий делитель Dl{x) и Д(лг), тэ это D(x) будет вместе с тем и наибольшим общим делителем всех k многочленов Д (лг), ... , Д (лг). Повторяя дословно те же рассуждения, что и выше, можно убе- убедиться в единственности наибольшего общего делителя нескольких многочленов (с точностью до множителя нулевой степени). Исходя из алгорифма Евклида, можно получить ряд выводов. Отметим наиболее существенное. Теорема 7. Если D(лг) — наибольший общий делитель мно- многочленов /(лг) и g(x) из Р[х], то в том же самом кольце Р[х] можно подобрать такую пару многочленов ср(х) и ^(лг), что F) Доказательство. Возьмём предпоследнее равенство E) и пе- перенесем rfe_, (лг) qk (лг) в левую часть. Тогда, принимая во внимание, что rk (лг) = D (лг), получаем: rfc_8 (*) — rft_, (х) qk (x)=D {x). G) Затем из равенства ffe-S (Х) = rfe-2 С*) Чк-1 (Х) + Гк-1 (•*) определяем rfc_t (лг) rk~\ (х) = гк_3 (лг) — rfe_2 (лг) qk_t (лг) и подставляем это значение rk_x (лг) в G). Получим: Гн-г И П + Як (х) qk.x (х)) — гк_3 (х) qH (х) = D (л;)
152 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ или гк-ч (х) 9, (х) + rk_3 (х) ф, (х) = D (х), (8) где <Pi (*)=!+ ft (*) Чк-г (*)• Ь (*) = — ft (¦*)• Далее, из равенства rk-i W = r*-i С*) ft-e С*0 + гк_ъ (x) определяем гк_#(х) и подставляем в (8). Получим: Гк-3 (Х) 92 W + Ofc-4 С*) ^ (¦«) = ^ С*) и т. д., пока не получится равенство fix) Ф*_2 (*) +g(x) Ь+ (x) = D(x), т. е. равенство F) с <pW=9wW и <J< (лг) = фй_8 (лг). В частности, когда многочлены f(x) и g(Jf) взаимно просты, равенство F) принимает вид Мы можем с положить равным 1, так как обе части последнего равенства можно разделить на с и в качестве ер(х) и ty(x) рас- рассматривать, соответственно, Таким образом, если многочлены f(x) и g-(jc) взаимно просты, то в том же кольце Р[х] можно подобрать такую пару много- многочленов ер(х) и ty(x), что 1- F*) Пример 2. Для многочленов / (х) = 2*в — 3j^ — 5лг3+х* + блг -f- 3, ?• (лг) = Злг4 4- 2лг3 — Злга — 5лг — 2 над полем рациональных чисел подобрать многочлены <р(лг) и над тем же полем так, чтобы / (¦*) 9 С*) + g (х) ){x) = D (x). , Здесь существенное значение имеют не только остатки, но и частные, получаемые в процессе последовательного деления; поэтому необходимо каждый раз учитывать производимое сокращение или умножение на число. С данными многочленами f(x) и^(лг) мы уже имели дело в примере 1. Учитывая умножение f(x) на 3, а также умножение на 3 многочлена —13л?4 — 9х3-\-13х*-{-22x-{-9, мы
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 153 можем соответствующие результаты вычислений, полученные в пре- предыдущем примере, записать коротко в виде равенств: 3/(лг) = ?(лг).2лг-Н— 13лг4 — 9лг3-|-13лг2 + 22лг-[-9), (9) 3(— 13лг4 — 9лг3+13лг2 + 22лг + 9) = ^(лг).(— 13) — rt (лг), A0) где ' г, (х) = х3—х— 1. Мы знаем из предыдущего примера, что гг {х) есть наибольишй общий делитель многочленов /(лг) и g(x), т. е. г, (х) = D (х). Умножим обе части равенства (9) на 3 и затем подставим значение 3 (— 1 Злг4 — 9хя + 1 Злг8 -j- 22x -f- 9) из равенства A0). Получаем: (- 13) —г, (*), или 9/ (*) = g (х) F* — 13) — Я (x). Отсюда /(jf).(—9)-f g(*)-F*—13) = /)( т. е. мы нашли, что = —9. «К*) = 6*— 13. Пользуясь равенством F*), можно без труда получить ряд свойств взаимно простых многочленов, аналогичных свойствам взаимно простых целых чисел. 1°. Два многочлена f(x) и g(x) из Р[х] тогда и только тогда взаимно просты, когда =l, F*) где <р (лг) и <Ь (лг) — некоторые многочлены из Р [х]. Доказательство. Если f(x) и g(x) взаимно просты, то, как мы уже знаем, должно выполняться равенство F*) для неко- некоторых ер(х) и ty(x) из Р[х]. Обратно, пусть имеет место равенство F*) для некоторых ер (х) и ^(лг) из Р[х]. Обозначим через d(x) произвольный общий дели- делитель f(x) и g{x). Тогда, очевидно, левая часть равенства F*) будет делиться на d(x), в силу чего на d(x) будет делиться и правая часть, т. е. 1. Но d(x) может делить 1 только в том случае, когда d(x) есть многочлен нулевой степени. Итак f(x) и g(x) могут иметь общим делителем только многочлен нулевой степени, откуда f(x) и g{x) взаимно просты. 2°. Если D{x) — наибольший общий делитель многочленов f (х) 11 g(x) из Р[х]> п10 многочлены ft(x) и g"i(.*r), получающиеся при делении /(х) и g(x) на D(x), будут взаимно простыми.
154 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Доказательство. Так как по условию /(x)=/,(x)Z)(x), g(x)=gl(x)D(x), то равенство /(*) 9W+f И ФС*) = я С*) можно переписать следующим образом: /, (х) 9 (х) D (х) -f ft (*) ф (*) D(x) = D (х). Сокращая на D (х), получаем: ¦ Л (¦*) 9 (*)+ft (*)*(¦*)= 1- Отсюда в силу предыдущего свойства 1° следует, что /, (д;) и #, (х) взаимно просты. 3°. Если многочлены /(х) и g(x) из Р[х] взаимно просты с третьим многочленом Л(х) из Р[х], то произведение f(x)g(x) также взаимно просто с Л(х). Доказательство. Так как по условию /(х) и А(х) взаимно просты, то для некоторых ер (х) и <{/ (х) из Р [х]. Умножим обе части этого равенства на g(x): f(x)g(x)ep{x)-]-h(x)g(x)^{x)=g(x). Пусть теперь d(x)— какой-нибудь общий делитель f(x)g(x) и А(х). Тогда левая часть последнего равенства будет делиться на d(x) и потому на d(x) будет делиться и правая часть, т. е. g(x). Таким образом, d{x) оказалось общим делителем g(x) и А(х). Но g{x) и А(х) взаимно просты. Следовательно, d(x) есть многочлен нулевой степени. Тем самым мы показали, что произведение f(x)g(x) взаимно просто с А(х). Свойство 3° можно с помощью метода математической индукции обобщить на любое число многочленов из Р[х]: если каждый из многочленов /,(х), /2(х), ..., fk(x) взаимно прост с h(x), то произведение /i(x)/2(x) ... fk{x) также взаимно просто с А(х). 4°. Если /(х), g(x), h(x) — такие многочлены из Р[х], что /(х) взаимно просто с А(х) к произведение f(x)g(x) делится на А(х), то g(x) делится на /z(x). Доказательство. Так как /(х) и А(х) взаимно просты, то для некоторых ер (х) и $ (х) из Р [х]. Умножим обе части этого равенства на ^(х). Получим: / С*) g (х) 9 (х) -|- А (х) g (х) ^ (х) = g (х).
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 155 Левая часть последнего равенства делится на k(x); следовательно, правая часть, т. е. g(x) делится на h(x). В теории делимости многочленов роль простого числа играют так называемые неприводимые многочлены. Определение. Многочлен f(x) из Р[х] называется приво- приводимым в поле Р, если он может быть разложен в произведение двух многочленов меньшей степени из того же кольца Р [х]. Напротив, многочлен р (х) из Р (х) выше "кулевой степени на- называется неприводимым в поле Р, если р (х) не может быть раз- разложен в произведение двух многочленов меньшей степени из того оке кольца Р[х]. Согласно этому определению многочлен нулевой степени нельзя считать приводимым, а также нельзя считать неприводимым много- многочленом. В этом отношении наблюдается та же картина, что и для числа 1. Число 1, как известно, не считается простым и в то же время не считается и составным числом. Пример 3. Рассмотрим многочлен над полем рациональных чисел. Он разлагается в произведение мно- многочленов меньшей (а именно второй) степени над тем же полем рациональных чисел: = (*? —2) (*• —3). Следовательно, рассматриваемый многочлен f(x) приводим в поле рациональных чисел. Пример 4. Многочлен первой степени над произвольным полем Р неприводим в Р. Действительно, если f(x) и g(x) — произвольные многочлены выше нулевой степени, то их произведение будет иметь по меньшей мере вторую, а не первую степень. Пример 5. Многочлен . р(х)=х3 — 2 неприводим в поле рациональных чисел. В самом деле, если бы многочен р (х) был приводим в поле ра- рациональных чисел, то р (х) разлагался бы в произведение двух мно- множителей, из которых один был бы первой степени, а другой — вто- второй степени: р (х) = х3 — 2 = (ах -J- Ь) (слг2 -\-dx-\- ё),
156 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ где а, Ь, с, d, е — некоторые рациональные числа. Полагая х = , получаем: „ или Получился абсурд: ]/2 оказался рациональным числом . Сле- Следовательно, многочлен р(х)=х3— 2 неприводим в поле рациональ- рациональных чисел. Однако этот же многочлен в поле действительных чисел будет уже приводимым — так как в поле действительных чисел мы счи- считаем допустимым разложение и на множители с иррациональными коэффициентами, то мы можем написать, что р (х) = (x—V2) (*2 +V^x +1^4"). Для многочленов из кольца Р[х] имеет место теорема, анало- аналогичная теореме о разложении целого числа на простые множители. Теорема 8. Всякий многочлен из Р[х] выше нулевой сте- степени разлагается в произведение неприводимых многочленов: /(Х)=Р1(Х)Р2(Х) ... рг (ЛГ) (Pi (х) — неприводимый многочлен в поле Р), и это разложение является единственным с точностью до порядка следования и множителей нулевой степени. Для доказательства этой теоремы придётся предварительно рас- рассмотреть следующие свойства неприводимых многочленов, сходные со свойствами простого числа. 1°. Если /7j (х) и р2 (х) — неприводимые многочлены в поле Р и pt (x) делится на р% (х), то рх (х) и р% (х) совпадают с точ- точностью до множителя нулевой степени. В самом деле, из равенства p1(x)=pi(x)q(x), где q(x) — частное от деления pt (x) на рг (х), следует в силу неприводимости Pi{x), что q(x) есть многочлен нулевой степени: q(x) = c^0. Отсюда рх (х) = ср% (х), что и требовалось показать. 2°. Многочлен /(дг) из Р[х] тогда и только тогда не делится на многочлен р(х), неприводимый в поле Р, когда f(x) и р{х) взаимно просты. Доказательство. Пусть f{x) не делится на р(х). Обозна- Обозначим через D(x) наибольший общий делитель f(x) и р(х). Так как р(х) — неприродимый многочлен, то из условия делимости р(х) на D(x) следует лишь одно из двух: либо 1) D{x) есть многочлен нулевой степени, либо 2) D (л;) совпадает с р (х) с точностью до
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 157 множителя нулевой степени. Вторая возможность, однако, отпадает, так как в случае совпадения D (х) с р (х) (с точностью до множи- множителя нулевой степени) многочлен f(x) делился бы на р(х). Следо- Следовательно, остаётся только одно — D(x) является многочленом ну- нулевой степени. Но это значит, что f(x) и р (х) взаимно просты. Обратно, пусть f(x) и р (х) взаимно просты. Тогда f(x) не может делиться на р(х): если бы f(x) делилось на р(х), то наи- наибольший общий делитель f(x) и р{х) был бы равен р (х), а не многочлену нулевой степени. 3°. Если произведение f(x)g(x) двух многочленов из Р[х] де- лится на многочлен р (х), неприводимый в Р, то на р (х) делится по меньшей мере один аз сомножителей f{x), g{x). Доказательство. Предположим противное — пусть ни f{x) и ни g (х) не делятся на р (лг). Тогда по предыдущему свойству 2° многочлены f(x) и g(x) будут взаимно просты с р(х). Отсюда в силу свойства 3° взаимно простых многочленов произведение f(x)g(x) будет также взаимно просто с р(х) и потому не может делиться на р (лг), что противоречит условию. Очевидно, что свойство 3° можно распространить на случай про- произведения любого числа сомножителей, стоит только воспользоваться ¦методом математической индукции. Теперь мы можем приступить к доказательству теоремы. Доказательство теоремы 8. Покажем сначала, что вся- всякий многочлен f(x) из Р[х] выше нулевой степени можно разло- разложить в произведение неприводимых множителей. Для неприводимого f(x) утверждение очевидно — в этом слу- случае получается разложение из одного неприводимого множителя: f(x)=f(x). Поэтому пусть f(x) приводимо. Тогда где /, (л;) и /4 (х) — многочлены из Р [х] более низкой степени, чем f(x). Если один или оба сомножителя fx (x) и /2(дг) приводимы, то один или оба сомножителя ft (дг) и /2 (х) будут разлагаться на даль- дальнейшие сомножители ещё более низкой степени и т. д. Этот про- процесс дальнейшего разложения на множители не может быть безгра- безграничным, так как степени многочленов не могут безгранично пони- понижаться. Следовательно, мы в конце концов дойдём до разложения многочлена f(x) на неприводимые множители. Теперь остаётся доказать вторую половину теоремы — единствен- единственность разложения на неприводимые множители. Пусть многочлен f(x) двумя способами разлагается в произве- произведение неприводимых множителей: fix) =Pi(x)pz(х) ... pk[x), A1) где Pi(x) — многочлены, неприводимые в поле Р, и A2)
158 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ где Qi(x) — также неприводимые в Р многочлены. Без ограничения общности можно предположить, что ?=?/. Из равенств A2) и A3) следует, что Pi С*) Л (X) ... рк (X) = qt (х) ?2 (X) ... qt (X). A3) Левая часть последнего равенства делится, очевидно, на р1 (лг); сле- следовательно, на рх (х) должна делиться и правая часть. Отсюда в силу свойства 3° неприводимого многочлена должен делиться на pt (x) по меньшей мере один из сомножителей правой части. Пусть для определённости qy {x) делится на ру{х). Тогда по свойству 1° неприводимого многочлена qt (x) и pt (x) должны совпадать с точ- точностью до множителя нулевой степени: qt (x) = с, /?, (х). Подставляя это значение qt(x) в правую часть равенства A3) и производя со- сокращение обеих частей равенства на pt (лг), получаем: Pi(X) ... рн(х) = ciqi(X) ... qt(x). A4) Повторяем относительно равенства A4) аналогичные рассуждения. Получим qi(x) = cipi(x) и затем после соответствующего сокра- сокращения Ps(X) ... pk(x) = Clc2q3(x) ... qt(x) и т. д. Мы утверждаем теперь, что k = l. В самом деле, если бы k<dl, то после всех таких последовательных сокращений мы полу- получили бы равенство 1=с,с2 ... ckqk+1(x) ... gi(x). Но это равенство абсурдно, так как 1 не может делиться на мно- многочлены qk+l (х), ... , ql (x), имеющие степень выше нулевой. Итак, k = l и q1(x) = c1p1(x), ... , qi(x) = clpl(x). Теорема пол- полностью доказана. В разложении многочлена f(x) на неприводимые множители могут встречаться многочлены, совпадающие с точностью до мно- множителя нулевой степени. Например, многочлен в поле рациональных чисел разлагается в произведение четырёх неприводимых многочленов: / (х) = Bл;8 -f 2л; + 2) (jc2 + х + 1) (х — 1) (Зх — 3), и мы видим, что многочлены 2jcs + 2j»;-f 2 и J^-fjc-fl совпадают с точностью до множителя 2, а многочлены X—1 и Злг—3 совпадают с точностью до множителя 3.
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 159 Пусть в разложении f(x)=pt(х)ръ(х) ... pk(х) многочлена /(лг) на неприводимые многочлены в поле Р много- многочлены pt (x), ра (х) и т. д. повторяются (с точностью до множителя нулевой степени) соответственно Oj раз, о2 раз и т. д. Тогда, объеди- объединяя повторяющиеся многочлены, получим так называемое каноническое разложение f(x) в произведение неприводимых многочленов: /(лг) = ср1? (х) рч {х) ... ра/ (х) (г =? k, с ф 0 — элемент из Р) Здесь неприводимые многочлены pt (x) между собой существенно различны (т. е. не совпадают с точностью до множителя нулевой степени). Показатель at называется кратностью неприводимого множи- множителя pi(x). Так, например, рассмотренный выше многочлен имеет следующее каноническое разложение: x— I)8, причём кратности неприводимых множителей равны двум. Вообще мы скажем, что некоторый многочлен g(x) из Р[х] входит в данный многочлен f(x) из Р[х] с кратностью о, если f\x) делится на ga (x), но не делится на ga+l (x). Пример 6. С какой кратностью входит многочлен ^(лг) = =дг8 —4 в многочлен f (х) — х*-+-х* — 8xs — 8x*-\- 1бд;+ 16? Применяя алгорифм деления с остатком, без труда убеждаемся, что /(лг) делится на g*(x), но не делится на g*(x). Следовательно, g(x) входит в f(x) с кратностью 2. Пример 7. С какой кратностью входит многочлен g(x) = =лг2 — 2х — 2 в многочлен /(лг)=дгв — Зд; — 3? Легко убедиться, что f{x) не делится на g(x). Это означает, что g(x) входит в f(x) с нулевой кратностью. § 3. Деление на линейный двучлен х—а. Корни многочленов Ради большей общности выводов мы в этом параграфе будем рассматривать многочлены над произвольным коммутативным коль- кольцом R с единицей ефО. Очевидно, что поле является частным случаем такого кольца. Мы займёмся часто встречающейся в алгебре задачей — задачей деления многочлена f{x) из R[x] на линейный двучлен х — а с а, лежащим в том же кольце R, что и коэффициенты многочлена f(x).
160 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Так как старший коэффициент двучлена х— а равен единице то согласно теореме 6 мы можем написать, что = (x — a)q(x)-\-r. A) Очевидно, что остаток г должен быть некоторым элементом кольца R, так как если г ф 0, то степень г должна быть ниже степени делителя х — а. Равенство A) остаётся в силе и при любом значении х [см. в § 1 соотношения G)]. Возьмём для х значение а. Тогда f(a) = (a — a)q(a)-\-r, или, так как а — а = 0, f(a) = r. Мы пришли к следующей теореме: Теорема 9. Остаток, получающийся при делении много- многочлена f{x) над кольцом R на линейный двучлен X — а над тем же кольцом R, равен значению многочлена при х — а. Пользуясь этой теоремой, можно находить остаток, не производя деления многочлена /(лг) на х—а. Пример 1. Найти остаток от деления многочлена / (лг) = Злг4 — лг3 — 2лг2 — х + 1 над кольцом целых чисел на лг + 2, не производя деления. Так как х-\-2=х — (—2), то здесь а = — 2. Таким образом, по теореме 9 получаем следующий остаток: Деление многочлена /(лг) на линейный двучлен лг — а осущест- осуществляется особенно просто с помощью схемы Горнера, заключающейся в следующем. Так как степень частного ^(лг) от деления многочлена /(лг) на х — а должна быть на единицу ниже, то мы можем положить: q {х) = Подставляя выражения /(лг) и ^(лг) в равенство A), получаем: ичи, производя в первой части перемножение и группируя по сте- степеням х: аох ¦¦ + 4" ¦ • ¦ 4" (г—
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 161 Отсюда согласно определению равенства двух многочленов сле- следует, что откуда B) Формулы B) позволяют последовательно находить коэффициенты частного и остаток. Вычисления по формулам B) удобнее всего проводить по следующей схеме, известной под названием схемы Горнера: ab0 -f Й1 abl -J- са В верхней строке схемы Горнера написаны в порядке убывания степеней х коэффициенты многочлена f(x), а в нижней строке — коэффициенты bt частного q (х) и остаток г. Поясним метод Горнера на нескольких примерах. Пример 2. Пользуясь схемой Горнера, разделить многочлен / (х) = 2хв — 5х* — 8х -f-1 над кольцом целых чисел на х — 3. Составляем схему Горнера. При этом надо выписывать все коэф- коэффициенты f(x) без пропусков. Так, в данном многочлене отсут- отсутствуют члены с х* и дг2. Это значит, что щ = 0 и с3 = 0. Итак, пишем: 0 — 5 0 — 8 1 3-2 + 0=6 3.6—5=133-13+0=39 3-39—8=109,3 • 109+1=328 Таким образом, частное равно = 2х4 + 6л:3 + 13х2 -f 39* + 109, а остаток равен 328. Пример 3. Пользуясь схемой Горнера, разделить многочлен над кольцом целых чисел на х -\- 3. 11 Эициклоиеди», кн. 2.
162 КОЛЬЦО МНОГОЧЛЕНОВ И nOJ!F РАЦИОНАЛЬНЫХ ФУНКЦИЙ Составляем схему Горнера; при этом а = — 3, так как х-|-3 = = лг—(—3). Выкладки мы будем здесь проводить в стороне, а в схему будем вписывать только окончательные результаты: — 3 3 3 2 — 7 0 21 j — 64 10 202 Таким образом, частное равно q (лг) = Зх3 — 7л;2 -f 21х — 64, а остаток равен 202. Схема Горнера выгодна не только для проведения деления много- многочлена f{x) на лг — а. Она оказывается весьма удобной и для вычи- вычисления значения многочлена при х = а. А именно, остаток при деле- делении f(x) на лг — а мы можем найти при помощи схемы Горнера, а по теореме 9 этот остаток есть не что иное, как значение много- многочлена при лг = с. Так, в примере 3 было найдено при помощи схемы Горнера, что многочлен при делении на лг—{— 3 даёт в остатке 202. Мы можем отсюда заключить, что /(—3) = 202. Приведём ещё один пример. Пример 4. Пользуясь схемой Горнера, вычислить значение /(—2) многочлена / (х)—лг4 — 8х* -f 24лг2 — 50лг + 90 над кольцом целых чисел. Проводим вычисления по схеме Горнера — 2 1 1 — 8 — 10 24 44 — 50 — 138 90 366 Мы видим отсюда, что /(—2) = 366. Займёмся теперь случаем, когда многочлен f(x) делится на х — о, без остатка. Этот случай тесно связан с понятием корня. Определение. Корнем многочлена f (x) называется такое значение х0 неизвестного, при котором значение многочлена равно нулю: /(лго) = О. Оказывается, что элемент а кольца R тогда и только тогда является корнем /(х), когда /(лг) делится на х — а.
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 163 Доказательство. Если f(x) делится на х— с, то по опре- определению делимости должно иметь место равенство f(x) = (x-a)q(x). Полагая х = а, получаем из этого равенства, что /(с) = 0, т. е. а оказалось корнем многочлена f(x). Обратно, пусть а — корень f(x). Тогда по теореме 9 остаток г от деления f(x) на х — а должен равняться /(с) = 0, т. е. f{x) делится на х — а. Иногда вместо того, чтобы говорить о корне многочлена, гово- говорят о корне алгебраического уравнения л-й степени над кольцом R, т. е. уравнения вида солг"-}- ... -\-ап = 0, C) где с0> а1г ... , ап — элементы кольца R, называемые коэффициен- коэффициентами уравнения. При этом под корнем уравнения C) подразуме- подразумевается корень многочлена f(x) = ao.v" -}- щх"'1 ~\- ... -\- ап. Равенство C) нельзя, конечно, рассматривать как равенство двух многочленов (многочлена /(л-) = солл-|-а1лл~1 -|- ...-\-ап и нуль- многочлена); величина х имеет здесь другой смысл, чем в мно- многочлене: х здесь означает любой из корней рассматриваемого уравнения. Может случиться, что многочлен f(x) га-й степени будет делиться не только на х — с, но и на некоторую степень х — а. В соот- соответствии с этим условимся а называть А-кратным корнем мно- многочлена f(x), если fix) делится на (х — a)k, но не делится на (х — а)к+1. Например, если f(x) делится на (х — af, но не делится на (х — сK, то а — двукратный корень f(x) (или корень кратности 2). Пример 5. Число 1 является корнем многочлена / (х)=Xs — 2xi -f x3 + -к8 — 2* + 1 над кольцом целых чисел. Найти кратность этого корня. Делим f(x) на х— 1 при помощи схемы Горнера: 1 1 1 2 — 1 1 0 1 1 — 2 — 1 I 0 Отсюда частное равно q(x)=x'1 — xs-\-x— 1,
164 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ а остаток, как и следовало ожидать, равен нулю. Получившееся частное делим в свою очередь на х—1: 1 1 1 J 0 0 0 1 1 J 0 Ды видим, что и здесь остаток равен нулю, а частное равно Если теперь разделить q1 (х) на х—1, то получится остаток, уже отличный от нуля. Таким образом, данный многочлен f(x) делится на (х—IJ, но не делится на (х—IK, в силу чего 1 является двукратным корнем f(x). Возникает естественный вопрос, сколько корней может иметь многочлен f(x) и-й степени над кольцом R. Обратимся к конкрет- конкретным примерам. Они помогут нам притти к правильному ответу. Пример 6. Многочлен х3 — 2 над полем рациональных чисел не имеет корней. Однако если х3 — 2 рассматривать как многочлен над полем действительных чисел, то дг3 — 2 будет, иметь один корень |/2. Мы видим, что как в случае поля рациональных, так и в слу- случае поля действительных чисел количество корней многочлена хь — 2 меньше трёх, т. е. меньше степени многочлена. Пример 7. Многочлен х* — 1 над кольцом целых чисел имеет два корня: 1 и — 1. Здесь получается, что число корней многочлена равно степени многочлена. Эти два примера заставляют нас склоняться к мысли, что число корней многочлена /z-й степени над R не должно превосходить сте- степени многочлена. Однако следующий пример покажет, что дело обстоит сложнее. Пример 8. Рассмотрим в качестве кольца R множество квад- квадратных матриц вида fa 0\ О b Г где а, Ъ — действительные числа. Предоставляем читателю проверить самому, что это множество в самом деле образует коммутативное кольцо относительно операций сложения иумножения матриц. Еди- Единицей здесь, очевидно, будет единичная матрица I 1
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 165 Выясним, какие корни может иметь многочлен f(x)=xs— е над этим кольцом R. Согласно определению корня многочлена нам надо найти такие матрицы: /и чтобы ?2 — е = 0, или ?2 = е, или в более подробной записи \0 vj ~\0 if Возводя матрицу в квадрат, получаем: (о *)Цо 1/' откуда иа=1, t)* = l. Таким образом, w = ±ti v = ±\, и мы получаем четыре корня: 0\ /— 1 0\ 1—1 0\ /1 0\ О Как видим, число корней здесь превосходит степень многочлена f(x)=x* — е. Вместе с тем рассматриваемое кольцо R содержит делители нуля. Так, 1 0\ /0 0\ о = | \0 но Подведём некоторый итог. В первых двух примерах число кор- корней не превосходило степени многочлена, и в качестве кольца мы имели поле рациональных чисел и кольцо целых чисел — области, не содержащие делители нуля. Напротив, в третьем примере мы имели дело с кольцом, содержащим делители нуля, и число корней рассматриваемого многочлена оказалось больше его степени. Ниже- Нижеследующая теорема показывает, что эта связь с делителями нуля не случайна. Теорема 10. Пусть коммутативное кольцо R с единицей ефО не обладает делителями нуля (является областью целост- целостности). Тогда всякий многочлен п-й степени над R имеет в R не более чем п корней, если даже считать каждый корень столько раз, какова его кратность. Доказательство. Обозначим черезf(x) какой нибудь много- многочлен над ^-выще нулевой степени, и пусть он имеет корни ait .... as
166 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ соответственно с кратностями klt ... , ks. Так как кратность корня Cj равна ku то мы можем написать, что где /j (ж) — многочлен над R, не делящийся на ж — аи т. е. не имеющий щ корнем: fl (щ) ф 0. Полагая в этом равенстве х = с8, получаем: Но cs — С! ф 0. Следовательно, так как R не имеет делителей нуля, должно быть /j (c2) = 0. Таким образом, а2 оказалось корнем многочлена /j (ж). Обозначим через s кратность корня с2 относительно fx (x). Тогда /,(*) = (* —о,)*/, (ж), Причём /2 (Cj) 9^ 0. Легко видеть, что s ^ А2. В самом деле, если бы s было больше k3, то из равенства f{x) = (х- а,)*« (х - с2O2 (х) следовало бы, что с2 — корень многочлена f(x) более высокой кратности, чем А2. С другой стороны, так как с2 есть А2-кратный корень / (х), то причём 9 (c2) ф 0. Отсюда (х - fll)*. (х - a2)V2 (ж) = (ж - а,)** ф (ж). C') Кольцо многочленов R [х] не содержит делителей нуля, так как R — область целостности. Поэтому обе части равенства (З1) можно сократить на (ж — с2)*. Получаем: (ж — ai)fci/2 (х) = (ж— Если допустить, что ?2^>s, то, полагая ж=а2, мы имели бы: откуда /2(о2) = 0, что невозможно. Следовательно, A2 = s. Итак, а потому f{x) = (ж - а,)*, (ж - а2) V2 (*). Затем подобным же образом убеждаемся, что
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 167 причём /3 (а3) ф О, и f(x) = (х — Ol)fei (X — а2)*« (л; — a3f>f3 (х) и т. д. В конечном счёте мы придём к разложению х) = (х — a,)fci (х — a2)*« ... (х — as)fc* / (х) Степень левой части последнего равенства равна п, а степень пра- правой части не меньше чем Aj —j— A2 —J— ... -\- ks. Отсюда получается, что kx -\- k.2 -\- .. -\- ks г? п, и теорема для многочлена степени п ^ 1 доказана. Но для многочлена нулевой степени теорема тривиальна: такой многочлен не имеет корней. Отметим одно важное следствие. Следствие. Если коммутативное кольцо R с единицей ефО является областью целостности и два многочлена f(x), g(x) над R со степенью, не превосходящей п, имеют равные зна- значения более чем при п различных значениях х, то эти много- многочлены равны: №=g(x). В самом деле, многочлен h(x)=f(x)—g(x), с одной стороны, имеет степень, не превосходящую п. С другой стороны, h (x) обра- обращается в нуль при более чем п различных значениях х, т. е. имеет более чем п корней. Отсюда по только что доказанной теореме получается, что h(x)=f(x) — g(v) = 0, т. e. f(x) = g(x). В случае бесконечной области целостности R из этого след- следствия вытекает, что два многочлена f(x) и g(x), имеющие равные значения при любых значениях х, должны быть равны. Будем в произвольном многочлене / (х) из R [х] неизвестное х заменять тем или иным элементом с кольца R. Мы получим вполне определённый элемент /(с) из R. Таким образом, каждому много- многочлену f{x) из R [х] будет ставиться в соответствие функция от одного аргумента, определённая на множестве R: /(*)->/tf). D) Через S мы здесь обозначили аргумент, а через /(S) — функцию, соответствующую многочлену f(x). Мы собираемся показать, что в случае бесконечной области целостности R функциональная и алгебраическая точки зрения на многочлен являются равносильными. А именно, имеет место сле- следующая Теорема 11. Если коммутативное кольцо R с единицей е^ЬО является бесконечной областью целостности, то множество функций /(?), соответствующих многочленам f(x) из R[x], обра- образует кольцо, изоморфное кольцу многочленов R[x].
168 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНЧЛЬНЫХ ФУНКЦИЙ Доказательство. Пусть некоторому многочлену g(x) из R [х] соответствует та же функция /($), что и многочлену f(x): /00-v/O), * (*)-*/(«). Тогда f(c)—g(c) для любого элемента с из R. Но мы уже знаем что в случае бесконечной области целостности R два многочлена' имеющих равные значения при любых значениях х, должны быть равны. Следовательно, f(x) — g(x). Таким образом, соответствие D) является не только однозначным, но и взаимно однозначным. Пусть, далее, f(x) и g(x) — два произвольных многочлена из R[x]. Обозначим /(х)-±g(x) через h(x) и f(x)g(x) через k(x). Тогда f(x)-\-g(x) будет соответствовать й(?), a f(x)g(x) будет соответствовать k(l): Но мы знаем, что для любого элемента с из R f(c) + g(c) = h(c), f(c)g(c) = k(c) (см. равенства G) в § 1). Следовательно, по определению суммы и произведения функций ') откуда / Итак, мы убедились, что соответствие D) в самом деле является изоморфизмом между кольцом R [х] и множеством функций /(?). Тем самым множество функций /(?) образует кольцо, изоморфное R [х], и теорема полностью доказана. В дальнейшем мы будем аргумент функций /(?) обозначать той же буквой х, что и неизвестное. § 4. Многочлены над полем рациональных чисел В элементарной алгебре рассматриваются простейшие методы разложения многочлена f(x) с рациональными коэффициентами на неприводимые множители в поле рациональных чисел. Так как эти методы связаны с вычислением рациональных корней многочленов, то мы в этом параграфе изложим с необходимой полнотой вопрос о вычислении рациональных корней. 1) Пусть М — некоторое мпожество с двумя определёнными в нём алгебраическими операциями + и • . Под суммой /(<;)+?(?) двух функций /F) и ?¦(?), заданных па множестве М, подразумевается функция, ставящая в соответствие каждому элементу с из М сумму значений f(c)-\-g(c) данных функций нри ?=с. Точно так же под произведением/E)^A) функций/© и g(?) подразумевается функция, ставящая в соответствие каждому элементу с из М произведение значений f(c)g(c) данных функций при ?=с.
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 169 Итак, пусть /(*) = а#Г + ЩХ"-1 + ... + ап (а, Ф 0) A) — многочлен л-й степени (ra^l) с рациональными коэффициентами. Без ограничения общности выводов можно предположить, что все коэффициенты многочлена A) — числа целые. Действительно, если бы многочлен f(x) имел дробные коэффициенты, то, умножая f(x) на общий знаменатель коэффициентов, мы получили бы многочлен с целыми коэффициентами и с теми же корнями, что и у f(x). Вычисление рациональных корней многочлена A) основано на следующей теореме. Теорема 12. Если несократимая дробь — (/, т — целые числа) является рациональным корнем многочлена A), то I есть делитель свободного члена ап, а т — делитель старшего коэф- коэффициента а0. Доказательство. Согласно определению корня многочлена мы можем написать, что или, умножая обе части последнего равенства на тп: а^ + а^т-^ ... -f-an Отсюда ... _|_anmn-t) B) апт" = -1 (с0Г' + ... + ап_хт^). C) Правая часть равенства B) делится, очевидно, на т. Следовательно, на т должна делиться и левая часть равенства B), т. е. ао1п. Но в силу несократимости дроби — число /" взаимно просто с т. По- Поэтому с0 должно делиться на /га. Аналогично рассуждаем и относительно равенства C). Его пра- правая часть делится на /. Следовательно, аптп должно также делиться на I. Отсюда ап делится на /, так как /я" взаимно просто с /. Отметим одно следствие из только что доказанной теоремы. Следствие. Многочлен со старшим коэффициентом, равным единице, и с целыми коэф- коэффициентами av ... , ап может иметь в качестве рациональных корней, только целые корни. В самом деле, по теореме 12 знаменатель /га^>0 рационального корня хй = — должен быть делителем старшего коэффициента,
170 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ т. е. равен 1. Отсюда хо = 1, и тем самым корень х0 является целым числом. Таким образом, испытывая всевозможные дроби —(.т^>0) с числителем /, делящим с„, и со знаменателем т, делящим стар- старший коэффициент с0, мы найдём рациональные корни многочлена A) или убедимся, что многочлен A) вовсе не имеет рациональных кор- корней. Однако эти испытания можно значительно сократить, если воспользоваться следующим предложением. Теорема 13. Если несократимая дробь — (от^>0)является рациональным корнем многочлена A), то для любого целого числа k число f(k) делится на l — km при условии, что I — krnjbO. Доказательство. Умножая многочлен A) на тп, получаем; mnf(x) = а0 (тх)п + тау («Г1 + ... + тпап, или, полагая тх=у. тп/(х) = ? СУ) = аоу + та,уп^ + ... + тпап. Так как корень многочлена f{x), то целое число / должно быть корнем многочлена ер (у), в силу чего мы можем написать, рассматривая <р (у) над кольцом целых чисел, что 9 (У) = (У —Од (У), где q (у) есть также многочлен над кольцом целых чисел. Отсюда l—km I—km должно быть целым числом; иными словами, mnf(k) делится на /—km. Но легко видеть, что т и /— km взаимно просты. В самом деле, если бы т и / — km были бы не взаимно простыми, то дробь l — km I , - = к т т была бы сократимой: l — km / т я где 0 <^ ту <^ т, и мы имели бы, что откуда J_ т mi ' т. е. в силу неравенства т1<^т следовала бы сократимость дроби - , что невозможно.
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 171 Теперь теорема становится очевидной — произведение m"f(k) делится на / — km, а т взаимно просто с / — km; следовательно, f{k) делится на /—km. Обращаясь к примерам, покажем, как на основании изложенного следует вычислять рациональные корни многочлена. Пример 1. Найти рациональные корни многочлена /(лг) = лг1 — 2лг3 — 8лг2 -f 1 Злг — 24. В этом многочлене все коэффициенты являются целыми числами и старший коэффициент равен единице. Следовательно, если много- многочлен f(x) имеет рациональные корни, то согласно следствию из теоремы 12 корни должны быть целыми. На основании теоремы 12 заключаем, что целые корни многочлена /(лг) должны быть дели- делителями его свободного члена — 24. Таким образом, целые корни следует искать среди чисел 1=1, —1, 2, —2, 3,-3, 4, —4, 6, —6, 8, —8, 12, —12, 24, —24. E) Эти числа можно рассматривать как дроби — с т=1; отсюда на основании теоремы 13 заключаем, что для целого корня лго = = -т- = / число f(k) должно делиться на / — k, где k — произволь- произвольное целое число, отличное от /. Возьмём k= 1 и ?==— 1. Так как /A)=—20 и /(—1)==—42, то 1 и —1 не могут быть корнями рассматриваемого многочлена, и потому остаётся исследовать числа 1=2, —2, 3, —3, 4, —4, 6, —6, 8, —8, 12, —12, 24, —24. F) Посмотрим, для каких чисел F) /A) делится на /— 1 и /(— 1) делится на /-)-1. Легко усмотреть, что только числа 1=2, —3, —4, 6 удовлетворяют этому условию. Так как /B) = — 30^0, то остаётся исследовать /=—3, —4 и 6. Число /B) = — 30 должно делиться на / — 2, если / — целый корень многочлена /(лг). Но этому условию делимости удовлетворяют только — 3 и — 4. Подставляя в выражение многочлена вместо лг значения —3 и —4, видим, что /(—3) = 0 и /(—4)= 180. Таким образом, рассматриваемый многочлен /(лг) имеет только один рацио- рациональный корень лго = —3. Пример 2. Найти рациональные корни многочлена Юлг1 —лг3—19лг2 —5лг-|-6.
172 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ По теореме 12 знаменатель т рационального корня xo = -L /71 многочлена /(лг) должен быть делителем 24, а числитель Z — дели- делителем 6. Мы можем знаменатель т считать положительным, относя знак к числителю /. В соответствии со всем этим составляем следую- следующую таблицу возможных значений лг0: / 1 1 2 — 2 3 — 3 6 — 6 1 — 1 т 1 г 1 х„ 1 — 1 2 2 3 — 3 6 — 6 -V. / 3 — 3 1 — 1 2 — 2 1 j 3 — 3 т 2 2 3 3 3 3 4 4 4 4 Х„ 7* — 7* 7. — 7а 7а -V. 7, -74 74 -V. / 1 — 1 1 — 1 3 — 3 1 — 1 1 — 1 т 6 6 8 8 8 8 12 12 24 24 Хо 7в -7в 7s — 7s V. -Vs 7u -7u 7и -724 Числа 1 и — 1 не могут быть корнями многочлена f(x), так как /A) = 15 и/(—1) = — 21. Затем, пользуясь теоремой 13, можно исключить ещё ряд возможных значений лг0. А именно, испытываем, для каких — число /A)=15 делится на /—т и число /(—1) = = — 21 делится на 1-\-т. Без труда находим, что этим условиям делимости удовлетворяют только числа ¦Х0 = 2, —2, 6, /2, — /2, — Л» — /з» — /ii Д> /е- Так как /B) = 840 и /(—2) = —660, то 2 и —2 исключаются и остаётся исследовать числа 6» /а» Л> Л» /з> /4> /i> /в* ( ) Выкидываем из ряда G) те числа —, для которых /B) = 840 не делится на /—2т. Затем выкидываем —, для которых/( — 2)= = — 660 не делится на 1-\-2т. В результате останутся 1/ I/ 3/ 2/ 3/ /2> /2> /2> /3> /i* Подвергаем эти значения непосредственному испытанию — подста- подставляем вместо х эти значения в многочлен /(лг): тМ-4)='(тН'(- *)="¦ /(-4)=-
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 173 Мы видим отсюда, что рассматриваемый многочлен имеет только следующие рациональные корни: — J _JL 1 xv— 2"' 3 ' 4' и мы можем написать разложение f(x) в произведение неприводи- неприводимых (в поле рациональных чисел) многочленов или / (л) = Bл — 1) (Зл + 2) Dл — 3) (л2 + лг-f 1). Квадратный трёхчлен лг2-|-лг-{-1 неприводим, так как он не имеет рациональных корней. В некоторых случаях большую помощь при вычислении рацио- рациональных корней могут оказать следующие предложения: 1°. Многочлен /(лг) с целыми коэффициентами не имеет целых корней, если для некоторых целых s и t /Bs) и fBt-\-\)— нечётные числа. Доказательство. Допустим противное — предположим, что /(лг) имеет целый корень лг0. Тогда = (л — xo)q(x). Отсюда /Bs) = Bs — xo)qBs) (8) (9) Из равенства (8) следует в силу нечётности fBs), что число 2s—лг0 должно быть нечётным. Так как 2s является чётным, то отсюда получается, что лг„ должно быть нечётным числом. С другой стороны, из равенства (9) следует, что2/-|-1—лг0 должно быть нечётным, откуда благодаря нечётности 2/-J-1 вытекает, что лг0 должно быть чётным. Итак, одно и то же число лг0 оказывается одновременно чётным и нечётным, что абсурдно. 2°. Многочлен f(x) с целыми коэффициентами не имеет рацио- рациональных корней, если можно указать два таких целых значения kt и &2 независимого переменного лг, что k1—?2^>2 и f(kt) = = dtl и /(?„) = ;? 1. Доказательство. Допустим, что многочлен f{x) при указгн- ных условиях имеет рациональный корень лг„ = — • Тогда по тео- теореме 13 /"(А,) = dt 1 должно делиться на /—kxm и должно делиться на / — k^m. Отсюда получается, что /—^/« = ±1 и I — ^/« = ±1.
174 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Вычитая из второго равенства первое, мы будем иметь: (kt—kz)rn = dz2 или (kt—?2)/л = 0. Но равенство (kx—k^)m = 0 исключается, так как kt ф ks и т ^> . Таким образом, имеет место только первое равенство. Из этого равенства видно, что 2 должно делиться на k^—?2, что невозможно, так как по условию kx — ?а ^> 2. Пример 3. Найти рациональные корни многочлена /(лг) = лг6 + х* — Xs- — 2лг3 — блг2 + 1х + 105. Согласно следствию из теоремы 12 этот многочлен может иметь в качестве рациональных корней лишь целые корни. Легко видеть, что /@) и /A) — здесь нечётные числа: /@)=/A)= 105. Следо- Следовательно, согласно предложению 1° рассматриваемый многочлен не имеет целых корней и тем самым не имеет рациональных корней. Пример 4. Найти рациональные корни многочлена /(лг) = 2лг* — 7лг3 — лг2 — 1 %х 4- 25. Полагая лг= 1 и лг=4, получаем: /A)= 1 и /D)= 1. Мы видим, что для этого многочлена условия предложения 2° соблюдаются. Следовательно, рассматриваемый многочлен не имеет рациональных корней. § 5. Разложение многочленов на неприводимые множители над полем рациональных чисел. Признак неприводимости На основании изложенного в предыдущем параграфе мы теперь укажем различные приёмы разложения многочленов /(лг) с рацио- рациональными коэффициентами на множители, неприводимые в поле ра- рациональных чисел. Для многочленов второй и третьей степени вопрос о разложе- разложении на множители решается просто. А именно, если многочлен второй степени i^\-\-c A) с рациональными коэффициентами приводим в поле рациональных чисел, то он, очевидно, будет разлагаться в произведение двух линейных множителей: / (лг) = а (лг — лг,) (х — лг2) (лг, и л-2 — рациональные числа), вследствие чего /(лг) будет иметь два рациональных корня лг, и лг2. Обратно, если многочлен A) имеет хотя бы один рациональный корень лг,, то многочлен будет разлагаться в поле рациональных чисел в произведение двух линей- линейных множителей.
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 175 Примерно такую же роль играют рациональные корни и для многочлена третьей степени f(x) = aj<*-\-bj<*-\-cx-\-d B) с рациональными коэффициентами: многочлен B) приводим в поле рациональных чисел тогда и только тогда, когда он имеет по меньшей мере один рациональный корень. В самом деле, если многочлен B) приводим в поле рациональ- рациональных чисел, то он должен иметь в своём разложении хотя бы один линейный множитель px-\-q с рациональными коэффициентами р, q. Этот множитель обладает рациональным корнем лг0 = — —. Оче- Очевидно, что хо = — — будет также корнем и многочлена B). Обратно, если многочлен B) имеет рациональный корень лг0, то откуда /(лг) приводим в поле рациональных чисел. Пример 1. Разложить многочлен f(x) = 2х* — лг2 — лг — 1 на множители в поле рациональных чисел. Пользуясь методами предыдущего параграфа, находим, что дан- данный многочлен не имеег рациональных корней. Следовательно, этот многочлен неприводим в поле рациональных чисел. Пример 2. Разложить многочлен = 6х3 — 7лг2 — 2лг -J-2 на множители в поле рациональных чисел. Находим, что этот многочлен имеет только один рациональный корень, равный -^. Следовательно, данный многочлен приводим в ноле рациональных чисел, а именно, распадается на линейный и квадратный множители. С помощью схемы Горнера без труда на- находим искомое разложение на множители: ! —4лг—4) или /(лг) = Bлг— 1) (Злг2 — 2лг — 2). Пример 3. Разложить многочлен f(x) = блг8 4 7лг2 — 9лг 4- 2 на множители в поле рациональных чисел.
176 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Находим, что многочлен /(лг) имеет три рациональных корня -~ t -^ и —2. Следовательно, f(x) должен разлагаться на три ли- линейных множителя (лг— -^)» \х ь) и {х-\-2)т. f{x) = 6 (х -1) (х -1) Впереди стоит число 6, так как старший коэффициент /(лг) ра- равен 6. Освобождаясь от знаменателей, получаем окончательно, что Для многочленов более высокой степени дело обстоит слож- сложнее— если многочлен я-й степени (я ^4) с рациональными коэффи- коэффициентами имеет рациональный корень лг0, то этот многочлен будет приводим в ноле рациональных чисел, так как будет делиться на лг — лг0. Обратное, однако, неверно. Например, многочлен /(лг) = лгв _ лг* — Злг3 + -*2 + Злг -f 1 не имеет рациональных корней и тем не менее он приводим в ноле рациональных чисел: = (лг2 — лг— 1)(лг3 — 2лг— 1). Для многочленов четвёртой степени можно указать довольно удобный приём разложения на множители, связанный с понятием кубической резольвенты. Пусть /(лг)=лг14 ах3 4 Ьх* 4 ex -\- d C) — некоторый многочлен четвёртой степени с рациональными коэф- коэффициентами. Преобразуем его так, чтобы он представился в виде разности двух квадратов. Для этой цели пишем: / (х) = [(X*)* 4 2*2 (-f-) ] 4 (k*2 + ex 4 d). Сделаем выражение внутри квадратных скобок полным квадратом, для чего прибавим и вычтем D?ч : =(*" + -?J4 [(b-± Далее, введём вспомогательную величину у, а именно прибавим к последнему выражению и вычтем из него многочлен
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 177 Получим: /(а-) = [ха- + ~+yj - (А* + Вх + С), D) или где Теперь подберём у таким, чтобы квадратный трёхчлен Axi -\- -\-Bx-\-C был полным квадратом. Мы воспользуемся следующим предложением: Квадратный трёхчлен Ах* -\- Вх -\- С с комплексными коэф- коэффициентами А, В, С тогда и только тогда является квадратом линейного многочлена еиг-|-р с комплексными коэффициентами, когда В* = 4АС. Доказательство. Пусть Ллг2 + Вх -f С = (ах -f РJ. Тогда Ахг2 -f Вх + С = а2лг2 + 2а,Влг -\- р2. Мы знаем, что если два многочлена равны, то у них должны сов- совпадать коэффициенты при одинаковых степенях х. Следовательно, Так как, очевидно, Bа[3J = 4a2j32, то отсюда вытекает, что 52 = Обратно, пусть В* = 4АС. Тогда квадратный трёхчлен можно преобразовать следующим образом: т. е. Лх2 -\- Вх -\- С представился в виде квадрата линейного двучлена. Вернёмся теперь к выражению D) многочлена f{x). На основа- основании только что доказанного предложения попытаемся подобрать у с таким расчётом, чтобы S2 —4ЛС или (ау _ с)» = 4 (зу + ¦? — ft ) О2—d). E) Мы получили уравнение третьей степени относительно у. Это урав- уравнение E) и называется кубической резольвентой многочлена C). 12 Энциклопедия, ки. 2.
178 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Итак, если у— один из корней кубической резольвенты E), то многочлен C) будет выражаться в виде разности двух квад- квадратов: Предлагаемый вниманию читателей приём разложения много- многочлена C) четвёртой степени на множители в поле рациональных чисел основан на следующей теореме: Теорема 14. Многочлен четвёртой степени f(x)=xl-\-ax3-\-bxi-\-cx-\-d C') с рациональными коэффициентами, не имеющий рациональных корней, тогда и только тогда приводим в поле рациональных чисел, когда его резольвента обладает таким рациональным корнем у0, что v-< являются рациональными числами. Доказательство. Пусть резольвента E) имеет рациональный корень yQ и I/ 2уо-\--т Ь, уу*0—d — рациональные числа. Тогда на основании вышеизложенного мы можем написать: где — рациональные числа. Но разность двух квадратов можно, как из- известно, представить в виде произведения суммы на разность. Сле- Следовательно, '*+Су.+ т. е. многочлен f(x) оказался приводимым в поле рациональных чисел. Обратно, пусть f(x) приводим в поле рациональных чисел. Так как по условию f(x) не имеет рациональных корней, то мно- многочлен f(x) будет разлагаться в произведение двух квадратных трёхчленов с рациональными коэффициентами: /(аг) = лг1 -f ах3 + Ъх* -f сх -\- d = (лг2 4 Pi* + Чд (х°~ +Р*Х + 4д или xi-\-ax3-}-bx*-\-cx-\-d =
К01ЫЮ MHOrO41FHOB ОТ ОДНОГО НЕИЗВЕСТНОГО 179 Сравнивая слева и справа коэффициенты при одинаковых степенях х, получаем: Р\-\-Р* = а, Р1Р% + Ч\-\-Чъ = Ь, р^3-\-р^1=с, <7,<72 = rf- F) Исходя из равенств F), нетрудно убедиться, что резольвента E) имеет рациональным корнем Л ( и у 2_у0 -]—-j Ъ, ]/yl — d являются рациональными числами. В самом деле, _ fi — ZpiP, +Pl _(pi—p* — 4 I — I 2 ) ' = flj/o — с = (p, Pili + Pi'gs — Pigs — A>ffi iPi—p2)(qi~qs) ~ 2 2 откуда уравнение E) при _у=^0 = -^~^-превращается в очевид- очевидное тождество Г (Pi— />s)(gl— g3) |2 _ 4 /Pl— PS\S /gl— <72\3 Итак, если многочлен C) приводим в поле рациональных чисел, то его резольвента E) имеет рациональный корень — рациональные числа, так как —-„-^ и ~—J^ рациональны. Покажем теперь на конкретных примерах, как на основании изложенного проводится разложение многочленов четвертой сте- степени на множители. Пример 4. Разложить многочлен / (х) = 2лг4 + х3 — Злг3 -f Зх — 1 на множители в поле рациональных чисел. 12*
180 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Прежде всего выясним, имеет ли данный многочлен рациональ- рациональные корни. С помощью обычных приёмов вычисления рациональных корней убеждаемся в том, что /(лг) имеет только один рациональ- рациональный корень лг = -^-. Пользуясь схемой Горнера, получаем: /(лг) = (х — ~ ) Bлг3 + 2лг2 — 2лг + 2) или /(лг) = Bлг — 1)(лг3 + лг2 —лг+ 1). Многочлен х3 + лг2 — лг + 1 уже неприводим в поле рациональ- рациональных чисел, так как он не имеет рациональных корней (корни этого многочлена являются также корнями многочлена / (лг)). Пример 5. Разложить многочлен /(лг)=лг& + Злг3 — 2лг2 + 2лг — 2 на множители в поле рациональных чисел. Этот многочлен не имеет рациональных корней. Поэтому вос- воспользуемся теоремой 14. Составляем резольвенту многочлена /(лг): или после очевидных упрощений 8у3 + 8/ + 28.У + 30 = 0, или, наконец, г3 + 2*2+ 14^ + 30 = 0, где г = 2у. Последнее уравнение не имеет, однако, рациональных корней. Следовательно, резольвента также не имеет рациональных корней. Отсюда рассматриваемый многочлен неприводим в поле рациональных чисел. Пример 6. Разложить многочлен /(лг) = лг1 + 2лг3 — 2лг2 + 2лг + 1 на множители в поле рациональных чисел. Нетрудно убедиться, что этот многочлен не имеет рациональ- рациональных корней. Поэтому обращаемся к теореме 14. Составляем резоль- резольвенту многочлена Bу — 2J = 4 Bу + 3) О2 — 1) или (У— Отсюда легко усмотреть, что резольвента имеет только один рациональный корень _уо=1. Для этого корня
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 181 Итак, рассматриваемый многочлен неприводим в поле рациональ- рациональных чисел, так как число |/5 иррационально. Пример 7. Разложить многочлен f(x) = 6х1 — 7х3 + х2 — 2 на множители в поле рациональных чисел. Этот многочлен не имеет рациональных корней. Чтобы можно было воспользоваться теоремой 14, преобразуем f(x) в многочлен со старшим коэффициентом, равным единице, для чего делим f(x) на 6: Составляем резольвенту этого многочлена: или окончательно 10823 — 18га -J- 144г -f- 25 = О, где z = 2у. Это уравнение имеет рациональный корень zo = g-. Отсюда резольвента также имеет рациональный корень, именно Уо = рт. Для этого корня у0 —-. -ж/ 1 Г~Г Следовательно, многочлен fl (x) и тем самым многочлен f(x) при- приводимы в поле рациональных чисел. Найдём, на какие множители распадается f(x). Для этой цели вычислим В: В-=ауо — с = — ^.(—^) = ~. Число В оказалось положительным. Отсюда а и C должны быть одного знака, так как 2<зф = В^>0. Возьмём а и 6 со знаком плюс (с таким же успехом можно было их взять и со знаком минус):
182 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Тогда, руководствуясь доказательством первой половины теоремы 14, получаем: Отсюда f{x) = 6/, (х) = Bх2 — х + 1) (Зх2 — 2х — 2). Обращаясь к многочленам f(x) выше четвёртой степени, отме- отметим, прежде всего, что следует всегда начинать с вычисления рациональных корней многочлена. Если f(x) имеет хотя бы один рациональный корень х0, то f(x) = (x— xo)/i (х), и тогда дело сводится к разложению на дальнейшие множители многочлена /i (x), имеющего меньшую степень. Если же f{x) не имеет рацио- рациональных корней, то приходится прибегать к особым методам. Один из таких методов мы и собираемся изложить в общих чертах. Коэффициенты многочлена над полем рациональных чисел всегда можно предполагать целыми, так как в противном случае мы умножили бы fix) на общего знаменателя его коэффициентов. В этом предположении назовём многочлен f(x) примитивным, если наибольший общий делитель всех ею коэффициентов равен единице. Например, f(x) = 2х* — 4х4 + Зх3 -f- 2х2 — 5х -\- 7 является примитивным многочленом; напротив f(x) = 3xi — 21x34-15x2 — бх+18 не примитивен, так как наибольший общий делитель всех его коэффициентов равен 3, а не единице. Рассмотрим две леммы, известные под названием лемм Гаусса. Лемма 1. Произведение двух примитивных многочленов есть также примитивный многочлен. Доказательство. Пусть = «о + aix + а*-х°' + • • • + «я-*Л =h 4- V+ь%х°- 4-...
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 183 — примитивные многочлены. Предположим, вопреки утверждению леммы, что их произведение ? (х) -i (х) = с0 + схх + ... + не примитивно. Тогда все коэффициенты си = aobo, ci+j = «<А+/ + «A+y-i + • • • + «i-ify+i + ««*/ -\- + aMbj-i -f • ¦ • -f ai+Jb0, произведения у(х)^(х) будут обладать наибольшим общим дели- делителем d, отличным от единицы. Пусть р — простое число, деля- делящее d* Тогда, очевидно, р будет делить все коэффициенты с0, с,, с2, ..., сп+т произведения ср (х) ty (x). Однако, р не может делить все коэффициенты <р(-*0> так как в противном случае ср(х) не было бы примитивным. Точно так же р не может делить все коэффи- коэффициенты" <|/(х). Таким образом, пусть a-t — первый коэффициент мно- многочлена ^ (х), не делящийся на р, и bj — первый коэффициент ty (x), не делящийся на р. Рассмотрим коэффициент CJ+j = a»bi+j + • ¦ • + «i-l^y+l + «А" + ««+1*7-1 + • • • + ««+А- F) В правой части равенства F) все члены, кроме atbj, делятся на р, так как а0 at_u bj_u ..., Ьй ещё делятся на р. Но член a-fij на р не делится, так как а{ и bj не делятся на р. Отсюда следует, что правая часть равенства F) не делится на р. Получилось про- противоречие с нашим предположением о том, что все коэффициенты произведения ср(х)$(х), и в частности c1+j, делятся на р. Это про- противоречие и доказывает лемму. С помощью леммы 1 докажем вторую лемму, играющую в изла- излагаемом методе основную роль. Эта лемма состоит в следующем: Лемма 2. Если многочлен f(x) с целыми коэффициентами приводим в поле рациональных чисел, то он разлагается в про- произведение двух многочленов низшей степени с целыми коэффи- коэффициентами. Доказательство. Пусть многочлен /С*) = а0+ 2 разлагается в поле рациональных чисел следующим образом на два. множителя низшей степени: fix)=g(x)h{x)%
184 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Если все коэффициенты многочленов g(x) и h(x)—-числа целые, то доказывать нечего. Поэтому пусть g (x) и h (x) имеют дробные коэффициенты. Обозначим через mt общий знаменатель коэффициен- коэффициентов g(x) и через /и2 общий знаменатель коэффициентов h(x). Тогда -fi?gi(x) и h{x) = — hl{x), где gt (x) и h1 (x) — многочлены уже с целыми коэффициентами. Далее, обозначим через dt наибольший общий делитель коэффи- коэффициентов gt (x) и через d% наибольший общий делитель коэффици- коэффициентов hx (x). Мы можем в таком случае написать, что где ср(х) и ty(x) — примитивные многочлены. Отсюда а = — /С*) = 7 ?(¦*)*(¦*)• G) или, полагая — - а- = — з где — — несократимая дробь: Если теперь = co-\-c1x+ ...-\- спхп, то из равенства G) следует, что Так как а0 — целое число, то гс0 должно делиться на s. Но в силу несократимости дроби — числа г и s взаимно просты. Сле- довательно, с0 должно делиться на s. Точно так же находим, что Cj, c2, ..., с„ делятся на s. Мы видим отсюда, что s есть общий делитель коэффициентов произведения <p(x)ty(x). По лемме 1 мно- многочлен 9 (jc) ^ (аг) должен быть примитивным. Тем самым s должно равняться единице и потому т. е. мы получили разложение многочлена f(x) в произведение многочленов с целыми коэффициентами выше нулевой степени. Теперь мы можем приступить к изложению основной идеи ме- метода разложения произвольного многочлена на неприводимые множи- множители над полем рациональных чисел. Для большей наглядности Обратимся к конкретному примеру.
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 185 Пример 8. Разложить многочлен f(x) = хв + х4 -f 3x3 -f 4x2 + 4* + 2 на множители в поле рациональных чисел. Легко убедиться, что данный многочлен f(x) рациональных кор- корней не имеет. Таким образом, если многочлен f(x) приводим в поле рациональных чисел, то он должен разлагаться на два множителя второй и третьей степени. По лемме 2 коэффициенты этих множи- множителей должны быть целыми числами, причём старшие коэффициенты должны равняться единице, так как старший коэффициент f(x) равен единице. Следовательно, если многочлен f(x) приводим, то его множитель второй степени должен иметь вид где р, q — какие-то целые числа. Отсюда получается, что при любом целом т число /(/я) должно делиться на g(m). Этим обсто- обстоятельством мы и воспользуемся для нахождения многочлена g(x). Так как /@) = 2 и /(—1) = —1, то для ^@) и g(—l) воз- возможны только следующие комбинации значений: l)g@)= 1 и g(—l)=l, 5)g@) = 2 и g(-l)=l, l и е(—1) = —1, 6)g@) = 2 и g(—i) = —l, = —1 и g(—i)=i, 7)g@) = — 2 и g(— 1) = — 1, —I и ff(—1) = —1, 8)g@) = — 2 и g(— 1)=1. Рассмотрим первую комбинацию ^@)=! и g(—1)=1. Имеем: откуда p = q=\ и Делим f(x) на х2-)-д;-]-1 и убеждаемся, что f(x) на этот квадратный трёхчлен делится: Таким образом, наша цель достигнута — разложение f{x) в поле рациональных чисел на неприводимые множители получено, и дальнейшие комбинации 2) — 8) незачем рассматривать. Во многих случаях большую помощь оказывают критерии не- неприводимости, позволяющие сразу обнаружить неприводимость многих многочленов в поле рациональных чисел. Укажем один из наиболее распространённых критериев. Признак неприводимости Эйзенштейна. Пустьf(x)— многочлен с целыми коэффициентами. Если все его коэффици- коэффициенты, кроме старшего, делятся на некоторое простое число р, а свободный член, делясь на р, не делится на /?2, то многочлен, неприводим в поле рациональных чисел,
186 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Доказательство. Допустим противное — предположим, что многочлен = aQ-\-alx-\- ... приводим в поле рациональных чисел. Тогда по лемме 2 многочлен f(x) разложится в произведение двух многочленов g(x) и h(x) низшей степени с целыми коэффициентами: f(x) = g(x)h(x). (8) Пусть Тогда из равенства (8) следует, что = 4bk Л- cibk-t По условию свободный член йо = ?ого многочлена f(x) делится на простое число р. Отсюда на р должно делиться Ьо или с0. Но Ьй и с0 не могут одновременно делиться на р, так как а0 не делится на р*. Пусть для определённости Ьо делится на р, но с0 не делится на р. Возьмём равенство а, = cobt + Cib№. Его левая часть at по условию делится на р, а в правой части член cjju делится на р, так как в этот член входит ?„, делящееся на р. Отсюда следует, что другой член в правой части cobt делится на р. Но с0 не делится на простое число р. Поэтому Ь1 должно делиться на р. Переходя к следующему равенству подобным же образом убеждаемся, что &, делится на р и т. д. Наконец, из равенства вытекает, что bk делится на р. Теперь обратимся к равенству an = bkcl. Так как bk делится на р, то ап должно делиться на р. Получилось противоречие с ус- условиями признана, согласно которым старший коэффициент а,п
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 187 многочлена f(x) не делится на р. Этим справедливость признака и доказана. Пример 9. Многочлен /(д;)г=гхв—12х34-36д;2—12х—12 неприводим в поле рациональных чисел. В самом деле, для простого числа р = 3 все условия признака Эйзенштейна выполняются — стар- старший коэффициент рассматриваемого многочлена не делится на 3, а остальные коэффициенты делятся на 3, причём свободный член—12 не делится на 32 = 9. С помощью признака Эйзенштейна можно построить многочлен произвольной степени, неприводимый в поле рациональных чисел, например f(x) = В некоторых случаях, когда признак Эйзенштейна непосредственно применить не удаётся, можно, полагая х = ау-\-ф, где а и [3 — над- надлежащим образом подобранные рациональные числа, получить много- многочлен от переменного у /iO0=/(<y + P) =/(¦*). удовлетворяющий условиям признака Эйзенштейна. В этом случае .из неприводимости многочлена fl (x) сразу будет вытекать неприво- неприводимость f(x). Действительно, если бы f(x) был бы приводим, в то время как ft (x) неприводим, то = g(x)h(x) или /(<У + P)=/i 0>)=е(*У+ Р) h (ay+ P) = ft СОЙ, 00, т. е. /i (x) было бы, вопреки условию, приводимым. Пример 10. С помощью признака Эйзенштейна показать, что многочлен f(x) = х4 — х3 + 2х -f-1 неприводим в поле рациональных чисел. К этому многочлену признак Эйзенштейна непосредственно при- применить нельзя, так как нельзя подобрать простого числа р, для ко- которого будут выполняться все условия признака. Поэтому поло- положим х=у-\-1. Тогда получим: При р = Ъ для многочлена /, (у) все условия признака Эйзенштейна выполняются. Следовательно, /4 (у) и потому f(x) неприводимы в поле рациональных чисел,
188 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ § 6. Основная теорема алгебры В произвольном числовом поле Р многочлен я-й степени f(x), как мы знаем, имеет не более чем я корней (считая каждый корень столько раз, какова его кратность)'). Однако многочлен f(x) в поле Р может и совсем не иметь корней. Возникает естествен- естественный вопрос, в каком числовом поле любой многочлен я-й степени имеет в точности я корней. Мы покажем, что таким полем является поле комплексных чисел, самое обширное числовое поле. Это заме- замечательное свойство поля комплексных чисел вытекает из теоремы, носящей название основной теоремы алгебры, и заключающейся в том, что всякий многочлен f(x) степени я ^э= 1 с комплексными коэффициентами имеет в поле комплексных чисел по меньшей мере один корень. Займёмся предварительно изучением основных свойств понятия непрерывности функции в области комплексных чисел, так как это понятие будет играть существенную роль в нашем доказательстве основной теоремы алгебры. Обычное определение непрерывной функции, излагаемое в курсе математического анализа, можно без особых затруднений перенести и на тот случай, когда переменное х и функция (р(х) принимают комплексные значения. А именно, назовем однозначную комплекс- комплексную функцию ср(х) комплексного переменного х непрерывной в точке хп, если для всякого наперёд заданного положительного числа е можно указать такое положительное число 8, что для вся- всякого значения х, удовлетворяющего неравенству |дг-дг,'<8, A) будет иметь место неравенство 19(*)—?(.*„) |<в B) для соответствующих значений функции. Обращаем внимание читателя на то, что здесь две вертикальные чёрточки означают уже не абсолютную величину, а модуль. Для большей наглядности дадим геометрическое истолкование этому определению непрерывности. Возьмём для изображения зна- значений переменного х и функции <р(х) две плоскости Р и Q. На плоскости Р выберем прямоугольную систему координат ОЪ\, а на плоскости Q — прямоугольную систему координат Ouv. Плоскость Р мы будем называть плоскостью переменного х, a Q — плоскостью ') Числовым полем принято называть всякую часть поля комплексных чисел, также образующую поле отпосительно арифметических действий сло- сложения и умножения. Эта часть может совпадать и со всем полем комплекс- комплексных чисел.
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 189 ¦функции. Так как х и ср(х) принимают комплексные значения, то можно написать, что где I, щ, и, v действительны, a i= |/—1—мнимая единица. Каждое значение x^%-\-ii\ можно на плоскости Р изобразить —>- точкой X с координатами ?, t\ или вектором ОХ. Соответствующее значение функции w = ср (х) = и -f- iv будет тогда изображаться точкой W с координатами a, v или векто- вектором OW на плоскости Q. Пусть теперь на плоскости Р переменного х значение х0 пред- представляется вектором ОХ0. Тогда модуль разности х—х0 будет оз- означать расстояние между точками X и Хо. Таким образом, нера- неравенство A) означает, что точка X должна лежать внутри крута С1 радиуса 8 и с центром в точке Хо. Точно такое же истолкование можно дать неравенству B): если на плоскости функции ср(х) зна- значение <р(х0) изображается точкой Wo, то неравенство B) означает, что точка W лежит внутри круга С2 радиуса е и с центром в точке Wo. Теперь определению непрерывности функции в точке можно дать следующее наглядное истолкование: функция ер(х) непрерывна . в точке х0, если для круга Са произвольного радиуса е с центром в точке Wo на плоскости функции можно указать на плоскости переменного х крут Сх такого радиуса Ь с центром в точке Хо, что всякой внутренней точке круга Сх будет соответствовать внутрен- внутренняя точка круга С2. Если функция ср{х) непрерывна в любой точке плоскости пере- переменного х, то функция ср(х) называется всюду непрерывной или, короче, непрерывной. Посмотрим теперь, что можно сказать относительно многочлена с комплексными коэффициентами, если его рассматривать как ком- комплексную функцию комплексного переменного 2). Легко убедиться в справедливости следующего предложения: Многочлен f(x) с комплексными коэффициентами есть непре- непрерывная функция комплексного переменного X. Доказательство. Пусть f(x) = а^ и х0 — произвольное значение х или, выражаясь геометрически, •) Так как поле комплексных чисел есть частный случай бесконечной области целостности R, то мы здесь имеем полное право рассматривать мно- многочлены над полем комплексных чисел как функции комплексного пере- переменного х.
190 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ произвольная точка. Так как f(xv) = а„хпа то f(x) —/(*„) = ао(яГ — *») + а, (.V -* Отсюда, принимая во внимание, что X* — Х% = (X - Хв) (Х»-1 + Хк~*Х0 + . . . + Д* - I), получаем: f(x)—f(xo) = (x—xo) [а„ (Xя Известно, что модуль суммы меньше или равен сумме модулей, а модуль произведения равен произведению модулей. Следовательно, V1- C) Возьмём точку х столь близкой к точке х0, чтобы х лежало внутри круга радиуса 1 с центром в точке ха, т. е. чтобы \х — лго| <^ 1. Тогда |лгК|хо|4- 1. Так как, очевидно, и | *01 <С I-^о I + *• то> полагая для сокращения письма |х0 ство C) усилить, заменяя в нём \х Получим: \х — хо\[\ао —[— 1 = -Л^, мы можем неравен- и 1 jc0 | большей величиной М. п раз п — I раз ИЛИ Обозначим через Л/. Тогда неравенство D) запишется в виде А теперь возьмём для заданного е^>0 число й^>0 так, чтобы 8<^-А- и 8<^1. Полагая \х — хй\<^Ъ, мы получим следующее >си- ление неравенства E): |/(х)-/(*„) ^ или окончательно
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 191 Итак, многочлен f(x) оказался функцией, непрерывной в точке х0. Но х0 — произвольно. Следовательно, f(x) есть всюду непрерыв- непрерывная функция, и наше утверждение доказано. Из непрерывности многочлена вытекает, что и его модуль \f(x) \ есть также непрерывная функция комплексного переменного х. В самом Деле, согласно одному из свойств модуля мы можем налисать, что | \f(x) | -|/(*0) 11 ^ |/(*) -/(*„) |. F) Так как по доказанному многочлен f(x) есть непрерывная функция комплексного переменного х, то для любого е^>0 можно указать такое 8^>0, что при \х — лс01 <СГ ^ будет выполняться неравенство №)-/(¦*„) I О Отсюда благодаря неравенству F) и подавно будет: при |jc- — л< Из теоремы о непрерывности многочлена вытекает ещё одно следствие: Пусть f{x) = а.х" + а,*" + • • • + а„_, х —многочлен степени п^О в со свободным членом ап, равным нулю. Тогда для любого е^>0 можно указать такое 8^>0, что для всех х, удовлетворяющих неравенству |лг|<^8, будет иметь место неравенство |/(-*0|<^е. В самом деле, возьмём в качестве х0 значение 0. В силу непре- непрерывности многочлена f(x) можно для любого е^>0 указать такое й ^> 0, что для всех х, удовлетворяющих условию | х — 0 | <^ 8, будет выполняться неравенство Но /@)=:0, так как f{x) есть многочлен со свободным членом, равным нулю. Таким образом, получается, что для любого можно указать такое 8^>0, для которого |/(-*0|<^е при |д| Для доказательства основной теоремы алгебры понадобится, кроме того, несколько лемм. Лемма 1. Модуль всякого многочлена f{x) = а«хп + а,*" + • • • + «,*-!-* + «» степени п'^1 при достаточно больших по модулю значенияхх может быть сделан больше любого наперёд заданного действи- действительного положительного числа М.
192 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Доказательство. Преобразуем многочлен f(x) следующим образом: Так как модуль суммы больше или равен разности модулей, то Выражение а0 ' х ' с0 х" ' """ ' с0 ' хп можно рассматривать как многочлен от — со свободным членом, Л равным нулю. Поэтому можно для е = -г- указать такое В^>0, что 1 при — <~Ъ будет иметь место неравенство А |-*-.±4- л_Еп..Л<Л (8) Иными словами, неравенство (8) будет выполняться при |лг|^>-^- = Л/. Отсюда, полагая \x\~^>N, можно неравенство G) усилить, а именно, или Возьмём теперь х столь большим по модулю, чтобы одновре- одновременно |.*r|>N и \x\~^>Nx, где Тогда или \f(x)\^>M, что и требовалось показать. Мы подошли к лемме, играющей в доказательстве основной тео- теоремы алгебры весьма важную роль. Лемма 2 (лемма Даламбера). Если многочлен степени п^1не обращается в нуль при х = хй, то можно подо- подобрать такое комплексное число п, чтобы
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 193 Доказательство. Положим x = xo-\-h. Тогда f{x, + h) = a0 (х0 -f hf + а, (х0 -f A)" + ... + ап. Раскрывая степени (хй-\-И)к по биному Ньютона и располагая члены по возрастающим степеням h, получаем: i*"~' + во*". (9) где &0, #J( ..., ^n_i — соответствующие комплексные числа. Полагая в равенстве (9) Л = 0, находим, что bQ—f{xu). Таким образом, /С*. + К) =/(*„) + *,А + Ь^ + • • • + Vi Л" + афп. A0) Может случиться, однако, что часть или даже все коэффициен- коэффициенты Ьи Ь%,~ .., Ъп_х будут равны нулю. Рассмотрим сначала тот слу- случай, когда не все Ь{ равны нулю. В этом случае можно указать такое число k (l^k<^n), что bk^b0, но Ьу=Ь2= ... =bk_l = 0 (в частности, если Ьх ф§, то k — l). В этом предположении равен- равенство A0) перепишется следующим образом: /(*о + *) =/С*о) + bkhk -f ЬшAft+1 + ... -f a0A". Разделим обе части последнего равенства на /(-?0). Делить на f(x0) мы имеем право, так как по условию f(xQ) ф 0. Получим: где г — причём сй у? 0, так как, по нашему предположению, Ьк ф 0. Принимая во внимание, что ck ф 0, мы можем правую часть ра- равенства A1) преобразовать так: Воспользуемся теперь тем, что модуль суммы меньше или равен сум- сумме модулей и модуль произведения равен произведению модулей: Выражение можно рассматривать как многочлен от h со свободным членом, равным нулю. Для такого многочлена можно при е=-о" указать такое о>0, что при \h\<^% будет: 13 Энциклопедия, кн. 2.
194 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Пользуясь этим обстоятельством, усиливаем неравенство A2), пред- предполагая | /г | <^ 8: |Я*±& Ol-f-c^l + ilCftA*!. A3) До сих пор мы подбирали h достаточно малым по модулю. Те- Теперь подберём аргумент h таким, чтобы ckhk было действительным отрицательным числом. Для этого надо потребовать, чтобы arg (cftAft) = я, так как аргумент отрицательного действительного числа равен к. Отсюда получаем, что 3xgck-\-kzxgh = -z и arg/г— 1t~~^!?fg-. A4) С этого момента мы будем всё время предполагать аргумент выбран- выбранным таким, как это указано в равенстве A4). Теперь при указанном выборе аргумента h имеем, что ckhkr= = — \ckhik\, и неравенство A3) можно переписать следующим образом: 1 I hb\ Может случиться, что | cft/zft | будет больше единицы. В таком случае возьмём h по модулю столь малым, чтобы \ск/гк \<^1. Тогда разность 1 — \ckhk J будет положительна и потому \\-\ckhk\\=l-\ckh«\. Отсюда f(xo + h) \^.л Но при \ckhk\<^\ неравенство 1—у [ ckhk \ <^ 1 будет, очевидно, выполняться. Следовательно, и подавно при указанном выборе /г по модулю и аргументу. Так как то отсюда следует, что ,%0,7[ ¦ • <Г ! f откуда Остаётся разобрать случай, когда все коэффициенты bt выраже- выражения A0) равны нулю. Но в этом случае дело обстоит ещё проще. А именно, если b1 = bi= ... =bn_l—0, то
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 195 откуда где с„ = ,,д° ф 0. Таким образом, f(x0) I ' ' " i" Полагая затем arg h = * ~ arg c" и |спЛ"|<^1, получаем, что | f(xn + h) . . „. />n!<"i I /(Xo) откуда Итак, лемма доказана полностью. Кроме леммы Даламбера, нам также понадобятся некоторые свойства последовательностей комплексных чисел, связанных с по- понятием предела. При этом мы будем предполагать, что читатель уже имеет некоторое знакомство с понятием предела и сходимости числовых последовательностей в области действительных чисел. Пусть хи дг2, .... xk, ... A5) — некоторая последовательность комплексных чисел, xk = ak-\-lbk, где ak, bk— действительные числа. Комплексное число а называется пределом числовой последовательности A5), если для любого можно указать такое число N^>0, что \хк — <*|<Се для всех ^ При этом последовательность A5) называется сходящейся к числу о. То обстоятельство, что а есть предел последовательности A5), мы будем коротко записывать так: limJfft = o. Последовательность, не ft-юо имеющая предела, называется расходящейся. Для сокращения письма мы будем последовательность A5) обозначать через \xk). Покажем, что последовательность {xk — ak-\-ibk} сходится тогда и только тогда к числу а — Ь-\-'щ когда последовательно- последовательности действительных чисел {ak\ и {bk) сходятся соответственно к числа и I и т). Доказательство. Если Нтдгл = а, то согласно определению ft -»оо предела числовой последовательности можно для всякого е^>0 указать такое положительное число N, что для всех k^>N |*ft—<х|<в. A6) Так как xk — <* — (ak — ?) + «(** — vj), то неравенство A6) можно переписать следующим образом: 13*
196 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ откуда и подавно \bk — Мы видим, что последовательность {ak\ сходится к Е, а последова- последовательность {bk\ сходится к т): limaft = ?, lim^ft = Tj. k —>со ft —*оо Обратно, пусть limaA = ? и lim?ft = T). Тогда для всякого. fc-»oo ft -»оо ед ^= ^> 0 можно указать такие положительные числа Nt и Nit что при ^ A7) Таким образом, если N—наибольшее из чисел Nt и Ni} то нера- неравенства A7) и A8) будут одновременно выполняться для всех Отсюда при k^>N получаем, что т. е. последовательность {xk} сходится к числу а. На основании только что доказанного можно вывести следующее свойство непрерывных функций комплексного переменного: если комплексная функция <р(х) комплексного переменного непрерывна в точке лг0, то для любой последовательности \хк\ комплексных чисел, сходящейся к лг0, будет иметь место равенство lim ф (**,) = ф С-*,,)- k —*со В самом деле, согласно определению непрерывности в точке для всякого числа е^>0 можно указать такое 8^>0, что для всех х, удовлетворяющих условию | х — лг01 <^ 8, будет выполняться нера- неравенство I <р (лг) — ф (-^о) | <С е- Пусть теперь \xk\ — последовательность комплексных чисел, схо- сходящаяся к дг0. Тогда для 8]>0 можно указать такое N^>0, что ]xk — jt:01<СГ^ ПРИ k~^>N. Для этих чисел xk, очевидно, будет иметь место неравенство 19 С**) — Ф(-*оI0 Мы видим отсюда, что последовательность {9 (-**)} сходится к 9(Лго)' т. е. lim 9 (J^) = 9 Ю- Назовём последовательность комплексных чисел {xk} (сходящуюся или расходящуюся — безразлично) ограниченной, если можно указать такое достаточно большое положительное число М, что |- | С^ (k=\, 2, 3, ...)•
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 197 Назовём, далее, подпоследовательностью последовательности комплексных чисел {jcft} последовательность {jcv },где Vj, v2, ...,\, ... есть некоторая монотонно возрастающая последовательность поло- положительных целых чисел: Vj<^v2<^ ... <^vA<^ ... Нетрудно убе- убедиться, что если последовательность {xk\ сходится к х(), то и всякая её подпоследовательность {х } сходится к х0. В самом деле, так как {xk} сходится к х0, то для любого е^>0 можно указать такое N^>0, что при k^>N будет иметь место неравенство \xk — лго|<^е. Отсюда для всех vk~^>N будет также \x-,k — лго|<^е, т. е. подпоследовательность {xVb} сходится к тому же числу х0. Отметим следующее важное свойство ограниченных последова- последовательностей: Всякая ограниченная последовательность комплексных чисел {xk} обладает сходящейся подпоследовательностью. Доказательство. Мы будем считать эту теорему известной для последовательностей действительных чисел. В соответствии с этим мы проведём доказательство так. Прежде всего легко усмотреть, что из ограниченности последо- последовательности {xk = ak-\-ibk} вытекает ограниченность последователь- последовательностей действительных чисел {ak\ и {bk}. В самом деле, так как | ak | =? | xk | и | bk | =s; | xk |, то из неравенства | xk | <^ M следует, что и подавно | ак [ <^ М, \ bk \ <^ М. Поскольку последовательность действительных чисел \ak} огра- ограничена, она должна обладать сходящейся подпоследовательностью. Пусть это будет {aVfe}- Тогда {¦X-,k = aVk~\-ibVk} будет некоторой подпоследовательностью последовательности \xk\. Рассмотрим по- последовательность {btk} мнимых частей чисел JtrVft. Эта последователь- последовательность есть подпоследовательность ограниченной последовательности \bk\ и потому в свою очередь ограничена. Следовательно, {bVk\ должна обладать сходящейся подпоследовательностью. Пусть это будет {Ьцк}. Рассмотрим последовательность {xilk = aVLk-\-ibVLk}. Она сходится, так как {fyijj сходится, и {ацй} сходится (как подпосле- подпоследовательность сходящейся последовательности {aVft}). Мы видим от- отсюда, что {xk} обладает сходящейся подпоследовательностью {лгцй}. Вернёмся теперь к многочлену f(x) и рассмотрим множество А всевозможных значений модуля многочлена |/(лг) |. Так как модуль комплексного числа не может быть отрицательным, то |/(дг)[^:О. Таким образом, это множество А оказывается ограниченным снизу. Известно, что всякое (не пустое) множество действительных чисел, ограниченное снизу, должно обладать нижней гранью. Следовательно, и для множества А должна существовать нижняя грань, т. е. должно существовать такое, действительное число /, что \/(х)\^1 для
198 К0ЛЫ10 МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ всех значений х, и для любого й^>0 можно указать такое значение = х', при котором \/(х')\<^1-\-Ь. Иными словами, для любого ] можно подобрать такое комплексное число х', что A9) Покажем, что имеет место даже нечто большее, а именно спра- справедлива следующая. Теорема 15. Если I — нижняя грань множества А всевоз- всевозможных значений модуля многочлена |/(лг)|, то существует по меньшей мере одно такое комплексное число х(), что /=|/(дго)|. Доказательство. Возьмём какую-нибудь последовательность \Ък\ положительных действительных чисел, сходящуюся к нулю. Согласно сказанному выше о неравенстве A9) можно для каждого bk подобрать такое x'k, что =l, 2, 3, ...)• B0) Последовательность {bk\ сходится к нулю. Это значит, что для всякого е^>0 можно указать такое N^>0, что для всех k~^>N будет иметь место неравенство 8A<^e. Отсюда для k^>N можно неравенство B0) усилить, а именно при k^>N будет иметь место Последнее неравенство свидетельствует о том, что последова- последовательность действительных положительных чисел {|/С*4)|} сходится к /. Поскольку последовательность { |/(-*4) |} сходится, она должна быть ограниченной, т. е. должно существовать такое число М~^>0, для которого (A = l, 2, 3, ...). B1) Согласно лемме 1 можно для этого М указать такое поло- положительное число N, что при | х | ^> N будет выполняться неравенство |/(*)|>М. B2) Но для чисел х\, х'ъ ..., х'к, ... имеет место неравенство B1), а не B2). Поэтому x'k не могут быть по модулю больше Л^; иными словами, [ Jtr'fc | =S7V. Таким образом, последовательность {л4} оказа- оказалась ограниченной. Но, как известно, ограниченная последователь- последовательность {x'k\ должна обладать сходящейся подпоследовательностью. Пусть это будет {х'Чк\, причём пусть lim x'Vk=x0. Так как {|/(лг,й) | } есть подпоследовательность последователь- последовательности {|/(лг^)|} сходящейся к /, то {|/(-x?ft)|} также сходится к /, Следовательно, мы можем написать, что lim |/(*;fc)| = /. B3) к -»оо
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 199 Но в силу непрерывности модуля многочлена Km \/(х'ч) | = |/(*0)|. B4) h —* со Таким образом, сравнивая равенства B3) и B4), получаем: и теорема доказана. Теперь мы можем сформулировать основную теорему алгебры и приступить к её доказательству. Основная теорема алгебры. Всякий многочлен f(x) степени п ^э= 1 с комплексными коэффициентами имеет в поле комплексных чисел по меньшей мере один корень. Доказательство. Как мы только что установили, сущест- существует по меньшей мере одно такое комплексное число хй, для ко- которого \f(xB)\ = l, где / — нижняя грань всех значений модуля многочлена |/(л:)|. Покажем теперь, что 1=0. Допустив против- противное, предположим, что 1=?0. Тогда /(х0) ф О, и мы можем вос- воспользоваться леммой Даламбера. Согласно этой лемме можно подо- подобрать такое комплексное число х' — xb-\-h, что |/(->О 1*0/(-*о) I или \/(х')\<^1. Но последнее неравенство противоречит тому, что / есть нижняя грань всех значений |/(Дг)|. Следовательно, наше допущение неверно и, таким образом, 1=\/(х0)\ должно равняться нулю. Отсюда /(дго) = О, т. е. х0 оказалось корнем многочлена/(лг). Из основной теоремы алгебры вытекает целый ряд следствий. Отметим наиболее существенные. 1°. В поле комплексных чисел неприводимыми являются лишь многочлены первой степени. В самом деле, если р (х) — многочлен, неприводимый в поле комплексных чисел, то он согласно основной теореме алгебры дол- должен иметь по меньшей мере один комплексный корень х0. Отсюда р(х) — {х — xo)q(x). Но в силу неприводимости р(х) многочлен q (x) не может иметь степень выше нулевой. Следовательно, q(x) = c, где с — некоторое комплексное число, отличное от нуля. Таким образом, р(х) = с(х — х0), т. е. р(х) оказался многочленом первой степени, что и требовалось показать. 2°. Всякий многочлен f{x) степени я^=1 с комплексными коэффициентами разлагается в поле комплексных чисел целиком на линейные множители. Действительно, многочлен f(x) должен следующим образом раз- разлагаться на неприводимые множители в поле комплексных чисел f(x) = ао(х—*/' (х - х.^ ...(х- х,У*, B5) так как в этом поле неприводимыми являются лишь многочлены первой степени. При этом, очевидно, а0 есть старший коэффициент многочлена f(x).
200 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ 3°. Всякий многочлен f{x) степени п с комплексными коэф- коэффициентами имеет п комплексных корней, считая при этом каж- каждый корень столько раз, какова его кратность. Действительно, это следствие с очевидностью вытекает из разложения B5). Для получения дальнейших следствий воспользуемся следую- следующим важным свойством многочлена с действительными коэффи- коэффициентами: если х0 — корень многочлена f(x) с действительными коэффициентами, то сопряжённое комплексное число х0 будет также корнем многочлена f{x). Иными словами, мнимые корни многочлена f(x) с действительными коэффициентами должны быть попарно сопряжены. Доказательство. Пусть лго = а-|-|3*' — мнимый корень мно- многочлена f{x) = а0 х" + п1лГ1 +... + ап с действительными коэффициентами. Обозначим через х0 комплекс- комплексное число, сопряжённое с х0, и разделим многочлен/(дг) на g(x) = = (дг — хо)(х — д;0) = л;2 — lax -J- (а2 -\-|32). Так как степень дели- делителя g(x) равна двум, то остаток будет иметь вид Px-{-Q, при- причём его коэффициенты действительны, так как коэффициенты де- делимого f(x) и делителя g(x) действительны. Таким образом, можно написать, что f{x) = (х — х0) (х — х0) q (х) + (Рх Полагая в последнем равенстве х—х0, получаем: или откуда Но Р -ф 0, так как х0 — мнимое число. Следовательно, Р= 0 и потому Q = 0. Отсюда f(x) = (х — х0) (х — л:0) q (x), и теперь становится очевидным, что х0 есть также корень много- многочлена f(x). Теперь укажем дальнейшие следствия из основной тео- теоремы алгебры. Они будут относиться уже к многочленам с действи- действительными коэффициентами. 4°. В поле действительных чисел неприводимыми могут быть только многочлены не выше второй степени. В самом деле, пусть, вопреки утверждению, f(x) есть много- многочлен с действительными коэффициентами выше второй степени и неприводимый в поле действительных чисел. Согласно основной теореме алгебры f(x) должен иметь по меньшей мере один ком"'
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 201 лексный корень х0. Этот корень не может быть действительным: если бы хе было действительным, то многочлен f(x) был бы при- приводимым в поле действительных чисел: f(x) = (x — xe)q(x), где q (лг) — многочлен с действительными коэффициентами. Следо- Следовательно, лг0 есть мнимый корень. Отсюда в силу доказанного выше получаем при хй — а.-\-Щ ф Ф 0), что / (X) = [X* - 2ах + (а* + р«)] q (х). Так как коэффициенты квадратного трёхчлена лг2— 2алг —J— (а2 —|— р2) действительны, то q (x) должен быть многочленом также с дей- действительными коэффициентами. Вместе с тем степень q (лг) не ниже единицы, так как /(лг) есть многочлен выше второй степени. Полу- Получилось противоречие с нашим предположением о неприводимости /(лг) в поле действительных чисел. 5°. Всякий многочлен степени п^1 с действительными коэф- • фицпентами разлагается в поле действительных чисел на мно- множители не выше второй степени. 6°. Число действительных корней многочлена /(лг) степени п^1 с действительными коэффициентами имеет ту же чётность, что и степень п многочлена. Справедливость этого свойства видна из следующих рассуждений. Как мы уже знаем, многочлен /(лг) должен иметь п комплексных корней (см. 3°). Среди этих корней могут быть и действительные корни. Пусть число действительных корней многочлена /(лг) равно s (Os?s=s;/z). Тогда п — s будет числом мнимых корней многочлена. Из попарной сопряжённости мнимых корней следует, что их число п — s должно быть чётным, откуда п и s имеют одинаковую чётность. Из свойства 6°, в частности, вытекает, что если степень много- многочлена /(лг) с действительными коэффициентами нечётна, то мно- многочлен имеет нечётное число действительных корней и потому имеет по меньшей мере один действительный корень. Мысль о том, что многочлен и-й степени имеет п комплексных корней, возникла еще в XVII в. и была высказана в 1629 г. фран- французским математиком Жираром. В 1746 г. Даламбер сделал попытку доказать основную теорему алгебры. Первое удовлетворительное доказательство было дано в 1799 г. Гауссом. В настоящее время известно много различных доказательств этой теоремы '). 1) В учебниках Куроша [2] и Окунева [4] по курсу высшей алгебры при- приводится доказательство основной теоремы алгебры, связанное с понятием поля разложепия. В кпиге Кузьмина-Фаддеева [х] можно найти доказатель- доказательство, связанное с поведением аргумента многочлена/(г) комплексного пере- переменного z при обходе точки z замкнутого коптура (см. стр. 41—51). Изве- Известны также и топологические доказательства основной теоремы алгебры. Одно из таких доказательств излагается на стр. 356 — 358 книги Р. Куранта и Г. Робипса «Что такое математика» (Гостехиздат, 1947J,
202 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ В свое время эта теорема считалась краеугольным камнем всей алгебры. В настоящее время в связи с весьма интенсивным разви- развитием таких разделов, как теория групп, теория колец и теория полей, эту теорему следует рассматривать только как основную теорему алгебры комплексных чисел. § 7. Проблема решения уравнений в радикалах. Двучленные уравнения В предыдущем параграфе было установлено, что всякое алгеб- алгебраическое уравнение «-й степени с комплексными коэффициентами а„*в + а1**-1+... + вл = 0 К^О) A) имеет в точности п комплексных корней. Теперь возникает вопрос — как найти эти корни с помощью тех или иных операций, произво- производимых над коэффициентами уравнения A). Основными алгебраическими операциями, совершаемыми над ком- комплексными числами, являются четыре арифметических действия, а также действия возвышения в степень и извлечение корня. Поэтому является вполне естественной следующая задача, известная под назва- названием проблемы решения уравнений в радикалах: выра- выразить корни уравнения A) через его коэффициенты с помощью конечного числа 'действий сложения, вычитания, умножения, деле- деления, возвышения в степень и извлечения корня. Операция извлечения корня n-fi степени из комплексного числа а сводится к отысканию корней так называемого двучленного ура- уравнения хп — а = 0 (а^О). B) Пг В алгебре обычно под символом у а подразумевается один из кор- корней двучленного уравнения B), и этот символ часто называется радикалом. Уже из курса элементарной алгебры известно, что уравнение второй степени решается в радикалах. В ближайших параграфах мы увидим, что решаются в радикалах и уравнения третьей и чет- четвёртой степеней. Гораздо сложнее обстоит, дело с уравнениями высших степеней. В § 16 мы покажем, что уравнения выше четвёр- четвёртой степени, вообще говоря, нельзя решить в радикалах. Таким образом, алгебраические действия оказываются недостаточными для решения любого уравнения, имеющего степень выше четырёх. Вернёмся к операции извлечения корня и-й степени из комплекс- комплексного числа. Из теории комплексных чисел известно, что все п кор- корней уравнения B) можно найти по формуле (Л = 0, 1,..., я-1),C)
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 203 где г—модуль а, 9 — аргумент а и \\fr\ — арифметическое зна- значение корня я-й степени из г. Формула C) допускает любопытное геометрическое истолкова- истолкование. Возьмём для изображения комплексных чисел координатную плоскость Р с прямоугольной системой координат Оа$. Тогда числа будут изображаться на плоскости Р векторами, имеющими начало в точке О, а концы — в вершинах правильного и-угольника, впи- вписанного в окружность радиуса R = | \fr и с центром в точке О. Мы видим отсюда, что решение двучленного уравнения B) тесно свя- связано с задачей построения правильного л-угольника. Пример. Найти правильный шестиугольник, соответствующий корням двучленного уравнения х6— г = 0, где i — \f—1—мнимая единица. Так как модуль i равен 1, аргумент i равен -у и «==6, то •по формуле C) получаем: У yi = cos ^ 1- i sin Полагая k равным последовательно 0, 1, 2, 3, 4, 5, будем иметь все шесть корней уравнения 5я , . . 5я 17гс , . . 17тс = cos-J2" + lSln U' -^4 = cos-72—riSm-i2~ 9ic . . . 9ic 21я . x% = cos -j2" + l Sln 12" > xi = cos -[тр -) J2 Корню -Хо на плоскости Р будет соответствовать вектор Ох0 с длиною, равною единице, причём этот вектор образует с поло- положительным направлением оси Оа угол, равный -ук-, т.е.в 15°. Чтобы получить вектор Ох1У соответствующий корню xv надо повернуть вектор Ох0 против часовой стрелки на угол, равный -ук- 12~ = "Т » т. е. на 60°. На тот же угол против часовой стрелки придётся, очевидно, повернуть и' вектор Oxt .для получения вектора Oxit изображающего корень лг2, и т. д. Одним словом, концы векторов Охе, Oxv Ох%, Ох3, Олг4 и Oxf будут находиться в вершинах правильного шестиугольника радиуса /? = 1.
204 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Двучленное уравнение B) можно свести к ещё более простому уравнению л;"—1=0. D) Дело в том, что между корнями уравнений B) и D) имеет ме- место следующая зависимость: умножая один из корней п-й степени из а на всевозможные корни той оке степени из единицы, мы получим все корни п-й степени из а. Доказательство. Будем обозначать, как и выше, корни п-1\ степени из а через xk, а корни и-й степени из единицы — через а!;. Возьмём один из корней и-й степени из а, например х0, и покажем, прежде всего, что лгоаА есть также корень и-й степени из а. Для этой цели возведём хоак в я-ю степень. Получим: т. е. лгоай действительно оказалось корнем я-й степени из a: xeak = xk. Теперь пусть хк — произвольный корень я-й степени из а. Рас- Рассмотрим частное —?-. Легко видеть, что — есть корень я-й степени нз единицы. В самом деле, Таким образом, мы можем написать, что —- = ctft, откуда х0 хк = хйак. E) Итак, все корни я-й степени из а получаются по формуле E), т. е. путём умножения корня х0 я-й степени из а на всевозможные корни ак я-й степени из единицы. Среди корней я-й степени из единицы весьма важную роль в теории двучленных уравнений играют так называемые первооб- первообразные корни. Корень е я-й степени из единицы называется первообразным, если е при возведении в степени 0, 1, 2, ..., я даёт все корни я-Я степени из единицы. Нетрудно убедиться, что для всякого целого положительного числа я существует по меньшей мере один первообразный корень п-й степени из единицы. Чтобы убедиться в справедливости этого утверждения, обра- обратимся к формуле извлечения корня и-й степени из комплексного числа. Согласно этой формуле получаем 1 /~г 2irk I . . 2ir? У I =cos n~-\-ism— (A = 0, 1, 2, ..., n—1).
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 205 Отсюда по формуле Муавра eft (k = 0, 1, 2,..., «—1), где е = cos — 4-1 sin —. п ' п Мы видим отсюда, что е есть первообразный корень я-й сте- степени из единицы. § 8. Уравнения второй и третьей степеней Теперь перейдем к уравнениям второй и третьей степеней. Пред- Предварительно, однако, сделаем одно замечание, относящееся к алгеб- алгебраическому уравнению а0хп + а1хп-1 + ...+ап = 0 (а0 ф 0) A) любой степени. А именно, покажем, что соответствующей заменой неизвестного х новым неизвестным у можно добиться некоторого упрощения уравнения A) — можно сделать равным нулю член с (п— 1)-й степенью неизвестного. Для этой цели положим 'Х=у-\-а, где а — пока совершенно произвольное число. Получим: или, раскрывая скобки по биному Ньютона и располагая члены в порядке убывания степеней у: аоуп + (паоа + а,)/-1 + • • • + К«" + "i*"'1 + • • • + в„) = 0. Таким образом, если мы стремимся, чтобы в последнем уравне- уравнении исчез член с У, то надо, пользуясь произволом а, положить паиа -\- ах = 0. Отсюда получаем, что а = "—. Итак, полагая х=у —, мы получим уравнение с неизвест- неизвестным у, в котором член с у"'1 равен нулю. Посмотрим, что даёт это преобразование для уравнения второй степени а*2-|-?лг+с = 0 (а^О). B) Здесь ао = а, at=b, я=^2. Поэтому в соответствии с изложен- изложенным полагаем: х=у — -=—. Получим:
206 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ или после очевидных упрощений: откуда — 4ac =0, "— 2a Мы пришли к известной формуле решения квадратного уравне- уравнения. Обычно эту формулу записывают в виде — b -t- лГъ- — 4ас Х— 2а ' W подразумевая под -]fb%— Аас одно какое-нибудь значение корня квадратного из Ь* — Аас. Формула C), таким образом, даёт оба корня уравнения B). Остановимся несколько подробнее на извлечении корня квад- квадратного из комплексного числа, поскольку решение уравнения вто- второй степени связано с этой операцией. На основании общей формулы извлечения корня п-й степени из комплексного числа мы можем в данном случае написать, что /Л = | у7| [ cos (-J + ft«) + / sin (| + ft*)] (k = 0,1), D) где <р — аргумент Лиг — модуль Л. Формулу D) удобнее, однако, преобразовать в более простую формулу, избавляющую от необхо- необходимости находить модуль и аргумент комплексного числа Л, когда Л задано в двучленном виде Л = а-|~р/. Именно, выразим г, cos 9 и sin «р через действительную часть а и коэффициент р при мнимой части комплексного числа Л. Имеем: символ абсолютной величины означает, что для модуля г числа Л берется положительное значение корня. Отсюда 9 ¦ cos-J=± sin-^ = ±
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 207 Знаки ± для cos-^ и sin -|- следует брать так, чтобы не было противоречия с соотношением <р ф 1 1 В cos ^- sm 4- = -s- sin <p =:-=-• -— v . А именно, в случае р ^> 0 числа cos -I и sin -?- должны иметь оди- наковые знаки, а при Р<^0— противоположные знаки. Принимая во внимание, что cos (-| + я) = — cos |-, sin (-| + я) == — sin получаем вместо формулы D) следующую формулу: При P;s=O следует брать перед мнимой единицей знак плюс, а при Р знак минус. Пример 1. Найти, чему равен Здесь а = 21, Р = 20^>0. Поэтому, руководствуясь формулой E), пишем: Пример 2. Решить квадратное уравнение A -f- 0 -Xя — G + 30 х -\- B2 + 20/) = 0. По формуле решения квадратного уравнения имеем: О + 30 + VO + 3Q2 - 4 A + 0 B2 + 20Q или 2A+0 ^— 2A+0 Мы написали перед радикалом знак плюс, так как у нас |/32 — 126/ означает любое значение квадратного корня. Найдем теперь, чему равен -/32 —126/: = ±(9-70-
208 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Отсюда G+3Q ±(9-7Q 2/1 -I- ft * -7Q_8-a_q к, Х1— 2A+0 _ G + 3Q-(9-7Q_-l+a_ х«— 2A+0 — 1+r — Займёмся исследованием квадратного уравнения с комплексными коэффициентами, т. е. выясним, при каких условиях уравнение имеет различные корни и при каких условиях оно имеет кратные корни. Нам придется воспользоваться так называемыми формулами Вьета. Мы их выведем для общего случая уравнения я-й степени, так как эти формулы понадобятся и для уравнений выше второй степени. Пусть ¦— алгебраическое уравнение с комплексными коэффициентами а1г ...,ап и со старшим коэффициентом, равным единице. Обозна- Обозначим его корни через хи х%, ..., хп. Тогда можно будет написать следующее разложение многочлена /(лг) = х"-\-a^jc" -\-...-\-ап на линейные множители: х" + а^1 + ... + ап = (х — xj (х — *„)... (х—хп). Отсюда, производя перемножение линейных множителей, получаем: Но если два многочлена равны, то их коэффициенты при одинако- одинаковых степенях х должны совпадать. Следовательно, = — C*i + ¦*« + • ¦ ¦ +¦*„), Х% + *1*3 + • • • + хп-1хп)' (А) В правых частях соотношений (А) стоят всевозможные произ- произведения корней по одному, по два, по три и т. д. Мы пришли к формулам Вьета. Вернёмся к квадратному уравнению. Для большей простоты можно всегда предположить, что старший коэффициент уравнения равен единице; в противном случае мы разделили бы обе части уравнения на старший коэффициент. В этом предположении квад- квадратное уравнение будет выглядеть так: 0. F)
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 209 Обозначим корни уравнения F) через xt и х%. Тогда по фор- формулам Вьета имеем: 2), q=x1x2. G) Корни Xi и jfa уравнения F) найдутся по формуле Мы пишем перед радикалом знак плюс, так как у нас I/ -p q означает любое значение квадратного корня. р2 Подкоренное выражение -^ q обычно называется дискрими' нантом квадратного уравнения. Исходя из формул Вьета, легко показать, что уравнение F) тогда и только тогда имеет двукрат- двукратный корень, когда его дискриминант равен нулю. В самом деле, если уравнение F) имеет один двукратный корень, то это означает, что уравнение имеет два равных корня: •*1=-*8- Отсюда р = — (j^-j-jej^—2хи q = x1x2=x21 и 4 Ч— 4 » » l — Обратно, если дискриминант-^ q равен нулю, то, подставляя вместо р vi q их выражения через корни xt и х2 но формулам Въета, получаем: Ра 4 Я~ 4 откуда {хх—jc2J = 0, или x1=xi. Если, в частности, коэффициенты уравнения F) действительны, то с помощью дискриминанта можно установить, когда корни урав- уравнения действительны и когда они являются мнимыми. Очевидно, что корни уравнения F) будут действительными в том и только в том случае, когда его дискриминант -^ q неотрицателен, так о3 как в этом случае корень квадратный из -~ q имеет действи- действительные значения. В дополнение к. только что сказанному можно отметить, что 1) уравнение F) имеет различные действительные отрицательные о3 корни, если -*?-•—q~^>0 и коэффициенты р и q положительны; 2) уравнение F) имеет различные действительные положительные корни, если -^ q^>®> коэффициент р отрицателен, а коэффициент q положителен; 3) уравнение F) имеет один корень положительный, 14 Энциклопедия, ни. 2.
210 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ „а а другой отрицательный, если -^ q^>0 и коэффициент q отри- цателен; 4) уравнение F) имеет при -^ q = 0 только один двукратный действительный корень, положительный или отрицатель- отрицательный в зависимости от того, будет ли р отрицательно или по- положительно. В справедливости всех этих утверждений легко убедиться с по- помощью формул Вьета. Перейдем к уравнению третьей степени: Без ограничения общности старший коэффициент можно предпола- предполагать равным единице. Подвергнем это уравнение уже знакомому упрощению — сделаем член с квадратом неизвестного равным нулю, для чего положим х=у „-. Получим в результате так называе- называемое каноническое уравнение третьей степени: У+/У + ? = 0, (8) ,, 1 с 2в3 аЬ . где р — Ъ — -g a\ q—^j Г + с- Чтобы найти корни уравнения (8), воспользуемся следующим приемом: подразумевая под у любой из корней уравнения (8), рас- рассмотрим квадратное уравнение г8— yz — -f = 0. Если и, v — корни этого квадратного уравнения, то по формулам Вьета y — u-\-VHUv = — -|-. (9) Отсюда, подставляя выражение у через и, v в уравнение (8), имеем: Раскроем скобки и произведём некоторую перегруппировку членов. Получим тогда, что (и + v) (Згго + р) + (И3 + v3 + q) = 0. Но в силу равенства (9) 3av-\-p=^0. Следовательно, и3 + г»3 или
КОльио Многочленов от одного неизвестного 211 Кроме того, возводя обе части равенства (9) в куб, получаем: A1) Из равенств A0) и A1) видно на основании формул Вьета, что ы3 и v3 являются корнями следующего квадратного уравнения: Решаем это квадратное уравнение: откуда (I) Мы пришли к формуле Кардана решения уравнения третьей сте- степени. При вычислении корней уравнения (8) третьей степени сле- следует, однако, иметь в виду, что и и v не независимы, а связаны друг с другом равенством uv _ Р 3 - Пример 3. Решить с помощью формулы Кардана уравнение Это уравнение является каноническим; поэтому можно сразу обратиться к формуле Кардана. Здесь р = \Ь, д= 124. Следовательно, в данном случае u=V— 62+ /3969 = V— 62 -f 63 = VT. Находим все три значения и; так как H = |/T=fcos0 + /;sitf0 = cos^-Hsin-^-, (* = 0. 1,2) и*
212 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ то и0 = cos О -J-1 sin 0 = 1, 2тс 1 n 4тс . . . 4it 1 .тЛГ Щ = COS у -(- I Sill g- = g- l 2~ " Соответствующие значения v мы найдём, пользуясь равенст- равенством uv = — 2- = — 5. Имеем: о 5 __g 5 _5 | .51/"зГ Отсюда без труда находим все три корня уравнения: i = — 4, = 2 — 3 i /3". Пример 4. Решить с помощью формулы Кардана уравнение Приводим это уравнение к каноническому виду, полагая дг = =3'—1. Получаем: Отсюда 2 Здесь удобнее сначала найти действительное значение щ корня третьей степени из —-ф^— • С точностью до четвёртого знака после запятой находим, что ;— 1,5463.
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 213 Остальные два значения и мы найдём, умножая ы0 на корни третьей степени из единицы: 2 2 ' Получаем: Щ = т (— 1 +' /3"). °«= Y (—» — * /3*)- Соответствующие значения г; найдутся из равенства uv = г»о = ^«*—1,9401, «о г,, =Д = -2^0A+* /3~)^ 0,9700A+г /3"), г;2 = | = —2-г»0A — Таким образом, Л = «о + ^о ^ — 3,4864, у, —щ 4-г/, я^ 1,7431 + 0,1969/ /3~, j>a = иа + г>а«=: 1,7431—0,1969 i/iT, иди _уо^_ 3,4854, j;,^ 1,7431 + 0,34101, у^ъ 1,7431 — 0,3410/. Вспомнив теперь, что лт=3;—1, получаем для корней данного уравнения следующие значения: хо=уо — 1ъ — 4,4864, лт, =j/, — 1 «а 0,7431 -f- 0,3410 /, jes=j;8—1^0,7431 —0,3410/. Пусть и0 — одно из значений и. Обозначим через е первообраз- первообразный корень третьей степени из единицы. Тогда остальные два зна- значения и могут быть записаны следующим образом: щ = и„е, щ = ы0е2. Отсюда получаем для соответствующих значений v: р р р Vo> — ~~ Зи^ — ~~ ШГ^-' е — — Зм0 е — V°B'
214 КОЛЫЮ МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Таким образом, .<орни уравнения (8) можно находить по фор- формулам voe, . A2) где ы0 — одно из значений и (какое именно, безразлично), у0—• =— ¦?—, а е—какой-нибудь первообразный корень третьей сте- степени из единицы. Если в качестве е взять cos ^-[-/sin ^ = — тг-\-1^-к-, то фор- мулы A2) принимают ещё более удобный для вычисления вид: Уо = "о + vo. .. _ «о + vB , . (и0 — v0) Уз УI 9 Г * 9 ' A2*) Выражение Д = (|) +(f")> фигурирующее под корнем квад- квадратным в формуле Кардана, иногда называют дискриминантом урав- уравнения (8) '). Посмотрим, что получается в случае Д = 0 и Если Д = (|Л +(?¦) =0, то и== у —&. Это выражение и можно несколько упростить. А именно, ? -ЬК =0, то ^- = — [~). Следовательно, «=—И 21/ — откуда в качестве одного из значений и получается следующее выражение: „ — Ч _3g i-i) 1) Более употребительно называть дискриминантом не Д, а —Д.
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 215 Соответствующее значение г»0 будет равно "°~ 3«0~ 9q— pq — pq — 2р~Щ' Обращаясь к формулам A2*), мы, таким образом, получаем: v __2и»__и __3? v __2"о__„ __3? Итак, если Д = 0, то уравнение (8) при рфО и q^Q имеет один простой корень у0 и один двукратный корень y1=yi. Эти корни можно найти, не прибегая к извлечению корней второй и третьей степеней, а именно, их можно вычислить по формулам Уо = 3?, Л=Л = -|- 03) Пример 5. Решить уравнение х3 — Зл;2 — Приводим, прежде всего, это уравнение к каноническому виду, для чего полагаем х=у-\-\. Получаем: Легко видеть, что здесь Д = (|-) ~b(f-) =0, и мы можем вос- воспользоваться формулами A3): _3«7_ 48 _ _ 48 _ .Уо — -— =712"— ~~ % У1—У* — — 1Г21—2- Обратимся к случаю Д^О и покажем, что если Д ф 0, то урав- уравнение (8) имеет три различных корня. Доказательство» Предположим противное: пусть уравне- уравнение (8) имеет два корня, равных одному и тому же числу а; третий же корень пусть равен р. Тогда по формулам Вьета по- получаем, что Следовательно, р = — 2a и р = — 3a8, q = 2a\ Таким образом, что противоречит условию Д ф 0.
216 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ До сих пор мы предполагали коэффициенты кубического уравне- уравнения любыми комплексными числами. Рассмотрим теперь наиболее часто встречающийся случай кубического уравнения с действитель- действительными коэффициентами. Мы увидим, что и в этом случае дискрими- дискриминант Д играет существенную роль в исследовании кубического уравнения. А) Д ^> 0. Так как здесь Д ф 0, то все три корня уравнения (8) должны быть различными. Выясним, сколько среди них будет действи- действительных корней. Обращаясь к выражению легко усмотреть, что под кубическим корнем находится действи- действительное число, так как Д^>0. Следовательно, одно из значений и должно быть действительным. Примем его за а0. Тогда г»0 будет также действительным. Отсюда на основании формул A2*) заклю- заключаем, что уравнение (8) имеет только один действительный корень, а именно у0 = щ -j- vb. Выясним, когда этот корень положителен и когда отрицателен. Пусть р^>0. Тогда < и и0 должно быть положительным, а число г<0, равное действитель- действительному значению должно быть, очевидно, отрицательным. Далее, при а при Таким образом, если д^>0, то [ »о 1<С1 ^ol» вследствие чегоyf)=n0-\-v(l будет отрицательным; если же д <^ 0, то | ы01 ^> | к01 и потому J'o будет положительным. Пусть теперь /><^0. Тогда >и и и0 должно быть отрицательным при д^>0 и положительным при д<^0, а. число v0, равное действительному значению
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 217 будет также при q^>0 отрицательным и при q<^0 положительным. Отсюда корень у0 == и0 -\- v0 при q ^> 0 будет отрицателен, а при q <^ О положителен. Итак, если Д ]> О, то уравнение (8) имеет лишь один действи- действительный корень, причём при q^>0 этот корень будет отрица- отрицательным, а при q<^0 — положительным. Б) Д = 0. Мы знаем, что при Д = 0, р^О, q^?0 уравнение имеет два равных корня. Учитывая, что теперь рассматривается уравнение с действительными коэффициентами, можно сделать сле- следующее заключение: при Д = 0, р фО, q ^ 0 все три корня урав- уравнения (8) действительны, причём два из них равны; иными сло- словами, уравнение имеет один простой действительный корень и один двукратный действительный корень: p' — v — _?? от- () (|) = 0 вытекает, что (|) = _(|) куда р<^0. Таким образом, если q^>0, то простой корень у0 бу- будет отрицательным, а двукратный корень yt =^2 будет поло- положительным; если же q<^0, то у0 будет положительно, a yl=yi — отрицательно. В) Д<^0. Этот случай известен под названием неприводимого 'случая и является в следующем отношении примечательным. А именно, так как корень третьей степени здесь приходится извлекать из мни- мнимых чисел, то и и s являются мнимыми. И тем не менее все три корня будут действительны. В самом деле, так как Д<^0, то мы можем положить Д = — а2, где а — некоторое действительное поло- положительное число. Тогда Найдём модуль г и аргумент <р подкоренного выражения. Имеем: ч — ~2' Таким образом, з г—, ;—¦—¦ г I з /— I / 9 + 2&гс | . . о + 2&гс > и= у г (cosер -\-1 sin ср) = ] у г I Icos-2—^ j— t sin -—g J.
218 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Полагая последовательно k = 0, 1, 2, получаем все три значения и: «о = \V~r\ (cos|- -f I sin -J), =| Vr\ (C0S Известно, что произведение комплексного числа z на сопряжён- сопряжённое комплексное число г равно квадрату модуля z: Руководствуясь этим, мы можем легко определить к0, vu v2. Для этой цели обратимся к выражению I cos —Ц^ \- i sin -—g Мы видим, что модуль и равен Отсюда квадрат модуля и будет равен — ~. Следовательно, ап = —¦?¦. Но « и г» связаны тем же самым соотношением: uv — — Y' Значит, v = Ti, и мы получаем, что "о = «о = i V~r\(cos у —'sin|-). vt = щ = I 1/7| (cos Ц^ -1 sin » + Теперь все три корня уравнения (8) найдутся без труда: Из формул A4) видно, что корни v0) З',, З'г действительны и различны. Кроме того, исходя из формул A4), можно показать.
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 219 что при q^>0 уравнение (8) имеет два положительных корня, а при q<C^O — только один положительный корень. В самом деле, если q^>0, то coscp<^0. Так как sin9^>0, то угол ф должен лежать во второй четверти. Отсюда-|-^>-^ и лежит Ф —I— 4тс в первой четверти, а1-^ в четвёртой, вследствие чего корни у0 и _уа положительны. Если q<^0, то аналогичным образом убеж- убеждаемся, что только Уо будет положительным. Итак, в случае Д<^0 уравнение (8) имеет три действитель- действительных различных корня, причём при q^>0 два корня положительны, а при q<C^O только один корень положителен. Корни у0, уи Уъ вычисляются по формулам A4) довольно легко, если пользоваться таблицами логарифмов значений тригонометри- тригонометрических функций. Формула (I) на стр. 211 обладает тем недостатком, что она в случае отрицательного Д выражает действительные корни уравне- уравнения (8) с действительными коэффициентами в мнимом виде. Для Кардана и его современников случай отрицательного Д казался парадоксальным, так как в то время понятие комплексного числа ещё не имело конкретного истолкования и операции извлечения квадратного корня из отрицательных чисел и извлечения кубического корня из комплексных чисел считались невозможными. Для матема- математиков того времени было удивительным то обстоятельство, что в случае Д<^0 получались с помощью этих невозможных операций действительные числа. Были предприняты многочисленные попытки освободиться от мнимостей в формуле Кардана, но эти попытки кончались неудачей. С помощью рассуждений, выходящих за пре- пределы нашей статьи, можно показать, что корни уравнения (8) с действительными коэффициентами в случае Д<^0 никаким спосо- способом нельзя выразить через радикалы с действительными подкорен- подкоренными выражениями. В силу этого обстоятельства случай Д<^ 0 и получил наименование неприводимого случая. Другой недостаток формулы (I) состоит в том, что она часто представляет рациональные корни в иррациональном виде. При- Приведём пример. Пример 6. С помощью общего приёма нахождения рациональ- рациональных корней многочленов с рациональными коэффициентами легко убедиться, что уравнение Xs — х— 6 = 0 имеет рациональный корень хо = 2. Так как для данного уравнения 242. А — YT>0' то 2 является единственным действительным корнем уравнения.
220 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Посмотрим теперь, что даёт формула (I). Обозначим через и0, vu действительные значения кубических корней в формуле (I): Мы видим, что м0 и v0 являются иррациональными числами. Таким образом, формула (I) даёт для корня хо = 2 довольно сложное вы- выражение о = f (для каждого кубического корня берётся действительное значение), которое приходится вычислять приближённо, так что на практике получается число, весьма близкое к 2, но не 2. Вследствие этого недостатка рекомендуется рациональные корни кубического уравнения с рациональными коэффициентами находить не по формуле (I), а с помощью общего приёма вычисления рацио- рациональных корней, изложенного в § 4. § 9. Уравнение четвёртой степени Мы начнём с изложения самого раннего способа решения уравне- уравнения четвёртой степени xi-\-ax3-\-bxi-\-cx-\-d = 0, A) решения, принадлежащего Луиджи Феррари — ученику Кардана. Этот способ, впрочем, был нами использован ещё в § 5 для разло- разложения многочлена четвёртой степени с рациональными коэффи- коэффициентами на множители. Мы будем предполагать, как и в предыдущем параграфе, коэф- коэффициенты уравнения комплексными (и, в частности, действитель- действительными) числами. Подвергнем многочлен f(x) = Xs- -f ах3 + Ьх°- + сх + d, находящийся в левой части уравнения A), тем же самым преобра- преобразованиям, что и в § 5. В результате уравнение A) превратится в (** +? + У? — (А** + Вх + Q = 0. B) где А = 2у + ~ — Ъ, В = ау — с, C=y°' — d. т Подберём теперь вспомогательную величину у так, чтобы квад- квадратный трёхчлен Ах1* -\- Вх -\- С был полным квадратом некото- некоторого линейного многочлена ajc —|— Р» Мы знаем, что это может
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 221 быть в том и только в том случае, когда у является корнем куби- кубической резольвенты ? —d). C) Пусть у0 — один из корней уравнения C). Тогда при у=Уо Лх2 -f Вх + С = (ах 4- рJ, в результате чего уравнение B) перепишется следующим образом: С**+ или, разлагая разность квадратов в произведение суммы на раз- разность: Отсюда, решая квадратные уравнения + Р)=(Ч мы получим все четыре корня уравнения A). Итак, решение уравнения A) сводится к решению уравнения третьей степени — кубической резольвенты — и решению квадрат- квадратных уравнений D). При решении того или иного уравнения четвёртой степени мы рекомендуем проводить последовательно преобразования Феррари, а не пользоваться готовыми формулами. В качестве образца приво- приводим решение следующего уравнения. Пример 1. Решить с помощью способа Феррари уравнение 4 4- 2х3 4- 5_v2 4- Ъх 4- 9 = 0. несём в правую часть ур се члены, степень которых 4- 2jc3 = — 5х2 — 6х — 9 Прежде всего перенесём в правую часть уравнения с противо- противоположными знаками все члены, степень которых не выше двух: или (х2J 4- 2*2 х = — 5jc2 — 6х — 9. Если к обеим частям последнего уравнения прибавить лга, то в левой части получится полный квадрат. Производим это преобра- преобразование: (х2J 4- 2*2 X 4- л:2 = — 5л:2 — 6* — 9 + лг2 ИЛИ (.V2 4- X)' = — 4л:2 — бл: — 9.
222 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Теперь к обеим частям получившегося уравнения прибавляем 2 (л:2 -[- х)у -j- _y2. От этого левая часть не перестанет быть полным квадратом: (X* + Xf -f 2 (*s -f х)у + У = — 4ж2 — 6л: — 9 + 2 (*2 + х)у +У, или -9). E) Возьмем теперь .у таким, чтобы и правая часть уравнения E) была полным квадратом. Для этого у должно быть корнем куби- кубической резольвенты. Чтобы получить кубическую резольвенту, надо воспользоваться условием В* = 4АС. В данном случае А = 2у—4, В = 2у—6 и С=у* — 9. Следовательно, или после некоторых упрощений: СУ —3)[(у —3) —Bу — Мы видим отсюда, что в качестве у0 можно взять 3. Возвращаемся к уравнению E) и заменяем в нём у значением _у0 = 3: или (х* 4- х 4- зJ—(Y~2xf=о, откуда ] л;24-A— /2)лг4-3 = 0. j F) Решая уравнения F), получаем все четыре корня данного урав- уравнения четвёртой степени, а именно, - 1,2 i + V 1Л2"-1 2 /9 —2l/ 2 ^э + гт/Т 2 Приведём ещё один способ решения уравнения четвёртой сте- степени. Он принадлежит знаменитому петербургскому академику Леонарду Эйлеру и замечателен в том отношении, что непосредственно выражает корни уравнения четвёртой степени через корни куби- кубической резольвенты.
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 223 Положим, прежде всего, х =у — -"-. Тогда полное уравнение четвёртой степени A) превратится в четырёхчленное уравнение =о. G) Наряду с уравнением G) рассмотрим кубическое уравнение отно- относительно z: z3 — 2yzi-\-mz-\-n = 0, (8) где у— любой из корней уравнения G), а коэффициенты тип пока произвольны. Если корни уравнения (8) обозначить через и, v, w, то по фор- формулам Вьета будем иметь 2_у = и -\- v -\- w, m = uv-\-uw-\-vw, п = — uvw. Возводим обе части равенства 2y=u-\-v-\-w (9) в квадрат: 4У = иг 4- z>2 + w% + 2 (uv + uw + vw)- Обе части равенства A0) возводим снова в квадрат: 1 бу4 = (и2 4- v* + ву2J + 4 (uv + ы 4- 4 (hV 4- и2ауа Подставляя в уравнение G) вместо у, У, у1 их выражения из равенств (9), A0) и A1), получаем после некоторых упрощений: (и« 4- v* 4" ^2J + 4 (ttv + к® + г)Ы') (и2 + 4- 4/? (и2 4- "8 + '2у2) + 8 (ыгш 4" Я) (и + " + 'гг0 + К12) 4- 4 (и2!J 4- и2и>2 4- rfw*) 4- 16г = 0. \ Подберём теперь коэффициенты тип уравнения (8) так, чтобы уравнение A2) максимально упростилось. А именно, положим: Тогда уравнение A2) превратится в «V 4- "s^s + viw* ~ Р* — ') Легко убедиться, что такой подбор коэффициентов вполне возможен. Прежде всего из равенства uvw-\-q=Q следует, что л = — uvw = q. Затем, заменяя в правой чаоти равенства A0) vP + р2+ w3 и uv-\-uw-\- vw их значе- значениями— 2р и т, получаем: откуда m = 2у'
224 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Отсюда следует, что и, v, w удовлетворяют следующей системе уравнений: н2 -\-vi-\-w-=— 2р, =/;2 — 4г, A3) Из равенств A3) следует на основании формул Вьета, что м2, vi, xifi яиляются корнями следующего кубического уравнения з* + 2рг*-\-{р1 — 4r)z — q* = 0, A4) которое переходит в уравнение кубической резольвенты для урав- уравнения G), если заменить здесь z через 2z'—р. Таким образом, решая уравнение A4), мы получим три его корня откуда u=/zly v=/zi, w— Значения радикалов ]fzly j/^, \fz% следует выбирать с таким расчётом, чтобы выполнялось равенство V~Zi • Vzi' /Z3 = — Я- - A5) Очевидно, что значения двух радикалов могут быть выбраны про- произвольно, а значение третьего радикала придётся уже брать, исходя из равенства A5). Выбрав указанным образом значения радикалов мы получим все четыре корня уравнения G) по формулам A6) Пример 2. С помощью способа Эйлера решить уравнение лг4 — блг3 4- 1 Ох* — 2х — 3 == 0. Полагаем х=у-\--к, в результате чего получаем уравнение =0. A7) Здесь р — — у, ?=1 и r = -jg. Стало быть, уравнение (Н)
кольцо многочленов от одного неизвестного 22б принимает вид: —1=0. A8) Корнями уравнения A8) являются Так как q = 1 ^> 0, то для /г,, /г2, / z3 можно взять положи- положительные значения. Таким образом, 2/Т, 2Л=1—1/3 + 2/2 — ]/3 — 2/2, —|^3—2/2, 3 — 2/2, или, так как 1/3 + 2/2= 1 + /2", ]/"з — 2|/Т= 1 — /2: 2Л = 3, 2^, = —1, 2^3 = - 1+2/2", 2^t = —1—2/2". Отсюда без труда находим корни xt, дг2, х3 и дг4 первоначального уравнения § 10. Алгебраическое расширение и другая постановка проблемы решения уравнений в радикалах В тесной связи с проблемой решения уравнений в радикалах находится весьма важное понятие алгебраического расширения. К изложению этого понятия мы сейчас и перейдём. ПустьР—некоторое числовое поле, а-—произвольное комплекс- комплексное число. Относительно а представляются, очевидно, только две возможности: либо а является корнем некоторого алгебраического уравнения и-й степени с коэффициентами из поля Р, либо а не может быть корнем 15 Энциклопедия, кн. 2.
226 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ никакого алгебраического уравнения произвольной степени с коэф- коэффициентами из поля Р. В первом случае а называется числом, алгебраическим относи- относительно поля Р, а во втором, в соответствии с общим определением трансцендентного элемента (см. § 1), — числом, трансцендентным относительно Р. Отметим, что всякое а из поля Р будет алгебраи- алгебраическим относительно Р, так как оно является корнем уравнения х—а = 0 с коэффициентами из поля Р. Если, в частности, Р есть поле рациональных чисел, то слова «относительно ноля Р» обычно опускают и говорят просто об алге- алгебраическом или трансцендентном числе. Например, \/ 2 есть алге- алгебраическое число (т. е. алгебраическое число относительно поля рациональных чисел), так как \/~2 является корнем уравнения вто- второй степени х*— 2 = 0 с рациональными (а именно, целыми) коэф- коэффициентами. Обозначим, далее, через Р[а] множество чисел вида где k — произвольное целое неотрицательное число, с„, с„... , ch — любые числа из поля Р. Легко проверить, что это множество Р[о-\ вамкнуто относительно первых трех арифметических действий и потому образует числовое кольцо. Рассмотрим, кроме того, более обширное множество всевозмож- всевозможных отношений элементов кольца Р\а]. Это множество, как легко видеть, является числовым полем. Мы его будем обозначать через Р(а)(а в круглых скобках1) и называть полем или простым расширением поля Р, получающимся путём присоединения к Р числа а. При этом пере- переход от поля Р к полю Р(а) называется присоединением элемента а к Р. Вообще, если некоторое числовое поле Д содержится в некотором другом числовом поле Q, то Д, как известно, называется подко- подколем поля Q, а 2—расширением поля Д. Таким образом, простое расширение Р(а) поля Р есть частный случай понятия расши- расширения поля. Отметим ещё, что Р(а) называется простым алгебраическим рас- расширением поля Р, если а является алгебраическим относительно Р\ если же а трансцендентно относительно Р, то Р(и) называется простым трансцендентным расширением Р. Пример 1. Возьмём в качестве поля Р поле рациональных чисел и 8 качестве а — число уЬ. Выясним, что собой представляют
КОЛЫЮ МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 227 Согласно общему определению P[j/5] есгь числовое кольцо, состоящее из элементов вида (i) где k — произвольное целое неотрицательное число, а с0,..., ck — произвольные рациональные числа. Выражение A) можно, однако, упростить. А именно, принимая во внимание, что (/5)» = 5, (/б)» = 5/б" и т. д., можно выражение A) преобразовать в двучленное вы- выражение a -{- Ъ }[Ь, где а, Ъ — рациональные числа. Итак, мы видим, что P[l/5] состоит из всевозможных чисел ви- вида a -\-b j/5. Теперь посмотрим, из чисел какого вида состоит P(j/5). По определению P(i/~5) есть не что иное, как совокупность эле- элементов вида где а, Ъ, с, d — рациональные числа, c-\~d \Гб ф 0. Для упрощения умножим числитель и знаменатель дроби B) на с — d j/5. Тогда получим: + bVI = <!• + ?-/5, 5 ~ v c + dj/ где , ас — bbd ,, be — ad а 7s — 5d-~ ' ~ с* — 5d~ Мы видим отсюда, что поле Р( j/б) состоит из элементов того же двучленного вида, что и кольцо Р [ yfb ]. Это значит, что кольцо Р [ -/5] совпадает с полем Р ( \Гъ ): Только что подмеченное совпадение Р[~\Г5] и Р(\Гъ) не является случайностью; оно характерно для всякого алгебраиче- алгебраического числа. Теорема 16. Если а — число, алгебраическое относительно поля Р, то уже Р[а] является числовым полем: Р[а] = Р(а). 15*
228 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Доказательство. Без ограничения общности выводов можно предположить, что а является корнем многочлена Р (*) = Ро +Pl Х + • • • + Рп"? (Рп Ф 0), неприводимого в поле Р. В самом деле, если бы а являлось корнем многочлена F(x), приводимого в Р, то, очевидно, а было бы корнем одного из неприводимых множителей F(x). Этот неприводимый множитель мы и взяли бы в качестве р (х). Согласно определению любой элемент р из Р [а] должен иметь вид р =/(а) = co + Cl а + ... +cka\ C) где k — целое неотрицательное число и с, ck — числа из поля Р. Покажем, прежде всего, что выражение C) можно преобразовать в следующее выражение: имеющее относительно а степень, меньшую чем степень п много- многочлена р (х). Обозначим через д(х) и r{x) = ao-\-aix-\-aix^-\- ...-{- -\- ап^ х"'1 соответсгвенно частное и остаток, получающиеся при делении на р (х). Мы можем написать, что f{x)=p{x)q{x)-\-r(x). D) Полагая в равенстве D) х = аи принимая во внимание, что /?(а) —0, получаем: f(d) = r(a), или что и требовалось показать. Теперь обратимся к отношению Мы сейчас убедимся, что его можно преобразовать в целое рацио- рациональное выражение от а. Для этой цели рассмотрим многочлен g(x) = bo-[-b1x-{- ... -\-bn_lxn~l. Он не равен (тождественно) нулю: если бы g(x)равнялось нулю, то 60 = 6j= ... =bn_1 = 0, в силу чего 1 что противоречит условию g (а) ф 0.
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 229 Очевидно, что g(x) не делится на р(х), так как степень g(x) ниже степени р (х). В силу неприводимости р (х) отсюда следует, что многочлены g(x) и р{х) взаимно просты. Но в таком случае будет иметь место равенство g(x)9(x) + p(x)<s(x)=l, F) где 9 (х) и ty (x) — некоторые многочлены с коэффициентами из того же поля Р (см. § 2). Полагая в равенстве F) х = а и прини- принимая во внимание, что jp(a) = O, получаем: g(a)<p(a)=l. G) Теперь, пользуясь равенством G), мы можем следующим обра- образом преобразовать отношение E). Умножим числитель и знамена- знаменатель E) на <р(а). Получим на основании равенства G), что Но /(а)ф(а) есть некоторый многочлен от а: /(а) ф (а) = с0 + Ci а + • •. + ckaK Следовательно, Итак, поле Р (а) состоит из тех же элементов C), что и кольцо Р [а], вследствие чего P(a) = P[a], и теорема доказана. Замечание. В только что проведённом доказательстве мы попутно установили, что всякий элемент р из Р(а) выражается в виде многочлена от a степени не выше, чем п—1, где п — степень многочлена р(х). Нетрудно убедиться, что такое выражение элемента Р является единственным. Действительно, если то (ao — bo Таким образом, многочлен h(x) = (a0 — bo)-\-(al—b{)x-\-... -\- 4-(а„_( —bn_^)xn~x имеет а своим корнем, а потому многочлены р{х) и h(x) будут не взаимно просты, так как будут иметь х — а общим делителем. Тем самым многочлен h(x) должен в силу неприводи- неприводимости р(х) делиться на р(х). Но это может быть лишь тогда, когда h (х) = 0; в противном случае р (дг) был бы делителем много-
230 КОЛШО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ члена h(x) более низкой степени, что невозможно. Итак, h (х) = О, откуда а0 — #0 = 0, ... , а„_, — bn_L = 0, т. е. ао = Ьо,..., ап_,= = Ьп_1, и наше утверждение о единственности выражения В через а становится очевидным. Подчёркиваем, что в случае трансцендентного а Р[а] уже не будет полем. В самом деле, если бы в этом случае Р[а] являлось полем, то отношение —!—, в частности, было бы равно некоторому целому рациональному выражению от а: ^±1 = ^ + ^0+ ... +cka\ где с0, ... , ck — элементы из Р. Отсюда мы имели бы, что a-f l=coa-f c,a2-|- ... -\-ckak + \ или что противоречит трансцендентности а, так как в последнем равенстве не псе коэффициенты равны нулю (так, — 1 отлична от нуля). До сих пор мы присоединяли к полю Р только одно число. Возьмём теперь несколько комплексных чисел о„ а2, ... , as (алге- (алгебраических или трансцендентных — безразлично). Присоединим сна- сначала к Р число aj. Мы получим простое расширение P(ai). Затем присоединим к Pfa) число а2. Получится дальнейшее расширение, которое мы обозначим через Р(а,, а2)), и т. д. После всех таких последовательных присоединений чисел о„ а2, ... , as мы. придём к расширению Р(а„ ..., as) поля Р. Мы будем называть P(alt ..., as) расширением, полученным путём присоединения к Р чисел alt ... , as. Оказывается, что числовое поле Р (а2 as) является мини- минимальным среди всех числовых полей, содержащих Р и аи ..., as, а именно, Р (аи , as) есть пересечение всех числовых полей Д, содержащих поле Р и аи ..., as. Доказательство. Так как каждое из упомянутых полей А вамкнуто относительно четырех арифметических действий (исключая, конечно, деление на нуль), то Д вместе с«,иР должно содержать и всевозможные числа вида Это значит, что P(ai) содержится в каждом из полей Д. Но если Я(а1) содержится в Д, то отсюда получается, что и P(«i, «г) содер- содержится а Д. Действительно, поскольку Д замкнуто относительно
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 231 четырёх арифметических действий, поле Д должно содержать вместе с f{ai) и а2 и всевозможные числа вида («0 + h Ы <h + • • • + h (a,) a{ где аДсс,), ^(а,) — элементы из Р^) и знаменатель отличен от нуля. Иными словами, Д должно содержать P(alf а2) и т. д. Рас- Рассуждая так, мы, наконец, убедимся, что Д содержит P(alf ..., as). Обозначим теперь через ? пересечение всех полей Д, со- содержащих Р и Oj, ..о, as. Так как P(alf ..., as) содержится во ьсех Д, то Р(«, «в)^2- (8) С другой стороны, Р(аи .... as), очевидно, содержит Рид, as и потому является одним из полей Д, содержащих Р и alt ..., as. Следовательно, , .... «,)• (9) Сравнивая соотношения (8) и (9), мы видим, что Р(аи ..., as) = E. Из доказанной теоремы сразу вытекает, что расширение Р (au ..., as) не зависит от того, в каком порядке присоединять к полю Р числа alt .... as: P(ait .... as) = P(a,1 alg). В самом деле, Р(о„ ..., as) есть пересечение всех числовых полей, содержащих Р и aj as; вследствие этого P(alf ..., as) зависит лишь от поля Р и от множества присоединяемых чисел alF ..., as, но не от порядка присоединения к полю Р этих чисел. Затем легко видеть, что Р(аг, ..., as) есть не что иное, как совокупность чисел вида где A,-, By — элементы из поля Р, а kty и /^ — целые неотрицатель- неотрицательные числа. В самом деле, благодаря замкнутости Р(а1, ..., as) относи- относительно четырёх арифметических действий поле Р (olf , <xs) будет содержать вместе с Р и аи ..., as и всевозможные числа, полу- получающиеся из чисел а„ ..., as и чисел из Р с помощью той или иной комбинации четырёх арифметических действий. Короче говоря, P(Oj as) должно содержать всевозможные числа вида A0). Но совокупность чисел вида A0) образует числовое поле. Следо- Следовательно, в силу минимальности, числами вида A0) должны исчер- исчерпываться все элементы поля Р(а1, ..., aj.
232 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ В дополнение к сказанному отметим, что если а1 является алге- алгебраическим относительно Р, а2—алгебраическим относительно P(at) и т. д., наконец, as является алгебраическим относительно P(at vs-i)> то P(aj, , as) будет исчерпываться числами вида . fed) fed) ft(i) . . . fefp) ft(p) fc(p) A^j a22 ... ass -f ... -\-Apa^ a,i ... a,. , получающимися в результате комбинации первых трёх арифмети- арифметических действий. Это следует из того, что в случае а алгебраиче- алгебраического относительно поля Р, кольцо Р [а] является полем: Р [а] = Р (а). Проблема решения алгебраических уравнений в радикалах тесно связана с процессом расширения поля путём присоединения чисел, алгебраических относительно рассматриваемого поля. Этой связью мы воспользуемся при доказательстве теоремы Руффини-Абеля в § 16. Введём предварительно весьма важное понятие нормального поля. Пусть Oj, ..., ап— все п корней уравнения /(*) = асх" + а,*-» + - • - + ап = О A1) я-й степени. Присоединим к полю R рациональных чисел коэф- коэффициенты a0, a,, ..., ап уравнения. Мы получим расширение i?(a0, at, ..., ап), которое мы будем называть областью рациональ- рациональности уравнения A1) и будем обозначать для краткости через Д. Присоединим, далее, к Д корни оь о2, ..., о„. Полученное при этом расширение Д (а1г .... оп) поля Д называется нормальным полем или полем Галуа уравнения A1). Нормальное поле Д(а1; ..., а„) мы будем часто обозначать через Q. Теперь покажем, что уравнение A1) тогда и только тогда раз- разрешимо в радикалах, когда нормальное поле Q = Д (alt , аП) содержится в расширении Е = Д(р1, р2, ..., pft), полученном путём присоединения к Д некоторых радикалов pj = /Aj, p2 = /Ла, ... ..., pk = yAk, где At принадлежит Д, Л2 принадлежит Д (р,), Аъ при- принадлежит Д (pj, р2), ..., Ak принадлежит Д (plf ,.., pfe_j). В самом деле, если уравнение A1) разрешимо в радикалах, то это значит, что корни уравнения выражаются через его коэффи- коэффициенты и некоторые радикалы pt, р2, ..., pk с помощью конечной комбинации четырёх арифметических действий. Так как поле ? = = Д(р!, ..., pft) содержит коэффициенты а0, аи ..., ап и радикалы Pi, p2, .... pfe и, как и всякое числовое поле, замкнуто относи- относительно арифметических действий, то корни av ап должны лежать в ?. Следовательно, Q, будучи минимальным среди всех числовых полей, содержащих Д и alf ..., а„, само должно содер-
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО 233 Обратно, если Q содержится в Е: QcrX!, то все корни at ап уравнения A1) лежат в ?. Вследствие этого в„ ...,в„ будут выра- выражаться через радикалы р4, , pft и некоторые числа из Д. Но каждое число из Д в свою очередь выражается с помощью той или иной комбинации арифметических действий через коэффициенты урав- уравнения A1), так как Д = /?(а„, .... ап). Следовательно, корни урав- уравнения A1) должны в конечном счёте выражаться через а0, ..., ап и радикалы pj pk с помощью некоторой конечной комбинации арифметических действий. Иными словами, уравнение A1) решается в радикалах. Пример 2. Мы знаем, что уравнение третьей степени JCB+px + q = 0 можно решить по формулам х __и __ _Р_ х ?_ _ Р /j2\ где н0, щ, «2 суть значения з/ Обозначим через А1 выражение 1-^1 +(^) . Очевидно, что Аг лежит в Д = /?(/?, q). Далее, обозначим через pt какое-нибудь из значений -\fAv Затем через Л2 обозначим: Очевидно, что Л2 лежит в Д (pj). В качестве дальнейших радикалов мы возьмём р2 = и0, Рз = Й1> р4 = иа. Таким образом, р2, р3, р4 являются здесь значениями -^А%. Теперь формулы A2) примут вид Таким образом, корни х0, хи х% выразились через радикалы Pi> Ра. Рз. Pi и потому лежат в Д(рп р2, р3, р4). Обращаем внимание читателя на следующее любопытное обстоя- обстоятельство. Если уравнение A1) решается в радикалах, то всегда можно его корни выразить в таком виде, чтобы радикалы plt p2, .... pk не входили в знаменатели, т. е. чтобы корни получались из рц р2, ..., рй и некоторых чисел поля Д с помощью действий сложе- сложения, вычитания и умножения, но не деления. Это следует из того, что pi является алгебраическим относительно Д, р2 является
234 КОЛЬЦО МНОГОЧЛЕНОВ И ПО1Е Р.\ЦИОН\ЛЬНЫХ ФУНКЦИЙ алгебраическим относительно Д (pj) и т.д. Например, в формулах A3) только что разобранного примера радикалы р2, р3, р4 встречаются и в знаменателях; однако мы можем формулы A3) преобразовать так, чтобы знаменатели зависели только от элементов поля Д. А именно, если под р понимать любой из радикалов р2, р3, р4, то ._?_ Г "И--) откуда Ps
ГЛАВА II КОЛЬЦО МНОГОЧЛЕНОВ ОТ НЕСКОЛЬКИХ НЕИЗВЕСТНЫХ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ § 11. Кольцо многочленов от нескольких неизвестных Пользуясь понятием кольца многочленов от одного неизвестного, мы сейчас определим индуктивно кольцо многочленов от несколь- нескольких неизвестных. А именно, пусть /? — снова коммутативное кольцо с единицей е ф 0. Тогда кольцо многочленов от х% над Rlt где Rt в свою очередь есть кольцо многочленов от xt над R, мы назовём кольцом многочленов от двух неизвестных х1 и jea над R и обозначим через R[xlt x3]. Вообще кольцо многочленов от хп над Rn_t, где Rn_% — кольцо многочленов от хи ..., xn_t над R, мы будем называть кольцом многочленов от п неизвестных xv x2, .... , хп и будем его обозна- обозначать через R[xlt x2, ..., хп]. Посмотрим теперь, что представляют собою элементы кольца R[xt х„]. Обратимся сначала к кольцу R[xt, x.2] от двух неиз- неизвестных. Каждый элемент / этого кольца является не чем иным, как многочленом от х2 над R [х,]: f=a0 (Jfj) + aj (JTi)jfa + ••• + ««. (^i)-^f» (О причем каждый из коэффициентов аг{х{) является многочленом от Xi над R: 1 (i — 0, I, ..., т; alh — элементы из R) Сложение и умножение, употребляемые в выражениях A) и B), следует понимать в смысле операций сложения и умножения кольца R [хи х%], так как R [х^ есть подкольцо кольца R [xt, X$\. Благо- Благодаря этому мы вправе заменить в равенстве A) коэффициенты аДл^) их выражениями B) и раскрыть скобки. В результате таких пре- преобразований элемент / выразится в виде конечной суммы (k^l), C)
236 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ где alt pf— целые неотрицательные числа, Лу- — элементы из R. Можно всегда предполагать, что в сумме C) нет подобных слагае- слагаемых, т. е. слагаемых, отличающихся друг от друга лишь множите- множителем Aj. В самом деле, если бы, например, А1Х^х^ и А^х^х'^ были подобны, то о1=а2, р, = р2, вследствие чего ' = (А + A) т. е. мы могли бы A^txb и А^яхР* заменить одним слагаемым Итак, каждый элемент / кольца R [xlt дг2] представляется в виде выражения C). Покажем, что и в общем случае п (л^1) неизве- неизвестных наблюдается та же картина: каждый элемент f кольца R [хи , хп] можно представить в виде выражения причём а,-,В;, ..., <о,- — целые неотрицательные числа, Аи Л2, ... ..., Ak — элементы из R, и в выражении D) нет подобных слагаемых. Для этой цели воспользуемся методом математической индукции: допустим, что наше утверждение справедливо для п — 1 неизвест- неизвестных, и покажем, что тогда оно будет верно и для п неизвестных. Действительно, так как / есть многочлен от хп над кольцом R[xu ..., xn_t], то + a,(jf,, .... xn_1)xn~\r...-\-am(x1, .... *„_,).*;?, E) где ai(xl, ..., xn_t) — многочлен от л— 1 неизвестных xlt ..., xn_t над R. В силу нашего допущения все коэффициенты аг (xlt .., хп^_1) можно представить в виде выражений }?...х?*. F) Но R[xlr ..., xn__t] есть подкольцо кольца R[xu ..., хп]. Следо- Следовательно, сложение и умножение, употребляемые в выражениях E) и F), надо понимать в смысле операций сложения и умножения кольца R [х1г ..., хп]. Таким образом, в правой части равенства E) можно коэффициенты а, (хи ..., хп_{) заменить их выражения- выражениями F), раскрыть скобки и произвести приведение подобных чле- членов; в результате у нас как раз и получится выражение D) эле- элемента /. Тем самым наше утверждение доказано для любого п, таге как оно верно для случая одного неизвестного. Очевидно, что справедливо и обратное: всякая сумма вида D) представляет собою элемент f кольца R [х1г ..., хп]. В самом деле, каждое слагаемое А^гх^... x^i есть многочлен от хп над R[xlt ..., xn_j], так как Atx\i ... хк*_х лежит в R \хи ..., хп_г]. Поэтому сумма таких слагаемых будет также много-
КОЛЬЦО МНОГОЧЛЕНОВ ОТ НЕСКОЛЬКИХ НЕИЗВЕСТНЫХ 237 членом от хп над R [xt, ..., х^], т. е. будет элементом кольца R[х1г ..., хп]. Элементы /кольца R[xt, .., , хп] называются многочленами от неизвестных xlt ..., хп над R и обозначаются через f(xu ..., хп), g(xv ..., хп) и т. п. Само выражение D) обычно называется нор- нормальным видом многочлена, слагаемое AjX\t... Xю' — членом и Аг — коэффициентом многочлена. В частности, всякий элемент а из кольца R можно рассматри- рассматривать как многочлен от п неизвестных над R, причём в случае a^tO следует предполагать, что показатели неизвестных равны нулю. Пользуясь общими свойствами операций сложения, вычитания и умножения элементов кольца, нетрудно получить обычные правила обращения с многочленами от нескольких неизвестных. А именно, пусть /С*, хп) = ..., хп) = в,*;!*/', ... л# + . —два каких-нибудь многочлена из R[xt, .... хп]. Тогда f(xu ..., xn)-\-g(xlr ..., хп) = (А1х? Так как во всяком кольце и, в частности в кольце R[xlt . .., хп], сложение подчиняется сочетательному и псреместительному зако- законам и имеет место распределительный закон, то мы можем рас- раскрыть скобки и произвести приведение подобных членов, в резуль- результате чего получится нормальный вид суммы f(xu ..., хп) -]- + g(xlt ..., хп). Что касается разности f(xv ..., х„) — g(xlr .... хп), то она сводится к сумме f(xu ..., хп)-{-[—g(xu ..., хп)], причем = (- В,) х?х$ ... х7 + ... + (- В,) хр дг|1 ... х%. Для получения произведения f(xu ..., хп) g(xlf ..., хп) мож- можно воспользоваться правилом умножения суммы на сумму — a1bl-\-...-\-albq-\-...-\-apbq, имеющим место во всяком кольце. Согласно этому правилу надо каждый член многочлена f(xlt ..., хп) умножить на каждый член
238 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ многочлена g(xt, ..., хп); затем, пользуясь сочетательностью и переместительностью умножения, а также распределительным за- законом, можно получившиеся произведения преобразовать в и затем произвести приведение подобных членов. В результате получится нормальный вид произведения/(лгц ..., хп) g(xlt ...,хп). Мы знаем, что многочлен над R от одного неизвестного равен нулю лишь в том случае, когда равны нулю все его коэффициенты. Оказывается, что это обстоятельство справедливо и для многочле- многочленов от п неизвестных, т. е. имеет место Теорема 17. Многочлен /(*!,..., *„) = А^хЬ ... j?i + • • • + А^ихЬ* ... x^k G) ¦ из R[xt, ..., хп] тогда и только тогда равен нулю, когда все его коэффициенты равны нулю. Доказательство. Если все коэффициенты At многочлена G) равны нулю, то, очевидно, многочлен сам равен нулю. Обратно, пусть AtX^xfr ... х^ -f- ... -f AuxZkxik • • • Kk — °- (8) Поскольку теорема верна для многочлена от одного неизвестного над R, воспользуемся методом математической индукции: допустим, что теорема верна для многочленов от л — 1 неизвестных xt xn__t над R, и покажем, что тогда теорема будет верна и для много- многочлена от п неизвестных. Выносим за скобки каждую степень неизвестного лг„ в левой части равенства (8). Получаем: «1 (А, • • •. хп_г) js?i + • • • + a, (*i *„_,) x%s = 0, (9) где at(xlt ..., Arn_i) — многочлены уже от п—1 неизвестных дг, jen_j над R. Рассматривая левую часть равенства (9) как много- многочлен от одного неизвестного хп над кольцом R(х1, ..., xn_t) и пользуясь тем, что теорема верна для случая одного неизвестного, получаем: Но мы допустили, что теорема верна и для случая п—1 неизвест- неизвестных. Следовательно, коэффициенты многочленов 1 \"^11 • • " 1 ""Я — 1/> • ¦ • I S V^i* " • • > "Я ~ш~ \j С*^
КОЛЬЦО МНОГОЧЛЕНОВ ОТ НЕСКОЛЬКИХ НЕИЗВЕСТНЫХ 239 все должны равняться нулю и тем самым должны равняться нулю коэффициенты многочлена f(xt, ..., лг„). Теорема доказана. Таким образом, если то по меньшей мере один из коэффициентов Ах, , Ак должен быть отличен от нуля. В дальнейшем мы будем в нормальном виде многочлена, отличного от нуля, опускать члены с нулевыми коэф- коэффициентами. Из только что доказанной теоремы 17 вытекает единственность представления многочлена в нормальном виде, а именно вытекает Теорема 18. Два многочлена f(xt, ..., хп) и g(xt, ..., хп) из JR [х,, ..., хп] равны тогда и только тогда, когда члены много- многочлена f(xu ..., хп) входят в состав членов многочлена g (xv ..., хп), и обратно, члены многочлена g(xlt . .., хп) входят в состав чле- членов многочлена f(xlt ..., хп). Доказательство. Если два многочлена f(xt, , хп) и g (xu ..., хп) по составу своих членов не отличаются друг от друг?, то f(xv ..., xn) = g(x1, .... хп), так как многочлены представляют собой сумму одних и тех же эле- элементов кольца. Обратно, пусть /(*!, .... ЛГ„) = g(Xu ..., Хп). Предположим, например, что многочлен f(xv ..., хп) имеет член, не входящий в состав членов многочленам^, , хп). Тогда раз- разность f(xu ..., хп) — g(xv ..., хп) будет содержать по меньшей мере один член с коэффициентом, отличным от нуля, и в то же время будет равна нулю: f—g=CAlj%- • • ¦#+ • • • + С, я»'х%... j# = О (С, ф 0). A0) Но равенство A0) противоречит теореме 17. Для изучения дальнейших свойств многочлена от нескольких неизвестных введём понятие степени многочлена. Степенью многочлена f(xlt ..., хп) ф 0 из кольцаR[хи ..., хп] по отношению к неизвестному xt называется наибольший показа- показатель, с которым xt входит в члены многочлена. Например, степень многочлена х\х\ -J- 5хгх3 — над кольцом целых чисел относительно xt равна двум, относительно а2 равна трём и относительно х3 равна шести.
240 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОН\ЛЬНЫХ ФУНКЦИЙ Если в многочлен f(xlt ..., хп) ф 0 неизвестное xt фактически не входит, то степень многочлена f(xv ..., хп) относительно этого неизвестного xt будет, очевидно, равна нулю. Назовём, далее, степенью члена многочлена f(xv ..., хп) ф 0сумму показателей «/-}- P,--f- • • •4~cui не- неизвестных. Тогда степенью многочлена (по отношению ко всей совокупности неизвестных) называется наибольшая из степеней его членов. Так, например, степень многочлена над кольцом целых чисел равна десяти. Мы ввели понятие степени для многочленов f(xt, ..., хп) из R(xlt ..., хП], отличных от нуля. Что касается многочлена, равного нулю, то мы его будем считать многочленом, не имеющим степени. Очевидно, что всякий элемент а ф 0 кольца R можно рассматри- рассматривать как многочлен нулевой степени над R от неизвестных xt, ..., хп. В этом отношении мы имеем здесь ту же картину, что и в случае многочлена от одного неизвестного. Однако в отличие от случая многочлена от одного неизвестного здесь уже нельзя го- говорить в прежнем понимании о старшем члене, так как в много- многочлене от многих неизвестных могут встретиться несколько членов наибольшей степени, а в некоторых случаях все члены многочлена могут быть одной и той же степени. Например, степень многочлена равна пяти, и многочлен имеет два члена х\ и xtx\ со степенью, равной пяти. В многочлене bxyz — х*у -\-y*z A1) все члены имеют третью степень. Многочлен f(xt хп) ф 0 из R[xu ..., хп] мы назовём однородным или формою яг-й степени, если все его члены имеют одну и ту же степень, равную т. В частности, форма первой сте- степени часто называется линейной, второй степени — квадратичной, третьей степени — кубичной. Рассмотренный выше многочлен A1) является кубичной формой от трёх неизвестных. Если кольцо R не содержит делителей нуля, то справедлива следующая Теорема 19. Если кольцо R не содержит делателей нуля, то кольцо R[xt xn] также не содержит делителей нуля. Доказательство. Мы знаем, что теорема верна для случая одного неизвестного (см. § 1). Поэтому воспользуемся методом ма-
КОЛЬЦО МНОГОЧЛЕНОВ ОТ НЕСКОЛЬКИХ НЕИЗВЕСТНЫХ 241 тематической индукции; допустим, что в кольце многочленов R[xv ...,jtrn_i] от п—1 неизвестных нет делителей нуля. Тогда и в кольце R[xt хп] также не будет делителей нуля, так как по определению R[хи ..., хп\ есть кольцо многочленов от одного неизвестного хп над кольцом R[xlt ..., xn_j] без делителей нуля. Исходя из только что доказанной теоремы, нетрудно убедиться, что теорема о степени произведения двух многочленов от одного неизвестного, высказанная нами ещё в § 1, может быть распростра- распространена и на многочлены от нескольких неизвестных: Теорема 20. Если кольцо R не содержит делителей нуля, то степень произведения двух многочленов из R [xv ..., лгп] равна сумме их степеней. Доказательство. Покажем, прежде всего, что теорема верна для однородных многочленов. Пусть <p(.xrj, ..., хп) и ^(.Vj, ..., хп) — две какие-нибудь формы из R[хи ..., хП] соответственно mt-Vi и /и2-й степени: A=1, 2, .... k;J=l, 2, .... /). Умножая каждый член формы ф на каждый член формы <]>, мы получим сумму слагаемых вида Afitfi + 'rii+t} ... x%i+»'j. A2) и степень каждого из таких слагаемых по отношению ко всей сово- совокупности неизвестных равна («/+«;)+(Р*+Ря + • • • + к+«я= Следовательно, если qpt}> ф. О, то не все слагаемые A2) исчезнут, и степень 9^ будет равна тх -\- mv Но ф-]/ не может равняться нулю, так как R[xlt ..., хп] есть кольцо без делителей нуля в силу теоремы 19. Итак, для форм наша теорема доказана. Остаётся доказать теорему для произвольных многочленов f(Xj, .... хп) и g(xt, .... хп) из R[xlt ..., хп]. Пусть степень многочлена f(xlt ..., хп) равна mv а степень многочлена g(xly .... хп) равна т%. Тогда мы можем написать, 16 Энциклопедии, кн. 2.
242 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ что /to •*„) = = фт, (Xi, .... хп) -f <?*, (дг„ ..., дг„) + ... 4-ФоС^ь • • •» ¦*;„), g-(jclt ..., хп) = = ЪтЛх1> •••> ^J + ^fts^l Хп)-\- ¦¦• -\-*irAxl Хп), где qpmi, qpfcj, ..., ерГ1 — формы, соответственно, тгй, Д^-й, ..., ггй степени, tym2, tyfts, ..., <{v2 — формы, соответственно, т2-й, А2-й, ..., г2-й степени и tnl~^>kly> ... ^>rt\ m,z ^> k% ^> ... ^> г2. Перемножая /(jclt ..., лг„) и ^(jfu ..., лгп), получаем: ь ¦••' xa)tyrt(xU •••• Хп)- Очевидно, что в произведении f(xlt ..., xn)g(xl, ..., хп) наи- наибольшую степень имеют члены, входящие в ф/иД-ХП, ..-, Xn)tyms(xl> •••> Хп)- (Щ Но по доказанному выше степень произведения A3) форм 9mi(xlt ..-, хп) и tyms(xi> •¦•> хп) должна равняться сумме щ-\-щ степеней этих форм. Следовательно, степень произведения много- многочленов f(xlt ..., хп) и g(xlt ..., хп) также равна ml-\-mi. Только что доказанную теорему можно распространить и на про- произведение нескольких многочленов: степень произведения S много- многочленов из R [jfj, ..., хп] равна сумме степеней этих многочленов. Понятие значения многочлена от нескольких неизвестных вво- вводится совершенно так же, как и в случае многочлена от одного неизвестного. Именно, пусть f(xlt .... хп) — произвольный много- многочлен из R[xlt ..., хп]. Заменим в нём неизвестные хи ..., хп какими-нибудь элементами си ..., сп кольца R. Мы получим неко- некоторый элемент d того же кольца R. Этот элемент и называется значением многочлена f(xlt ..., хп) при значениях неизвестных х1 = с1 хп = сп и обозначается через/(с1( ..., с„). Очевидно, что если два многочлена из R[xlt ..., х„] равны, то их значения также равны при любых значениях неизвестных. Для произвольного кольца R обратное, как мы знаем, неверно уже в случае многочлена от одного неизвестного. Однако дело обстоит иначе, когда кольцо R бесконечно и не обладает делителями нуля. Докажем, прежде всего, следующую теорему: Теорема 21. Если кольцо R бесконечно и не содержит дели- делителей нуля, то многочлен f(xu ..., хп) над R в том и только в том случае равен нулю, когда при любых значениях неизвест- неизвестных он обращается в нуль. Доказательство. Если многочлен f(xlt .... хп) равен нулю, то все его коэффициенты должны равняться нулю, и
КОЛЬЦО МНОГОЧЛЕНОВ ОТ НЕСКОЧЬКИХ НЕИЗВЕСТНЫХ 213 потому многочлен будет обращаться в нуль при л,обых значе- значениях неизвестных. Обратно, пусть многочлен f(xlt ..., хп) обращается в нуль при любых значениях неизвестных. Для случая одного неизвестного (т. е. при и—1) теорема была доказана уже в § 3. Поэтому вос- воспользуемся методом математической индукции: предположим, что теорема верна для случая п — 1 неизвестных, и покажем, что тогда теорема будет верна и для случая п неизвестных. Многочлен /(Jfj xn) можно записать в виде f(xt, .... хп) = а0(х1, ..., xn_t) + й! (х1г ..., где at(xl3 .... хп)— многочлены от я—1 неизвестных^, ..., Arn_j. Дадим неизвестным хх, лг2, ..., хп_х произвольные значения Ьи #3,... .... ?>„_,.Тогда мы получим многочлен уже от одного неизвестного хп над кольцом R: «oFi U + «.(*i--.U^ + -+^(*.--U^ A4) Так как f(xlt ..., vn) равен нулю при любых значениях неиз- неизвестных, то многочлен A4) будет равен нулю при любом значении неизвестного хп. Отсюда в силу того, что теорема верна для много- многочлена от одного неизвестного над R, получаем: a«(*i. •••> *»-i) = О, .... ат{Ь1,...,Ьп_д = 0. A5) Равенства A5) свидетельствуют о том,что многочленыа^Ху,..., -vn_i) от п — 1 неизвестных х^, ..., хп^ над /? обращаются в нуль при любых значениях неизвестных, так как Ь1г ..., Ъп_х произ- произвольны. Но, по предположению, теорема верна для многочленов от л — 1 неизвестных. Следовательно, ав(хи ..., *„^) = 0, ... , am(xlt ..., лг^^О, в силу чего и f(xlt .... хп) равен нулю. Из только что доказанной теоремы вытекает Теорема 22. Если кольцо R бесконечно и не содержит делителей нуля, то два многочлена из R [xv ..., хп] равны в том и только в том случае, когда их значения совпадают при любых значениях неизвестных. Доказательство. Если многочлены f(xt xn) и g(xlt , хп) равны, то, как мы уже выше отметили, их значения совпадают независимо от того, будет или не будет R бесконечным кольцом без делителей нуля. Поэтому рассмотрим обратное: пусть значения многочленов f(xu .... хп) и g(xlt ..., хп) совпадают при любых значениях неизвестных. Тогда разность /С*ь •••> xn) — g(x. хп) 1С*
244 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ будет обращаться в нуль при любых значениях неизвестных и по- потому на основании теоремы 21 будет равна нулю: /to, .... xn) — g(x1 хп) = 0, откуда f(xt, ..'., xn) = g(x1 xn). В заключение этого параграфа отметим следующее: с помощью примерно тех же соображений, что и для случая многочлена от одного неизвестного, нетрудно убедиться, что если Хи ..., Xn)-\-g(Xu .... Хп) П(Хи ..., Хп), f(xlt ..., xn)g(xlt .... xn) = k(xlf .... хп), то при произвольных значениях х1 = с1, ..., хп = сп неизвестных. Пользуясь соотношениями A6) и теоремой 22, можно затем убедиться, что для бесконечного кольца /? без делителей нуля алгебраическая и функциональная точки зрения на многочлен от нескольких неизвестных равносильны. Рассуждения по существу будут теми же, что и для многочлена от одного неизвестного. § 12. Поле алгебраических дробей Многочлены являются частным случаем понятия алгебраической дроби. В этом параграфе мы сначала дадим соответствующее опре- определение алгебраической дроби, а затем выясним, при каких усло- условиях можно эти дроби рассматривать как функции. Пусть Р—произвольное поле. Множество многочленов Р[х1У ..., хп] от неизвестных хи..., хп образует, как мы знаем из предыдущего параграфа, коммутативное кольцо без делителей нуля. Однако Р\хх, ..., хп] полем всё же не является, так как далеко не всегда один многочлен делится на другой. Например, х"*-\-а, где афО — элемент из Р, не делится на j^-j"a5 не делится по той простой причине, что степень делимого меньше степени делителя. Предположим теперь, что существует такое поле Q, в котором кольцо Р[х1г.... хп] является подкольцом. Тогда для каждой па- пары многочленов /(х1г .... хп) и g(xlt ..., хп)^0 из P[xlt ..., хп] уравнение g(xlt .... хп)г=/(х1г .... хп) будет иметь в поле Q единственное решение z = a. Обозначим это решение через Ял: х > О { V" VI О \Л1Г • • •» -^п)
КОЛЬЦО МНОГОЧЛЕНОВ ОТ НЕСКОЛЬКИХ НЕИЗВЕСТНЫХ 245 и назовём алгебраической дробью от неизвестных хи..., хп над полем Р. При этом f(xlt..., хп) и g(xu..., xn) будут называться соответственно числителем и знаменателем дроби. На основании общих свойств поля легко установить, что дейст- действия над алгебраическими дробями ничем не отличаются от дейст- действий над обычными дробями, а именно: 1°. /l (Хи . . ., Х„) _ f. (Xi, ..., Х„) gl (Хи . . ., Хп) gt (XU ..., Хп) тогда и только тогда, когда /tfo, ..., xn)g.z(xu .... дг„)=/з(лг1, .... xjgifa, .... хп). 2°. , • • ; Хп) | /. (Хи . . ., Хп) хи..., хп) г" g, (хи.. .f Xn) _ /l (Xi,. . ., Хп) g. (Хи . . ., Хп) + Л (*i, ..., Хп) gr (Хи . .., Хп) g1(xl,..., xn)g.{xu..., хп) 3°. /l (Xi,..., Хп) ^ /a (-^l, ¦ • •, Х„) A (-*ii , Хп) /. (xlt , Х„) gl (XU . . ., Xn) ' g2 (Xu . . ., Х„) gx (XL, . . ., Xn) g. (XU . . ., Xn) " /t (xu..., xr) . /. (xu..., xn) __ A (xt xn) ga (xi х„) gi (xu..., xn) • gs (xu..., xn) gi (xu..., xn) /s (xu..., xn) (ft(xlt..., Мы ограничимся выводом свойства 1°, причём для сокращения письма будем многочлены /(*„..., xn), g(xl,..., xn),... обозна- обозначать одной буквой: /, g,... Если то по определению алгебраической дроби gia=fi, g^=A- Умножим первое равенство на git а второе на gt. Получим: откуда /1(д-2=/^1 Обратно, пусть f1gi==fig1 и g1a=f1. Покажем, что это а бу- будет также решением и уравнения g-2z=/2. Умножаем обе части равенства gla=fl на g%. Получаем: /igr«=/eg"i. Следовательно, заменяя в правой части равенства -2 выражением f%glt имеем:
21C КОЛЬЦО МНОГОЧЛЕПСЗ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Последнее равенство можно сократить на gv так как g^O, По- Получаем в результате такого сокращения, что g-2a^fi' Отсюда вы- вытекает, что а = —, т. е. —- = —. & gs gi Из свойств 1°—4° вытекает, что множество всех алгебраических дробей над Р от неизвестных xt;..., хп образует подполе поля Q. Это подполе мы обозначим через Д и будем называть полем алгеб- алгебраических дробей от х1У..., хп над Р. Мы рассматривали Р [xt,..., хп] как подкольцо некоторого по- поля Q. Не исключено, однако, что Р[хи..., хП] может оказаться подкольцом и другого поля Q'. Возникает вопрос, каково будет поле алгебраических дробей в 2'. Оказывается, что поле алгебраи- алгебраических дробей будет (с точностью до изоморфизма) тем же, что и в.й. Иными словами, можно высказать следующую теорему: Теорема 23. Если для кольца многочленов Р [xt,..., хп] су- существует поле алгебраических дробей, то это поле является единственным (с точностью до изоморфизма). Мы говорим «если существует», так как мы пока ещё не знаем, существует ли вообще поле Q, имеющее Р[х1У..., хп) своим под- подкольцом. Доказательство. Пусть Р[хи..., хп] является подкольцом как поля Q, так и поля О'. Обозначим через Д поле алгебраических дробей в Q и через Д' поле алгебраических дробей в Q'. Далее, возьмём из P[xv..., хп] два произвольных многочлена/^,..., хп) и g(x,,..., xn)^0 и обозначим через а решение уравнения gz=f 0) в поле Д и через а' решение того же уравнения в поле Д'. Поставим теперь в соответствие элементу а элемент а': «->«'. B) Это соответствие является не только однозначным, но и взаимно однозначным. В самом деле, пусть решению E уравнения gi*=fi C) в поле Д соответствует то же самое а'. Это значит, что уравнения A) и C) имеют в поле Д' одно и то же решение а'. Отсюда в силу свойства 1° алгебраических дробей должно выполняться равенство /gi=fig- D) Но если имеет место равенство D), то в силу того же свойства 1° р = а. Очевидно, что для каждого а из Д' найдётся в Д эле- элемент а, которому а' и ставится в соответствие. Bed это вместе взятое означает, что B) есть взаимно однозначное соответствие между полями Д и А'.
КОЛЬЦО МНОГОЧЛЕНОВ ОТ НЕСКОЛЬКИХ НЕИЗВЕСТНЫХ 247 Покажем, что соответствие B) является изоморфизмом между Д и Д'. Пусть а и E — два каких-нибудь элемента из Д, причём пусть а и E являются соответственно корнями уравнений gx*=fi (ft Ф 0) E) и ff**=/« GTs^O) F) в поле Д. Пусть в поле Д' уравнение E) имеет корень а', а ура- уравнение F) корень В'. Тогда а-><*', Р-»Р'. Согласно свойству 2° алгебраических дробей сумма <х -{— р есть корень уравнения giS^=figt-\-ftgi G) в поле Д. Обозначим корень уравнения G) в поле Д' через ?'• Тогда «Ч-Р-т1- Обращаясь снова к свойству 2°, имеем, что сумма а' -\- В' должна быть в поле Д' корнем того же уравнения G), откуда в силу един- единственности решения уравнения G) -у' = а' —j— P'. Мы видим, что Подобным же образом, пользуясь свойством 3° алгебраических дробей, можно показать, что оЗ->-а'В'. Итак, поля Д и Д' оказались изоморфными. Отметим, что при изоморфизме B) многочлены из Р[х1г..., хп] будут соответствовать самим себе: /—>•/. Действительно, много- многочлен f(xu..., хп) можно рассматривать как корень уравнения 1 • г=/, где 1 — единица поля Р. Но это уравнение как в поле Д, так и в поле Д' имеет одно и то же решение, а именно /. Мы обнаружили, что если поле алгебраических дробей для кольца Р[хи..., х„] существует, то оно является единственным. Покажем теперь, что это поле в самом деле существует. Теорема 24 (о существовании поля алгебраиче- алгебраических дробей). Поле алгебраических дробей существует для вся- всякого кольца многочленов Р[х1г ..., хп]. Доказательство. Рассмотрим множество М пар (/, g) мно- многочленов/=/(jc, лг„) ug = g(x1, ...,лг„)^О из Р[хи ...,хп\. Руководствуясь свойством 1° алгебраических дробей, мы для пар (/> ё) введем следующее отношение эквивалентности; положим (Л> gd~(f» ffj). если f
248 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Легко убедиться, что определённое таким образом соотношение действительно является отношением эквивалентности между парами множества М. В самом деле, так как fig1=f1gl, то (fu gi)~(/i, gi), т. е. наше соотношение обладает свойством рефлексивности. Далее, так как равенство flg$=figi можно переписать в виде hgi—figi> т0 т (/i> gi)~(A> gs) следует (/2, ^j-^C/i, gi), т. е. соотношение обладает свойством симметрии. Наконец, пусть (/„ g-,)^(/2> g-2) и (/2, g-2)~(/3, Ы- Тогда будут иметь место равенства (8) Умножим обе части равенства (8) на g3 и равенства (9) на gr Получим: откуда Сокращая последнее равенство на g^, имеем: ftg3 ^f^gi, т. е. из (fu gi)~(Ugi) и (/а, #а)~(/з>#з) следует, что (/„ й)~(/3, &)• Соотношение, таким образом, обладает свойством транзитивности. Итак, соотношение^^обладает всеми свойствами эквивалент- эквивалентности. Тем самым это соотношение определяет разбиение множества М на классы эквивалентных пар. Условимся класс, в котором лежит пара (/, g), обозначать символом —. Очевидно, что — = — тогда .и только тогда, когда /ig"a=/a?i- Введём для множества Д всех этих классов — операции сложе- сложения и умножения так, чтобы Д стало полем относительно введён- введённых операций. Руководствуясь свойствами 2° и 3° алгебраических дробей, мы сумму и произведение классов определим следующим образом: /l I h ___/igs+/ggi /jq\ gi * & gig* ' y ' Si ft gtg» ' Покажем, что эти определения законны. Они законны, во-первых, потому, что g^ ф 0, так как gt^0 и gtj^0 (напоминаем — для всех пар (/, g) множества М многочлен g ф 0). Таким образом, сим- символы в правых частях равенств (J0) и A1) имеют смысл.
КОЛЬЦО МНОГОЧЛЕНОВ ОТ НЕСКОЛ'.КИХ НЕИЗВЕСТНЫХ 249 Во-вторых, правые части равенств A0) и A1) не зависят от выбора представителей классов. В самом деле, пусть Посмотрим, что произойдёт, если в сумме — -}-— и в произведе- &1 62 /. /„ f. i, нии — • ii заменить — через —. Из равенства A2) следует, что tei- A3) Умножая обе части равенства A3) на g-2, получаем: Прибавляя затем к обеим частям последнего равенства fvgtf, имеем: /ifiW +/2?"i9 = tygig* + /aft?, (Aft +/aft) 9 = (№2 +/«<?) ft. Наконец, умножаем обе части получившегося равенства на ga: (fig* + /aft) 9^2 = (te + f-29)gig2- A4) Равенство A4) как раз свидетельствует о том, что gig» 9g2 Аналогично, умножая обе части равенства A3) на /2й"г> п!> лучаем: откуда Совершенно тем же способом можно показать, что, выбирая вместо (/2, е9) другой представитель класса —, мы этим также gs не изменим правые части равенств A0) и A1). Теперь покажем, что относительно введённых операций множе- множество классов Д образует поле. Очевидно, придётся проверить все условия, характеризующие поле. Мы ограничимся проверкой соче- сочетательности сложения. Имеем: gi *~\gs ~~*~ gt) gi (fi I fx\ I /a__/igg+/ggi | /a _figiga+fsgig»+fagig* .
250 КОЧЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РЛЦИОНЛЛЬНЫХ ФУНКЦИЙ Получился в обоих случаях один и тот же результат. Следова- Следовательно, Так же проверяются и остальные условия. Мы утверждаем, что построенное поле Д и будет искомым по- полем алгебраических дробей. Это утверждение станет очевидным, если мы покажем, что Д содержит подкольцо, изоморфное кольцу Р[хи ..., хп]. Рассмотрим в поле Д подмножество классов вида -у, где 1 — единица поля Р. Поставим в соответствие каждому многочлену / из Р[xlt ..., хп] класс -у с тем же самым /. Мы получим тогда взаимно однозначное соответствие между кольцом Р[х1г ..., хп] и множеством, состоящим из клас- классов вида у. В самом деле, разным многочленам fl и /2 из P[xlt ..., хп] должны соответствовать разные классы -~ ^ь у3-. Если бы классы -А- и -у совпадали, то на основании условия равенства двух классов мы имели бы, что /,-1=/а-1 или /1=/а, что невозможно. Взаимно однозначное соответствие A5) будет к тому же изо- изоморфизмом. Действительно, если fi ~*~~\~> fi~*'~Y > то 7i-f-/a-> i — jTj — i TJ. fifj /l/s fi_ fa^ 1 Ы 1 ' i • Итак, множество классов вида у образует подкольцо поля Д, изоморфное кольцу Р[х1г ..., хп]. В силу этого мы можем класс у не отличать от соответствующего многочлена /. Далее, так как класс - является элементом, обратным относи- тельно класса -, то в силу равенства 8 g
КОЛЬЦО МНОГОЧЛЕНОВ ОТ НЕСКОЛЬКИХ НЕИЗВЕСТНЫХ 231 ыы можем любой классе—, т. е. любой элемент поля Д, рассмотри- о вать как отношение многочленов / и g ф 0 из кольца Р\хи ..., хп], т. е. Д есть поле алгебраических дробей для кольца P[xt, ..., хп\. Теорема доказана. Поскольку мы убедились в существовании поля алгебраических дробей для кольца P[xt xn], мы будем в дальнейшем обо- обозначать это поле через P(xlt ..., хп) (неизвестные в круглых, а не в квадратных скобках). Перейдём теперь к вопросу о функциональной точке зрения на алгебраическую дробь. Обратимся к случаю алгебраической дроби от одного неизве- неизвестного. Пусть — некоторая алгебраическая дробь из Р(х). Введём понятие зна- значения дроби г(х). Предварительно отметим, что числитель и знаменатель дроби A6) можно всегда предполагать взаимно простыми. Действительно, если бы многочлены f(x) и g(x) имели наибольший общий делитель D (х) со степенью выше нулевой, то f{x) =/, (х) D (x), g (x) = gl (x) D (x), /t (x) и gt (x) были бы взаимно простыми, и на основании условия равенства алгебраических дробей мы могли бы написать: Итак, мы будем многочлены f(x) и g(x) предполагать взаимно простыми. Возьмём теперь из поля Р некоторый элемент с. Если g(c)i?O, то под значением г(х) при х = с мы будем подразумевать f (с\ отношение —-. значений многочленов" f(x) и g(x) при х=с и будем это отношение обозначать через г (с). Очевидно, что значе- значение г (с) дроби г(х) есть некоторый элемент поля Р. Из этого определения следует, что если две алгебраические дроби равны: г, (х) = г2 (х), то их значения совпадают при любом значении неизвестного х, не обращающего в нуль знаменатели дробей rt (x) и г2 (х). В самом деле, если и г у (х) = г2 (х), то в силу условия равенства алгебраических дробей х) =Л (х) gi (¦**
252 К0ЛЫ10 МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Пусть с—элемент из Р, для которого g^ (с) ф О и g^{c) ф 0. Пола- Полагая х = с, имеем: Л (О ft (О =/«(') ft (О. откуда, пользуясь условием равенства дробей в поле Р, получаем: Покажем, что в случае бесконечного поля Р будет верно II обратное: если значения алгебраических дробей г1 (х) и г2 (х) совпадают при любом значении неизвестного х, не обраща- обращающем в нуль знаменатели дробей, то дроби г1 (х) и г2 {х) равны. Доказательство. Пусть gl (e) gs (C) ' где с — произвольный элемент из Р, не обращающий в нуль gx (x) и g%(x). Тогда /i@ft@=/«@ftW- A7) Из равенства A7) видно, что значения произведений fx (x) g% (x) и /8 0*0 ft 0*0 совпадают при бесконечном множестве значений неиз- неизвестного х, так как поле Р бесконечно, а многочлены g1 {x) ф 0 и g-2 (х) ф 0 над полем Р имеют ограниченное число корней. Следо- Следовательно, многочлены f1 (x) gs (x) и /2 (х) g1 (x) должны быть равны /i (x) Si (x) =/а 0*0 5"i С-*7)* Отсюда на основании равенства алгебраических дробей получается, что и наше предложение доказано. Будем в произвольной алгебраической дроби г(х) = —р- из P(jc) неизвестное jc заменять тем или иным элементом с из поля Р, не обращающим в нуль знаменатель g(x). Тогда мы будем получать вполне определенные элементы г (с) из Р. Таким образом, каждой алгебраической дроби г(х) из Р(х) будет ставиться в соответ- соответствие функция от одного аргумента I, определённая для всех значе- значений х, кроме значений, обращающих в нуль знаменатель g(x): /¦(*)-* г(Ц. A8) Через г(?) мы здесь обозначили функцию, соответствующую алгеб- алгебраической дроби г(х). Мы будем г($) называть рациональной функ- функцией над полем Р.
КОЛЫЮ МНОГОЧЛННОВ ОТ НЕСКОЛЬКИХ НЕИЗВЕСТНЫХ 253 ¦ Руководствуясь соответствием A8), введём теперь операции сложения и умножения рациональных функций. А именно, если гЛх)-йм' гЛх)~ел*) — две какие-нибудь алгебраические дроби из Р(х), то под 1(^)\ -f- r2 (?) мы будем подразумевать рациональную функцию, соответ- сгвующую сумме r1(x)~{-ri(x) алгебраических дробей, а под Г] (?) г2 (?) будем подразумевать рациональную функцию, соответ- соответствующую произведению гг (х) г2 (х) алгебраических дробей. Наше определение операций сложения и умножения несколько расходится с обычным определением операций над функциями. Так, например, в нашем смысле О— 1J-^гт = ^— 1 A — единица поля Р), A9) а в обычном смысле (S—lJ-g_ . нельзя считать равным \-—1, так как правая часть равенства A9) определена для всех значений I, а в левой части . при Е—1 не определена. Итак, мы определили надлежащим образом операции сложения и умножения рациональных функций над полем Р. Покажем теперь, что в случае бесконечного поля Р алгебраическая и функциональ- функциональная точки зрения на дробь в известном смысле слова совпадают. Точнее, покажем, что имеет место следующая Теорема 25. Если поле Р бесконечно, то множество раци- рациональных функций г(?) над Р образует поле, изоморфное полю алгебраических дробей Р(х). Доказательство. Пусть двум алгебраическим дробям ™ = и гЛх)=Ф соответствует одна и та же рациональная функция г(Е) над Р: r.W->r(E). г, (х) —г F). Тогда ri(c)=/(c) для любого с из Р, не обращающего в нуль знаменатели g-t (x) и g% (x) дробей гг (х) и г2 (х). Но выше мы уже убедились, что в случае бесконечного поля Р такие алгебраиче- алгебраические дроби должны быть равны. Следовательно, гх (х) = г2 (х), и мы видим, что соответствие A8) является не только однозначным, но и взаимно однозначным. Далее, согласно самому определению суммы и произведения рациональных функций
254 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Таким образом, соответствие A8) есть изоморфизм между полем Р(х) и множеством рациональных функций г{1) нвд Р. Тем самым это множество функций образует поле, изоморфное Р{х), и теорема доказана. Только что доказанная теорема даёт нам основание не разли- различать в случае бесконечного поля Р алгебраическую дробь от раци- рациональной функции 1), и мы можем в этом случае аргумент | обо- обозначать той же буквой, что и неизвестное х. Примерно такое же обоснование функциональной точки зрения на алгебраическую дробь можно дать и для случая нескольких неизвестных, но мы не будем на этом задерживаться. § 13. Симметрические многочлены В настоящем параграфе будет рассмотрен один довольно важ- важный класс алгебраических дробей, так называемые симметри- симметрические ачгебраические дроби или симметрические функции. Пусть JR — коммутативное кольцо с единицей е ф О и без дели- делителей нуля. Симметрическим многочленом над кольцом JR принято называть такой многочлен f(xlt ..., хп) от п неизвестных над R, который не меняется при любой перестановке неизвестных хи ..., хп. Например, многочлен f(xu x%, xi) = x\xi-{-x1x\-ii-x\x%-\-x1xl-{~xlx%-{-xixl A) является симметрическим; легко убедиться, что он не меняется при любой перестановке неизвестных: f{x1, xit x3)=f(x3, х%, j^i)=^=/(x2, xlt лг3) =/(лг2, х3, х1) = Возьмём хотя бы f(x3, хъ xl) = xbci-{-xsxl-{-xlx1-{-x.ix\-{-xlxi-{-xix\. B) Для получения выражения f(xs, х%, xj мы в выражении A) много- многочлена f(xlt xit x3) неизвестное х1 заменили через х3, х% оставили без изменения, а х3 заменили через xt. Сравнивая выражения A) и B), видим, что они отличаются друг от друга лишь порядком следо- следования членов и порядком следования неизвестных в каждом члене. Следовательно, f(x3, x2, xl)=f(xl, x2, х3). Алгебраическая дробь и .... хп)' у которой числитель /(х„ ..., хп) и знаменатель gfa х„) Ф О являются симметрическими многочленами над полем Р, называется симметрической алгебраической дробью, или симметрической функ- функцией над Р. J) He различать по отношению к алгебраическим операциям.
КОЛЬЦО МНОГОЧЛЕНОВ ОТ НЕСКОЛЬКИХ НЕИЗВЕСТНЫХ 255 Поскольку симметрическая функция выражается через симметри- симметрические многочлены, мы, естественно, начнём наше изложение с изуче- изучения основных свойств симметрических многочленов. Впервые приходится сталкиваться с симметрическими многочле нами при решении следующей задачи: пусть уравнение /z-й степени над полем Р f(x) = Xя -f alXT* + ... + ап = 0 C) со старшим коэффициентом, равным единице, имеет п корней. Эти корни Оц а2, ..., а„ даны. Найти коэффициенты с,- уравнения. Мы знаем (см. § 8, стр. 208), что коэффициенты уравнения C) выражаются через корни по формулам Вьета: D) Руководствуясь этими формулами, составим теперь многочлены от п неизвестных . .. -[--^п-1-^и. E) Легко видеть, что многочлены E) являются симметрическими. В са- самом деле, равенства D), очевидно, не зависят о г нумерации кор- корней: а,, а2, ..., а„. Мы могли бы, например, корню ах приписать дру- другой номер, хотя бы 2, а корню а3 — номер, равный единице; это изменение нумерации ни в какой мере не нарушило бы равенств D), так как при их выводе совершенно безразлично, какой корень следует обозначать через аи какой через а2 и т. д. Многочлены E) называются основными или элементарными сим- симметрическими многочленами от неизвестных хх хп. Эти многочлены играют в теории симметрических функций исклю- исключительную роль благодаря следующей теореме: Основная теорема о симметрических многочле- многочленах. Всякий симметрический многочлен f(xv ..., хп) от п неиз- неизвестных над кольцом R может быть выражен в виде многочлена от основных симметрических многочленов о]( о2, ..., оп над тем же кольцом R: f(xu ..., xn) = g(a1 о„), где g(al, ..., о„) — многочлен от alt о2, ..., о„ над R.
256 КОЛЬЦО МНОГОЧЛЕНОВ И ПО IE РАЦИОНАЛЬНЫХ ФУНКЦИЙ Существует весьма большое количество доказательств этой тео- теоремы. Мы предлагаем вниманию читателя доказательство, доста- достаточно простое как в теоретическом, так и в практическом отно- отношении. Однако предварительно придётся ввести понятие высоты члена многочлена и доказать одну лемму, связанную с этим понятием. Пусть f(xt, . ., хп)— некоторый многочлен (он может быть и несимметрическим). Возьмём два каких-нибудь члена этого мно- многочлена ^? ... хап" F) * ... х*«. G) Условимся считать из членов F) и G) тот выше, у которого больше показатель при л;,; если же показатели при х1 равны, то условимся считать выше тот член, у которого больше показатель при аг2, и т. д. Вообще, если аг—C,- есть первая отличная от нуля разность, то при а,-—-Рг^>0 член F) считается выше члена G), а при а,- — Р,-<^0— ниже члена G). Пример 1. Какой из членов многочлена f(xu x2, хг) — 8x^^x1-^ x\Xi-\-х\х?2Х3— x\xlx% является наивысшим? Член 8х^хгх% ниже члена Х\Х%; в свою очередь член х\х% ниже члена x\vix3, a х\х1хъ ниже члена —x\xlx%. Таким образом, дан- данный многочлен имеет наивысшим членом —х\х\х%. Мы предостерегаем читателя от смешения понятий высшего члена и члена с наибольшей степенью. Так, в только что разо- разобранном примере член влг^лгз имеет наибольшую степень, но он является даже наинизшим членом многочлена. Лемма. Наивысший член произведения двух многочленов f(xu ..., хп) и g(xt, ..., хп) равен произведению наивысших членов этих многочленов. Доказательство. Пусть Ах^х? ...хап" (8) Bx\*xf...xf (9) — соответственно наивысшие члены многочленов f(xlt...,xn) и хп). Возьмём какой-нибудь член ...хЪ" (Ю) многочлена f(xv ..., хп) и какой-нибудь член Nx\lx? • • • К" О1)
КОЛЬЦО МНОГОЧЛЕНОВ ОТ НЕСКОЛЬКИХ НЕИЗВЕСТНЫХ 257 многочлена g(xt, ..., хп) и покажем, что произведение A2) членов (8) и (9) выше произведения MNx^x^* ... х *»¦**" A3) членов A0) и A1), если член A0) ниже члена (8) или член A1) ниже члена (9). Так как (8) и (9)—наивысшие члены многочленов f(xt, ..., хп) и g(xu ..., хп), то a,Ss/i,, Pi^X,, откуда «^-fPi Ss^i + V Таким образом, если а, —[— Pi ^>jul, —J— X,, то член A2) выше члена A3). Если же <*!-}- Pi=^i -j- ^n T0 «i=^n Pi = ^i> и мы обращаемся к следующим показателям а2 и Р2. Так как a,=jx,, Pi=X, и член (8) не ниже члена A0), а член (9) не ниже члена A1), то a2^jx.2> P2^X2, откуда а2~ЬР2^^2~Ь V Член A2) будет выше члена A3), если a2 + P2>JX2+^2; есЛИ Же а2 + Р2 = ^2 + ^2. Т0 «2=^2. Ра = h' и мы обращаемся к показателям а3 и рз и т. д. В конечном счёте мы доберёмся до показателей aft и Рй таких, что будет иметь место по меньшей мере одно из неравенств ak~^>y.k и pft^>Xft, и тогда мы получим, что aft -[- р* 2>J^ft -j- Хй, т. е. член A2) выше члена A3). Теперь приступаем к доказательству основной теоремы теории симметрических функций. Доказательство. Возьмём наивысший член симметрического многочлена f(xu ..., хп). Пусть это будет член Ах?х? ...хяа». (Н) Тогда многочлен /(л:, хп), являясь симметрическим, должен вместе с членом A4) содержать и все члены, получающиеся из чле- члена A4) при всевозможных перестановках неизвестных. Покажем, что Действительно, переставляя xt и х%, мы получаем из члена A4) член 2 • • • Лл • Так как этот член не может быть выше члена A4), то показатель при хх в этом члене не может превосходить показателя при xt в члене A4): aj^a2. Точно так же, сравнивая член A4) с членом получающимся из A4) путём перестановки неизвестных х% и ха, приходим к заключению, что а2^а3 и т. д. Очевидно, что А,?'ф...ов*«, A6) 17 Энциклопедии, кн. 2.
258 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНЛЛЬНЫХ ФУНКЦИЙ где kt — целые неотрицательные числа, есть также симметрический многочлен ог хи .... хп. Попытаемся подобрать числа kl так, чтобы наивысшиП член симметрического многочлена A6) совпадал с чле- членом A4). Основные симметрические многочлены о„ о2 о„ имеют наи- наивысшими членами соответственно хи хгх2, .... х^ ... хп. Сле- Следовательно, согласно недавно доказанной лемме, симметрический многочлен A6) имеет наивысшим членом ^р ... (ед ... хп)"" = ¦ +Ч$+ •••+**... *?«. A7) Таким образом, член A7) будет совпадать с членом A4) в том случае, если f k%-\- ... -\-kn = а2, Решая эту систему уравнений относительно kt, получаем: *!=«, — а2, А2 = а2 — а3, .... kn_l = an_l — an, kn = an. В силу неравенств A5) эти значения kt будут целыми неотрица- неотрицательными числами. Итак, вычитая из многочлена f(xt, ..., хп) выражение мы уничтожим член A4) и получим симметрический многочлен /,(*„ .... xn)=f(x , хп)-Ас?-а2о?-*3 ... <», состоящий из более низких членов. Пусть — наивысший член многочлена fx (xlt ..., хп). Тогда мы снова по- повторим процесс понижения высоты членов — вычтем из многочлена /, (х1г ..., хп) выражение Бо?'~Р2о^2~Рз ... о^", в результате чего получим симметрический многочлен Л (хи ..., хп) =/, {хи..., хп) - В&- V/"p3 ...<#• и т. д. Этот процесс, однако, не может быть бесконечным: если на А-м шагу мы придём к симметрическому многочлену fh (хх, ..., хп) с наивысшим членом Lx№...xl», A8) то, с одной стороны, его показатели Xt будут удовлетворять усло- условию Xj 5s Х2 Si ... ^ Х„, а с другой стороны, a, 5s >ч» так как член
КОЛЬЦО МНОГОЧЛЕНОВ ОТ НЕСКОЛЬКИХ НЕИЗВЕСТНЫХ 259 A4) выше члена A8). Но, очевидно, существует лишь конечное множество систем целых неотрицательных чисел Xlt л2, ..., Хп, удо- удовлетворяющих условиям a, S= ^ и X, 5= Х2 S= • • • S= ^„- Тем самым наш процесс должен закончиться, т. е. через конечное число шагов неизбежно получится, что Отсюда вытекает, что т. е. многочлен /(atj, ...,#„) выразился в виде многочлена от о„ о2, ..., оп над тем же самым кольцом R. Этим теорема и доказана полностью. Способ выражения симметрического многочлена через основные симметрические многочлены, положенный в основу только что про- проведённого доказательства, является и в практическом отношении довольно удоэным способом. Обратимся к такому примеру. Пример 2. Выразить симметрический многочлен — ДГ8J(ДГ8 A9) через основные симметрические многочлены о,, о2, о3. Очевидно, что хг — х%, xt — х3, х2 — к3 имеют наивысшими чле- членами соответственно хи xt и х2. Поэтому на основании известной леммы наивысшим членом многочлена A9) будет: 11а — ^^ Существенно облегчает наши выкладки то обстоятельство, что многочлен A9) является формой шестой степени. Составим теперь следующую табличку наивысших членов много- многочленов /(л:, хп), fi(xtJ .... хп), fs(xlt .... хп) и т. д., полу- получающихся при нашем способе понижения высоты членов симметри- симметрического многочлена. Ясно, что каждый из этих многочленов будет также формой шестой степени, и поэтому все члены будут шестой степени: Соответствующая комбина- комбинация основных симметриче- симметрических функций Система показате- показателей наивысшего члена 4 2 0 4 1 1 3 3 0 3 2 1 2 2 2 Наивысший член Х1К Bx\xzxs Сх\х\ Dx\x\x3 pvavava l-a°l-Q°l= «W n*
260 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Обращаем внимание читателя на то, что при составлении первого столбца таблички следует руководствоваться условием ^1^^2=3=^з» имеющим место для наивысшего члена симметрического много- многочлена fk {хи ..., хп), получающегося на А-м шагу нашего процесса. Таким образом, / (*i. xit хъ) = сХ -}- Вс\аа + Со» -|- DoAo, 4- Eel. B0) Остаётся определить, чему равны коэффициенты В, С, D, Е. Для этой цели будем неизвестным хи *г2, х3 давать те или иные значения. Полагаем xl = l, xs=l, х3 = 0. Тогда /A, 1, 0) = 0, о, = 2, aj=l, c3 = 0, и равенство B0) превращается в откуда С = — 4. Следовательно, /(*i, ^ хг) = ojc$4-fl<te-4cj 4- DolOA 4- ?с|. B1) Полагаем теперь х, = 1, ^=1, х3 — — 2. Получаем: /A, 1, —2) = 0, о, = 0, о2 = — 3, о3^ —2, и равенство B1) превращается в 0 = 108 4-4?, откуда Е = — 27. Следовательно, Далее, полагаем jicj = 1, лг2=1, лг3=1. Получаем: /A, 1, 1) = 0, Ol = 3, o2 = 3, о3= и 0 = 81 4-27S— Ю8 4-9D — 27, или Затем, полагая ^ = 1, лгй = 1, >г3 = —1, получаем: /A, 1, —1) = 0, о, = 1, с2 = — 1, о3=—1 0=1—64-44-^ — 27, или В — D = — 22. B3) Решая систему уравнений B2) и B3), находим без труда, что ? = — 4, ?=18.
КОЛЬЦО МНОГОЧЛЕНОВ ОТ НЕСКОЛЬКИХ НЕИЗВЕСТНЫХ 261 Итак, окончательно / (*„ xt, х3) = о\о\ — 4о*о3 — 4а» + 18О1оЛ - 27о*. В случае неоднородного симметрического многочлена мы реко- рекомендуем разбить многочлен на сумму однородных симметрических многочленов и каждый из таких многочленов выражать через основ- основные симметрические многочлены так, как это было сделано в только что рассмотренном примере. Существует, впрочем, и много других способов выражения сим- симметрических многочленов через основные симметрические много- многочлены; некоторые из этих способов читатель найдёт в книге А. К. С у ш к е в и ч, Основы высшей алгебры, изд. 4-е, Гостех- издат, 1941. Несмотря на большое разнообразие способов выражения сим- симметрических многочленов через основные симметрические много- многочлены, имеет место следующая Теорема о единственности выражения симметри- симметрических многочленов через основные симметриче- симметрические многочлены. Всякий симметрический многочлен выра- выражается единственным образом в виде многочлена от основных симметрических многочленов. Мы опускаем доказательство этой теоремы'). Очевидно, что все основные результаты настоящего параграфа остаются в силе и для симметрической алгебраической дроби. А именно, всякая симметрическая алгебраическая дробь f{.Xlt...,Xn) g(xu...,xn) от п неизвестных над полем Р может быть выражена в виде алге- алгебраической дроби от основных симметрических многочленов alt o2, о3, ..., оп над тем же полем Р: f(Xi,...,Xn)_ у К ..., а„) g (х„..., хп) ф К..., с„) ' где q>(a1 о„) и ^(°ц •-•! ап) — многочлены от о„ ..., о„ над Р. § 14. Некоторые приложения теории симметрических многочленов Ещё в элементарной алгебре приходится встречаться с задачей уничтожения иррациональности в знаменателе. Здесь мы рассмотрим эту задачу в полном объёме для случая числового поля. ') Её доказательство можно найти в учебниках по высшей алгебре, на- например в учебнике Куроша ['] или в учебнике Окунева ['].
262 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Пусть — некоторая алгебраическая дробь от х над числовым полем Р, е?{х)— некоторый многочлен я-й степени над полем Р и Ь1 6П — комплексные корни многочлена <р(х), причём пусть Ь1 6П не являются корнями g(x). Задача уничтожения иррациональности в зна- знаменателе заключается в следующем: требуется преобразовать дробно- рациональное выражение ) Ж) A) так, чтобы оно оказалось равным целому рациональному выражению от 6j с коэффициентами из того же поля Р: где k (х) — некоторый многочлен над Р. Мы предлагаем вниманию читателя два решения этой задачи. 1) Умножим числитель и знаменатель дроби A) на Получим: Мы видим, что в качестве знаменателя получился симметрический многочлен FF,, ... , ^n) — g(^i)g(^)...g(bn) от 0„ ... , &„. Следо- Следовательно, согласно основной теореме теории симметрических много- многочленов FF, 6П) можно выразить в виде многочлена над Р от основных симметрических многочленов о„ о8, ... , о„. Отсюда в силу формул Вьета F(blt ..., 6„) будет выражаться и через коэффи- коэффициенты многочлена ср(х), т. е. если 9 (х) = хп + а,^"-1 + ... + ап, то F(%, ... , 0„) = Я(а, ап), где Я(а, ап) — многочлен от а,, а2, ... , ап над полем Р. Но аь а2, ... , а„ суть числа из поля Р. Значит, и FFj, .... 0п) = //(а, а„) является некото- некоторым числом b из Р. Таким образом, Остаётся /(^i)^"F2)...^rFn) выразить через Ьг. Для этой цели рассмотрим: g @8) jg- F3)... g FЛ). Произведение
КОЛЬЦО МНОГОЧЛЕНОВ ОТ НЕСКОЛЬКИХ НЕИЗВЕСТНЫХ 263 является, очевидно, симметрическим многочленом от 62 6„. Следовательно, произведение B) можно выразить через основные симметрические многочлены 6п-16я> от 62, ... , 6П. В свою очередь о,, os, ... , ол_, можно следующим образом выразить через 6, и основные симметрические многочлены °i> °2 о„ от 6„ ... , 6„: о,=о, — 6„ °2 = °2 ^1°1 == °2 ^1 (°1 %) == °2 °1^1 ~Ь ^i> о3 = о3 _ О.о; = о, — 0, (о, - о,6, + 0J) = о3 — о26, + з.б* _ 0J и т. д. Но по формулам Вьета Следовательно, о, = — а, — 6„ og = aa-f-Oi6i + 6', о3 = —а3 — а2в,—afi\—6J и т. д. Итак, мы видим, что g(^) ... ?F„) можно выразить через 6, и коэффициенты а„ ... , ап многочлена <р (дг), т. е. где А F,) — многочлен от 6, над Р. Отсюда мы освободились от иррациональности в знаменателе. Пример 1. Дана дробь 1 1+6 • где G — корень уравнения Xs — 2х — 2=0. Освободиться от ирра- иррациональности в знаменателе. Умножаем числитель и знаменатель дроби на A -|-6e)(l +OS), понимая под 62 и 63 остальные два корня рассматриьаемо! о урав- уравнения: 1 о +ад A + 63) 14-е iHeji где 6, = 0.
264 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Обращаемся к симметрическому многочлену F@lt е2, e^=(i + eI)(i + ea)(i + eB)= = W, + F,6, + 6,63 + 0263) + F, + 62 + 63) + 1 и выражаем его через основные симметрические многочлены. Имеем: вАв, = ов, 6,62 + 6,63 + 6863 = о8, 6, + 62 + 63=о,. Отсюда F@,, 62, 63) = о3 + о2 + о, + 1. Но по формулам Вьета имеем в данном случае, что о, =0, о2 =— 2, о3 = — (—2) = 2. Следовательно, FF,, 62, 63) = 2 — Таким образом, Остаётся всё выразить через 6 = 6,. Пишем: е8е3=о2—б,е8—б,е3=о2—е, (б2 + е3)= = °8 — 6, (о, — 6,) = о2 — 0,6, + Ь\ или, так как о, = 0, о2 = — 2, о3 = 2: = — 6„ 6263 = —2 + 6=. Отсюда окончательно получаем, что 1 l+_=i _ 6,-2 + 6*=- i_e1 + ej=-i-e + e«. Пример 2. Избавиться от иррациональности в знаменателе дроби Здесь 6, = |/бесть корень уравнения дг3 — 5 = 0. Переписываем данную дробь так: 20!— 1 Умножаем, далее, числитель и знаменатель на F° + 4) F^ + 4): 26,-1 _ Be1 F?+ 4) F1+ 4) F1+ 4) • *) Этот пример легко решить, умножив числитель и знаменатель па У52 — 4]/5 + 16; мы хотим, одпако, продемонстрировать общий приём, указанный выше.
КОЛЬЦО МНОГОЧЛЕНОП ОТ НЕСКОЛЬКИХ НЕИЗВЕСТНЫХ 265 Симметрический многочлен FFlt e8> ев)=(в; следующим образом выражается через основные симметрические многочлены: Так как в данном случае о, = 0, о2=:0, о3 = 5, то F F„ 6„ 63) = и потому Выражаем ^ + ^ 6^ + 6Ю+ 16 через Oj, o2. Так как КК=(W=°^ р, + в;=(в„ + е3J - 2вявв=о^ - то (е1 + 4) Fа3 + 4) = о= + 4 (of — 2о8) + 16. Наконец, принимая во внимание, что о1== —а, —в1== —6It о„ = ав +0,6,+ 61 = 6;, находим, что = ej — 46J+16 = 56, — 46J4- так как 6^ = 5. Итак, ^-^-=^Bб1—1)Eвж —46J+16) = _ 1461 + 276! —56 ~~ 89 или 2) Второе решение задачи об уничтожении иррациональности в знаменателе основано на использовании алгорифма Евклида и заключается в следующем. Так как Gj — корень многочлена <р (х) над полем Р, то 6 является числом, алгебраическим относительно Р. Но ещё в § 10 мы
256 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ установили, что в случае такого 6, дробь /(В.) где /F,) и g F,) ф 0 — произвольные многочлены от 6j над Р, мо- может быть приведена к целому рациональному выражению от 6j с коэффициентами из Р: где А F,) — некоторый многочлен от bt над Р. В том же § 10 был указан метод нахождения многочлена h{bt). Отметим, что в этом методе существенно, чтобы многочлен <р (х) был неприводим в поле Р. Пример 3. Освободиться от иррациональности в знаменателе дроби е. ва+1 » где 6, — корень уравнения <р(лг) = лгв-—2х— 2=0. Здесь g(x) = = дгЦ- 1 и многочлен ср(х) неприводим в поле рациональных чисел. Многочлен ср(х)=хь—-2х — 2 при делении на g\x) = x-\-1 в частном даёт q(x) = xi—jcs-|-jc2 — х—1, а в остатке г(дг) = = —1. Таким образом, 9 (¦*)=* С*) ?(¦*)—1- Отсюда g(x)q(x)-9(x)=l. Полагаем в последнем равенстве дг = 6,: Следовательно, ^F!) = -—. и потому Так как 6, есть корень уравнения дг" — 2дг—2 = 0, то 6J = 26,-f-2, в силу чего Симметрические многочлены находят также применение и в ре- решении алгебраических уравнений. Пусть <р (х) = хп-\- а,*" + а2^п-2 +... + ап = 0 C) — уравнение «-й степени с комплексными коэффициентами и 6, 0„ — корни этого уравнения. Рассмотрим некоторое целое рациональ- рациональное выражение н=/(в„ е2 о„) над полем рациональных чисел от корней Glt 02, ... , 6„. Будем про-
КОЛЬЦО МНОГОЧЛЕНОВ ОТ НЕСКОЛЬКИХ НЕИЗВЕСТНЫХ 267 изводить всевозможные перестановки корней 6,, 68 6Л; при не- некоторых перестановках 6„ 62 6П и может не измениться, а при других перестановках 6„ ... , 6П и может измениться. Пусть при этих перестановках и принимает т различных значений: и, ==и, м2, ... , пт\ очевидно, что 1 =? т =? п. Составим следующий много- многочлен: где От перестановки 6Ь 68, ... , 6П многочлен ^(аг) не может изме- измениться, может произойти лишь перестановка линейных множителей х — и,-. Отсюда ясно, что коэффициенты gt многочаена g(x) являются симметрическими многочленами корней 0,, ... , 6П. В силу этого коэффициенты gt будут выражаться через коэффициенты данного уравнения C): g. = h. («! ап), где Л,-(а,, ... , я„) — многочлен от а„ ... , ап над полем рацио- рациональных чисел. Уравнение g (X) = (Х— Щ) (X — Щ) ... (X — 11т) = называется резольвентою или разрешающим для уравнения C). В некоторых случаях удаётся с помощью соответствующего разрешающего уравнения свести решение данного уравнения C) к решению уравнений более низких степеней. В качестве иллюстра- иллюстрации рассмотрим следующий пример: Пример 4. Обратимся к уравнению четвёртой степени 0 D) и обозначим его корни через 0,, 62, 63, 64. В качестве и мы возьмём и= е3е4. Легко видеть, что и при всевозможных перестановках корней 6,, 62, 63, 64 принимает только три различных значения: И, =0 = 6,61 + 6,04, Ив = 61в,+ вя6|, «3 = 6,64+6,63. Таким образом, разрешающее уравнение g(x) = 0 будет третьей степени. Найдём его коэффициенты glt git gA. С помощью сравни-
268 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ тельно несложных вычислений находим: gv = а,и2 + и,н3 + щщ = ata3 — 4a4, g3 = и^щ = flj + a^j — 4a2a4. Следовательно, разрешающим уравнением будет: л;3 — а2л:2 + (а^з — 4а4) л: — (а\ + я*я4 — 4я2а4) = 0 *). Теперь стоит только найти корни аи щ, щ разрешающего урав- уравнения, и мы легко определим корни данного уравнения D). В самом деле, для щ имеем: 6i62 + 6364 = и,, 6j62 • 6364 = а4, откуда видно, что 6,62 и 6364 являются корнями квадратного урав- уравнения xi — u1x~\-al = 0. E) Далее, на основании формул Вьета 6i6263 + бДбд -f- 6,6364 + 626364 = — а3 или е,е2 @,+е4) + б3е4 F, + е2)=- а,. Отсюда, обозначая корни 6,62 и 6364 уравнения E) соответственно через а и р, получаем следующие два соотношения для 6t -f- 62 и е3+е4: F, + 62) + F3 + 64) = - alt р F, + 62) + а (в, + 64)=- ав. Из этих соотношений без труда находим, что Следовательно, 6j и 62 являются корнями квадратного уравнения а 63 и 64 — корнями квадратного уравнения *) Это уравнение совпадает с разрешающим уравнением C), построен- построенным по способу Феррари (стр. 221), если положить х = 2у.
Г Л А В A 111 О РЕШЕНИИ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ В РАДИКАЛАХ § 15. Подстановки В настоящей главе мы покажем, что алгебраические уравнения выше четвёртой степени вообще нельзя решить в радикалах. Однако для этой цели нам придётся предварительно познакомиться с поня- понятием подстановки, с понятием, представляющим также и самостоя- самостоятельный интерес. Пусть а1г а2, ... , ап A) — некоторая совокупность п элементов. Что собой представляют эти элементы, нас не интересует. Подстановкой и-й степени элементов A) называется такая за- замена каждого элемента а,- некоторым элементом ау- той же сово- совокупности. A), при которой различные элементы переходят также в различные элементы. (В частности, тот или иной элемент а1 мо- может быть заменён самим собою, т. е. может быть оставлен без изменения.) Обычно подстановку /z-й степени записывают следующим образом: /«1 «« из ••• а ~W а/а ан ••• a Здесь под элементами аи а2, ... , ап первой строки находятся соответственно элементы а,^, я,-2, , ain второй строки. Это озна- означает, что at заменяется элементом а,-,, а8 — элементом а<а, ... , ап—- элементом а1п. Например, fa, aq а, аЛ S=( ' 2 3 4 B) есть подстановка четвёртой степени элементов аи а2, а3, с4. Мы здесь видим, что под элементом Oi первой строки находится эле- элемент а3 второй строки. Это значит, что подстановка 5 заменяет
270 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ элемент а, элементом а3. Далее, из записи подстановки B) видно, что эта подстановка заменяет элемент а2 элементом а4, я3 — эле- элементом а1 и а4 — элементом а2. Условимся для упрощения писать вместо элементов а,, а2, ... , ап их номера и говорить о подстановках я-й степени нз п чисел 1, 2, ... , я. Так, например, вместо подстановки B) можно гово- говорить о подстановке /1 2 3 4\ 3 4 12 Введём теперь операцию умножения подстановок я-й степени. Для большей наглядности возьмём две подстановки чегвёртой степени: П 2 3 4\ /1 2 3 4> Посмотрим, что получится, если сначала применить подстановку 5 и затем подстановку Т. Подстановка 5 число 1 переводит в число 3, после чего 3 пере- переводится подстановкой Г в 4. Таким образом, при последовательном применении подстановок S и Т число 1 переводится в. 4: Далее, число 2 подстановкой 5 переводится в 1, после чего 1 под- подстановкой Т переводится в 2. Таким образом, при последователь- последовательном применении подстановок S и Т число 2 переводится в 2: 2-* 2, т. е. остаётся без изменения. Подобным же образом находим, что при последовательном применении подстановок S и Т число 3 пере- переводится в 1 и число 4 переводится в 3: 4-+3. Мы видим отсюда, что последовательное применение подстано- подстановок S и Т равносильно применению одной подстановки 4 2 13 Подстановку D) мы назовём произведением подстановок 5 и Т и обозначим через ST. Вообще произведением 5i5s подстановок St и 58 я-й степени называется такая подстановка я-й степени, которая равносильна последовательному применению подсгановок St и S.2.
О РЕШЕНИИ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ В РАДИКА ЧАХ 271 Легко убедиться, что умножение подстановок не подчиняется перемесгительному (коммутативному) закону. Например, произведе- произведение TS подстановок C) будет уже отлично от подстановки D) 2 3 4' 4 » 3 Относительно умножения подстановок справедлива следующая Теорема 26. Множество Sn всех подстановок п-й степени образует группу относительно операции умножения подстановок. Доказательство. Прежде всего покажем, что умножение подстановок подчиняется сочетательному закону: для любых трёх подстановок S^, 52 и 53 п-П степени имеет место равенство В самом деле, пусть а — одно из чисел 1, 2, , п и пусть подстановка St число а переводит в р, подстановка S2 число Р переводит в у и у подстановкою S3 переводится в 8. Тогда (S^) S3 будет о переводить в 8, так как S^ число а переводит в у, после чего S3 число у переводит в 8. Точно так же 5t (SA) переводит а в 8, так как St переводит а в р и SjSg переводит р в 8. Мы видим отсюда, что (S^S1,,) S3 и Si (S^Ss) производят одинаковую замену — они а переводят в 8. Следовательно, Теперь покажем, что среди подстановок л-й степени имеется подстановка, играющая роль правого единичного элемента. Для этой цели рассмотрим подстановку _/1 2 3. . .л\ /==\1 2 3. . .я]' носящую название тождественной или единичной подстановки. Не- Нетрудно проверить, что для любой подстановки л-й степени /1 2 3 ... п \ S=[ E) У*1 «2 «з • • • <*«/ выполняется равенство S7=S. Следовательно, подстановка / и будет правой единицей.
272 КОЧЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Наконец, покажем, что для каждой подстановки E) сущест- существует подстановка той же степени, играющая для 5 роль правого обратного элемента. Мы утверждаем, что такой подстановкой будет: /а, а2 . . . а„\ -[l 2 ...я'' Действительно, 1 переводится подстановкою 5 в а„ после чего 5" переводит а, в 1; следовательно, произведение 55' переводит 1 в 1. Подобным же образом убеждаемся, что произведение 55' переводит 2 в 2, 3 в 3, ... , и в и. Значит, 55' = /, что и требовалось по- показать. Подстановка 5' обозначается через 5 и называется обратною относительно 5. Группа 5„ всех подстановок /г-й степени обычно называется симметрическою группой л-й степени; она является некоммутатив- некоммутативной группой, так как вообще умножение подстановок не обладает свойством переместительности. Симметрическая группа 5„ состоит, очевидно, из л! подстановок, вследствие чего 5„ есть конечная группа порядка, равного я!. Всякая подгруппа G симметрической группы 5„ называется груп- группой подстановок л-й степени. Например, существует всего шесть групп подстановок третьей степени, а именно сама симметрическая группа 53 третьей степени; группа Gt, состоящая из трёх подста- подстановок: /1 2 3\ /1 2 3\ /12 3\ /=ll 2 з)' \2 3 1/' U 1 2/; группа G2, состоящая из двух подстановок: 'I 2 3\ /12 3\ 7"~"\1 2 3/' \2 1 3 группа G3, состоящая из двух подстановок: 2 3\ /1 2 Z 2 3}' U 2 1. группа G4, состоящая из двух подстановок: И 2 3\ /12 3\ ^12 3/' Vl 3 2/' наконец, группа GB, состоящая лишь из единичной подстановки /='12 Группу GB принято обозначать через Е и называть единичной группой.
О РЕШЕНИИ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ В РАДИКАЛАХ 273 § 16. О неразрешимости уравнений выше четвёртой степени в радикалах В настоящем параграфе мы увидим, что для всех алгебраических уравнений данной степени я^5 не существует общей формулы решения в радикалах. В § 10 было показано, что уравнение аох" + а,*" + ... + ап = 0 (а0 ф 0) A) тогда и только тогда разрешимо в радикалах, когда нормальное поле й = Д(а,, ... , о„) содержится в расширении Д(р1( р2> ... , pk), полученном путём присоединения к Д некоторых радикалов рх = уАи рг= V^2> ••• > Pft — V^-k' r#e А принадлежит Д, А2 принадлежит Д (р,), ... , Ak принадлежит Д (pj, р2, ... , р,^); при этом поле Д есть не что иное, как область рациональности уравнения (см. § 10). Мы можем всегда показатели пх, л2, ... , nk радикалов предпо- предполагать простыми числами. В самом деле, если бы встретился, напри- например, радикал *\/А, то мы его заменили бы тремя радикалами р' = -\[А, р"= -/р' и р'"==|Ур". В знак этого мы будем в дальнейшем пока- показатель радикала р,- обозначать не через л,-, а через pt и будем мол- молчаливо под Pi подразумевать простое число. Присоединим к Д первообразные корни />ги> /Vй» • • • > Pk~& степени из единицы и обозначим через К поле, получившееся в ре- результате такого присоединения: /f=A(e,, e2, ... , sk). Очевидно, что если уравнение A) разрешимо в радикалах, то его нормальное поле Q будет и подавно содержаться в расширении К(р1г р2,... , pft). Pir— Pkr — Однако часть радикалов pt= у Аи ..., рд = у Ak может оказаться лишней. А именно, если подкоренная величина A-t радикала рг = \fAi будет точной prli степенью в поле К (pi, ¦ ¦. , p,_i), т. е. если Л? = ар', где а — некоторый элемент из К (pi, р2,..., p,-_i), то в этом поле будут лежать все корни двучлена х ' — At, в силу чего радикал р,- будет лишним — его присоединение к полю ^(р^ р2, ... , р^) никакого расширения фактически не даст: K(pv р8, ... , Pi) = K(Vi, p2. ••• . p;-i)- Теперь докажем следующие леммы: Лемма 1. Если Аг не является точной ргй степенью в поле K(pi, p2, ..., p,-_t), то двучлен xPl — At неприводим в поле P Доказательство. Предположим противное, пусть этот дву- двучлен приводим в поле K(pv р2 p.--i): 18 Энциклопедия, ки. 2.
274 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ где ср(х) и <\>(х) — многочлены над полем K(plt р2. ••• > Pi-i)- Обо- Обозначим через е первообразный корень /?гй степени из единицы и через Go — какой-нибудь корень нашего двучлена. Тогда, как изве- известно, любой корень 6V двучлена найдётся по формуле Отсюда свободный член b многочлена <р(х) будет равен &=(—1Lx4 ••¦Ч=е'(-W Ч где e' = ev'+¦••+V и l=s;r<^«- Очевидно, что е' есть некоторый корень prPi степени из единицы. Возведём b в ргю степень: т. е. АЦ = {- Так как l=S/'<^/'j и Pi — простое число, то г и pt взаимно просты; отсюда существуют такие целые числа s и t, что rs-\-ptt=.\. Таким образом, получаем: At = А? + «* = А? Ар = (- 1 fWA**=[(- 1 fbsA\\\ т. е. At является точной /?,-й степенью в поле К (pj. рг. i Pj~i). что невозможно. Р1 _ f A Р1 _ Лемма 2. Если радикал рг = \f At не лежит в поле К(plf..., P/_t), то целая степень р™ тогда а только тогда лежит в поле AT(pt» ••• > Pi-t)» ^ог^а т делится на pt. Доказательство. Если т делится на pit то т =ptq, где ^ — некоторое целое число. Отсюда Но At и тем самым At лежат в поле /f(p,,... , pf_t). Следовательно, pf должно лежать в /('(р!, ... , р,-^). Обратно, пусть pf лежит в /f(pi, ... , р,-^), т. е. pf = a, где a — некоторый элемент /С(pi, ... , p,-_i). Обозначим через q частное и через г остаток при делении т на /?,-. Тогда мы можем написать, что m—ptq-\-r. Предположим, что остаток г отличен от нуля. В таком случае откуда в силу равенства рГ = а получаем, что Alpi = а или pi = b, где b = aATq — элемент поля К(ри ... , р,-^). Мы видим отсюда, что рг является одновременно корнем многочлена р(х) = хр' — Л,- и многочлена ср(х) = хг—Ь, в силу чего многочлены р(х) и <р(х) не взаимно просты. Но по лемме 1 многочлен р (х) неприводим
О РЕШЕНИИ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ В РАДИКАЛАХ 275 в поле К(ри .... р,_,). Следовательно, поскольку многочлены р(х) и qp (а;) не взаимно просты, ц> (дг) должно делиться на р (х). Но это невозможно, так как степень г многочлена ф (а;) меньше степени pt многочлена р(х). Поэтому предположение, что гф 0 неверно, т. е. т делится на pt. Лемма 3. Если уравнение A) разрешимо в радикалах, то каждый из корней уравнения можно следующим образом выразить через радикалы: а = "о + Рл + «2рл + • • • + Ир^рЯ*-», где р1 = [^А1, р2= УAit ... , рл= h/Ah (p-t— простые числа), Л,—элемент поля К\ А2— элемент поля K{pt) Ah — эле- элемент поля K(pi, ... , pA_t); К—расширение, получающееся путём присоединения к области рациональности Д уравнения первообраз- первообразных корней ?j, е2, ... , еА соответственно ргй, ..., pk-ft степени из единицы (k^h); ut — элементы К(ри р2, •••, Рл-i)- При этом pj не лежит в К, ... , рл не лежит в K(pv ... , ph_t) и а не лежит в #(Р2> Рз, ••• . Рл). К(р1г рз, .•• , рл), ... , K(pi, р2, ••• , Рл-2. Рл). ^.(Pi. Pa Рл-!)- Доказательство. Пусть а = Oj — один из корней уравне- уравнения A). Так как уравнение A) разрешимо в радикалах, то а будет содержаться в 2 = A(pj pA) и, следовательно, будет содержаться в одном из полей вида К (pi, р2, • ¦ • . Рл) (h^k). Отсюда следует, что о = а0 + а^л + а2рл + • • • + apjb-iP/T1' B) где at — элементы поля ^(р^ р2, ... , рл-i)- Мы можем предполо- предположить, что pj не лежит в К, р.2 не лежит в K(pt), , Р/, не лежит в K(plt ..., рЛ_,) и о не лежит в K(plt .... ры, р,+1, •••, Рл) (/=1, 2, , /г). В самом деле, если бы имело место иное, то в выражении B) некоторые радикалы р; можно было бы опустить. Покажем, что при соответствующем выборе радикала рЛ вели- величина at может быть сделана равной единице. Действительно, все av ... , пр.-х в правой части равенства B) не могут равняться нулю, так как в противном случае о лежало бы в K(plt p2, ... , pA_i). что невозможно. Поэтому пусть агф0 О^^^/^л)- Тогда полагаем: а*Рл = РЛ. Так как числа / и ph взаимно просты, то существуют такие целые числа s и t, что sl-\-tph=\. Легко видеть, что s не делится на ph: если бы s делилось на ph, то, очевидно, и sl-\-tph делилось бы на ph, вследствие чего и 1 делилась бы на простое число ph, а это невозможно. Возведём рл в s-io степень: откуда 18*
276 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ где v = Af,ais—элемент, лежащий в /f(pj рл-i)- Очевидно, что рл не лежит в /f(plf ... , pA_t); в противном случае рЛ = г'рл* и подавно лежало бы в K(f>\, ••• , Рл-i)- Таким образом, мы можем вместо рд взять в качестве /г-го радикала рл- Заменяя в равенстве B) радикал рЛ его выражением через рл и принимая во внимание, что а*Рл = рл, получаем: a=a1=a0+a1v?'h'+ati?t?+ • ¦ ¦ +Р*+ • • • + «^-Х* Р**"*'- C) В равенстве C) все степени pJ,w(v = O, 1, ... , ph—1) между собой различны. В самом деле, если бы р^р?" (v,>vB), то pa<V| ~Va)s= 1, откуда по лемме 2 (v, — v2)s делилось бы на ph, т. е. Vj—v2 делилось бы на ph, так как s не делится на простое число ph. Но Vj — Vjj не может делиться на ph, так как 0 <^ va — v2 <^ph. Следовательно, при Vj ф v2 степени p^1* и р'ьа* различны. Пусть, далее, q — частное и г — остаток при делении vs на ph. Тогда РЛ =(рЛ Л^ РЛ =*рА, где b = (p'p/l)9 — элемент поля К(ри р2, ..., рл^)- Очевидно, что при изменении v от 1 до ph — 1 остаток г будет в той или иной последовательности принимать ph—1 различных значений 1, 2,... ... , ph—1. Отсюда равенство C) принимает следующий вид: а = Щ + рл + и2рл + • • • 4 *Ph-#T~%' т. е. вместо Й! получилась единица. Лемма 4. Если уравнение A) разрешимо в радикалах р„ р2, ... ... , pft с показателями pv p2 pk, то радикалы р,- являются целыми рациональными функциями корней уравнения A) над по- полем К, где К имеет тот же смысл, что и в лемме 3. Доказательство. Пусть а = at — какой-нибудь корень урав- уравнения A). Согласно лемме 3 мы можем написать, что о = о1= щ + рл 4- нврЛ + ... + иРН_, р?л~\ D) причём р; не лежит в поле K(pt, p2 р^) и о не лежит в поле Phr — р,-_!, р,- +1 рЛ)(г= 1,2,..., А). Так как рд= / Ah не лежит в поле K(pi, р2,..-, Рл i). то по лемме 1 двучлен xPh—Ah неприводим в поле K(pi, р2, •.., рл-i)- Принимая это во внимание, подставим в уравнение A) вместо X выражение D) корня а. Тогда в левой части уравнения получится относительно рЛ многочлен, степень кото- которого с помощью равенства р^Л = Лд можно понизить до ph—1:
О РЕШЕНИИ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ В РАДИКАЛАХ 277 где Bt лежат в К (pi, р2, ... , р^). В силу неприводимости двучлена xPh — Ah в поле K(pi, р2, ..., рл^) последнее равенство может иметь место только тогда, когда B0 = Bt = .. , = BPh_1=0. Таким образом, это равенство будет осуществляться для любого корня двучлена дгРЛ — Ah. Следовательно, » «о + ейр* +... + «Pft_, 4 <**-> pflf-i E) (l» = 0, 1, ... , ph—l) есть также корень уравнения E). Умножим теперь каждое из равенств E) на е/,^4 и сложим почленно (l^v^ph—1). После некоторых упрощений у нас получится: РА-1 РА-1 ел^Чч.!, рн1Цр1= ? ел~^\ы (v = 2, ... ,ph— 1), откуда РЛ —1 Pft —! РА — ' Рл~/>д Zj л 'ч-1' т. е. рд и м., лежат в /f(ai( ... , <х„). Таким образом, величины Лд = рлЛ и hv по только что доказанному являются целыми рациональными функциями корней се,, .... а„ над полем К, а с другой стороны, выражаются через радикалы pt,— ..., рй_,. Введём для этих величин с целью сокращения письма единое обозначение pv. По меньшей мере одна из величин pv должна содер- содержать радикал рД-1. Если бы это было не так, то в выражении D) корня а через радикалы можно было бы рд,1 опустить, вследствие чего мы имели бы, что корень а лежит в K(pt, ¦¦• , рл_2. Рл)> что невозможно. Пусть $t содержит ph_v Напишем выражение вели- величины р, через радикалы: $l=v0~\~vl?h-i Так как Pt есть целая рациональная функция корней а^ .... ап над К: то мы можем в выражении г(а„ ..., а„) произвести всевозможные перестановки корней ajt в результате чего получим я! значений: Oj = рр G2, ..., Gn!. Составим уравнение
278 КОЛЬЦО МНОГОЧ1ЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Очевидно, что коэффициенты этого уравнения суть симметрические многочлены от о,, <х2, ... , о„ над полем К\ поэтому g(x) есть многочлен над К. Итак, мы видим, что р, есть корень уравнения G), разреши- разрешимого в радикалах. Согласно лемме 3 в выражении F) можно принять ©,== 1: Повторяя относительно pt те же рассуждения, что и для av полу- получаем, что рд_1 и v</ лежат в /Г(а,, ... , о„). Далее, вводим для величин рЛ-1 и i»v единое обозначение yv. По меньшей мере одна из величин у„, например Yif должна содержать радикал рЛ_2. Повторяя для Yi рассуждения, аналогичные тем, кото- которые мы провели для р„ получим, что рЛ_2 лежит в К(а1г ..., <х„) и т. д. В конечном счёте мы дойдём до радикала pj и покажем, что он лежит в K{a.lt ... , ап), и этим завершим доказательство леммы. Лемма 5. Пусть 2"=/?(е„ .... ek)—расширение, получа- получающееся путём присоединения к полю R рациональных чисел перво- первообразных корней sv ... , ek, соответственно рх-й, р2-й, .... рк-й степени из единицы. Тогда всякое рациональное соотношение над полем Т: ^2 х„, о„ о2, ... , о„) = 0 (8) между независимыми переменными хи ... , хп и основными сим- симметрическими многочленами о1з о2, , <зп от этих переменных остаётся в силе при любой перестановке переменных: */ х,п, ои о2, ... , о„) = 0, (9) где iu /2, ... , 1п — произвольная перестановка чисел 1, 2, ... , п. Доказательство. Для произвольной системы значений пере- переменных х1 = а1, ... , хп — ап (а,- — любые комплексные числа) пусть а1=р1, , <зп=^рп. Тогда согласно условиям леммы ?(а1. а2 а„. Pi. Pi. •¦• , Рп) = °- Полагая, далее, _#, = «,•,, лг2 = о,-8, ... ,хп = а1 , мы при этих зна- значениях переменных будем иметь, очевидно, те же значения at=pv , anz=zpn основных симметрических многочленов. Таким образом, мы можем в соотношении (8) положить x1=all, лг2 = = о,а, ..., хп = а1п, о1=р1 °п—Рп' в результате чего получим: a«V ••• • av Pi, Pi, •¦• , Р„) = 0. Отсюда в силу произвольности чисел о,, о2, ..., ап следует, что 9tai> xlt, ... , х-ы, о,, ... , о„)=0.
О РЕШЕНИИ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ В РЛДИКЛЛ\Х 279 Замечание. Переход от соотношения (8) к соотношению (9) можно, очевидно, осуществить с помощью подстановки '1 2 ... t, h ¦¦• ln Мы можем, следовательно, сказать, что соотношение (8) не нару- нарушается при любой подстановке симметрической группы Sn п-й степени. Теперь мы вплотную подошли к известной теореме о не- неразрешимости алгебраических уравнений выше четвёртой степени в радикалах. Теорема Руффин и-А беля. Для алгебраических уравнений заданной п-й степени не существует общих формул, выражающих каждый корень уравнения через радикалы, когда п ^5. Доказательство. Предположим противное — пусть какой- нибудь корень хх произвольного алгебраического уравнения (_ 1 )"on = о степени п ^5 выражается через радикалы по общей формуле •Ki = '4Pi> ••• » Рл> °i» °2. ••• . °п)> где r(pu~. • •, р/,, <?„ о2,... , о„) — рациональная функция от р, рЛ, <3у о„ над полем T = R(e1, s2 ek), не зависящая от выбора уравнения; е,-, как и выше, означает первообразный корень /?,-й сте- степени из единицы. В силу произвольности алгебраического уравнения мы можем его корни xt, ,xn рассматривать как независимые пере- переменные. Согласно лемме 4 радикалы рг должны быть целыми рацио- рациональными функциями от xlt ... , хп над полем К= Д (ej, .... ek)*) или, что то же, рациональными функциями от х, хп, о„ ... , оп над полем Т: pl = ri(x1 хп, <?! о„), A1) причём, поскольку формула A0) является общей для всех алгебраи- алгебраических уравнений заданной степени п Э=5, выражения Г, (xlt ... , Хп, а1г ... , о„) также не должны зависеть от выбора уравнения заданной степени п. Рассмотрим подстановку ' 1 2 3 4 5 6 ... п\ \2 3 4 5 1 6 Она переводит корень хг в лг2, лг2 в х3, х3 в xit jt4 в Л"8 и xs в хи а остальные корни (при «^>5) оставляет неподвижными. Будем обозначать через Ht выражение, получающееся из некоторой рациональной функции Н от х1г ... , хп, о„ ..- , оп над полем Т *) Д = R(olf <sit ... , <:„).
280 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ в результате применения подстановки t л-й степени. Покажем, что от подстановки s величина первого радикала не меняется. Так как pj^г, (х{, ..., х„, аи ... , оп) = {/гАх и Ах есть рацио- рациональная функция над полем Т от о1( о2, ... , оп, то равенство можно рассматривать как рациональное соотношение между хи ... , хп, о1? , ап над полем Т; таким образом, это соотношение по лемме 5 не нарушится после применения подстановки s: или, так как (pPl)s = (pis)Pl и Als = Av имеем: т. е. p,s оказалось также корнем ptrR степени из At. Отсюда p1s=slp1, где v — некоторое целое неотрицательное число. Далее, p1sm = (p1s)sm~1 = e11(p1sm~1)= ... =e™vpv Но s*^I, где /—еди- /—единичная подстановка. Следовательно, p1s" = p1 = e^vp1, откуда e^v = l. Теперь обратимся к подстановкам /1 2 3 4 5 6 ... п\ /12 3 4 5 6... л\ t=\ I и и = | . \1 2 4 5 3 6 ... п) \2 3 1 4 5 6 ... п) Легко видеть, что tu = s и ts = u3 = I. Рассуждая аналогичным обра- образом, получаем, что pi/ = efpi и р1и = е?р1, где ц. и X — некоторые целые неотрицательные числа и e*i = ejx=l. Отсюда 9ls = р, (tu) = ejf (р,и) = eif • e\Pl = ef + xPl, вследствие чего ej = e!^+x. А теперь получаем, что т. е. piS=pi—подстановка s оставляет радикал pj без изменения. Переходя к р2, затем к р3 и т. д., убеждаемся с помощью ана- аналогичных рассуждений, что все радикалы р^ р2, ..., рд не меняются от подстановки s. Наконец, обращаемся к равенству A0). Согласно равенствам A1) мы можем равенство A0) рассматривать как рациональное соотношение между xv ... , хп, at оп над полем Т. Таким образом, в силу леммы 5 равенство A0) не нарушится после при- применения подстановки s: x1s = r(p1s, ... , pns, 0j5, .... ans). Ho x1s = x2, ois=^al и по доказанному выше p1s = p1, ..., р„5 = р„« Следовательно, ( ••• • Pn> °t> •••> °n)> т. е. лг? = лг1, что противоречит независимости хи
О РЕШЕНИИ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ В РАДИКАЛАХ 281 § 17. Группа алгебраического уравнения Доказанная в предыдущем параграфе теорема Руффини-Абеля обнаруживает только то, что для всех алгебраических уравнений данной степени п ^ 5 универсальной формулы решения в радикалах не существует. Но отсюда ещё не следует, чго существуют уравнения с числовыми коэффициентами, которые нельзя решить в радикалах; ведь остаётся возможность того, что каждое уравнение может иметь своё особое решение в радикалах. Поэтому для более полного иссле- исследования вопроса о разрешимости алгебраических уравнений в ра- радикалах нам придется пойти дальше и изложить некоторые сведения, относящиеся к теории нормальных полей (нолей Галуа). Пусть =о A) — некоторое алгебраическое уравнение л-й степени над числовым полем Р. Мы будем предполагать, что комплексные корни уравнения A) различны '). Присоединим к полю Р корни с^, а2, ... , ап уравнения A). Мы получим поле Q = P(alt o2 ап), носящее название нормаль- нормального поля или поля Галуа относительно Р. В частности, когда Р есть область рациональности уравнения A), то Q называется просто нормальным полем или полем Галуа, слова «относительно Р» опу- опускаются (см. § 10, стр. 232). Введём теперь весьма важное понятие группы уравнения. Обо- Обозначим через G совокупность всех таких подстановок симметрической группы Sn корней уравнения A), которые, оставляя неподвижными элементы поля Р, не нарушают ни одно рациональное соотношение между корнями а1г ... , ап над полем Р. Покажем, что множество G образует группу относительно умножения подстановок. Для этой цели воспользуемся следующим предложением, извест- известным из теории групп: если М — конечное множество, то оно обра- образует группу относительно алгебраической операции, определённой в этом множестве и подчиняющейся сочетательному закону. Таким образом, нам надо показать, что умножение подстановок является для G алгебраической операцией, т. е. что умножение подстановок всегда выполнимо во множестве G. Возьмём две произвольные подстановки st и s2 из G. Пусть подстановка в! переводит некоторое соотношение гу (а,, ... , ап) = 0 между корнями уравнения A) в соотношение г2(а17 , ап) = 0, а подстановка s2 переводит г2(а,, ... , ап) = 0 в г3(а,, ... , ап) = 0. Тогда произведение s1si переведёт соотношение гх (а„ ... , оп) = 0 ') В противном случае мы отделили бы кратные корни. Об отделении кратных корней см, в книге Куроша ['] или в § 29 книги Окунеоа [*].
282 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РЛЦИОНЛЛЬНЫХ ФУНКЦИЙ в rs(alt ... , ап) = 0. Следовательно, произведение s,s2 не нарушает ни одно из рациональных соотношений между корнями уравнения A), в силу чего SjSj должно также принадлежать G. Так как G — конеч- конечное множество, то отсюда следует, что G образует группу. Эта группа G носит название группы Г-алуа уравнения A) над полем Р или короче группы уравнения A) над полем Р. В тех случаях, когда Р есть область рациональности уравнения, слова «над полем Я» обычно опускаются. Пример 1. Найдем группу квадратного уравнения **-\-px + q=0 B) с рациональными коэффициентами, имеющего два различных дей- действительных иррациональных корня at и а2. Очевидно, что в данном случае Р есть поле рациональных чисел. Далее, всякое рациональное соотношение r(alt а2) = 0 между корнями уравнения B) можно предполагать целым рациональным, так как at и а2 являются алгебраическими числами (относительно поля рациональных чисел). Кроме того, мы можем предположить, что в соотношение r(alt аа)^0 каждый из корней alt o2 входит со степенью, не превосходящей 1, так как в противном случае мы могли бы с помощью уравнения B) понизить степень соответ- соответствующего корня. Таким образом, соотношение r(alt o2) = 0 можно записать в виде /•(<*!, а2) = aa1ai -\- Ьщ -\- са2 -\- d — О (а, Ь, с, d — рациональные числа). Но по формулам Вьета а^^^д. Следовательно, полагая aq-\-d = m, имеем: /¦(<*!, а2) = Ьаг -f- са2 -)- т = 0. Так как а2 = — р — а,, то получается, что Если бы Ъ — сф§, то мы имели бы, что а1 = рс ~т , а это не- невозможно, так как aY иррационально. Следовательно, b — е = 0, в силу чего соотношение г(аи о2) = 0- принимает такой оконча- окончательный вид: г (а„ а2) = Ь (я, + вя) + т = 0. C) Соотношение C), очевидно, не нарушается (даже остаётся одним и тем же) при любой подстановке симметрической группы 52 второй степени. Следовательно, 52 и есть группа уравнения B). К понятию группы уравнения можно подойти и с несколько иной точки зрения. Назовём автоморфизмом нормального поля Q
О РЕШЕНИИ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ В РАДИКАЛАХ 283 уравнения A) относительно Р такой изоморфизм Q с самим собою, при котором каждому элементу а из Р ставится в соответствие тот же самый элемент а, т. е. при котором элемент а остаётся без изменения. Условимся автоморфизмы в отличие от подстановок обозначать большими латинскими буквами, чаще всего последними буквами латинского алфавита. При этом если какой-нибудь авто- автоморфизм 5 переводит элемент to поля Q в элемент <о', то мы будем записывать это обстоятельство в форме равенства <oS=c/. Введём теперь понятие умножения автоморфизмов поля Q. Пусть Si и 52 — два произвольных автоморфизма поля 2 и пусть (t>Sl = to', to'S2 = <°"» Тогда соответствие <о->-<о" будет взаимно однозначным и при этом соответствии % -j- <о2 —»- <о" -j- <о'2', <Oj<o2 —*- <e"o>j, а элементы из поля Р не будут изменяться. Короче говоря, это соответствие будет авто- автоморфизмом поля Q; мы его обозначим через S^Sj и назовём произ- произведением автоморфизмов Si и 52. Покажем, что множество Н автоморфизмов нормального поля образует относительно введённой операции умножения груп- группу, совпадающую с точностью до изоморфизма с группой G уравнения A). Возьмём какое-нибудь рациональное соотношение г (ах,..., ап) = О над Р между корнями уравнения A) и посмотрим, что произойдёт с этим соотношением при автоморфизме 5 нормального поля Q.' Так как автоморфизм 5 сохраняет алгебраические операции поля Q и не изменяет элементы поля Р, то автоморфизм 5 переведёт со- соотношение г(а„ ... , ап) = 0 в соотношение r(at5, ... , ап5) = 0. Далее, так как о,- — корень уравнения A), то /(а,-) = 0. Очевидно, что автоморфизм 5 равенство /(<х/) = 0 переведет в /(о,-5) = 0. Мы видим, что о,-5 есть корень уравнения A), т. е. aiS=ctj.. При этом, если i ф k, то a{S ф akS, так как 5 является взаимно однозначным соответствием. Таким образом, автоморфизм 5 вызывает некоторую подстановку 1 2 ... п\ J корней уравнения A), переводящую соотношение г(ах an) = 0 в соотношение г (а^ а,- ) = 0. Иными словами, автоморфизм 5 вызывает подстановку s группы G уравнения A). Поставим эту подстановку s в соответствие 5: S-+S. D) Покажем, что соответствие D) является изоморфизмом между мно-- жеством Н и группой G.
284 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Пусть Т—ещё один автоморфизм поля Q и пусть Т соответ- соответствует та же подстановка s, что и автоморфизму 5: T-+S. Любой элемент ш из 2 есть многочлен ог а^ ... , Поэтому »S=/(a1S, ... , anS)=f(ah a, Так как ш — произвольно, то отсюда вытекает, что S^T. Лэгко, далее, убедиться, что для всякой подстановки s из О можно указать автоморфизм Анормального поля Q такой, что 5—>-s. В самом деле, если \h к • • • то подстановка s переведёт произвольный элемент ш=/(а, ап) из 2 в элемент ш'=/(а/1, ... , а. ). При другом выражении u> = g (а„ ... , а„) элемента to через корни уравнения A) подстановка s переведёт to в тот же самый элемент to'. Это следует из того, что рациональное соотношение /(ai а„) = ?(а1. ... , а„) между корнями уравнения A) не должно нарушаться вследствие под- подстановки s группы G. Таким образом, подстановка s вызывает соот- соответствие <o-W, E) не зависящее от способа выражения элемента to через корни урав- уравнения A), причём, очевидно, что если а — элемент поля Я, то а-+а. Возьмём теперь другой элемент 6 из Q. Если б —*- to', то обратная подстановка s будет переводить один и тот же элемент ш' в раз- различные элементы to и б, что невозможно, так как мы только что убедились, что всякая подстановка группы G, в частности s'1, должна, независимо от способа выражения элемента to' через корни уравнения A), переводить ш' в один и тот же элемент. Стало быть, соответствие E) является не только однозначным, но и взаимно однозначным. Наконец, для произвольного ш' можно указать такое ш, что to -»- ш'. Именно, таким элементом ш будет элемент, получающийся из to' в результате применения обратной подстановки s. Итак, мы убедились, что соответствие E) есть не что иное, как взаимно однозначное отображение поля Q на самого себя, оставляющее элементы поля Р неподвижными. Покажем, что соответствие E) и будет искомым автоморфизмом 5. Действительно, если ш-^-to' и б -»-6', то подстановка s переведёт сумму to-j-6=/(a,, ... , а„)-|-?(а„ ... , а„) в /К,.... ««•„) + ? К
О РЕШЕНИИ \ЛГЕБРАИЧЕСКИХ УРАВНЕНИИ В РАДИКАЛАХ 285 в силу чего to-|-G-»-to'-j-e'. Точно так же убеждаемся, что tuO-»-to'e'. Все эти рассуждения показывают, что соответствие D) есть взаимно однозначное соответствие между множествами Н и G. Остается проверить, выполняются ли для соответствия D) условия изоморфизма. Пусть h • ¦ - JJ Тогда для произвольного элемента to=/(a1; , о„) из Q получаем: miST)==(mS)T=f(all, ... t aln)T=f(ah, ... , «,„) = <«'. Мы видим отсюда, что элемент to' получился из элемента to с по- помощью подстановки С2 ¦¦¦:)=* Следовательно, ST-+st. Итак, Н и О оказались изоморфными. Благодаря этому обстоя- обстоятельству мы можем не отличать G от Н и в случае надобности понимать под группой уравнения A) группу автоморфизмов его нормального поля 2. Так как группа автоморфизмов Н зависит лишь от поля Q, то мы будем иногда G (и И) называть группой нормаль- нормального поля Q. Прежде чем переходить к дальнейшему изучению группы урав- уравнения, отметим некоторые свойства нормального поля Q и алге- алгебраических расширений. Теорема 27. Всякий элемент to нормального поля Q является корнем некоторого многочлена, неприводимого над Р. Д о к а з а т е'л ь с т в о. Поскольку ш — элемент поля Q, он выра- выражается в виде многочлена от корней уравнения A) над Р: Подвергая /(a,, ..., ап) всевозможным подстановкам симметрической группы Sn, мы получим п\ элементов поля Q: Составим вспомогательное уравнение =(х—е.) (х—е8) ... (х—ев!)=о. На основании основной теоремы о симметрических многочленах нетрудно установить, что g(x) есть многочлен над Р. Вместе с тем g (x) имеет в качестве одного из корней to. Очевидно, что ш также будет корнем одного из неприводимых (в Р) множителей много- многочлена g{x), и теорема доказана. Теорема 28. Если корень ш многочлена р (лг), неприводимого в Р, лежит в нормальном поле Q, то и все корни р (х) лежат в Q.
286 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Доказательство. Как и выше, строим вспомогательный много- многочлен g(x) над Р, имеющий to своим корнем. С одной стороны, все корни многочлена g(x) лежат в поле Q. С другой стороны, g(x) имеет с многочленом р (л:) общий корень to и потому в силу непри- неприводимости р (х) делится на р (х). Но в таком случае корни р (х) должны войти в состав корней g(x). Отсюда следует, что корни р (х) должны лежать в Q. Теорема 29. Если нормальное поле Q изоморфно отобра- отображается на некоторое промежуточное поле А (Я'сгд ей) так, что элементы Р остаются неподвижными, то Д = 9. Доказательство. Прежде всего легко убедиться, что нор- нормальное поле Q образует векторное пространство над Р относительно операций сложения элементов Q и умножения элемента Q на элемент поля Р. В самом деле, любой элемент нормального поля ?}=Р(аи ,ап) является многочленом от а,, ... , а„ с коэффициентами из Р. Склады- Складывая два таких многочлена, мы, очевидно, получим снова многочлен от а1у , ап с коэффициентами из Р. Точно также умножая много- многочлен от аи ... , ап с коэффициентами из Р на элемент поля Р, мы получим снова многочлен от аи , ап с коэффициентами из Р. Кроме того, выполняются и те требования, которые в опре- определении векторного пространства были сформулированы в виде аксиом I — V (см. стр. 42—43). Очевидно, что промежуточное поле Д относительно тех же операций будет подпространством пространства 2. Далее, легко показать, что Q — конечномерное пространство. Действительно, поскольку at(i=\, 2, ..., п) является корнем алге- алгебраического уравнения A) я-й степени, любая степень о* с показа- показателями k^zti будет линейно выражаться через низшие степени а,-°=1, а,- а" . Поэтому каждый элемент а нормального поля Q можно выразить в виде многочлена от а,, ... , ап над Р, содер- содержащего а,, , ап с показателями, не превосходящими п — 1. Таким образом совокупность произведений aj aj ... ар с показателями kj, lj, ... , sj, не превосходящими п—¦ 1, образуют конечный базис про- пространства Q, в силу чего Q конечномерно. Теперь мы можем доказать нашу теорему. В теории вектор- векторных пространств доказывается, что конечномерное пространство нельзя изоморфно отобразить на собственное подпространство так, чтобы элементы Р оставались неподвижными. Следовательно, Д не может быть собственным подполем й и потому Д = 2. Введем весьма важное понятие продолжения изоморфизма. Оно понадобится при изучении дальнейших свойств группы уравнения. Пусть К и К—два изоморфных кольца (числовых или нечи- нечисловых, безразлично), А — расширение кольца К, а Д — расширение кольца 1С. Пусть Д и Д также изоморфны. Мы назовём изоморфизм
О РЕШЕНИИ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ В РАДИКАЛАХ 287 Дс^Д1) продолжением изоморфизма К~К, если всякий элемент а кольца К, отображающийся при изоморфизме К=К на а, при изоморфизме Д = Д попрежнему отображается на а. Пример 2. Возьмём в качестве К поле всех действительных чисел, а в качестве К—поле матриц вида 1а 0\ м- где а — произвольное действительное число. Для поля К алгебраическими операциями будут, очевидно, обыч- обычные арифметические сложение и умножение, а для Д"— матричные сложение и умножение. Приведем в соответствие каждому действи- (а \ тельному числу а матрицу О а_ а О О а Нетрудно убедиться, что это соответствие является изомор- изоморфизмом: К~К. Затем в качестве расширения Д возьмём поле комплексных чисел, а в качестве расширения Д — поле матриц вида а где а, Ь — произвольные действительные числа. Читатель может сам проверить, чтсг множество матриц вида F) в самом деле обра- образует поле относительно операций сложения и умножения матриц. Приведём в соответствие каждому комплексному числу а-\-Ы матрицу ( — о а Нетрудно убедиться, что это соответствие также является изо- изоморфизмом: Д^Д. •Положим Ь = 0. Тогда соответствие G) превратится в а О О а счесть гокращённое обозначение изоморфизма.
288 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Мы видим, что при изоморфизме Д^Д действительное число а попрежнему отображается в матрицу (а 0\ О а Следовательно, изоморфизм Д?^Д есть продолжение изоморфиз- изоморфизма К^К. Отметим следующие свойства продолжения изоморфизма: Теорема 30. Если Р и Р — изоморфные поля, то кольцо многочленов Р [х] можно изоморфно отобразить на кольцо много- многочленов Р[х] так, чтобы изоморфизм Р[х]д^Р[х] являлся про- продолжением изоморфизма Реп р. Доказательство. Пусть при изоморфизме Р^Р элемента поля Р отображается на элемент а поля Р: а-^-а. Тогда произ- произвольному многочлену f(x) = ao-\'aJx-\- ... -\-атхт из Р[х] можно поставить в соответствие многочлен f(x) = ao-\-'alx-\- ,..-\-атхт из Р[х]: /(*) = о, + а,* +... + атхт ->/(*) = \ -f а,* +... + ~атхГ. (8) Читатель может без труда проверить, что (8) является взаимно однозначным соответствием между Р[х] и Р[х]. Покажем, что соответствие (8) является изоморфизмом колец Р[х] и Pf-v]. В самом деле, если g(х) = Ьо-\-Ь^х-\- ... -^-Ь^ — ещё один произвольный многочлен из Р[лг], то Пусть, например, 1^т. Тогда • • • 4- где ci = ai-{-bi, причем в случае 1<^т надо положить bl+1= ... = = йт = 0. Отсюда Аналогично можно убедиться, что f(x)g(x)-*-f(x)g(x). Остается показать, что изоморфизм Р[д:]^Р[а:] есть продол- продолжение изоморфизма Р^Р. Обращаемся к многочлену f(x) = a, где а — элемент Р. Для него соответствие (8) принимает вид а-+а. Мы видим, что при изоморфизме Р[х]^Р[х] элемент а поля Р попрежнему отобра- отображается на элемент а поля Р. Переходя ко второму свойству продолжения изоморфизма, от- отметим, что если f(x) — некоторый многочлен над полем Р, то под
О РЕШЕНИИ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ В РАДИКАЛАХ 289 f(x) мы будем всё время подразумевать такой многочлен над изо- изоморфным полем Р, на который отображается f(x) при изоморфизме Р[лг]=Р[лг], упомянутом в теореме 30. Отметим ещё, что если р (дг) — многочлен, неприводимый над Р, то согласно теореме 30 многочлен р (х) также неприводим над Р. Теорема 31. Если Р и Р—изоморфные числовые поля, б— корень многочлена р (х), неприводимого над Р,иЬ — корень много- многочлена р(х), то изоморфизм Р^Р можно продолжить до изо- изоморфизма Р (б) ^ Р F), при котором б будет отображаться на б. Доказательство. Пусть степень многочлена р(х) равна k. Тогда произвольный элемент f алгебраического расширения РF) будет единственным образом выражаться в виде Y = а0 -f- Gj6 -j- ... -\- а^б* (а,- — элементы из Р) (см. замечание на стр. 229). Пусть при изоморфизме Р^Р эле- элемент at отображается на at. Поставим элементу у в соответствие элемент т = я0 -J- ^б -J- ... -|- ak_l 6 *-1 поля Р: т = а0 + а,6 -f • • • + а^б*-1 -+ т = а0 + a,S + ... + aj?"'. (9) Покажем, что соответствие (9) является изоморфизмом Р F)^ Р F). Пусть какой-нибудь элемент 8 расширения РF) отображается на тот же самый элемент, что и у. й-»-?- Тогда, если 8 = йо-|- +*1 то 8 -* ft0 + ft,6"+ - ¦ • + **-i б"* = Т = «о Но многочлен р (х) неприводим над Р. Следовательно, '( должно единственным образом выражаться в виде многочлена от б степени, не превосходящей k—1, и с коэффициентами из Р. В силу этого а0 = b0, al = bu ... , aft_! = bk_x. Отсюда благодаря изоморфизму Р^Р получается, что ao'=bo, al = bl, ... , ai_1 = bk_l, т. е. 8 = т- Очевидно, что для всякого элемента 7 из Р(б) можно указать в РF) такой элемент 7. которому -у и ставится в соответствие. Всё это вместе взятое означает, что (9) есть взаимно однознач- однозначное соответствие между РF) и Р(Ь). Возьмём теперь из расширения Р@) два произвольных элемента Этим элементам в алгебраическом расширении Р F) будут соот- соответствовать Т, = а0 + а,6 + -I Л -|- aftj*-. Т, = ^о + W + ... -J- V^. 19 Энциклопедия, кя. 2.
290 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОН\ЛЬНЫХ ФУНКЦИЙ Отсюда сумме Ti+ъ=(«в+К) будет соответствовать («о + *о) + C«i + *i) в + • • • + (a»_i + **_i) б* = Ti Точно так же убеждаемся, что произведению 71Т2 должно соот- соответствовать произведение 7iTs- Мы видим, что соответствие (9) есть изоморфизм РF)?^Р@). Покажем, что изоморфизм Р(б)^Я(б) является продолжением изоморфизма Р~Р. Действительно, если f — элемент поля Р, то у = а0, и для такого элемента а0 соответствие (9) принимает вид ао-»-ао. Таким образом, при изоморфизме РF)^Р(б) эле- элементы поля Р отображаются совершенно так же, как и при изо- изоморфизме Pc^iP. Наконец, соответствие (9) будет, очевидно, переводить эле- элемент 6 в 6. Вернёмся к группе уравнения A). Мы собираемся рассмотреть следующие свойства группы уравнения. Мы знаем, что всякий элемент <о нормального поля Q является корнем некоторого многочлена р(х), неприводимого над Р (см. теорему 27). Назовём два элемента to и <о' поля Q сопряжёнными, если они являются корнями одного и того же многочлена р (х) неприводимого над Р. Тогда можно высказать такую теорему: Теорема 32. Всякая подстановка (автоморфизм) группы уравнения A) переводит элемент <о нормального поля Q в сопря- сопряжённый элемент ш'. Обратно, если <и' — элемент, сопряжённый и>, то в группе уравнения A) существует по меньшей мере одна подстановка (автоморфизм), переводящая <о в <о'. Доказательство. Пусть ш является корнем многочлена р(х), неприводимого над Р, и s—произвольная подстановка из группы G уравнения A). Равенство р(ш) — 0 есть рациональное соотношение над Р между корнями а„ ... , а„ уравнения A), так как <о рацио- рационально выражается через а1г , ап. Следовательно, применяя к этому соотношению подстановку s, получаем на основании определения группы уравнения, что р (шв) = 0. Таким образом, <о' = сю есть корень того же самого многочлена р (х), т. е. элемент <о' сопряжен с <о. Обратно, пусть to' — некоторый элемент, сопряженный <о. Это значит, что <о и <о' являются корнями одного и того же многочлена р(х), неприводимого над Р. Воспользуемся теперь теоремой 31: возьмём в качестве Р то же самое поле Р, а в качестве изомор- изоморфизма Рд^р будем рассматривать соответствие а —*¦ а, оставляющее элементы а поля Р неподвижными '). Тогда на основании теоремы 31 Так называемый тождественный изоморфизм поля Р с самим собой.
О РЕШЕНИИ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ В РАДИКАЛАХ 291 этот изоморфизм Р^Р можно продолжить до изоморфизма Р(ш)^Р(ш'), переводящего ш в ш'. Если Р(ш) = 2, то в силу те- теоремы 29 расширение Р(ш') должно также совпадать с 2, и мы имеем автоморфизм поля Q, переводящий ш в а/. Если же Р(<*>) не совпадает с Q, а является лишь частью Q, то рассуждаем следующим образом. Возьмём из Q элемент 6, не лежа- лежащий в Р(ш). Обозначим через pt (x) неприводимый над Р много- многочлен, имеющий в своим корнем. Над полем Р(ш) многочлен pt (х) может оказаться приводимым. Пусть pt (х) над полем Р(ш) следую- следующим образом разлагается в произведение неприводимых множителей: Pi С*) = Чх (*) q% {х) ... qr (x) A0) (множители qt (x) будут выше первой степени). Предположим для определённости, что 6 — корень qx (x). На основании теоремы 30 разложению A0) будет над полем Р(ш') соответствовать разложение р, (х) = у, (х) qz {x) ... qr (x) на множители у,(х), неприводимые в Р(ш')- По теореме 28 все корни многочлена рх (х) должны лежать в нормальном поле Q. Тем самым в Q будут лежать и все корни множителя ~qv (x). Пусть 6' — один из корней q1 (x). Тогда по геореме 31 Р(«, 6)^Р((о', 6'), A1) причём изоморфизм A1) есть продолжение изоморфизма Р(ш)^Р(ш'). Если Р(ш, 6) = 2, го по теореме 29 будет и Р(ш', 6') = 2; вслед- вследствие этого A1) будет искомым автоморфизмом нормального поля Q, переводящим ш в ш'. Если же Р(ш, 6) не совпадает с Q, а является лишь частью Q, то продолжаем наш процесс. В конеч- конечном счёте мы, очевидно, придём к искомому автоморфизму поля Q '). Условимся в дальнейшем говорить, что элемент ш нормального поля Q допускает подстановки (автоморфизмы) группы поля Q, если ш остаётся неизменным при любой подстановке группы. Тогда из теоремы 32 вытекает такое важное. Следствие. Элемент ш нормального поля Q тогда и толь- только тогда допускает подстановки группы G поля Q, когда ш лежит в поле Р. •) Конечность этого процесса вытекает из следующих соображений. Каждое расширение Р(<*>), Р{<», 6);. ... можно рассматривать как подпро- подпространство конечномерного пространства О. Но в теории векторных про- пространств доказывается, что последовательность подпространств конечномер- конечномерного пространства, в которой каждое подпространство содержится в сле- следующем, не может быть бесконечной (в связи с ограниченностью размер- размерности подпространств). 1У*
292 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ В самом деле, пусть ш лежит в поле Р. Тогда, очевидно, <о не меняется при любой подстановке из группы G. Обратно, если ш не меняется при любой подстановке из группы G, то по только что доказанной теореме 32 все элементы, сопряжённые с ш, должны совпадать с ш. Но последнее возможно лишь тогда, когда ш есть корень многочлена р(х) первой степени: р(х)^х— а, где а — элемент Р. Таким образом, ш — а = 0 или ш = а. Мы видим, что ш оказался элементом поля Р. Существенную роль в нашем изложении будет играть следующая Теорема 33. Пусть Q — нормальное поле и G — группа уравнения A) над Р. Тогда всякому промежуточному полю Р(Рс^Р1 с^-Q) соответствует подгруппа G' группы G, кото- которая в свою очередь является группой уравнения A), но уже над Р', а именно G' является совокупностью таких подстано- подстановок из G, которые оставляют неподвижным любой элемент Р'. При этом поле Р' определяется подгруппой G' однозначно: Р есть совокупность всех элементов Q, «допускающих» подста- подстановки из G', т. е. остающихся неподвижными при этих под- подстановках. Доказательство. Группа G' уравнения A), рассматриваемого над Р^есть.очевидно, совокупность таких подстановок корней at,.. .,ап уравнения, которые не нарушают ни одно рациональное соотноше- соотношение между ос,, ... , ос„ над Р' и оставляют элементы Р неподвиж- неподвижными. Отсюда подстановка s из G' и подавно не будет нарушать рациональное соотношение между а,, , а„ над Р, так как эти соотношения можно рассматривать и как соотношения между а,,..., а„ над Р. Следовательно, s есть элемент группы О, откуда G' есть подгруппа G (возможно совпадающая с G). Покажем теперь, что G' состоит из всех тех подстановок группы G, которые оставляют элементы Р неподвижными. Обозна- Обозначим совокупность таких подстановок через G". Ясно, что группа G' будет содержаться в G": G'czG". Кроме того, легко видеть, что G" является также группой, так как произведение двух подстановок, оставляющих элементы поля Р' неподвижными, также оставляет неподвижными элементы Р. Пусть теперь t — некоторая подстановка из G". Эта подстановка не нарушает ни одного рационального соотношения между а1г , <*„ над Р, так как / содержится в группе G уравнения A). Рассмотрим некоторое рациональное соотношение г(о„ ..., а„) = 0 над Р. С одной стороны, это соотношение не нарушается подстановкой t, так как, выражая коэффициенты соотношения через корни а,, ... , а„ уравнения A), мы получим соотношение между а^ ... , о„ над Р. С другой стороны, коэффициенты соотношения г (а,, ... , а„) —О подстановкой t не меняются. Следовательно, / содержится в G', откуда G"c=G'. Сопоставляя G"cz:G' и G'c^G", видим, что G" — G'.
О РЕШЕНИИ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ В РАДИКАЛХХ 293 Для завершения доказательства теоремы остаётся убедиться в однозначности определения поля Р посредством подгруппы О'. Пусть ш — некоторый элемент Q, допускающий подстановки из О. Тогда согласно следствию из теоремы 32 сразу вытекает, что ш есть элемент Р. Для дальнейшего введём понятие гомоморфизма групп. Изо- Изоморфизм является частным случаем этого понятия. Пусть некоторая группа //, однозначно отображается на группу Н2, причём отображение может и не быть взаимно однозначным. Мы назо- назовём отображение гомоморфным, если произведению любых двух эле- элементов группы Ht соответствует произведение соответствующих элементов группы //2. Мы будем гомоморфное отображение группы Н1 на группу /f2 записывать в виде: Н1<Л2Н^. Теперь мы можем высказать следующую теорему: Теорема 34. Если поле Р', промежуточное между Р и нормаль- нормальным полем Q (P c^ Р cj: Q), есть в свою очередь нормальное поле неко- некоторого многочлена g (х) над Р, то группа О поля Q над Р гомо- гомоморфно отображается на группу О поля Р1 над Р. Доказательство. Обозначим корни g(x) через р„ р2, ... , Рт. Каждая подстановка s из G будет перемещать корень 8, в корень ру. При этом различные корни В? и pfc будут перемещаться подстановкой s в различные корни. В самом деле, если бы p,-s было равно $ks при fii ф pfe, то, применяя к равенству C;5 = р/г5 обратную подстановку s, мы нарушили бы соотношение P/S=?fcs, а именно получили бы Р/ 9^ Рй- Таким образом, получилось бы противоречие с тем, что s принадлежит группе G. Итак, подстановка s вызывает некоторую подстановку корней многочлена g(x). При этом, очевидно, s не будет нарушать ни одно рациональное соотношение г(^„ ... , рт) = 0 над Р и будет оставлять неподвижными элементы из Р, т. е. я будет подстановкой группы поля Р над Р. Обратно, всякую подстановку 5 из группы поля Р над Р можно с помощью процесса, использованного при доказательстве теоремы 32, продолжить до подстановки (автоморфизма) s группы поля Q над Р. Поставим теперь подстановке s в соответствие подстановку s, вызываемую s: s-*s. A2) Легко видеть, что соответствие A2) будет отображать произведение s,s2 в произведение s^, вследствие чего соответствие A2) есть гомоморфное отображение группы G на группу G.
294 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ § 18. Уравнения с симметрической группой В этом параграфе мы покажем, что уравнения степени с симметрической группой неразрешимы в радикалах. Предварительно докажем несколько теорем. Теорема 35. Если первообразный корень нечётной п-й сте- степени из единицы не принадлежит полю Р, то группа двучленного уравнения f(x) = xn—l=0 A) над Р является коммутативной. Доказательство. Пусть е — первообразный корень уравне- уравнения A). Тогда Р(е) есть нормальное поле уравнения A), так как все корни уравнения A) рационально выражаются через е, а именно являются степенями е. Обозначим через р (х) тот из неприводимых над Р множителей многочлена J (х), который имеет е своим корнем. Очевидно, что Р(е) будет нормальным полем и для р{х), вслед- вследствие чего группа р(х) совпадает с группой уравнения A). Пусть б, = е, 62 = efe», ... , 6m = efem—все корни многочлена р(х). По теореме 31 PF,)^P(G;), причём этот изоморфизм является про- продолжением тождественного изоморфизма Рд^Р (т. е. изоморфизма, оставляющего неподвижными элементы поля Р) и переводит 6, в 6;. Так как, очевидно, Р F,-) ЕЕ Я (8,), т° в силу теоремы 29 получается, что РF1) = РF/). Мы видим отсюда, что РF,)^Р(б,-) есть автоморфизм нормального поля РF,) над Р, т. е. один из элементов группы G уравнения A) над Р. Таким образом, группа G должна состоять из т различных подстановок s1=l, s2, ... , sm: btst = 8„ GlS2 = 8S> ... , 6,sm = 8m. Найдём, чему равны 6, (s,-sy) и 6, (sy-s,-). Имеем: Отсюда siSj=sisi, т. е. G есть коммутативная группа. Теорема 36. Если F(x) = Aox'l-{-A1x»-i+...+An = O B) есть уравнение с симметрической группой над полем Р, то много- многочлен F (х) неприводим над Р. Доказательство. Пусть аи , а„ — корни уравнения B) и пусть многочлен F(x) приводим над Р:
О РЕШЕНИИ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ В РАДИКАЛАХ 295 где pi (х) — различные неприводимые над Р многочлены. Пусть <х? есть корень /?, (х), а а,- — корень р2 (х). Возьмём подстановку, пере- перемещающую только корни at и ау-: \1 2 ...j i...nj, и применим её к рациональному соотношению pi(ai) = 0. Получим pt (ay) = 0. Отсюда многочлен /?, (х) должен в силу неприводимости делиться на pi (x), вследствие чего /?, (х) и р% (х) совпадают с точ- точностью до множителя нулевой степени, что невозможно. Теорема 37. Если B) есть попрежнему уравнение с сим- симметрической группой над полем Р и степень уравнения B) больше двух, то ни один из корней такого уравнения не может быть рациональной функцией первообразного корня k-й (нечётной) сте- степени из единицы над Р. Иными словами, ни один из корней a,t ураанения B) не лежит в поле Р(е), где е — первообразный корень k-Vi степени из единицы. Доказательство. Согласно теореме 35 группа G' поля Р(е) над Р является коммутативной. Так как по теореме 36 многочлен F(x) неприводим над Р, то, предполагая, что в Я(е) лежит по меньшей мере один корень F(x), получаем на основании теоремы 28, что в Р(е) должны лежать все корни F(x), т. е. Р(аи ... , оп)с=Р(е). Таким образом, на основании теоремы 34 получаем, что G'^G, где G — группа уравнения B) над Р или, что то же, поля Q над Р. Из гомоморфизма G'^G вытекает, что G — также комму- коммутативная группа'). Но последнее невозможно, так как по условию О — симметрическая группа: G = Sn, а при л^>2 симметрическая группа не является коммутативной. Теорема 38. Пусть попрежнему B) есть уравнение степени п ^> 2 с симметрической группой над Р. Тогда группа уравнения B) над полем Д"=Я(е,, ..., efe), где et — первообразные корни из единицы простой нечётной степени pt (pt между собой различны), будет также симметрической. Доказательство. Обозначим для краткости P(at а„) через Q и /Г(а,, ... , а„) через 2. Мы утверждаем, что К=Р(е), где е — первообразный корень PiP% ... pk-Pi степени из единицы. В самом деле, с одной стороны, P(*)^P(*t %). так как нетрудно убедиться, что произведение е,Е2 ... efc есть пер- первообразный корень PiPi /Vй степени из единицы. С другой стороны, •) Действительно, если элементы а'Ь1' группы С, отображаются иа эле- элементы a, b группы G, то а'Ь'~ аЪ и b'a'—ba. Так как группа С коммута- коммутативная, то а'Ъ' — Ь'а'. Отсюда и ab==ba, т. е. группа G также должна быть коммутатишюй.
296 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ так как каждое из е,- является корнем двучленного уравнения х™—1=0, где т = РхРъ pk, и потому является некоторой сте- степенью е. Отсюда следует, что Р(е, efc) = P(e). На основании теоремы 37 имеем, что Е zd К, но не равно К. Относительно полей Р и К представляются две возможности: либо К=Р, либо К^эР- Если К=Р, то теорема очевидна. Поэтому пусть Pcz^c=E. C) По теореме 33 соотношению C) должно соответствовать соот- соотношение где G,—группа поля Е над Р, G2— группа того же поля над К и Е— единичная группа (т. е. подгруппа, состоящая только из еди- единицы). Очевидно, что G2 есть вместе с тем и группа уравнения B) над К- Поле Е можно, очевидно, рассматривать как нормальное поле многочлена над Р. Таким образом, G, есть, кроме того, группа уравнения А(х) = 0 над Р. Обозначим корни многочлена хт~1-{-... -\-х-{-I через 6,, 62 6т_,. Тогда корнями h (х) будут: а„ а2 а„, 6, 6т_,. Эти корни между собой различны, так как по теореме 37 много- многочлены F(x) и xf"~l -\- ... -\-x-\-l не могут иметь общих корней. Посмотрим, что представляет собою подстановка я группы Gt. Эта подстановка не может перемещать аг в 6у. В самом деле, если бы a?s было равно Ь/, то F(ai) = 0 под влиянием 5 перешло бы в FFy) = 0, что в силу теоремы 37 невозможно. Таким образом, под- подстановка 5 из G, должна иметь вид Покажем, что индексы iu г2 г„ во второй строчке выражения D) образуют произвольную перестановку п чисел 1, 2 п. Дей- Действительно, так как II13 Q :з р и группа поля Q над Р есть сим- симметрическая группа Sn, то по теореме 34 0!<Лз5п и при этом гомо- гомоморфизме . E) «/, ••¦ «!„/ Теперь, если бы в выражении D) индексы г1( г2, , in не пробе- пробегали бы всех п\ перестановок из п чисел 1, 2 п, то соответ- соответствие E) не исчерпывало бы всех подстановок 5 симметрической
О РЕШЕНИИ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ В РАДИКАЛАХ 297 группы Sn, вследствие чего G, не могла бы гомоморфно отобра- отображаться на Sn (она отображалась бы на правильную часть Sn). Посмотрим, далее, что представляет собою группа G2 ноля Е над К- Согласно теореме 33 группа G2 состоит из тех и только тех подстановок Gt, которые оставляют неподвижными элементы промежуточного поля К и, в частности, оставляют неподвижными 6у-. Отсюда получаем, исходя из выражения D), что группа Ga должна состоять из всевозможных подстановок t вида г, <й Щ, ••• «,-„ 6t 62 ... 6т_,/. Теперь без труда уб&ждаемся, что группы G2 и Sn изоморфны. Именно, изоморфным отображением G2 на Sn здесь будет соответ- соответствие 'а, а2 ... ah ... at Итак, теорема доказана: группа G2 уравнения B) над К с точ- точностью до изоморфизма совпала с симметрической группой Sn. Мы подошли вплотную к основной теореме о неразрешимости в радикалах алгебраических уравнений с симметрической группой. Теорема 39. Если группа уравнения п-й степени , = 0 F) (Л,-—комплексные числа) является симметрической и степень уравнения больше четырёх, то уравнение неразрешимо в ради- радикалах. Доказательство. Роль поля Р здесь играет область рацио- рациональности Д уравнения Д'=Д(е,, , efc). По теореме 38 группа уравнения F) будет симметрической и над полем К- Таким образом. к этой группе будут также принадлежать подстановки _ /1 2 3 4 5 6 ... п\ /1 2 3 4 5 6 ... п\ S~\2 3 4 5 1 6 ... п), \1 2 4 5 3 6 ... л/, 1 2 3 4 5 ... л 2 3 1 4 5 ... п Эти подстановки, как и любые подстановки группы уравнения над К. не будут изменять элементы А' и, в частности, будут оставлять неподвижными е,.. Поэтому мы можем дословно повторить все рас- рассуждения, приведённые в доказательстве' теоремы Руффини-Абеля (см. § 16). В результате мы получим, что корни at и а2 уравнения F) равны, что невозможно в силу неприводимости многочлена F (х).
298 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Для завершения нашего изложения остаётся привести конкрет- конкретный пример уравнения степени п ^5 с симметрической группой. Для этой цели отметим некоторые факты из теории групп под- подстановок, не вдаваясь в детали. Пусть О — некоторая группа подстановок л-й степени. Возможны два случая: 1) в группе G существуют подстановки, переводящие число 1 в любое заданное число k(k=l, 2, ... , п); 2) подстановки группы G перемещают 1 не во всякое заданное число k. В первом случае группа G называется транзитивной, а во втором случае — интранзитивной. Роль транзитивной группы в теории алгебраических уравнений видна из следующей теоремы: Теорема 40. Если уравнение п-й степени F(х) = Адх"-J-Alxn~l-\- ... -\-Ап = 0 (At — комплексные числа) неприводимо над своей областью рациональности А, то группа такого уравнения транзитивна. Доказательство. Если многочлен F(х) неприводим над полем Д, то по теореме 32 в группе уравнения наверное найдутся подстановки, переводящие корень Oj в любой другой корень ак уравнения F(je) = 0, чем транзитивность группы и обнаруживается. Мы воспользуемся следующим свойством транзитивной группы: транзитивная группа простой степени р, содержащая транспози- транспозицию, является симметрической группой. Примечание. Транспозицией называется подстановка, пере- перемещающая только два числа, т. е. подстановка вида 1 2 3 ... I j ... п\ 1 2 3 ... j i ... nj. Обычно транспозиция, перемещающая числа /, у", обозначается сокра- сокращённо символом (i, j). Пользуясь этим свойством транзитивной группы, мы сейчас дока- докажем такую теорему: Теорема 41. Всякое уравнение простой степени р^Б с рацио- рациональными коэффициентами, неприводимое над полем рациональных чисел и имеющее лишь одну пару чисто комплексных корней, не- неразрешимо в радикалах. Доказательство. По теореме 40 группа такого уравнения F(x) — 0 есть транзитивная группа. Она к тому же является группой простой (p-Pi) степени. Пусть а, —а-{-Ы и а2 = а — Ы — чисто комплексные корни уравнения; остальные корни а3, а4, ... , ар согласно условиям тео- теоремы должны быть действительными. Рассмотрим какое-нибудь рациональное соотношение / BJ, сс„ ... , ар) = 0 G)
"О РЕШЕНИИ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ В РАДИКАЛАХ 299 между корнями а,, а2 ар над полем рациональных чисел. Это соотношение можно даже считать относительно av — , <хп целым рациональным. Подставляя в левую часть равенства G) вместо at и а2 соответственно а-\-Ы и а — Ы и собирая отдельно действи- действительные и мнимые члены, получаем: г (а,, а2 ар) = Р -\- iQ = О (Р, Q — действительные числа), откуда P = Q = 0. Применим теперь к r(at, а2 ар) транспо- транспозицию A2). В силу сопряжённости корней о, и а2 это равносильно перемене знаков мнимых частей выражения r(alt а2, , ар): г(а2, о„ ... , ap)—-P — iQ. Но по доказанному выше P=Q = 0. Следовательно, г(а2, о„ ... , ар) = 0. Таким образом, транспозиция A2) не нарушила соотношения G). Это означает, что транспозиция A2) содержится в группе G урав- уравнения. Отсюда согласно вышеупомянутому свойству транзитивной группы вытекает, что группа G является симметрической: G = Sn. Значит, по теореме 39 уравнение F(x) — 0 неразрешимо в ра- радикалах. Из этой теоремы сразу получается, что уравнения пятой степени вида х« — q°-x — д = 0, (8) где q — простое число, неразрешимы в радикалах. В самом деле, неприводимость уравнения (8) сразу обнаружи- обнаруживается с помощью критерия Эйзенштейна. Пользуясь теоремой Штурма1), можно установить, что уравнение (8) имеет всего три действительных корня. Таким образом, уравнение (8) удовлетво- удовлетворяет всем условиям теоремы 41 и потому не может быть решено в радикалах. Изучение свойств алгебраических расширений с помощью аппа- аппарата теории групп является основной задачей теории Галуа. Рассмотренный здесь вопрос о разрешимости алгебраических урав- уравнений в радикалах есть одно из приложений этой теории. В рабо- работах советских математиков (С. О. Шатуновский, Н. Г. Чеботарёв, Б. Н. Делоне и др.) теория Галуа получила дальнейшее обобщение и развитие2). Н. Г. Чеботарёв посвятил ей две свои монографии: «Основы теории Галуа», ч. 1 (ГТТИ, 1934) и ч. 2 (ОНТИ, 1937) •) См. стр. 324, А. П. Д о м о р я д, Численные и графические методы ре- решения уравнений. s) Более подробные сведения можно найти в сборнике «Математика в СССР за 30 лет> (Гостехиздат, 1948).
300 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ и «Теория Галуа» (ОНТИ, 1936). Им же получены фундаменталь- фундаментальные результаты, относящиеся к одному из разделов теории Галуа, так называемой «П роблеме резольвен т». За свои исследо- исследования в этой области (основные результаты этих исследований опубликованы в статье «Проблема резольвент», Юбилейный сбор- сборник АН СССР, 1947) Н. Г. Чеботарев удостоен Сталинской премии первой степени. Б. Н. Делоне разработал оригинальную геометри- геометрическую теорию, представляющую собой обобщение теории Галуа. Б. Н. Делоне и Д. К. Фаддеев применили геометрические методы к решению наиболее трудных задач теории Галуа. § 19. О разрешимости алгебраических уравнений в квадратных радикалах Существует целый ряд геометрических задач на построение, сводящихся к нахождению корней некоторого алгебраического урав- уравнения /z-й степени G0^" + Gtx'!-1+... + Gn = 0. (I) К таким задачам относятся, например, задача удвоения куба, задача трисекции угла. В курсе теории геометрических построений доказывается, что некоторое выражение а тогда и только тогда может быть по- построено с помощью циркуля и линейки, когда оно получается в результате решения уравнений не выше второй степени. Например, выражение можно построить с помощью циркуля и линейки, так как оно по- получается в результате решения ряда уравнений не выше второй степени. А именно, а, = j/2 есть корень квадратного уравнения х2 — 2 = 0, и мы можем построить j/2 с помощью циркуля и ли- линейки. Далее, а2 = 1 —j— \^2 является корнем уравнения первой сте- степени х-—A —j— aj,) = 0, и мы можем 1 -|- j/2 также построить с по- помощью циркуля и линейки — придётся складывать отрезки, соответ- соответствующие 1 и |/2. Затем <х3 = j/a2 является корнем квадратного уравнения х*— о2 = 0, и, поскольку а2 было уже заранее постро- построено, мы этот корень без труда построим с помощью циркуля и ли- линейки. Наконец, a= j/a3 есть корень квадратного уравнения, х2 — а3 = 0, а так как <х3 уже построено, то мы построим с помощью циркуля и линейки и а= 1^«з*
О РЕШЕНИИ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ В РАДИКАЛАХ 301 'Таким образом, возникает следующий естественный вопрос — при каких условиях, необходимых и достаточных, уравнение (I) ре- решается в квадратных радикалах? Введём предварительно важное понятие конечного расширения. Пусть Д и Q —два каких-нибудь числовых поля, причём пусть U является расширением Д. Мы будем часто пользоваться обозначе- обозначением Дез2, выражающим, что Д есть подполе 2 (а 2 есть расши- расширение Д). Назовём систему k элементов at afc из 2 линейно зависимой относительно Д, если в Д можно выбрать такие числа Cj,..., ск, не все равные нулю, чтобы В противном случае, когда равенство A) имеет место только при ct =cg = ... = cn = 0, система элементов о,,..., ak называется ли- линейно независимой. Понятие конечного расширения мы теперь определим следующим образом. Назовём расширение 2 поля Д конечным относительно Д, если в 2 существует такая линейно независимая система элементов Ю|,..., ws, что всякий элемент о из С является линейной комбина- комбинацией <Dj <as: а = с,ш, -[-... + asuis, где at — элементы из Д.. Систему элементов ш1г..., a>s мы будем называть базисом ко- конечного расширения 2. Вообще мы назовём базисом всякую линей- линейно независимую систему элементов из 2, через которую линейно вы- выражается любой элемент расширения. Отметим следующие основные свойства конечного расширения. 1°. Количество элементов базиса конечного расширения 2 не зависит от выбора базиса. Мы будем это количество элементов базиса называть степенью конечного расширения 2 относительно Д и будем обозначать че- через (Q: Д). 2°. Если B:Д) = я, то всякая система s-\-l элементов конеч- конечного расширения 2 линейно зависима (относительно Д). 3°. Если B: Д) = s, то каждый элемент а конечного расшире- расширения Й является алгебраическим относительно А, а именно яв- является корнем многочлена над Д не выше s-й степени. Свойство 3° легко вытекает из свойства 2°. В самом деле, в силу свойства 2° система s-j-1 элементов а°=1, а, о2,..., ол дол- должна быть линейно зависима (относительно Д), т. е. Cq —j— C|Gc —j— CgCt —|—... —j— cs& — u, y^) где cf — элементы Д, причём среди с( но меньшей мере один эле-
302 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ мент отличен от нуля. Но равенство B) как раз свидетельствует о том, что о есть корень многочлена f(x) = cB-lrcix-\-...-{-csxs над А не выше s-й степени. Приведем примеры конечных расширений. Пример 1. Легко видеть, что поле К комплексных чисел является конечным расширением поля D действительных чисел и притом второй степени относительно D. В самом деле, 1 и г=|/^Т образуют линейно независимую систему относительно D, так как равенство с • 1 -\-d • i — 0, где с и d— действительные числа, имеет место лишь при c=^d = 0. Кроме того, всякое комплексное число, как известно, выражается в виде а-\-Ы, где а, Ъ — действительные числа. Следовательно, 1, / является базисом К- Так как базис 1, / состоит из двух элементов, то степень (K:D) равна двум. Пример 2. Алгебраическое расширение РF), получающееся путём присоединения к полю Р корня 6 многочлена р (х) k-Pi сте- степени, неприводимого в Р, является конечным расширением k-Pi сте- степени поля Р. Действительно, 1, 6, б2,..., б* образуют линейно независимую систему: если бы имело место равенство где с,- — числа из Р, не равные одновременно нулю, то 6 было бы корнем уравнения ниже k-Pi степени с коэффициентами из Р, что в силу неприводимости р (х) невозможно. Затем, как известно, всякий элемент алгебраического расшире- расширения РF) следующим образом выражается через 6: а = ао-\-а1Ь-\-а%№-{-...-[-а^Ь*'1 (а,-— числа из Р). Мы видим отсюда, что РF) есть конечное расширение Р с базисом 1, 6, б'2,..., б*. Очевидно, что степень (РF): Р) равна k, так как базис 1, 6, б2,..., б** состоит из k элементов. В теории конечных расширений основную роль играют следую- следующие две теоремы: Теорема 42. Если Qt — конечное расширение поля Д, а 22 — конечное расширение 2„ то Q2 есть конечное расширение Д и Q QQQ Теорема 43'). Пусть 2 — конечное.^ расширение поля Д. Тогда всякое расширение ? поля А, содержащееся в 2, будет •) Доказательство теорем 42 и 43, а также выводы других свойств ко- конечных расширений можно найти в книге: Л. Я. О к у и е в, Высшая алгебра, глава одиннадцатая (см. § 53—56 в издании 1944 г. или § 52—55 в издании 1949 г.).
О РЕШЕНИИ АЛГГьРЛИЧЕСКИХ УРАВНЕНИИ В РЛДИКАЛДХ 303 конечным расширением Д. Степень (?: Д) будет при этом дели- делителем степени (Q: Д). Из теоремы'42 вь.текает, что всякое расширение Р F, ..., бп), по- получающееся в результате присоединения к Р элементов 6j, ..., 6П, алгебраических относительно Р, является конечным расширением поля Р. Отсюда, в частности, следует, что нормальное поле Q = = Д(а,,..., оп) многочлена f(x) = aoxn-\-a1x"r~1-\-...-\-an /z-й степени является конечным расширением области рациональности Д многочлена f(x). Теперь мы в состоянии дать ответ на вопрос, поставленный в начале параграфа. А именно, можно высказать следующую теорему: Теорема о разрешимости алгебраического урав- уравнения в квадратных радикалах1). Пусть f(x) — много- многочлен п-й степени, Д — область рациональности и 2 — нормальное поле многочлена / (лг). Для того чтобы уравнение / (х) = 0 было разрешимо в квадратных радикалах, необходимо и достаточно, чтобы (й:Д) = 2т. Неразрешимость уравнения f(x) = 0 в квадратных радикалах не исключает, однако, того обстоятельства, что некоторые корни урав- уравнения всё же могут выражаться через квадратные радикалы. Но если многочлен /(дг) неприводим в своей области рациональности Д, то справедлива следующая Теорема 44. Если многочлен f(x) степени п^2 неприводим в своей области рациональности Д и какой-нибудь его корень вы- выражается через квадратные радикалы, то и все остальные корни многочлена выражаются через квадратные радикалы. Доказательство. Пусть корень а многочлена fix) выра- выражается через квадратные радикалы •р1=]/л|> р2 = ~\[ А-ъ Рз = = |/Л3,..., pfc = i/Ak, где Л,— элемент Д, Л2— элемент A(pt), Л3 — элемент Д(р„ ps) Ak — элемент A(pj, р2,..., pfc_t). Первый радикал можно рассматривать как корень многочлена над Д. Этот многочлен ^(х), кроме р,, имеет корнем другой квад- квадратный радикал pi = — pj. Так как Л2 — элемент поля Д(р]), то А.г = а-\-Ьр1, где а, Ъ — элементы Д. Отсюда следует, что второй радикал р2 можно рассма- рассматривать как корень многочлена 92 (х) = {х*-а- Ь?1) (х* - а + ftPl) = *4 - 2ах* + (а2 + &%) над Д. Этот многочлен, кроме р2> имеет своими корнями квадрат- квадратные радикалы рг = —р2> рг= \fa — ftp,, рг" =—р'г • ') Доказательство этой теоремы см. в кн.: Л. О кун ев, Высшая алге- алгебра, § 55, издания 1944 г. или § 54 издания 1949 г.
304 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Затем, так как As — элемент поля Д(р1, р2), то As = \pit причём си d — элементы A (pi), т. е. е = /я-)-/гр, и d = m1-\-n1p1, где т, п, /и, и «1 — элементы Д. Отсюда следует, что радикал р3 можно рассматривать как корень многочлена над Д 9з (х) = (х* — с — dp2) (х* — с + dH) (х* — 7— d р) (х* —~с 4- d p.2), где Многочлен ФзМ' кроме р3, будет иметь в качестве корней и другие квадратные радикалы. Аналогичным образом можно убедиться, что р4 будет корнем многочлена <pt(x) над Д, имеющего, кроме р4, в качестве корней и другие квадратные радикалы, и т. д. Составим теперь многочлен F (х) = 9, (х) ф8 (х)... % (х) над Д. Присоединяя корни многочлена F (х) к Д, получим для F(x) нормальное поле й. В этом поле, очевидно, будет лежать и ко- корень о данного многочлена f{x). Так как многочлен f(x) непри- неприводим в Д, то по известному свойству нормального поля (см. тео- теорему 28) все корни f(x) должны лежать в Q. Тем самым все корни многочлена f(x) выражаются через корни F (х), т. е. через ква- квадратные радикалы, что и требовалось доказать. § 20. О разрешимости в квадратных радикалах уравнений 3-й и 4-й степеней В теории геометрических построений чаще всего приходится иметь дело с задачами, сводящимися к алгебраическим уравнениям не выше четвёртой степени. Так как корни квадратного уравнения, очевидно, выражаются через квадратные радикалы, то остаётся рас- рассмотреть случаи уравнений третьей и четвёртой степеней. Относительно уравнения третьей степени имеет место Теорема 45. Уравнение третьей степени , = O A) тогда и только тогда разрешимо в квадратных радикалах, ко- когда многочлен f(x) = aBx3-{- а,д;2-|-а2лг-)-а3 приводим в своей об- области рациональности Д. Доказательство. Пусть многочлен f-(x) неприводим в Д. Тогда, присоединяя к Д какой-нибудь корень 6 уравнения A), мы получим конечное расширение ?=ДF) третьей степени относи- относительно Д. Это 2, очевидно, будет содержаться в нормальном поле 2 многочлена f(x). По теореме 43 степень (Q: Д) должна делиться на степень B: Д) = 3. Поэтому степень (Q: Д) не может равняться
Р РЕШЕНИИ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ В РАДИК\Л\Х 305 2т, откуда следует, что уравнение A) не может быть решено в квадратных радикалах. Обратно, если многочлен /(лг) приводим в Д, то где а, р и q — числа из Д. Мы видим отсюда, что уравнение A) распадается на уравнения первой и второй степени и тем самым решается в квадратных радикалах. На основании теоремы 44 мы можем утверждать, что если мно- многочлен /(л:) = aoxs ~\- а,лг2 -\- а2х -\- а3 третьей степени неприводим в своей области рациональности Д, то ни один из его корней не выражается в квадратных радикалах. Отметим одно следствие, вытекающее из теоремы 45. Следствие. Уравнение третьей степени с рациональными коэффициентами тогда и только тогда разрешимо в квадратных радикалах, когда оно имеет по меньшей мере один рациональный корень. В самом деле, в этом случае область рациональности Д много- многочлена f{x)^aoxi-\~aixi-\'aix-\~ a3 будет совпадать с полем рацио- рациональных чисел. Затем, как известно, многочлен третьей степени с рациональными коэффициентами тогда и только тогда неприводим в поле рациональных чисел, когда этот многочлен не имеет рацио- рациональных корней. Отсюда следствие становится очевидным. Впрочем, в справедливости следствия можно убедиться и незави- независимо от теоремы 45. Приводим здесь соответствующие рассуждения. Доказательство. Без ограничения общности выводов можно предположить, что старший коэффициент уравнения третьей сте- степени с рациональными коэффициентами равен единице: + с = 0. (I1) Если уравнение (Г) имеет рациональный корень, то оно, оче- очевидно, разрешимо в квадратных радикалах. Обратно, пусть уравнение (Г) разрешимо в квадратных радикалах. Допустим, что при этом уравнение (Г) не имеет рациональных корней. Возьмём какой-нибудь из корней #, уравнения или, что то же, многочлена f(x). Пусть А", выражается через квадратные радикалы: р,= |/Л1, p2=^Aj>• • •• Pfc—V~/lft, где k^l, .A, — элемент по- поля Д рациональных чисел, А$ — элемент поля Д (р,) и т. д. Мы вправе предположить, что радикал pfc не лежит в Д (pt,..., pfc_i); в противном случае он был бы лишним; в частности, ни один из радикалов не должен лежать в поле рациональных чисел. Кроме того, мы имеем право допустить, что xt не лежит в 20 Эндшшоисдин, кн. 2.
306 КОЛЬЦО МНОГОЧЛЕНОВ II ПОЛЕ РАЦИОН \ЛЬНЫХ ФУНКЦИЙ поле Д (р,,..., рд,^); если бы это было не так, то радикал pfc снова был бы лишним. Таким образом, мы можем написать, что где р, q—-элементы поля Д(р,,..., pfc_,) и q ф 0. Несложный подсчёт показывает, чтолг2=/»— qpk также является корнем многочлена f(x). А именно, подставляя значение хг в урав- уравнение (Г), после очевидных преобразований получаем: где + ад*Ак Очевидно, что Р и Q являются элементами поля Д (р,, ..., pfc_,). р Теперь, если допустить, что Q ф 0, то pft = — -— и радикал v pfe лежал бы в A (pt..., pfc_j), что невозможно. Следовательно, Q = 0 и тем самым Р=0. Подставляя в многочлен f(x) вместо х число x2=p — qpk, по- получаем после аналогичных преобразований, что Но P=Q = 0. Значит, /(лга)=^О, т. е. лг2 также является корнем многочлена f(x). Отметим, что х%ф хи так как q^tQ. Обозначим, далее, через х3 третий корень многочлена f(x)- Тогда по формулам Вьета откуда х3 = — а — xt — дг2, или, подставляя значения aTj и лг2: х3 = — а — 2р. Мы видим отсюда, что лг3 лежит в поле Д (р!7.... p^_i), так как аир лежат в Д(р„..., pfc_,)')- ') Применяя подобные рассуждепия к уравнению 3-й степепи с произ- произвольными (не обязательно рациональными) коэффициентами, мы получим также другое доказательство теоремы 45.
О РЕШЕНИИ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ В РАДИКАЛАХ 307 Повторим для корня х3 те же рассуждения, что и для лг,. Так как х3 выражается через радикалы pj pfc_,, то мы получим, что ху и jf2 лежат в Д (pi, , р*._г). Но это невозможно, так как хх не лежит уже в Д(р„..., pfc_,). Применим изложенное к следующим задачам на геометрические построения. Задача об удвоении куба, как известно, сводится к уравнению третьей степени /(лг)=лг3 —2 = 0 B) с рациональными коэффициентами. Это уравнение, однако, не имеет рациональных корней. Следовательно, уравнение B) нельзя решить в квадратных радикалах, и потому задача об удвоении куба нераз- неразрешима с помощью циркуля и линейки. Обратимся теперь к знаменитой задаче о трисекции угла. Она заключается в следующем. Пусть дан угол а; требуется его разде- разделить на три равные части. Посмотрим, к какому алгебраическому уравнению можно свести эту задачу. Обозначим искомый угол через ср. Тогда cos о = cos З9 = 4 cos3 9 — 3 cos ср. Поскольку угол о дан, мы можем считать его косинус также за- заданным. Поэтому полагаем coso = -^-, a cos<p обозначаем через -к-. Таким образом, или окончательно: f(x)=x3 — 3x — b — 0. Возьмём, например, 0 = -^-. В этом случае Ъ^\, и мы получаем уравнение л:3 —Зд;—1=0 с рациональными коэффициентами. Легко убедиться, что это уравне- ние не имеет рациональных корней. Стало быть, угол о = -^- нель- нельзя разделить на три равные части с помощью циркуля и линейки. Относительно уравнении четвёртой степени справедлива сле- следующая Теорема 46. Пусть /(jc)=je4 + fl,*1 + a»*s + fl1jf + e4 = 0 (З) ¦—уравнение четвёртой степени. Если кубическая резольвента 20*
308 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ этого уравнения имеет в А хотя бы один корень, то корни уравнения C) выражаются через квадратные радикалы. Обратно, если корни уравнения C) выражаются через квадратные радика- радикалы, то резольвента имеет по меньшей мере один корень в Д. Доказательство. Пусть кубическая резольвента уравнения C) имеет в Д корень уй. Тогда на основании известных преобразо- преобразований (см. § 5) получаем / (х) = (*2 + ~ ах -\-y.J — (Ах + В)\ где Таким образом, корни уравнения C) будут выражаться через квад- квадратные радикалы, возникающие при решении квадратных уравнений 0, D) *¦+(!—Л) * +(У.-Я) = 0. E) Обратно, пусть корни уравнения C) выражаются через квадрат- квадратные радикалы. Тогда, обозначая через хи jc2 корни уравнения D) и через xs, дг4 — корни уравнения E), получаем: ATjJVTg —уо-\-В, X3Xt =ув — В. Отсюда находим, что .Уо = -2" (*i*s+*3*4)- Но корни уравнения C) все выражаются через квадратные радика- радикалы. Следовательно, у0 также выражается через квадратные радика- радикалы. Таким образом, если y* + ay*-\-by-\-c = 0 F) — кубическая резольвента уравнения C), то в силу произвольности .у0 все её корни выражаются через квадратные радикалы. Итак, кубическая резольвента F) разрешима в квадратных ради- радикалах, а потому она по теореме 45 должна иметь по меньшей мере один корень в Д. Следствие. Уравнение четвёртой степени с рациональными коэффициентами тогда и только тогда разрешимо в квадратных радикалах, когда его кубическая резольвента имеет по меньшей мере один рациональный корень. Теорему 46 можно дополнить следующим предложением. Теорема 47. Если многочлен четвёртой степени ¦ f (.v) = л'¦¦ -} и^ 4- й2а- 4^ а3х-\-с4
О РЕШЕНИИ ^rEBPAH4ECKHX УРАВНЕНИЙ В РАДИКАЛАХ 309 не имеет корней в своей области рациональности Д и один из корней а многочлена f (x) выражается через квадратные радика- радикалы, то и все остальные корни многочлена выражаются через квадратные радикалы. Доказательство. Если многочлен /(дг) приводим в своей области рациональности Д, то он должен разлагаться в произведе- произведение двух квадратных многочленов с коэффициентами из Л: /(*) = (х* + рх + q) {х* + Pi*-f 4i), так как по условию f{x) не имеет в А корней. Таким образом, корни /(лг) найдутся из квадратных уравнений т. е. будут выражаться через квадратные радикалы. Если многочлен f(x) неприводим в своей области рационально- рациональности, то по -теореме 44 все его корни должны выражаться через квадратные радикалы. Пример. Через точку А B, 1) плоскости Р провести на этой плоскости прямую g так, чтобы оси Ох и Оу прямоугольной систе- системы координат Оху на плоскости Р отсекали на прямой g отре- отрезок с длиною, равной пяти единицам выбранного масштаба. Уравнение искомой прямой можно написать в следующем виде: Так как прямая g проходит через точку А B, 1), то Отсюда и + 2 v = —!— и Таким образом, подставляя это выражение v в уравнение получаем после некоторых преобразований: H4-f-4H3 — 20и2 + 4н-}-4 = 0. G) Уравнение G) не имеет рациональных корней; следовательно, по теореме 47 возможно лишь одно из двух: либо все корни уравне- уравнения G) выражаются через квадратные радикалы, либо ни один из корней уравнения не выражается через квадратные радикалы. Резольвентою уравнения G) является
310 КОЛЬЦО МНОГОЧЛЕНОВ И ПОЛЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ Нетрудно убедиться, что резольвента не имеет рациональных кор- корней. Принимая во внимание теорему 46, мы заключаем отсюда, что ни один из корней уравнения G) не выражается через квадратные радикалы. Следовательно, искомая прямая g не может быть построена с помощью циркуля и линейки. Литература 1. Кузьмин Р. О. и Фаддеев Д. К., Алгебра и арифметика комп- комплексных чисел, Учпедгиз, 1939. В первой части книги содержатся сведения нз теории комплексных чи- чисел и изчагается ряд приложений комплексных чисел, обнаруживающих пло- плодотворность введения их в пауку. Вторая часть книги посвящена арифме- арифметике целых комплексных чисел. 2. Курош А. Г., Курс высшей алгебры, Гостехиздат, 1946 и 1950. Учебник для университетов и педагогических институтов. 3. Маркушевич А. И., Деление с остатком в арифметике и алгебре. Издательство Академии педагогических наук, 1949. Книга посвящена вопросу делепия с остатком в произвольном кольце, удовлетворяющем неко горым условиям и, в частпости, делению с остатком в кольце целых чисел и в кочьце многочленов. 4. О куне в Л. Я., Высшая алгебра, Гостехиздат, 1944 и 1949. Учебник для университетов и педагогических институтов. 5. О куне в Л. Я., Основы современной алгебры, Учпедгиз, 1941. Книга посвящена элементам теории групп, теории колец и полей, а так- также теории разрешимости алгебттических уравнений в радикалах. 6. Проскуряков И. В., Числа и многочлены, Издательство Академии педагогических наук, 1949. Целью книги является строгое определение чисел, многочленов и алгеб- алгебраических дробей и обоснование их свойств, уже известных из средней школы. 7. Шапиро Г. М., Высшая алгебра, Учпедгиз, 1938. Учебник для педагогических институтов.
А. П. ДОМОРЯД ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ #
ВВЕДЕНИЕ В средней школе изучаются главным образом такие уравнения и системы уравнений, которые допускают «точное» решение: для линейных уравнений и их систем корни рационально выражаются через коэффициенты, а в других случаях дело сводится, как пра- правило, к квадратным или к двучленным уравнениям, и корни выражаются через коэффициенты с помощью радикалов. Однако нередко в школу проникают «со стороны» и более сложные уравнения вроде 2х — 4аг=0; A) \ B) ;=41 J и т. п., причём ставится требование «элементарного» решения по- подобного рода уравнений. Нельзя отрицать, что поиски искусственных приёмов решения таких уравнений могут принести некоторую пользу, но, во-первых, они дают чаще всего лишь некоторые из возможных решений й, кроме того, чрезмерное увлечение искусственными приёмами и осо- особенно противопоставление «элементарных» решений решениям «не- «неэлементарным» безусловно может принести большой вред, неверно ориентируя учащихся в тех требованиях, которые практика предъ- предъявляет математике. Значительно полезнее в таких случаях познакомить учащихся с существованием общих приёмов решения уравнений, приёмов, позволяющих с любой степенью точности вычислить любой дей- действительный корень как алгебраического, так и трансцендент- трансцендентного уравнения. Следует отметить, что эти общие приёмы нельзя считать менее законными, чем, например, решение уравнений в радикалах. Но не только «со стороны» могут проникнуть в школу урав- уравнения высших степеней и уравнения трансцендентные. Целый ряд задач элементарной математики приводит естественно к таким уравнениям-
314 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ Укажем для примера песколько таких задач. Задача 1. Найти центральный угол сектора, площадь которого делится пополам хордой, стягивающей кснцы дуги'). Задача 2. Найти дугу, длина которой равнялась бы длине линии косинуса а). Считая центральный угол ранным х радианам, легко придти в этих зада- задачах, соответственно, к уравнениям х — 2 sin х = 0, C) х — cos х = 0. D) Задача 3. (Задача Архимеда.) На каком расстоянии от цептра шара проходит секущая плоскость, отсекающая от шара часть его объёма. Легко убедиться, что искомое расстояние удовлетворяет уравнению тре- третьей степени: (^K = 0. E) Задача 4. (О трисекции угла.) Разделить данный угол <р на три равные части. Если, решая эту задачу алгебраическим способом, обозначить при R = 1 о cos f=a, cos -у- = х, о то для х будем иметь уравнение 4х3 —Зх —в = 0, F) вытекающее из известной формулы для косинуса тройного угла. Задача 5. (Построепие правильных м и о г о у г о л ь и и- к о в.) Построение правильных семиугольника, девятнугольника н одинпадцати- . 2и о 2я 2тг угольника связано с построением отрезков 2 cos -=-, 2 cos -, 2 cos у.- удо- удовлетворяющих соответственно (при R=\) уравнениям хз + хв _ 2д; _ 1 = 0, ¦ G) 0, (8) 0. (9) Нам кажется, что рассмотрению подобного рода задач следует время от времени уделять в школе некоторое внимание, так как составление уравнений является хорошим упражнением на программ- программный материал; разъяснение же весьма несложного табличного спо- способа решения уравнений, пригодного для любого уравнения вида с непрерывной функцией в левой части, даст учащимся ясное пред- представление о практическом решении любых ураннений и будет спо- способствовать приближению преподавания математики к нуждам прак- *) Л. Эйлер, lntroductio in Analysin infiiiitorum, 1748, т. 11, u" 532. s) Там же, nu 531.
ВВЕДЕНИЕ 315 тики. Кроме того, решение уравнений представляет источник полу- получения иррациональных чисел «не радикального типа» и естест- естественно приводит, к объяснению сущности понятия трансцендент- трансцендентного числа. Способ вычисления действительных корней уравнения A0), ко- который в дальнейшем мы будем называть табличным способом, за- заключается в следующем: придавая аргументу х целочисленные зна- значения, находим, например, что Следовательно, при каком-то значении аргумента, лежащем ме- между а и а -\- 1, / (х) обращается в нуль. Придавая'затем аргументу х значения а-\-^, а-\- j=, a-\-~^r и т. д., можно уточнить цифру десятых долей искомого корня, за- затем перейти к уточнению цифры сотых и т. д. Конечно, табличный способ очень трудоёмок, и существуют спо- способы, дающие гораздо быстрее значения действительных корней уравнений с большой точностью. Некоторые методы позволяют вы- вычислять и мнимые корни уравнений. Следует подчеркнуть, что мни- мнимые корни алгебраических уравнений играют большую роль во многих вопросах; так., например, в механике для «устойчивости дви- движения» необходимо, чтобы действительные части мнимых корней' некоторого уравнения были отрицательными. Ещё чаще приходят к уравнениям, требующим применения чи- численных методов, при решении различных задач механики, высшей математики, астрономии и т. д. Ограничимся одним лишь примером: Леверье при его колоссальных вычислениях, приведших к открытию Нептуна, пришлось столкнуться с решением уравнения') 3447г6 + 14 560г8 -\- 22 430г4 -\- 25 857г3 4.- + 29 193za + 11 596г 4- 5602 = 0, На практике иногда приходится иметь дело с системами уравне- уравнений, в которых число уравнений превышает число неизвестных (например, в геодезии); довольно часто приходится решать уравне- уравнения, коэффициенты которых—-приближённые числа, следовательно, точное решение уравнения не даёт точного решения задачи. Влияние подобного рода причин на погрешность корней изу- изучается в «приближённых вычислениях». В дальнейшем мы будем предполагать, что коэффициенты решае- решаемых уравнений — точные числа, а в системах уравнений число не- неизвестных совпадает с числом уравнений. ') П. В. М е л е н т ь е в. Несколько новых методов и приёмов прибли- приближённых вычислений, 1937, стр. 26.
316 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ Настоящая статья посвящена рассмотрению методов, пригодных для решения любых уравнений с числовыми коэффициентами неза- независимо от возможности решить их по специальным формулам (напри- (например, уравнения третьей степени) или с помощью каких-нибудь упро- упрощающих приёмов (например, tg2jc — tg^r—1=0). Методы эти лучше называть численными, а не приближёнными, как принято у некоторых авторов, так как алгорифмы, к которым они сводятся, дают возможность получить значения корней с любой степенью точности, и в этом отношении они нисколько не уступают решениям, получаемым, например, по формулам, выражающим корни уравнения в радикалах. Отметим, кстати, что вопрос о разрешимости уравнений в ради- радикалах, важный в некоторых отношениях и для школьного препода- преподавания (например, разрешимость задач на построение с помощью циркуля и линейки связана с возможностью представления корней некоторых уравнений с помощью квадратных радикалов), нас здесь не будет интересовать*). 1) Для ознакомления с этим вопросом отсылаем читателя к статье Л. Я. Окупева в этой книге.
ГЛАВА I РЕШЕНИЕ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ § 1. Постановка задачи Рассмотрим сначала методы, пригодные в основном для числен- численного решения алгебраических уравнений, хотя некоторые из них могут быть приспособлены и к решению уравнений трансцендентных. Иногда при решении алгебраического уравнения нас интересует значение какого-нибудь одного корня (например, определяя сторону правильного восемнадцатиугольника, вписанного в круг единичного радиуса, мы убеждаемся в том, что она является меньшим положи- положительным корнем уравнения х3 — Зх-\- 1=0). В других же случаях надо вычислить значения всех действительных, а иногда и мнимых корней данного уравнения (например, при разложении рацио- рациональной дроби на сумму простейших дробей, при решении так назы- называемых характеристических уравнений, соответствующих обыкновен- обыкновенным линейным дифференциальным уравнениям с постоянными коэф- коэффициентами и во многих других случаях). Если нас интересуют все действительные (а может быть, и мни- мнимые) корни данного уравнения, то полезно уметь быстро опреде- определять тот, по возможности узкий, интервал (или, соответственно, ту область на плоскости комплексного переменного), вне которого не могут лежать корни данного уравнения. Как увидим несколько ниже, задача эта решается очень просто даже при отсутствии какого-либо представления о примерной вели- величине корней уравнения. Помимо установления области, в которой следует искать корни уравнения, для некоторых методов вычисления действительных кор- корней [например, для способа- Горнера (§ 4) или для способа Лагранжа (§ 5)] существенно предварительное отделение искомого корня от других корней, т. е. определение такого интервала, внутри кото- которого лежал бы только один корень данного уравнения. Эта задача, называемая задачей отделения корней, может быть также решена без предварительного представления о величине от- отдельных корней уравнения. Следующие два параграфа будут посвя- посвящены рассмотрению этих вопросов.
318 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ § 2. Определение границ действительных корней Существует ряд простых способов для быстрого определения верхней границы положительных корней уравнения с действитель- действительными коэффициентами: == аохп 4- а,*71 + Й2*"~2 + • • • + а»-!* + ап = 0, A) т. е. для определения такого положительного числа К, которое было бы заведомо больше любого корня данного уравнения. Например, нетрудно убедиться, что верна следующая Теорема. Если ао^>О и А — наибольшее из чисел то Действительно, при любом положительном значении х мы имеем: — А*" — Ах"^ —... — Ах — А C) (читателю полезно подумать, в каком случае здесь возможен знак равенства); отсюда ^l {^)^-r C') А А А Если х">1-|~- то х—1 ^>—^>0 или яо^> г^>®- Сле- fi ^ ^ u 0 Л довательно, при х^> 1 -] оба члена справа в соотношении C') будут положительными, а потому и подавно f(x)^>0. Иначе говоря, ни при каком значении х, превышающем 14 f(x) не может во обратиться в нуль, т. е. можно считать, что ' «о Примечание. С помощью совершенно аналогичных рассужде- рассуждений можно было бы убедиться в том, что для уравнения с ком- комплексными коэффициентами а^+м"-1+ ...+*„=о верхняя граница модулей корней уравнения равна l-j~TT~~f> гДе В — наибольший из модулей коэффициентов \Ь1\, \bs\, ..., \Ьп\, т.е. мнимые корни этого уравнения следует искать среди тех точек
РЕШЕНИЕ АЛГЕБР 1ИЧЕСКИХ УРАВНЕНИЙ 319 плоскости комплексного переменного, которые лежат внутри круга радиуса R = 1-+-ПГТ ')• Формула B) даёт, вообще говоря, слишком крупные значения для К, так как при выводе её мы искали значения х, при которых положительной будет правая часть соотношения C); последняя же может оказаться значительно меньшей, чем функция f(x). Лучшие значения для К даёт, как правило, способ Маклорена, в котором учитываются знаки коэффициентов уравнения A); способ этот основан на следующей теореме: Теорема. Если в уравнении A) D) и A-i — наибольшее из абсолютных значений отрицательных коэф- коэффициентов уравнения, то i фициентов уравнения, то Доказательство проводится так же, как и доказательство преды- предыдущей теоремы. Именно при условиях D) для любого положитель- положительного значения х / (х) Ss апх" — Л, (х"-т + хп-т~1 -|~ • • • + х -\- 1) = __ _ „п А(л"-т+'-1) _ „_т+1 а^'Чх-Ц-А, , А, Но при дг^>1-|-1/— имеем: ао(х—l)m^>Aly в силу чего оба т вс слагаемых в конце соотношений F), а следовательно, и f(x) будут положительны, т. е. корни уравнения A) не могут превышать числа, определяемого равенством E). Укажем ещё на способ Ньютона, в основе которого лежит следующая Теорема. Если при каком-то значении дг = с^>0 числа /(с). fiP). f(c) Я"-1» (с), ЛпЧс)>0, G) то можно считать, что 1(=с. Действительно, из формулы Тейлора для многочленов 2) *) См., например, А. К. С у ш к е в и ч, • Основы высшей алгебры, 1941, стр. 115. s) См. стр. 321.
320 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ следует, что при х^с и при условиях G) f{x) будет больше нуля, т. е. такие значения х не могут быть корнями уравнения A). Перейдём теперь к рассмотрению нижней границы отрицатель- отрицательных корней, т. е. такого числа, которое наверное меньше, чем любой отрицательный корень данного уравнения. Для её нахожде- нахождения достаточно сделать в данном уравнении A) подстановку х = — z, (8) что приведёт к уравнению /(—z) = Q или к уравнению (-1)" .f(-z) = aozn-alzn~i-\-a,zn-* \-{-1)" • ап = 0 (9) (обе части уравнения умножены на (—1)" для сохранения знака старшего коэффициента). Если для уравнения (9) найдём верхнюю границу положительных корней Д*!, то для любого положительного корня этого уравнения будем иметь: а в силу равенства (8) для соответствующего отрицательного корня уравнения A) получим неравенство т. е. число —Д*! будет нижней границей отрицательных корней уравнения A). Поясним на примерах всё вышеизложенное (см. стр. 322—324). Предварительно заметим, что при делении многочлена на дву- двучлен вида х — с вычисления удобнее всего располагать по так назы- называемой схеме Горн ера: ап at а2 ... я„_1 ап *— коэффициенты делимого bn bt #2 ... bn_i Г — остаток коэффициенты частного Очевидно, старшие коэффициенты делимого и частного всегда будут одинаковы (рй = ай); любой же следующий коэффициент част- частного и остаток г вычисляются по формулам ** = '* = <** + **-! С \ (Ю) r=an-\-bn__1c. ) Эти формулы сразу получаются из тождества аох" + й^-" + -.. + ап_гх -f an = = (х—с) (Vм + М^ + • • • + К-г если, раскрыв справа скобки и сделав приведение подобных членов, приравнять друг к другу коэффициенты при одинакоиых степенях х в обеих частях тождества.
РЕШЕНИЕ ЛЛГЕБРЧИЧЕСКИХ УРАВНЕНИЯ 321 Схема Горнера особенно удобна при решении следующей задачи, которая в дальнейшем нам часто будет встречаться: данный многочлен разложить по степеням двучлена лг — с. Пусть = ?i (лг) (лг — с) -f г0, Яп-i (х) =-- <7„_, (л) (х — с) f г„_2, Чп-\ (х) = а0 (лг — с) -f г„_„ (И) где ^s+1 (лг) и rs обозначают частное и остаток, получающийся при делении qs(x) на лг — с. Если самое последнее выражение в A1) подставить вместо qni (лг) в предпоследнее равенство, а затем то, что при этом по- получится, подставить вместо qn_% (лг) в третье равенство снизу и т. д., то придём, наконец, к тождеству + г2 (лг- cf + ¦ • • + г„_, (х - с)"-1 + % (х-с)\ A2) Это и есть разложение данного многочлена по степеням лг — с. Если в тождестве A2) и в соотношениях, которые получатся после А-кратного его дифференцирования (в частности, при А=я), положим лг = с, то получим: A3) Поэтому равенство A2) можно переписать в виде -сГ, 04) а это и есть формула Тейлора для многочленов (см. стр. 319). Так как деление по схеме Горнера/(лг) на лг — сдает коэффи- коэффициенты частного qi (лг), которое в свою очередь надо делить на лг — с и т. д., то все вычисления удобно располагать в одну таб- таблицу, как это указано в следующем примере. 21 Энциклопедия, кн. 2.
322 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ Разложить f(x) = xl—Злг3 ~\-х—2 по степеням лг—3: 3 3 3 3 1 1 1 1 1 з 0 3 6 9 0 0 9 27 1 1 28 — 2 1 г, =28; Следовательно, f(x) = 1 (*— ЗL + 9 (х— ЗK + 27 (х— ЗJ + 28 (х— 3) + U при этом в силу соотношений A3) /C) = 1, /C) = 28, /'C) = 54, /'"C) = 54, /vC) = 24. A5) Обратимся к примерам вычисления границ корней. Пример 1. Найти границы действительных корней уравнения / (лг) = 2лгв -f Злг4 — 1 Олг3 — 60лг2 -f 4^x -J- 200 = 0. Здесь ао = 2, А = 200, Л, = 60, т = 2. 900 По первому способу К== 1 -|—^—= 101. По способу Маклорена К= 1 -J- у -у ^ 6»5 (приближённое зна- значение берём с некоторым избытком). Для определения числа с, удовлетворяющего условиям G), при- приходится иногда делать несколько попыток; удобнее всего каждый раз применять схему Горнера. Попробуем испытать число 2: 2 2 2 2 2 3 7 11 —10 4 26 —60 —52 0 40 —64 — 64= Г 200 72 B) Так как /B) = —64<^0, то попытка оказалась неудачной вследствие нарушения условий G). Испытаем число 3: 3 3 2 2 2 3 9 15 —10 17 62 —60 —9 177 40 13 544 200 239
РЕШЕНИЕ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ 323 Так как вторая строка состоит исключительно из положительных чи- чисел, то отпадает необходимость в вычислениях дальнейших строк, ко- которые будут состоять из положительных чисел; в частности, числа /C), /C), /"C), /'"C), /IVC), /vC) будут положительны. Итак, по способу Ньютона ^=3. Таким образом, наилучшая верхняя граница положительных корней получилась по способу Ньютона. Подстановка х = — z приводит нас к уравнению 2,гв — Зз4 — 10гъ -f G022 + 40г — 200 = 0. Здесь ао = 2, Л = 200, Л] =200, та=1. Следовательно, имеем: 900 По первому способу К\ = \-{—2~=101. Of)f) По способу Маклорена Л^ = 1 -{--к—= 101. По способу Ньютона: испытае;« число 2: 2 2 2 2 2 —3 1 5 —10 — 8 2 60 44 + 40 128 + —200 56 Так как получилась строчка исключительно положительных чи- чисел, то условия G) выполняются и Kt — 2. Опять способ Ньютона дал наилучший результат, в то время как первые два способа дали совершенно одинаковые и очень плохие значения для /f,. Итак, нижняя граница отрицательных корней равна — Кх = —2; следовательно, все действительные корни уравнения A5) лежат в ин- интервале (—2, 3). Пример 2. Найти границы действительных корней уравнения — 12 = 0. A6) Отметим, что для данного уравнения те = 4, так как перед пер- первым отрицательным коэффициентом стоит четыре члена, коэффи- коэффициенты которых неотрицательны (обязательно надо учитывать от- отсутствующие члены!). Преобразованное уравнение имеет вид — 160** — z— 12 = 0. A7) Легко видеть, что по первому способу /f = 81, /(",=81, т. е. можно утверждать, что все действительные корни данного уравне- уравнения A6) (если они у него имеются) лежат в интервале (—Кц К), т. е. в интервале (—81, 81). 21*
324 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ По способу Маклорена следовательно, можно утверждать, что корни лежат в интервале (-4, 4). Переходя к способу Ньютона, испытаем число 3 сразу для урав- уравнений A6) и A7) — они отличаются только знаком коэффициента при неизвестном в первой степени: 2 0 10 0 —160 ±1 —12 2 6 28 84 92 + + Так как вся строчка состоит только из положительных чисел, то 3 удовлетворяет условиям G), а потому /f = 3 и К1 = 3; интервал же для действительных корней будет (—3, 3). Упомянем ещё о двух границах корней, играющих значительно меньшую роль в вопросах решения уравнений: о нижней границе положительных корней (так называется положительное число, ко- которое назерное меньше любого положительного корня данного уравнения), равной jz-, где /f2— верхняя граница положительных корней уравнения, получающегося из данного подстановкой лг = —,и о верхней границе отрицательных корней (так называется отрица- отрицательное число, которое наверное больше любого отрицательного корня данного уравнения), равной — jr , где Ks — верхняя граница положительных корней уравнения, получающегося из данного под- подстановкой лг = . § 3. Отделение корней Наиболее совершенное средство для отделения корней даёт тео- теорема Штурма, к рассмотрению которой мы и перейдём. Будем предполагать, что в предложенном нами уравнении с дей- действительными коэффициентами кратные корни уже выделены, т. е. мы имеем дело с уравнением / (х) = аох" -f а,*»-» + • •. + ап _ ,* + а„=, A) все корни которого простые. Составим систему функций Я, (х), Я2 (х), ..., /?„_, (х), Нт = const B) следующим образом.
РЕШЕНИЕ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ 325 Деля f(x) на / (х), обозначим получающийся при делении остаток через — /?, (х); взятый же с обратным знаком, остаток этот даёт третью функцию Rt(x) системы B). Деля затем /'(х) на /?, (лг), обозначим остаток через —/?2 (jc), а взяв его с обратным знаком, получим четвёртую функцию системы B). Это продолжим до тех пор, пока не получится функция, на которую предшествую- предшествующая функция системы B) делится без остатка. Описанный процесс совпадает по существу с отысканием наиболь- наибольшего общего делителя функций f(x) и /(jc) с помощью алгорифма Евклида1) (изменение знаков .остатков не имеет значения, так как в алгорифме Евклида допускается умножение на постоянные числа не только окончательных остатков, но даже остатков промежуточных, получаемых в процессе деления). Так как уравнение A) не имеет кратных корней, то /(jc) и / (jc) будут взаимно простым», следо- следовательно, наибольший общий делитель их, т. е. последний остаток в описанном выше процессе, будет постоянным числом. Предполо- Предположив, что остаток этот получается при т-м делении, обозначим его через — Rm; взяв же это число с обратным знаком, получим по- последний член системы B). Составленные таким образом функции B) носят название функ- функций Штурма, а вся система B) называется системой Штурма уравнения A). Будем это название сохранять и для системы функций, отличаю- отличающихся от соответствующих функций системы B) постоянными поло- жительн"ыми множителями. Пусть при каком-то значении аргумента х = с вычислены значе- значения функций Штурма, т. е. получена система постоянных чисел /(с), /(с), /?,(с), ...,/?„_, (с), /?„. C) Если какие-нибудь два соседних числа этой системы имеют раз- разные знаки, то будем говорить, что переход от одного числа к другому сопровождается переменой знака (при одинаковых же знаках у двух соседних чисел будем говорить, что имеет место повторение знака); если какое-нибудь из чисел ряда C), кроме /(с), будет равно нулю, то этот член будем пропускать, сравнивая друг с другом знаки соседних с ним чисел. Обозначим общее число перемен знака в последовательности C) через W(c). Теорема Штурма. Если а<^Ь, то W{ a) ^ W (Ь), причём разность 117 (а)—W(b) равна числу действительных корней урав- уравнения A), заключённых в интервале (а, Ь). Другими словами, число перемен знака, теряемых системой функ- функций Штурма при переходе от а к Ь, равно числу действительных корней уравнения A), лежащих в интервале (а, Ь). 1) См. Э. э. м., кн. 1, А. Я. Хин чин, Основы теории чисел.
326 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ Поясним сначала теорему Штурма примером, а затем дадим её доказательство. Пример. Пусть дано уравнение лг3— и надо, во-первых, найти число положительных и число отрица- отрицательных корней этого уравнения, а во-вторых, отделить корни друг от друга. Так как /'(лг) = 3лг9—10, то выполняем следующее деление: 3(лг3 — Юх-\-2) Kх"'— 10 ~~ Злг3—Юл: лг Следовательно, можно считать R1(x)—10x— 3. Примечание. Мы умножили делимое на положительное число 3, чтобы не иметь дела с дробными коэффициентами; при этом остаток возрос в три раза, что допустимо, так как нас инте- интересуют не сами числа R^a) и Rt(b), а лишь знаки этих чисел. По той же причине мы взяли /?,(jc)= Юлг—3, а не 20х— 6. Ясно, что недопустимым является умножение или сокращение на отрица- отрицательные числа. Разделим теперь f'(x) на R^x): — 10) \\0х— 3 30jc3 — 9jc 3jc -j- 9 10(9лг—100) ~~ 90лг —27 —973 = — /?2. Следовательно, /?2 = 973, или можно также считать, что /?2=1. Итак, мы получили систему функций Штурма для уравнения D): f(x) = x3 — lOjf-J-2; /(лг) = Злг*— 10; Rt(x) = Юх — 3; Я2=1. Имея в виду определить число перемен знака W(x) при разных значе- значениях х, будем заносить значения этих функций в следующую таблицу: X 0 + 00 00 2 ^ 5 2 Значения или знаки функций + 2 + 14 — 22 + — 10 J. + 38 + — 3 + — 23 — 43 $ - - - W(x) 2 0 3 2 3 0 1
РЕШЕНИЕ ЛЛГЕБРЛИЧЕСКИХ УРАВНЕНИЙ 327 Желая найти общее число положительных корней уравнения, прежде всего находим W@) = 2, а затем полагаем, условно выра- выражаясь, JC = -j- 00. Конечно, значений функций Штурма при лг = -|-оо мы не вычи- вычисляем, так как -J- оо есть лишь символ переменной величины, при- принимающей какие угодно большие положительные значения, но при определении знаков f(x), f'(x) и т. д. при jc = -f-oo мы руковод- руководствуемся простым правилом, в силу которого знак любого много- многочлена при достаточно больших по абсолютной величине значениях аргумента совпадает со знаком его старшего члена (это следует из того, что старший член при |jc|->-|-oo растёт по абсолютной ве- величине значительно быстрее, чем остальные члены многочлена ')). Итак, число положительных корней рапно W @) — W (-f оо) = 2 — 0 = 2. Найдя затем W(—оо) = 3, мы можем утверждать, что число отри- отрицательных корней уравнения равно W(~ оо)— 117@) =1. Желая найти сравнительно небольшой интервал, заключающий отрицательный корень уравнения, полагаем лг = —-2, и так как W( — 2) = 2 = W@), a W{ — оо)— W(— 2)= 1, то единственный отрицательный корень будет меньше чем —2; но W(—4) = 3; следовательно,, можно утверждать, что отрица- отрицательный корень лежит в интервале (—4, —2). Положив лг = 5, находим: WE) = 0, т. е. оба положительных корня лежат в интервале @, 5), так как W7@)— W E) = 2. Наконец, при лг = 2 имеем: 117B)= 1, следовательно, и поло- положительные корни отделены друг от друга: один лежит в интервале (О, 2), а другой — в интервале B, 5), так как W @) — 117B) = W[2) — WE) = 1. Перейдём к доказательству теоремы Штурма; оно основано на следующих четырёх свойствах функций Штурма: I. При изменении х последняя функция Штурма не меняет своего знака. Это свойство очевидно, так как последняя функция есть просто постоянное число. ') См., например, А. К. Сушкевич, Основы высшей алгебры, 1941, стр. 131.
328 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ II. Две соседние функции Штурма не могут обратиться в нуль при одном и том же значении аргумента. Для доказательства возьмём ряд тождеств (вытекающих из из- известного соотношения: делимое равно делителю, умноженному на частное, плюс остаток) f(x)=f(x) ?,(*) — /?,(¦*), Ят_2 (*) = /?„_, (*) ?„ (*) - /?„, Rm^(x) = Rm qm+l(x). (Здесь через qx (х), qq (х) и т. д. обозначены соответствующие частные.) Если бы при каком-то jc^=jc0 какие-нибудь две соседние функции равнялись нулю, например Rk (jc0) = Rk+1 (xv) = 0, то из соответствующего соотношения в E) следовало бы, что Rk_t (х0) =0, а из предшествующих ему соотношений последовательно вытекало бы, что Rj,_i(xQ) = 0, Rk_3(x0) = 0,..., Rv(xo) = O, R1(x0)==0, и, наконец, f'(xo) = O и /(л:0) = 0. Но это означало бы, что хп есть кратный корень уравнения A), а это противоречит условию, в силу которого все корни уравне- уравнения A) простые. III. Если какая-нибудь из функций Штурма f'(x), Rt(x), Rq (x),..., Rm_i (x) обращается в нуль при некотором значении х = с, то значения соседних с нею функций Штурма, вычис- вычисленные при том же значении х=с, имеют разные знаки. Действительно, если Rk(c) — 0, то из тождества Rk^ (х) = Rk (х) дкц (х) — Rk+1 (X) следует: Свойство III играет существенную роль в доказательстве тео- теоремы Штурма благодаря вытекающему из него следствию: Пусть лг принимает настолько близкие друг к другу значения с — е, с, c-J-e, что знаки чисел /?ft_, (с — е) и 7?й_, (с -f- e) совпадают со знаком числа Rk_t (с), а знаки чисел R/,+1(c—е) и ^?ft+i(e-|-e) — со знаком числа Rk+l (с) '). Тогда в силу соотношения F) в •) Это выполнимо, так как Rk-i(x) и %iD будучи многочленами, являются функциями непрерывными.
РЕШЕНИЕ А1ГЕБР\ИЧЕСКИХ УРЛВНЕНИЙ 329 каждой тройке чисел Rk-Лс —Е). Як(с — Е), /?А+1(с — в), G) Rk-i(c + z), /?ft(c + e), Rk+l(c-\-z) (8) крайние числа будут иметь разные знаки, и независимо от того, какие знаки будут у чисел Rk(c— е) и Rk(c-\-e), каждая из этих троек чисел будет давать одну перемену знака. Очевидно, всё изложенное выше относится и к тройке функций /(jc), f'(x), Ri(x) ггри условии, что лг, возрастая, проходит через корень функции /'(лг). С другой стороны, те из функций Штурма, которые в точке лг = е не обращаются в нуль, сохраняют свой знак в малой окрестности этой точки, а потому никакого влияния на изменение числа перемен знака оказать не могут. Таким образом, из свойства III вытекает следствие: Если х, возрастая, проходит через корень одной из функций f (x), Ri (jc), /?2 (jc), ..., /?m_i (x), то при этом число перемен знака среда функций полной системы Штурма C) не меняется. Иначе обстоит дело, как это следует из свойства IV, когда лг, возрастая, проходит через корень функции /(лг): IV. Если лг,— корень функции /(лг), то при достаточно ма- малом положительном е числа /(#, — е) и f'(xl —е) имеют разные, а числа /(лГ|-|-е) и f'(xl-\-e.)— одинаковые знаки. Действительно, так как /'(л^) ф 0 (иначе лг, было бы кратным корнем /(лг)), то, взяв е настолько малым, чтобы в интервале (лг, — е, лг, -j- е) функция / (лг) сохраняла знак, будем иметь одну из двух возможностей: 1) В интервале (лг, — е, лг,-)-?) функция f'(x)^>0. Но тогда /(лг) есть функция, возрастающая в этом интервале, и следовательно, /(лг, — е)<^0 и /^j-f-e)^>0, в то время как /'(лг,—е)]>0 и + i+)> 2) В интервале (лг, — е, лг,-J-e) функция /'(лг)<^0. Но тогда /(лг) есть функция, убывающая в этом интервале, и следова- следовательно, /(лг, — е)>0 и /(лг,-|-е)<^0, в то время как/'(лг,—е)<^0 и/' (лг,-\-е)<^0. Таким образом, свойство IV доказано полностью. В силу этого свойства т. е. система функций Штурма теряет одну перемену знака всякий раз, когда х, возрастая, проходит через корень уравнения A). Так как во всех других случаях число перемен знака в системе функций Штурма не меняется, то общее число теряемых перемен знака при переходе от а к Ъ будет равно числу корней уравнения A), лежащих в интервале (а, Ь), а это и есть теорема Штурма. Как показывает рассмотренный' выше пример, с помощью тео- теоремы Штурма действительные корни могут быть отделены друг от
330 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ друга, и каждый интервал, заключающий тот или иной корень, может быть затем уменьшен до требуемых размеров. Однако, уста носив, что в каком-то интервале лежит точно один корень данного уравнения, для дальнейшего уменьшения интервала нет необходимости вычислять значения всех функций Штурма, а достаточно определять всё более и более узкие интервалы, на кон- концах которых функция f(x) имеет разные знаки (табличный способ вычисления корней). Казалось бы, можно было бы с самого начала, не прибегая к теореме Штурма, табличным путём отделить корни друг от друга; во многих случаях так и делают. Однако при этом существует опасность не заметить корней уравнения, лежащих в каком-нибудь интервале. Например, для уравнения составляя таблицу F{x) = 9jc3 — = 0, X 0 1 2 3 F{x) 60 8 10 120 можно было бы сделать заключение, что уравнение не имеет поло- положительных корней (так как при лг^>3 функция F(x) будет при- принимать лишь положительные значения, ибо старший член её будет расти гораздо быстрее, чем отрицательный член). Однако такое заключение было бы неверным, так как в интер- интервале A, 2) лежат два действительных корня, в существовании кото- рых мы убеждаемся, определив, например, г \-~) = — -%. Правда, этот пример подсказывает следующий практический совет: когда убывание функции сменяется её возрастанием (или наоборот), а сама функция, принимая сравнительно малые значения, не меняет знака при табличных значениях аргумента, надо быть осторожным и лишь после детальной проверки поведения функции в соответствующем интервале утверждать, что в этом интервале нет корней- уравнения. Еще опаснее случай, когда при наличии в каком-нибудь единич- единичном интервале трёх действительных корней таблица «подсказывает», что этот интервал содержит лишь один действительный корень. Так, например, будет обстоять дело для уравнения = (Злг — 7) Djc — 11) (jc2 — 3jc -f-1) = = 12л4 — 97jc3 -f- 272лг2 — 292jc -|- 77 = 0.
РЕШЕНИЕ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ 331 Из таблицы X 0 1 2 3 4 Ф(х) 77 — 28 — 3 + 2 125 можно было бы заключить, что в интервале B, 3) заключён один корень уравнения; на самом ж"е деле в этом интервале заключено три корня: Итак, табличный способ может привести к ошибочному заклю- заключению, тогда как способ Штурма в этом отношении безупречен, хотя и связан иногда с очень громоздкими вычислениями. Кроме способа Штурма определения числа корней, заключённых в данном интервале, существуют другие приёмы. Приведём без доказательства теорему Бюдана-Фурье, связанную с гораздо более простой системой функций, чем система Штурма, но иногда дающую, к сожалению, довольно расплывчатый ответ. Теорема Бюдана-Фурье. Число действительных корней уравнения A), заключённых в интервале (a, t), равно числу те- теряемых перемен знака в системе функций fix), f (х), Г (х), ..., /("">) (х), /(") (х) при переходе от а к Ъ или на чётное число меньше, чем это число. Если, например, теряется пять перемен знака, то по теореме Бюдана-Фурье можно утверждать, что число корней, лежащих в дан- данном интервале, равно 5, 3 или 1. Правда, если теряется одна перемена знака, то можно утверждать, что в интервале (а, Ь) лежит точно один корень уравнения. Без доказательства же приведём теорему Декарта '). Теорема Декарта. Число положительных корней уравне- уравнения A) равно числу перемен знака в последовательности коэффи- коэффициентов уравнения а0, а,, а2, ..., ап_х, ап или на чётное число меньше, чем это число. Теорема эта позволяет быстро (но не всегда точно) определять число положительных корней уравнения, а при использовании под- подстановки дг=—z — число его отрицательных корней. ') Интересующихся подробностями, связанными с теоремами Бюдана- Фурье и Декарта, отошлём к цитированной выше книге Сушкевича.
332 ЧИСЛЕННЫЕ И ГРХФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРЧВНЕНИЙ § 4. Способ Горнера ПуСТЬ /(х)=:ао** + а1л»-1+...+а^х + ая = 0 A) — уравнение с действительными коэффициентами. Для вычисления какого-нибудь действительного корня уравнения A) способом Горнера поступают следующим образом: определив хотя бы табличным способом целую часть искомого корня, с по- помощью некоторых подстановок переходят затем к такому уравне- уравнению, у которого целая часть соответствующего корня равна пер- первому десятичному знаку искомого корня. Повторяя этот процесс, можно получить сколько угодно десятичных знаков интересующего нас корня уравнения A). Каковы же эти подстановки? Пусть *! = с0 + -щ + -fiQ + -Що + • • • = Vi^a • • • предста- представляет искомый корень, написанный в виде десятичной дроби, и мы уже нашли с0 табличным способом, установив, например, что числа /(со) и /(со4~1) имеют рашые знаки. Тогда подстановка х — со=у B) приведёт нас к уравнению ?iC) = 0, C) у которого соответствующий корень у1 = O.CjC^ ..., а затем под- подстановка заменит уравнение C) уравнением $100 = 0, E) где K1 = c1,csc8ci ... Определив целую часть корня Yt, подстановкой К-с,=г F) преобразуем уравнение E) в уравнение 0, G) а последнее подстановкой в уравнение *„(г)=о, (9) у которого соответствующий корень Zj = С2, СзС4 . . . Ясно, что процесс этот можно повторять сколько угодно раз.
РЕШЕНИЕ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ 333 Если бы мы нашли Z, не с точностью до единицы, а, например, с точностью до одной сотой, т. е. установили бы, что ,01, то это нам дало бы сразу три цифры искомого корня, а следую- следующие подстановки имели бы вид Z—св, сас4 = и, A0) U 1000 • 00 Подстановки B), F), A0) и т. д. удобнее всего выполнять, предварительно разлагая f(x) по степеням х—с0, ф, (К) — по степеням Y—сг и т. п.; переход от уравнения C) к уравнению E) сопровождается лишь умножением коэффициентов соответственно на 1, 10, 102, 103 и т. д. (при подстановке же A1) — на 1, 103, 106 и т. д.). Пример 1. Найдём, чему равен положительный корень урав- уравнения ,. . т . ,„ f(x)=x3-{-x—13 = 0. Так как /B) = —3, а /C) = 17, то 2<дг1<3, т. е. со — 2. у Следовательно, надо сделать подстановки х — 2 = v, y = -iK или, объединяя их: х = 2-\--^. 2 2 2 1 1 1 1 0 2 4 6 1 5 13 — 13 — 3 Таким образом, имеем: 9iCV)=J'1 + 6^ + 13y —3 = 0, ^(Г)=Г34-60Г2+1300Г— 3000 = 0. Здесь сразу видно, что <]>1B)<^0, а <|/, C)>0; следоватечьно, З, т. е. с1=2, и надо сделать подстановки Y — 2—z; Z. z = ~=- или, объединяя их: К будем иметь: дг, =2,2 -р-щН : Z I =2 4--гр( для искомого же корня 2 2 2 1 1 1 1 60 62 64 66 1300 1424 1552 — 3000 — 152
334 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ откуда ^ (Z) = Z3-f 660Z2-}- 155 200Z— 152 000 = 0. Ясно, что 0<^Zi<Cl, и соответствующие подстановки будут: Z== = 0-\-п = и; и = -г-г или Z=-^r- (следовательно, дг1 = 2,20-|-—' ) • это даст нам: !5 520 000t/— 152 000 000 = 0. Хотя мы и получили уравнение с очень крупными коэффициентами, но резкое возрастание их к концу уравнения позволит нам получить границы для Ul простым делением свободного члена на коэффициент при U, причём деление это позволит даже найти сразу несколько следующих цифр искомого корня: 152000 000 139 680 000 15520000 12320000,0 10 864000,0 9,75 1 456 000,00 776 000,00 680000,00 Последняя цифра частного 5 сотых (а не 9 сотых, как должно было бы получиться при обычном делении) взята с таким расчётом, чтобы получился остаток (равный 680 000), несколько бблыиий, чем зна- значение двух временно отброшенных членов уравнения U3 -\- 6 6006/2 при U—9,75: 9,753 -f- 6600 • 9,752 < 661 000 < 680 000. Следовательно, ^ С другой стороны, если бы мы взяли последнюю цифру в частном равной 6 сотым, то получился бы остаток 524 800 < 9,763 + 6600 • 9,762, и следовательно, мы имели бы <|/(9,76) ^> 0. Итак, 9,75 < t/t < 9,76, откуда 2,20975 <^!<2,20976, т. е. корень уравнения получен с точностью до 10~". В силу теоремы Декарта других положительных корней данное уравнение не имеет. Конечно, в интервале (с0, с0 —j— 1) может лежать не один, а не- несколько корней уравнения A); заметим, что при чётном числе корней знаки /(с0) и /(со-|- 0 одинаковы, и при неосторожном применении табличного способа можно, как уже указывалось в примечании к теореме Штурма (§ 3), такие корни даже проглядеть. Однако, если будет установлено, что в интервале (с0, с0 -j-1) лежат, например, точно два корня, то каждый из них можег быть
РЕШЕНИЕ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ 335 вычислен отдельно, как было указано в разобранном примере. В самом деле, пусть Тогда уравнение E) будет иметь корни !<10 и 0<Г2<10. Если окажется, что целые части у У1 и К2 совпадут, т. е. что Vt и К2 лежат между с, и cl -j- 1, то переход к уравнению (9) совер- ШИМ С ПОМОЩЬЮ ПОДСТАНОВКИ Y=C1-\--Tq. Пусть целые части у Zl и Z% будут разные: тогда подстановка Z=c'2-\-jj-. приведёт к цепи вычислений, дающих хх с требуемой степенью точности; подстановка же Z=^c\-\- у^ приведёт в конечном счёте к корню xv Пример 2. Решим уравнение 9jc3 — 61* + 60 = 0. Из § 3 мы знаем, что оно имеет в интервале A, 2] два корня; следовательно, 1 <^ ^2 Сделаем подстановку je = 1-{-Tq . 1 1 1 9 9 9 9 0 9 18 27 — 61 — 52 — 34 60 8 Из таблицы ф, (Y) = 9У3 + 270У2 — 34?0Г + 8000 = 0. знак ii (Y) видно, что 3<Г!<4, 6<Г2<7. Делая подстановку К=3-(--г^, придём к уравнению 9Z3 + 3510Z2 — 153 700Z ^ 473 000 = 0 (читателю предоставляется самому получить это уравнение); так как 3<^Zj<^4, то 1,33<^JCj <^ 1,34. Конечно, продолжая вычисления, можно получить сколько угодно десятичных знаков для JCj-
336 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ W Подстановка же К=6-}~т7т приведёт нас к уравнению 9\\-{-4320W^-{-8l 200 W— 736000 = 0, и так как 6<и?!<7, то 1,66<>2< 1,67. Сделаем, наконец, замечание о вычислении по способу Горнера отрицательных корней. Возьмём для примера уравнение / (дг) = х3 4- 10х + 53 = 0. Так как /(—3) = —4, а /(—2) = 25, то — 3O,<—2. Де- Делая подстановку х = — 3 4~ тт;: — 3 — 3 — 3 1 1 1 1 0 — 3 — 6 — 9 10 19 37 53 — 4 придём к уравнению у* — 90^4- 3700Г— 4000 = 0, где 1 <^К1<Г2. Следовательно, надо сделать подстановку К=14~~ 4-jq, которая приведёт к уравнению Z3 — 930Z2 4- 351 700Z — 391 000 = 0, причем 1<Z,<2. Таким образом, используя приём, применяемый для обозначения логарифмов с отрицательной характеристикой, получим: 3,H<*i<3,12, или — 2,89 <>!< — 2,88. К тому же результату можно было бы придти, сделав с самого начала в данном уравнении замену: х— — w, что привело бы к уравнению г?K4-Юпу — 53 = 0. Найдя для последнего 2,88 <^т&1<^2,89, мы по- получим: — 2,89 <дг, = — ву,<—2,88. § 5. Способ Лагранжа В то время как в способе Горнера ищутся один за другим деся- десятичные знаки действительного корня уравнения, в способе Лагранжа последовательно определяются так называемые неполные частные д0, qx, g2, ... той непрерывной дроби, в которую разлагается иско- искомый корень уравнения.
РЕШЕНИЕ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ 337 Пусть для уравнения с действительными коэффициентами n = O A) установлено (например, табличным способом), что корень лежит в интервале (д0, до-{- 1), т. е. гу> ( ) где о — неизвестная положительная величина, меньшая единицы, а у—неизвестная положительная величина, большая единицы. Ясно, что подстановка 1 C) приведёт нас к уравнению 0, D) у которого обязательно найдётся положительный корень, превышаю- превышающий единицу [если в интервале (q0, ^0 -}-1) заключено несколько корней уравнения A), то столько же положительных, превышающих единицу корней будет иметь и уравнение D)]. Обозначим корень уравнения D), соответствующий корню хи через .у,; тогда будем иметь: Ъ = 9о + ~. - C') Если найдём затем такое целое число д„ что то подстановка У = Я1 + Т E) приведёт нас к уравнению Ф(*) = 0, F) имеющему положительный, превышающий единицу корень ги причём У1 = Я1 + ~ E') (читателю полезно подумать, в каком случае уравнение F) может иметь несколько положительных корней, превышающих единицу). Найдя интервал (q2, 9г~1~1)> в котором заключён zl3 делаем под- подстановку *=?*+'i- G) и продолжаем этот процесс до тех пор, пока не будет обеспечена возможность определения искомого корня хх с заданной точностью. 22 йштклонедип, кн. 2
338 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ Сопоставляя C'), E') и т. п., получим представление искомого корня в виде непрерывной (или цепной) дроби (8) ?3+- Конечно, может случиться, что положительный корень одного из получающихся в результате преобразований уравнений будет числом целым; пусть, например, окажется, что ul — q3 (целому числу); тогда Ц(9) т. е. искомый корень будет числом рациональным. Таким образом, рациональность искомого корня обнаруживается в способе Лагранжа автоматически, что представляет принципиальное преимущество способа Лагранжа перед другими методами вычисления действительных корней. Для корней же иррациональных процесс никогда не закончится, т. е. х1 будет выражаться бесконечной непре- непрерывной дробью, для которой по способу Лагранжа можно вычислить сколько угодно неполных частных: д0, qv q% и т. д. Если непрерывную дробь (конечную или бесконечную) оборвать на каком-то звене, то получится её так называемая подходящая дробь + Например, Qo Подходящие дроби данной непрерывной дроби обладают рядом замечательных свойств; отметим здесь некоторые из них без дока- доказательства '). ') См. Э. э. м., кн. 1, А. Я. X и н ч и и, Элементы теории чисел.
РЕШЕНИЕ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ 339 Т. Существуют соотношения, выражающие числитель (или зна- знаменатель) любой подходящей дроби через числители (соответственно, через знаменатели) двух предшествующих дробей: (Ю) Формулы A0), A1) позволяют очень просто вычислять одну за дру- Р Р, гой подходящие дроби, если предварительно вычислены — и -?г-; Vo VI 859 возьмём для примера разложение в непрерывную дробь числа ^ • 859_ 392" Так как — 2—2- ^1_2 i J- — 11 а —г то э0 = 11 . 4 + 2 = 46, = 5-4+1=21. ; Вычисления удобно расположить в таблицу: A2) А: 4k i 0 2 1 2 1 11 5 5 2 46 21 4 3 103 47 2 252 115 2 5 859 392 3 Заполнив с самого начала верхнюю и нижнюю строки, а также пер- первые два столбца средних строк, вычисляем [см. A2)] Р2 и Q2, затем Р3=103 (умножив Р2 = 46 на следующее неполное частное q3 = 2 и прибавляя Pi= 11), аналогично Q3 и т- Д- Очевидно, ^ должно сов- совпасть со значением всей непрерывной дроби. Итак, для данного примера подходящие дроби будут: 22* 2 1 ' 11 "' 43 21' 103 47 ' 252 115' 859 392-
340 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ II. Все подходящие дроби с чётными номерами Й' Ql' Й* "¦ будут меньше, а все подходящие дроби с нечётными номерами Ei Ел Ei Qi' Q»' Qt' '" будут больше, чем данная непрерывная дробь. III. Всегда :мс Р, Q* Рц Q* Qs+i )тренн' Pt Qi Р, Q* Qs QsQs+i' ом случае 46 21 103 47 п " 5 ~~ 46 21 47 1 105' 1 • 21- A3) Последнее свойство даёт возможность определять в способе Лагранжа, в какой момент можно прекратить вычисления. Действи- Р Р тельно, так как дг, заключено между -? и -~^-, то Ws Vs+i Но поэтому S+i 1 \х, — Qs+i Qs I QsQs+i" : Qs -j- Qs_j (так как ^ 1 A4) Если погрешность приближённого равенства быть меньше заданного числа а, т. е. будем иметь: Ек или f=*z ~ должна Qk то, как только 1 вычисления можно будет прекратить. Таким образом, если одновременно с вычислением q0, qx, q^ и т. д. по способу Лагранжа заполнять таблицу (аналогичную таблице, указанной в примере) и вычислять значения выражения Qs (Qs -\- Qs_i), то в лю- любой момент легко будет определить, с какой точностью соответ- соответствующая подходящая дробь выражает искомый корень. Свойство же II даст возможность определить: найдено ли приближённое зна- значение корня с недостатком или с избытком.
РЕШЕНИЕ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ 341 Поясним способ Лагранжа примерами. Предварительно заметим, что подстановка x=qo-\— (и ей подобные) очень просто выпол- выполняется по схеме Горнера: ищутся коэффициенты разложения функции /(лг) по степеням х— q0 и так как х — qu = —y то для получения уравнения с неизвестным у достаточно взять полученные по схеме Горнера коэффициенты в обратном порядке (свободный член сделать старшим коэффициентом и т. д.; старший коэффициент превратить в свободный член). • Пример !.• Найти положительный корень уравнения Из таблицы / (дг) = 7х3 — За-2 + 4х — 20 = 0. /(*) — 20 —12 32 видно, что положительный корень уравнения лежит в интервале A,2), . . 1 следовательно, надо сделать подстановку х=1-\- : 1 1 1 7 7 7 7 — 3 4 11 18 4 8 19 — 20 — 12 Беря полученные числа в обратном порядке (и умножая их на — 1, чтобы старший коэффициент преобразованного уравнения сделался положительным), получим: <p(j/)=12y— 19У— 18у — 7 = 0. Так как фB)<0, а фC)>0, то 2<_Уд<3, и следует сделать подстановку у = 2\ 2 2 2 12 12 12 12 — 19 5 29 53 — 18 — 8 50 7 — 23 Отсюда «J, (z) = 23zs — 50г* — 53г — 12 = 0. Так как >|< C) = 0, то zx = 3, следовательно, , . 1 10 ^ 3
342 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ Пример 2. Извлечь j/9 с точностью до 10~в. Иными сло- словами, надо найти единственный действительный корень уравнения Xs — 9 = 0. Очевидно, следовательно, надо сделать подстановку 2 2 2 1 1 1 1 0 2 4 6 0 4 12 — 9 — 1 Следовательно, уравнение для у будет: 9 (у) =у — 12/2 — 6у — 1 =0. Левую часть удобнее представить в виде так как при таком представлении сразу видно, что а <рA3)>0, т. е. I2<^yt<^13; делаем подстановку .у =12-]- — 12 12 12 1 1 1 1 — 12 0 12 24 -в — 6 138 j — 73 Уравнение для z будет иметь вид ^ (z) = 73z3 — — 138 — ^ — ~ W 0. Сразу видно, что становку z = 2 -j- , ^C)>0, т. е. 2<[гг,<^3; делаем под- под2 2 2 73 73 73 73 — 138 8 154 300 — 24 — 8 300 — 1 — 17 Очередное уравнение Легко видеть, что FA8)<0, a f(I9)>0, т. е. 18<j?j<19.
РЕШЕНИЕ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ 343 Если параллельно с приведёнными выше вычислениями вычислять соответствующие подходящие дроби для J 1 12 + - 18+ . k Pk- Qk Як 0 2 1 2 1 23 12 12 2 52 25 2 3 4 9ol • • - 402 • • • 18 .- и подсчитывать каждый раз, чему равно выражение Qh (Qk-\-Qk~i)>то Р Р61 легко установить, что -~ = — = 2,080085... представляет ИСКО- ИСКОСА g 4OZ мый корень с точностью, даже превышающей требуемую, так как р В силу свойства II -~ является для искомого корня прибли- V8 1 жённым значением с избытком, а так как 462 487 ^ 0|000005, то можно написать, что 2,080081 < -^9 <2,080087 или ^9 = 2,080083 (±3-10-в) (из таблиц имеем j/9 =« 2,0800838). § 6. Способ Лобачевского Нашему великому соотечественнику Н. И. Лобачевскому при- принадлежит способ решения алгебраических уравнений, являющийся одним из самых удобных, особенно в тех случаях, когда надо опре- определить и действительные, и мнимые корни уравнения *). 1) Способ Н. И. Лобачевского был открыт им не поздпее 1832 г. Он изложен в его сочинении «Алгебра или вычисление конечных», вышедшем в свет в 1834 г. (Нопое издание этого сочинения см.: Н. И. Лобачевский, Полное собрание сочинений, т. IV, Гостехиздат, М.—Л., 1948). Независимо от Н. И. Лобачевского аналогичный способ был предложен бельгийским мате- математиком Дапделеном A826) и шпенцарским математиком Греффе A837). Работа последнего получила наибольшее распространение, почему в учебной литературе способ этот долгое время назывался но имени Греффе.
344 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ Одно из существенных удобств этого способа заключается в том, что нет необходимости предварительно определять границы действительных корней, общее число их, отделять корни друг от друга; всё это, как правило, автоматически определяется в процессе весьма несложных вычислений, сводящихся в основном к сложению, вычитанию и умножению чисел и дающих сразу все корни уравне- уравнения. Перейдём к изложению способа. Пусть дано уравнение с действительными коэффициентами f(x) = ajcn + пух"'1 + •••+- an_tx -\-an = 0, A) имеющее своими корнями числа Тогда, во-первых, составляется уравнение /iM = 0 B) Сспособ его составления будет описан ниже), корнями которого будут числа ' Х\, Xi, ... , ¦ Хп, т. е. квадраты корней уравнения A), взятые со знаком минус. Затем с помощью того же преобразования переходят от урав- уравнения B) к уравнению /«(*) = 0, C) корнями которого будут числа: — {—X\f = —Xi, —Xi ... , — ЛГ„. После А-кратного повторения этого преобразования приходят к уравнению " + ... + Ая = 0, D) корнями которого будут числа Смысл этих преобразований особенно отчётливо усматривается, когда все корни уравнения A) действительны и различны по
РЕШЕНИЕ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ абсолютной величине; действительно, пусть Введём для краткости обозначение и напишем соотношения Вьета для уравнения D): 345 E) F) G) Деля почленно каждое из соотношений G) (начиная со второго) на предыдущее, получим: (8) При условии E) числа —-,—,— и т. п., вообще числа г Х1 Х1 Хъ вида ——- A^>гп) будут по абсолютной величине меньше единицы; поэтому при достаточно больших k, а следовательно и s, положи- положительные числа а4, а%, ... , an^t будут как угодно малыми,
346 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УР МНЕНИЙ Поэтому соотношения (8) можно заменить приближёнными со- соотношениями ~*~,А А„ с как угодно малыми (при больших значениях s) относительными погрешностями. Таким образом, корни уравнения D) благодаря резкому отли- отличию их друг от друга могут быть определены с большой точностью по формулам (9); после же извлечения с помощью таблиц логариф- логарифмов корней степени s из чисел (9) получим и корни уравнения A) (надо лишь для каждого т определить, будет ли уравнению A) удовлетворять -\- I/ -?&- или — 1/ ¦ fm ). Перейдём теперь к рассмотрению вопроса о переходе от урав- уравнения A) к уравнению B), затем C) и т. д. Для вывода правила составления функции /j (лг), корни которой были бы равны —х\, —лг1, ... , —х~п, удобнее всего пойти сле- следующим, несколько искусственным путём. Для многочлена /(лг) имеем: а0 (X — лг,) (л:—лг2)... (лг — лгп) = == аохп + а^"-1 + aiX"-* + ^" + • - • + ап^ -f an_lX+ an. A0) Если в этом тождестве заменим лг на —лг и обе части тожде- тождества умножим на (— 1)" (чтобы в правой части старший коэффи- коэффициент сохранил свой знак), то получим: + (-1)»-'^^ + (-1УЧ- A1) Перемножая почленно тождества A0) и A1), получим: в5 (лг2 — лг?) (лг* — лЗ)... (лг* — хЪ) = аадг2» — (а? — 2я0а2) лг2" - 2 + 2a1a3 + 2a0ai)x*n-* — ... + (— \f(a% — 2«fe -К—If в». A2)
РЕШЕНИЕ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ 347 Заменяя, наконец, в тождестве A2) л;2 на —х и умножая обе части его на (— 1)", получим: аЬ (х -f х\) (х 4- *»•••(* + хп) = аЬхп + («Г — 2а0а2) хп^ +... + в*. A3) Стоящий здесь справа многочлен и есть искомая функция /, (дг), так как из тождества A3) видно, что он обращается в нуль при X — Х\у X-ij -•• > Хп. Итак, если х1у дг2, ... , дг„ — корни уравнения A), то любой коэффициент уравнения, корни которого равны числам —х\, — х\, ... , —х%, равен квадрату соответствующего коэффициента данного уравнения минус удвоенное произведение соседних с ним коэффициентов, плюс удвоенное произведение коэффициентов, индексы которых отличаются от данного на две единицы, минус Згдвоенное произведение коэффициентов, индексы которых отли- отличаются от данного на три единицы, и т. д. до тех пор, пока не будет использован -какой-нибудь из крайних коэффициентов. Так как через два-три шага коэффициенты делаются очень большими, то дальнейшие вычисления приходится вести либо с по- помощью таблиц логарифмов, причём выгодно привлекать к вычисле- вычислениям также и гауссовы таблицы логарифмов сумм и разностей'), либо на арифмометре, округляя каждый раз результаты вычислений так, чтобы у крупнейших слагаемых сохранялось определённое, зависящее от требуемой точности число значащих цифр; в послед- последнем случае результаты обычно записываются в виде произведения десятичных дробей с целой частью, не превышающей десяти, на ту или другую степень десяти. Запись вычислений удобно располагать так, как указано в про- проделанном ниже примере: помимо окончательных результатов, выпи- выписываются удвоенные произведения соответствующих «соседних» коэффициентов, что облегчает в случае необходимости проверку вычислений. Удвоенные произведения будем выписывать всегда с учётом со- соответствующих знаков,, т. е., например, будем писать числа а|, —2^3, -\-2a0ai и т. п., которые после этого остаётся лишь сложить, для чего удобно иметь под руками счёты; если какое- нибудь удвоенное произведение будет исчезающе мало (в пределах точности вычислений) по сравнению с квадратом соответствующего коэффициента, то вместо него будем ставить звёздочку (*)- Пример. Дано уравнение f(x) = 2хъ — 15х2 4-16* -|- 12 = 0. ') См., например, Пржевальский, Пятизначные таблицы логариф- логарифмов, стр. 155—171.
348 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ Составить функции /, (лг), /2 (х), /3 (лг), /4 (лг), сохраняя при вычи- вычислениях четыре значащие цифры. k s Давиое уравне- уравнение 1 2 3 4 2 4 8 16 Коэффициенты уравнений 2 4 16 25S 6,554-10* —15 (— 15)s = 225 — 2-2- 16 = —64 161 161s = 2,592-10' —2-4.616 = —0,493-10* 2,099 ¦ 101 4,406- 108 — 0,107 ¦ 103 4,299 • 108 1,848- 10" — 0,001 - 10" 1,817 - 10" 16 16s = 256 —2-(—15)-12=360 616 616s = 3,795- 10° — 2-161-144 = — _ 0,464-10° 3,331 • 10» 1,110- 10" —0,008 • 10" 1,102 • 10" 1,214 • 1022 1,214- 10ss 12 144 2,074 • 10* 4,301 • 108 1,850- 10" Из таблицы следует, что /4(лг) = 6,554. 104лг3-1-1,847- 1017лг2-(- 1,214 • 1022лг+1,850 • 1017. . Конечно, чем резче отличаются друг от друга корни уравне- V I ния A), т. е. чем меньше будут величины ———— , тем быстрее бу- дут убывать с возрастанием k величины а1; а2, , ап_г в соот- соотношениях G) и тем меньше надо сделать преобразований для до- достижения заданной точности.' Если бы мы знали заранее верхнюю границу для чисел — нигь величины <хд, а2, . , то смогли бы сразу для любого k oiw
РЕШЕНИЕ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ 349 Важно, однако, найти признак, по которому можно было бы судить, даже ничего не зная о величине чисел какой т точностью получатся корни данного уравнения после определённого числа преобразований и, наоборот, в какой момент можно, прекра- прекратив преобразования, применять формулы (9), если нам заданы гра- границы погрешностей искомых корней. Для установления этого при- признака предположим, что мы ещё раз преобразовали уравнение D), перейдя к уравнению /ш (х) = В.х" + Я,**-' + ... + Вя = 0, A4) корни которого равны —x\s, —xls, ... , —х9„ Bfc+1 = 2 • 2k = 2s). Аналогично формулам G) будем иметь: (здесь т может быть любым числом от единицы до /г), причём по- положительные величины р„ р2, ... , р„_! будут меньше соответ- соответствующих величин а,-, а (Зп = 0. Так как Al т а В0 = А1, то, деля почленно соотношение A5) на A6), получим: Соотношение A7) показывает, что в том случае, когда величины alt a2 an_j в формулах G) достаточно малы по сравнению с единицей, так что в пределах точности вычислений соотноше- соотношения (8) могут быть заменены приближенными соотношениями (9), с той же примерно точностью будем иметь: ВтъА?п. A7') Таким образом, преобразование уравнений мы должны вести до тех пор, пока все удвоенные произведения «соседних коэффициен- коэффициентов» не сделаются исчезающе малыми (в пределах точности вычи- вычислений) по сравнению с квадратами соответствующих коэффи- коэффициентов. Отметим без доказательства, что справедливо и обратное утвер- утверждение: когда для всех значений т будут иметь место (в преде- пределах точности вычислений) соотношения Вт *=& Am, то с той же точностью будут справедливы равенства (9), т. е. можно, прекра- прекратив дальнейшие преобразования, приступить к вычислению корней по формулам (9).
350 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ Правда, с течением времени накапливается вычислительная по- погрешность, особенно при большом числе преобразований. Поэтому нельзя быть уверенным, что окончательные значения корней будур иметь столько же верных цифр, сколько сохранялось при вычи- вычислениях; однако можно рассчитывать, вообще говоря, на то, что число верных цифр в окончательных ответах будет лишь на еди- единицу меньше, чем число цифр, сохранявшихся при вычислениях. Отметим, что когда все корни уравнения A) действительны, то уравнения B), C) и т. п. имеют исключительно отрицательные корни, откуда следует, что все коэффициенты будут обязательно положительными (в чём легко убедиться, применив теорему Де- Декарта— см. стр. 331). Таким образом, если какое-нибудь из уравнений B), C) и т. п. будет иметь хотя бы один отрицательный коэффициент, то можно утверждать, что данное уравнение A) имеет мнимые корни.. Вычисление мнимых корней. Рассмотрим сначала простейший случай, когда уравнение A) имеет лишь одну пару мнимых корней, например: Хъ, 3 = a±W = r(cos9=t/sIn9), A8) причём [- 09) Напомним, чго сумма и произведение одинаковых степеней двух сопряжённых комплексных чисел будут числами действительными: xl^xs3 = 2rscoss^, xpcl — r*. ' B0) При условиях A9) в любом из равенств G), кроме второго, наиболее крупным модулем будет попрежнему обладать первое слагаемое, а потому будем иметь: ^ -А- = ^A+а3), ^==je?jej(i4-a1)f... B1) Б силу равенств B0) второе из соотношений G) нам даст: -^ = {х\х\ + х[х1) = 2xs/s cos 59 -f- r ^) B2) Модули всех стоящих в скобках слагаемых, кроме cos 59, будут при возрастании s стремиться к нулю, при этом сумма их [так же
РЕШЕНИЕ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ 351 как и величины alt a3, ... в B1)] будет числом действительным, так как комплексные слагаемые входят в неё сопряжёнными парами. Что же касается cos s<p, то его изменение будет зависеть от угла 9- Например, при ф=120° cos Bfc9) = cos 59 = — 2 > если 9= 9m > то ПРИ ¦s = 2ft^>2m будем иметь: cos scp= 1; вообще же cos $9 ПРИ своём изменении будет принимать и положительные и отрицательные значения как очень малые по абсолютной величине, так и близкие к единице. . . Но даже в случае чисто мнимых корней (9 = у), когда дая второго и следующих преобразованных уравнений cosscp будет равен 1, коэффициент при хп~* не будет меняться даже при боль- больших значениях s так же правильно, как при действительных кор- корнях. Действительно, из равенств будет следовать: Ai ^ txl г ^ г Во , а так как Во = Aq, to В^ g Ai. B3) Однако неправильное изменение коэффициента при Jtn~2 не ме- мешает из соотношений B1) получить: х*~ Ао> г ~ д> х^ а,' •¦¦• Л"~А^ что позволяет после извлечения корней (и выбора подходящих зна- знаков) определить х1г Х& хв, ... , хп и Но *, + (*« + *в) + -..+*» = *1 + 2я + *4 + -- *„ = -^, B5) откуда легко найти действительную часть искомых мнимых корней а затем и мнимую часть v=/ra — u*. B7)
352 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ Поясним примером применение формул B4), B6), B7). Пример. Решить уравнение + 15 = 0. k 1 2 s 2 4 Коэффициенты уравнений 12 144 2,07 -10* — 17 289 — 1320 — 1,03-10» 1,08-10е — 1,02.10е 0,04-10е 55 3025 510 3,54-103 1,25-107 • + 0,05- 107 1,30-107 15 225 _ 5,06-10* Легко видеть, что в следующем преобразованном уравнении все коэффициенты, кроме второго, будут квадратами полученных чисел (в пределах трёх значащих цифр, сохраняемых при вычислениях). Так как в преобразованных уравнениях встречались отрицательные коэффициенты, то, несомненно, данное уравнение имеет мнимые корни, причём Х\ д = г (cos ip ±i sin ср) = и ±vi и r^>' xs\, потому что неправильно меняются коэффициенты при х"~*, а не при лг"~2, как было в разобранном нами случае. Итак, ''3(М07 ъ 5,006, х3 ~ fWS^ - 0,2498 ' У 2ДП (по теореме Декарта данное уравнение или совсем не имеет поло- положительных корней, или имеет их два; но при двух мнимых корнях у уравнения имеется один лишь действительный корень; следова- следовательно, он должен быть отрицательным). По формулам B6) и B7) имеем: ця« —1(_ il —0,2498) ^ 0,8333, v^/5,006 — 0,8333^2,077. Следовательно, xit 2^ 0,8333 ± 2,077 i (точные значения корней Х3 = — 0,25, хи 2=4 ±/-3^- = 0,83333... ± Л 2,0742...)-
PEIIIFHHE АЛГРГ,РД.ИЧЕСКИХ УРИВНЕНЧЧ 353 Легко убедиться с помощью соотношений G), что при двух парах мнимых корней, например при Х{$ = rx (cos 9j ± i sin <pi) =  ± t»,i и 5,6 = h (cos <р4 dr I sin <p2) = щ± тг1, если при этом г,>|л"з|>|л",|>г2>|лгв|> ... >|аг„|, непра- неправильно себя будут вести коэффициенты при х" 1 и при jc"~b; осталь- остальные же коэффициенты, начиная с некоторого момента, будут (в пре- пределах точности вычислений) просто возводиться в квадрат при очередных преобразованиях; вместо B4) будем иметь: B8) Для определения nt и щ следует воспользоваться соотношениями а B9) J I 1 I _| 1 __ 1 I 1 I . 1 ¦ __ _ Оп-1 х, ' хг ' • •'"г Хп Ux ^_ Ol, .Т м, — oi; ' ж, "• '" ап (последнее соотношение следует из того, что корни уравнения ««•*"-!-an-ix"~4- ... +alx-{-aQ = 0 равны -L,^-, -J- -j-). 1 1 2и 2и ' ! ' Так как г-| г= о ,' ,¦ ==—^ и аналогично для второй пары мнимых корней, то соотношения B9) дают: B9') 2и,-|-2и, = — (^ +^3 + ^4 + ^7+ •••+ \ " *3 ЛГ4 АГ7 Л„/ р +7 1^ •1 'г \ "n откуда легко найти я,, я2, а затем и i>lf г»2 по формулам vl = s Случай действительных корней, почти одинаковых по абсо- абсолютной величине. В том случае, когда все корни уравнения A) действительны, но вместо E) имеем, например, второе из соотношений G) даёт: *? + х\х\ -{-...= 2х\х\ [ 1 4 23 Энциклопедия, кн. 2
354 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ Если s настолько велико, что а'2 по сравнению с единицей будет весьма малой величиной, то при следующем преобразовании полу- Члм уравнение вида A4), где °2 ^" 2 s' ^A) в чём легко убедиться, рассуждая так же, как и при выводе соотно- соотношения B3). Игнорируя неправильно изменяющийся коэффициент, из равенств A At S лА ^1 О О О получим: _ 2$ Как всегда, после извлечения корней надо проверить, какой из знаков будет подходящим для данного уравнения. При этом может оказаться, что jc2 и лг3 будут разных знаков (т. е. они почти совпадают только по абсолютной величине); но возможно, что jc2 и xs .бу- .будут иметь одинаковые знаки (случай кратною или «почти крат- кратного» корня). Как мы видели выше, в случае мнимых дгг.з при 9 = w поведе- поведение коэффициента при хп~2 может сделаться похожим на поведение этого коэффициента при дг2, ха действительных и | jc2 | я« | х31. Следует заметить, что для распознавания мнимых корней слу- служит, вообще говоря, наличие отрицательных коэффициентов в ка- каком-нибудь из преобразованных уравнений. Правда, может случиться (например, при очень малом ер), что отрицательные знаки не успеют появиться, а мы обнаружим изме- изменение какого-нибудь коэффициента, характерное для двух действи- действительных корней, имеющих почти равные абсолютные значения. Пример. Решить уравнение /(лг) = jc3 + 101лг2-f-2601 jc + 2501 =(х*-{-\00х +2501) (лг+1)=О, корни которого хи2=— 50 ±tfv 50,01 (cos l°10'±/ sin Так как дальнейшее изменение коэффициента при х и свободного члена будет правильным, а изменение коэффициента при х"' подчи- подчиняется соотношению B3), и, кроме того, ни одно из преобразован- преобразованных уравнений не содержит отрицательных коэффициентов, можно было бы предположить, что мы имеем случай двух близких по гбсолютной величине корней:
РЕШЕНИЕ АЛГЕБР\ИЧЕСКИХ УРАВНЕНИЙ 355 k 1 2 s 2 4 Коэффициенты уравнений 1 1 1 101 1,02 • 10» —0,52 • 104 0,50 • 10* 2,50 • 107 —1,25 • 107 1,25 • 107 2601 6,77 • 10е —0,50 ¦ 10° 6,27 • 10° 3,93 • 1013 —0,01 • 1013 3,92 • 1013 2501 6,26 • 10° 3,92 • 10-s Конечно, — 1 удовлетворяет нашему уравнению, но ни 50, ни —50 и никакое близкое к ним действительное число корнем данного уравнения не будут. Разделив f(x) на jf —[— 1, можно из соответствующего квадрат- квадратного уравнения искать мнимые корни. Можно было бы поступить и иначе: вести вычисления не с тремя значащими цифрами, а, например, с семью цифрами (при наличии арифмометра это легко выполнимо). Тогда через несколько преобразований появились бы отрицательные коэффициенты, свидетельствующие о мнимых корнях. Конечно, в подобного рода случаях может быть использована и теорема Штурма. В случаях, когда уравнение имеет три пары мнимых корней, особенно, когда модули у двух или трёх пар корней почти одина- одинаковы или когда модуль какой-нибудь пары совпадает с абсолютным значением действительного корня и т. п., вычисления по способу Лобачевского усложняются. Отсылая интересующихся подробностями к специальной литературе, особо укажем на «Лекции о приближён- приближённых, вычислениях» акад. А. Н. Крылова, где подробно рассмотрены различные возможности и укачаны, в частности, разные приёмы вычисления аргументов ф,, ф2, ф3> ••• мнимых корней, приёмы уточне- уточнения полученных по способу Лобачевского корней и т. п. Задачи к главе I 1. Отделить по способу Штурма корни уравнепий: а) Xs+ х —24 = 0, б) л-3 — 60л" + 4 = 0, в) л4 — 6л + 4 = 0, найдя для каждого корня интервал, длина которого не превышала бы еди- единицы. 23*
356 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ 2. Найти границы действительных корней уравнений: а) X1* + 2х4 — 10х3 + 20х — 40 = О, б) х° + х1 — х3 — 4х2 + 60 = О, в) 4л* — х2 + 20х — 2 = 0. 3. Вычислить с точпостью до 0,01 по способу Горпера и по способу Лагранжа положительные корни уравнений: х3 —28 = 0, в) х* + х —19 = 0. 4. Отделить по способу Штурма и вычислить по способу Лагранжа и по способу Горпера с точпостью до 0,01 корни уравнений: а) 15л:8 — 65л* + 93л; — 44 == 0, б) Зх3 + 4х2 — 9х — 12 = 0. 5. Доказать, что нижняя граница положительных корней уравнения равна -р-, а верхняя граница отрицательпых корней равна — jr- (см. конец § 2). As Aj 6. Найти но способу Горнера с точпостью до 0,0001 наименьшее поло- х жителыюе значение -=- из уравнения х3 — 3/?2х + /?3 = 0 и истолковать геометрический смысл результата [см. уравнение E) во пве- депии]. 7. Используя идею способа Лаграпжа, найти первые три неполных частных разложения в непрерывную дробь корпя уравнения 10* = 2. 8. Доказать, что, когда все корпи уравнения/(л:) = 0 действительны и | x"i: «= | х2 | «а х3 > [ х4 !>...>[ х„ |, в способе Лобачевского непра- неправильно будут меняться коэффициенты при хп~1 и при хп~2; при этом f-, |x4|^ у ^1 и т. д. 9. Решить по способу Лобачевского уравнения: а) Зх5 — 32х2 + 170х — 100 = 0, б) х" — 9х3 + 41 х2 -f 40х + 50 = 0, в) Зх3 —41х2+113х —11=0, г) х" —
ГЛАВА II РЕШЕНИЕ ТРАНСЦЕНДЕНТНЫХ УРАВНЕНИЙ § 7. Способ линейного интерполирования и способ Ньютона Переходя к решению трансцендентных уравнений, заметим, прежде всего, что любой из описанных ниже способов будет пригоден и для решения уравнений алгебраических. Как было указано в предисловии, табличный способ решения уравнений позволяет уменьшать как угодно интервал, внутри кото- которого лежит действительный корень данного уравнения (трансцен- (трансцендентного или алгебраического): /(¦*) = о. A) По своей идее табличный способ чрезвычайно прост, но каждое существенное уменьшение интервала, заключающего искомый корень, связано с большой вычислительной работой, так как требует вычи- вычисления большого числа значений функции f(x). Значительно быстрее можно достигнуть цели при комбинирован- комбинированном использовании двух способов: способа линейного интерполиро- интерполирования, называемого также правилом ложного положения (regula falsi) a), и способа Ньютона. Перейдём к их описанию. Пусть в интервале (а, Ь) лежит лишь один действительный корень Jtj уравнения A), причём знаки f(a) и f(b) различны. Пусть, кроме того, f'\x) в интервале (а, Ь)ке обращается в нуль. B) Так как мы предполагаем /" (х) непрерывной, то отсюда следует, что кривая, представляющая график функции f(x), либо обращена своей вогнутостью вверх на протяжении всего интервала (при /"(*)>0), либо —вниз (при /'(*)<()). Обе эти возможности изображены на рис. 1, где буквой а обозначен тот-конец интервала, где f(x) и /"(•*) имеют одинаковые знаки, а не обязательно левый конец, как обычно принято. Или правилом двух ложных положений (regula duorum falsorum).
358 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УР\ВНЕНИЙ Переход к более узкому интервалу (av Ьг) осуществляется так. Взяв уравнение прямой MN, проходящей через две точки М \а, /fall и N[b,f(b)]: JK П y-f(o) _x-a t{b)—f{a) — Ь — а> У°) определяют абсциссу точки пересечения MN и осью Ох, или то О У\ а а, Ъ, Ъ О М ъ h М N /а.) а х Рис. 1. значение х, при котором у в уравнении C) обращается в нуль, т. е. решают уравнение °—/(о) х — а f(b)-f(a) — Ь — а' Корень этого уравнения принимают за границу Ь^ нового интервала; следовательно, D) Таким образом, функция f(x) как бы заменяется линейной функцией (т. е. функцией первой степени): определяемой из равенства C). Эта функция носит название интерполяционного многочлена и обладает тем свойством, что её знрчения совпадают со значениями функции _Дх) при х—а и при х— Ь.
РЕШЕНИЕ ТРАНСЦЕНДЕНТНЫХ УРАВНЕНИЙ 359 Отсюда и самый способ вычисления по формуле D) границы Ьх нового, более узкого, интервала носит название способа линей- линейного интерполирования. Примечание. Напомним, что линейное интерполирование применяют также при пользовании различными таблицами, когда ищут значение функции для аргумента, лежащего между какими- нибудь двумя его значениями, приведёнными в таблице. Например, зная, что lg 1705 = 3,23172, lg 1706 = 3,23198 считают, что в интервале A705, 1706) функция \gx может быть за- заменена интерполяционным многочленом первой степени вида E), т. е, F) и если надо найти, например, lg 1705,4, то вычисляют значение многочлена F): lgjt^ 3,23 172+ 0,00026-0,4^3,32182. В тех случаях, когда такая замена грозит большой погреш- погрешностью, применяют так называемое параболическое интер- интерполирование, т. е. заменяют данную функцию многочленом, например, второй степени, значения которого совпадали бы со зна- значениями функции не в двух, а в трёх точках. Однако для интересующей нас цели (получение bt — улучшенной границы для искомого корня) использование интерполяционных многочленов даже второй степени практически нецелесообразно. Другая граница интервалг (а, Ь) улучшается по способу Ньютона, согласно которому считают, что /(*W(a)+/(a)(* —а), G) т. е. пренебрегают в разложении f[x) в ряд Тейлора членами, содержащими (х— аJ, (х— аK и т. д. Приравнивая правую часть равенства G) нулю: /(«)+/(«) (х - а) = 0, принимают корень полученного уравнения зз вторую границу aY нового интервала: Так как уравнение касательной МТ, проведённой и точке М [a, /(а)] (см. рис. 1), имеет вид y=f{a) \ f {а)(х-а),
360 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ то аи найденное по формуле (8), будет абсциссой точки пересе- пересечения касательной МТ с осью Ох. Если окажется, что новый интервал (a,, Ьх) всё ещё слишком велик, то, повторно применяя способ линейного интерполирования и способ Ньютона, вычисляют и поступают так до тех пор, пока не получится интервал (ak, bk) достаточно малых размеров (см. рис. 1). Иногда для приближения к исходному корню используют лишь способ Ньютона, вычисляя а1г а2, а3 и т. д., что с геометрической точки зрения равносильно про- проведению одних касательных МТ, МХТХ, Ж2Г2 и т. д. (рис. 2). При этом по специальной формуле (см. ниже § 8) можно ju оценить границы погрешно- ^~г стей приближённых равенств: х^ ^» п\, Х\ «=* а% и т. п., но всё-таки приближение к иско- искомому корню с двух сторон при комбинированном применении двух способов имеет за собой преимущесгво большей Hai ляд- Рис. 2. ности, а часто и большей про- простоты в практическом отно- отношении, так как оценка погрешности при этом получается автома- автоматически. Перейдём к примерам. Пример 1. Найти все положительные корни уравнения Из таблицы 3 4 5 6 х>6 1 —2 —1 —1 0 12 40 /(х)>0 делаем заключение, что 0<^JCi <^ 1 и лг2 = 4. Так как / (х) = 2х 1п 2 — 4 я« 0,693 . 2х — 4 и / " (х) ъ 0.6932 • 2х то в интервале @,1) условие B) соблюдается: /'(*)> 0,
РЕШЕНИЕ ТРАНСЦЕНДЕНТНЫХ УРАВНЕНИЙ 361 а так как /@)^>0, а /A)<^0, то буквой а обозначим левый конец интервала: а = 0;- 6=1. Тогда /(«)=/' @)^-3,307. Следовательно, применяя формулы D) и (8), получим: at = 0 — _ззо7 =°.3023 •-• «* 0,302, bv = 0 — -^П0? = 0.3333 ... я« 0,334. Отсюда Xl я» a±±h я« 0,318 (± 0,016). Примечание. Рекомендуется всегда округлять нижнюю гра- границу интервала в сторону уменьшения, а верхнюю — в сторону увеличения (например, 0,3333 ... = 0,334, а не 0,333), так как иначе можно получить такой интервал, что искомый корень окажется лежащим вне его. Пример 2. Найти положительный корень уравнения /(*) = .*+4 sin jc — 5е* + 6 = 0 (ея»2,7183). Для определения интервала, в котором заключён корень, вычислим несколько значений функции: =l-f 4sinl— 5e-J-6?^7-J-4sin57o18' — 5-2,7183 я» 7 -f- 4 • 0,8415 — 13,5915 = — 3,2255, ,5) = 0,5-J-4sin28°39' — 5 • 1,6487 + 6^0,1741. Так как /@,5)>0, а /(!)<[0, то 0,5-^j^-^l; кроме того, f"(x) = — 4 sin л: — 5еж<^0 в интервале @,5; 1). Следовательно, примем а=1, 6 = 0,5. По формулам (8) и D) получим: (так как/'(l)=l + 4cosl—5e^—10,431), -3,2255@,5-1) _ &i — * ~ 0,1741 - (- 3,2255) ~ В этом случае получился довольно большой интервал @,52; 0,70), так что лучше было бы предварительно провести небольшую дополни
362 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ УН о \ х Рис. 3. тельную работу (табличным способом), чтобы исходный интервал (а, Ь) был бы меньших размеров. В том случае, когда в интервале (а, Ь) нарушается условие B), указанный путь сближения границ интервала может оказаться не- неприемлемым. Действительно если, например, кривая^ =/(*) будет иметь вид, указанный на рис. 3, то ни к одному из ч, а ?_ I'V. концов интервала способ Нью- Ньютона нельзя применить, так как это нас удалит от иско- искомого корня; причиной является обращение в нуль /" (х) внутри интервала (а, Ь)\ в этом слу- случае кривая y=f(x) имеет так называемую точку перегиба, в которой изменяется направление её вогнутости. Правда, уменьшив табличным путём интервал (а, Ь), можно, вообще говоря, добиться выполнения условия B) (если /" (л^) ф 0), но при/"(#1) = 0, есте- естественно, для любого ин- интервала, заключающего корень xt уравнения A), условие B) будет нару- нарушаться. Условие B) является достаточным для совмест- совместного применения спо- способов Ньютона и ли- линейного интерполирова- интерполирования к интервалу (а, Ь); однако оно не является необходимым. Как показывает рис. 4, иногда даже при нарушении условия B) применение этих двух способов может дать хороший результат. В скрытой форме способом линейного интерполирования поль- пользуются обычно при вычислении корней табличным способом. Дей- Действительно, если, например, для уравнения хъ-\-2х — 28 = 0 из таблицы 2 3 О М ¦X Рис. t. /(*) —16 5 заключаем, что корень лежит в интервале B, 3) и мы хотим уточ- ндгь цифру десятых долей искомого корня, то было и'ы нерационально
РЕШЕНИЕ ТРАНСЦЕНДЕНТНЫХ УРАВНЕНИЙ 363 ¦ придавать аргументу значения: 2,1; 2,2; ..., так как, повидимому, функция/(л) обращается в нуль где-то вблизи точки лг= 3. Естественно поэтому попробовать придать аргументу значения 2,7; 2,8 и, может быть, соседние с ними. Подтверждением этого предположения послужило бы вычисление bt по способу линейного интерполирования (btя« 2,76). Заметим, наконец, что, применяя табличный способ к трансцендентным урав- уравнениям, надо быть особенно внимательным в том случае, когда, например, после убывания до малых положительных значений функция начнёт возрастать. Может быть, при этом кривая в какой- то момент коснётся Ох или даже даст две близкие точки пересе- пересечения. При небрежном применении табличного способа такие корни могут оказаться незамеченными. Если на' концах интервала (а, Ь), заключающего один корень уравнения A), /(а) и f(b) одинаковых знаков, то можно применить либо одностороннее приближение к корню по способу Ньютона, либо один из способов, описанных в следующих параграфах. § 8. Обобщение способа Ньютона Рассмотрим другой вывод формулы (8) предыдущего параграфа, что даст нам, во-первых, возможность оценить границу погрешности приближённого равенства хг я« а -у-^ и, во-вторых, приведёт нас к ряду формул, являющихся естественным обобщением способа Ньютона. Пусть а — приближённое значение искомого корня уравнения о (О (алгебраического или трансцендентного), причём xt = а -\- а «« а, B) т. е. а есть погрешность приближённого равенства xt «s* а. Так как f(a.-\-a) — 0 (a-\-a — точное значение корня), то наряду с равенством B) можно написать следующее равенство, справедливое при любом значении постоянного с: где I — некоторое число, заключённое между а и хг. Если взять
364 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ то коэффициент при а в равенстве C) превратится в нуль, и мы будем иметь: —a f(a) f"® а? —а Л-а ~я rV\ где at^a тг^Л — новое (ньютоновское) приближение к искомому корню, а а1 = -2г%)а* С5) есть погрешность приближённого равенства х1т=&а1. Для получения формулы, обобщающей формулу Ньютона, на- напишем равенство B) в виде х1 = а-\-а-]г{с1-\- саа)/(а + «) = = а + о + (с, + с2а) [/(а) +/ (а) а + Д^- а* -f ^©- а3] F) или, вводя обозначения Ла) = р f'(a) = F' - — F" — — — F'" (!¦) ПЛ /I Ol V V ' перепишем равенство F) в виде ^Г" (Е). F') Последнее соотношение справедливо, при любых постоянных сх и с2; подберём их так, чтобы обратились в нуль коэффициенты лри о и о2 в правой части равенства F'): 1 + ctF + c^F = 0, c,F" + c2F = 0. (8) Из уравнений (8) получим: —F' F" .qx FF" ' С* (F'f — FF" • Подставляя полученные значения с, и с8 а F'), получим: .. _ . FP , a3 [(F")a - F'F"> (?)] + a^"F'" (g) Л1 —" (Z71)8 FF" (F')- FF" \lxJJ или jf^aj + a^e;, A0') где ai a {FT'-FF"—a 2\f(a)\*—f(a)f(a) И _ a3 [(P')8 - F'P" (g)] + *F"F» (g)
РЕШЕНИЕ ТР\НСЦЕНДЕНТНЫХ УРАВНЕНИЙ 365 Если бы мы взяли множитель при /(а-)-а) в равенстве типа F) в виде ct -J- с2а т|- с3а8, то смогли бы получить: где F F F F p, p F 0 ' F' F " F" F' A3) A4) а о** зависит от а4, ав, ае. Формулы A1) и A4) обобщают способ Ньютона и являются частными случаями полученной автором настоящей статьи общей формулы, которая дайт возможность получить в один приём вместо исходного приближения xt = а-\-а<=«а новое приближение х,^^^!, погрешность которого зависит от ofc+1, o'i+2, ... (где k — л.обое целое число). Формулы E) и A2) можно применить для оценки верхней гра- границы погрешности приближённых значений ах и а* искомого корня: зная, что |а!<^7 (где -\ равна 0,1 или 0,01 и т. п.), опреде- определяют сначала границы, в которых заключена /" (I) или /'" (?), а затем ищут по формулам E) или A2) верхнюю границу для \а.1\ или для | а* |. Пример. Вычислить положительный корень уравнения —3 = 0, найдя предварительно иеходное приближение по способу Горнера с точностью до 0,01. Так как 0<^a;i<^1, to, уточнив число десятых, найдём: 0,8<д;1<0,9. Делаем подстановку х — 0,8 =у (отказавшись в дальнейшем от Y Z \ подстановок у = -^г <г=="Тб' и т' п') 10 3 —3 0,8 0,8 0,8 1 0,8 3,-5-i —0,088 I 1,6 4,92 1 2,4 f[x) = (x — 0,8K -f 2,4 (лг — 0,8J + 4,92 (x — 0,8) — 0,088 = =У + 2>4^2 + 4.92-V — °'088 = 9 Cv) = 0. A5)
356 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ Так как 0,0l<^yt<C0,02, то делаем подстановку у — 0,01= (следовательно, z=x— 0,81) 1 2,4 4,92 —0,088 1 2,41 4,9441 —0,038559 1 2,42 4,9383 1 2,43 0,01 0,01 0,01 = Су — 0,01K + 2,43C/—0,01)*+ 4,9683 (у — 0,01) — 0,038559-= = г3 -J- 2,43г2 -f 4,9683г — 0,038559, а так как z = x — 0,81, то коэффициенты последнего многочлена равны тейлоровским коэффициент а.и разложения f(x) по степеням х — 0,81, т. е. / @,81) = — 0,038559 = F, /' @,81) = + 4,9683 = F, /'"@,81) _„,, 3! —i—r. Кроме того, P,81<jc,<@,82, т. е. лг, = 0,81 -\-a^0,81 = а, где 0<o<0,01. Так как 0,81 <?<Jfi<0,82, f'(x) = 6x, f"(x) = 6, ro ,92 и /"'@ = 6 или F"@=l. Формула E) даёт нам: «i<0 и |«i |< гД^йз -'«|8< 0,00005, а по формуле A2) имеем: 0<-а*~ ^J2,43=-4,9683 .J]+a* • 2,43-1 ** + Ы 00000005 и\а>— 4,9683=-2,43. (-0,038559) \ 21 <\и.ииииииио> или 0 < а* < 0,00000005. A6) Следовательно, вычисление at по способу Ньютона будем вести до 5-го, а вычисление а* по формуле A1) — до 8-го знака после запятой: а —П81 —0,038559 no177fi a1 = U,ol 4 9683—=0,8177b ..., Л* ПЯ| —0,038559-4,9583 _n а, = 0,81 - ¦ а9683J_243 _ (_0038559) = 0, Итак, по способу Ньютона 0,81771 <>j< 0,81777,
РЕШЕНИЕ ТРАНСЦЕНДЕНТНЫХ УРАВНЕНИЙ 367 а по обобщённому ¦ способу 0,81773165 <л;1<0)81773171. A7) Примечание 1. Из A7) видно, что для погрешности равен- равенства лг, «=»0,81 имеем: о<^0,0078; следовательно, вместо A6) можно получить: о*<^2'10~8, а вместо A7): 0,81773165О,<0,81773168. A7') Примечание 2. Так как мы применяли способ Ньютона не в комбинации со способом линейного интерполирования и погреш- погрешность о исходного приближения мала, то можно было отказаться от требования равенства знаков у /(а) и /"(а). Правда, в данном случае лучше было бы взять а ^ 0,82, так как это значение ближе к искомому корню, как это видно из уравнения A5). Рекомендуем читателю проделать соответствующие вычисления; они должны дать для xt лучшие границы, чем A7'), если, конечно, учесть после первого этапа вычислений, что в этом случае — 0,0023 <о<0. Конечно, обобщённые формулы типа A4) слишком громоздки, чтобы их применять к более или менее сложным уравнениям; осо- особенно много хлопот доставляет оценка погрешности. Однако для простейших вопросов, с которыми приходится сталкиваться в средней школе, например для извлечения корней, дело сильно упрощается, и обобщённый . способ Ньютона даёт, как увидим в следующем параграфе, ряд полезных формул. Отметим, наконец, что для алгебраических уравнений опреде- определённой степени с буквенными коэффициентами можно совершенно элементарно вывести формулы, отвечающие обычному или обобщён- обобщённому способу Ньютона, стоит только разлагать / (а -|- о) не по фор- формуле Тейлора, а элементарным путём; в § 10 это будет проделано для уравнения х"— 7V = 0. § 9. Способ итерации Для применения способа итерации, получившего своё название от латинского слова iteratio — повторение, требуется предваритель- предварительное преобразование данного уравнения /С*)=о A) к виду х = <р(х). B) Как увидим ниже, такое преобразование можно осуществить многими способами.
368 ЧИСЛЕННЫЕ И ГРЧФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ Допустим, что для интересующего нас действительного корня х - уравнения B) мы получили каким-нибудь способом (например, таб- табличным) приближённое значение xl f^ а. Вычисляя затем последо- последовательно ряд чисел а1, а2, ..., а„, ... по формуле i) C) [считая ао = а, следовательно, а1=ср(а)], мы при некоторых усло- условиях сможем получить значение корня xt с какой угодно малой погрешностью. Следующая теорема даёт условие, обеспечивающее сходимость чисел аи а2, а3, ... к искомому корню. Теорема. Если в интервале, заключающем числа xv а и числа аи а2, ..., вычисляемые по формуле C), выполнено условие <1. D) то lim an=^xt. Другими словами, повторяя одну и ту же операцию, определяемую равенством C), мы сможем приблизиться к искомому корню как угодно близко. Для доказательства теоремы из равенства xl=cp(x1) E) \xt — корень уравнения B)] вычтем почленно равенство C) и при- применим теорему о среднем значении: •*i — ак = 9 C*i) — 9 (ak -1) = С*] — ak -1) 9' (?). где ? — некоторое число, лежащее в интервале (ak_l, x). Переходя к абсолютным значениям и используя условие D), получим: I | l |l'(9IO| — ak-i По условию теоремы неравенство F) имеет место для k = 0,1, 2, 3 ...; следовательно, если обозначим для краткости \Xj^ — as| = Д^ то будем иметь: Д, </яД0, откуда Д1Д2 ••• K-iAn<m"\ или Дп<»г"Д0, т. е.
РЕШЕНИЕ ТРАНСЦЕНДЕНТНЫХ УРАВНЕНИИ 369 Так как 1\тгАа = 0, то п->со. lim ап = хи т. е. теорема доказана. Очевидно, числа аи а2, .... ап тем быстрее будут приближаться к корню xt, чем меньше будет т. Следовательно, заменяя уравне- уравнение A) уравнением B), надо стремиться получить справа такую функцию y(jc), производная которой в окрестности искомого корня была бы мала по абсолютному значению. Отметим, что при вычислении с определённым числом десятич- десятичных знаков из совпадения какого-то as с as_l будет следовать, что as = cp(as_1) = as_1, т. е. as_t будет (в пределах точности вычислений) удовлетворять уравнению B) и можно считать, что X1<^as_l; следовательно, процесс вычислений в способе итерации прекращается автоматически. При м е р. Решить уравнение f(x) = x3 — 20x-\-4 = 0. (8) Как легко установить табличным способом, уравнение это имеет три действительных корня хх, xv_, лг3, лежащих, соответственно, в интервалах @, 1), D, 5), (—5, —4). Заменить уравнение (8) уравнением вида B) можно многими способами; например, * = :гЕУг* = 0,05(*« + 4), (9) или л: = jf 20а:— 4, A0) или х = х-\-(х3 — 20*-f 4). A1) Однако для уравнения A1) <р' (л:) = Злг2 — 19, и условие D) не соблюдается ни для одного из интервалов, заключающих наши корни. Для уравнения (9) tp (х) = -^г ив интервале @,1) | у'(¦*) I *С-Я)' следовательно, xt можно найти, решая уравнение (9) по способу итерации. 48 Но в окрестностях корней л:2 и л:3 для уравнения (9) | Ч>'(*) I ^> о"б» следовательно, х2 и xs не следует искать по способу итерации из уравнения (9). 2о Для уравнения же A0) у' (х) = ^-; в интервале @,1) |у'(л:)|^>1, и способ итерации непригоден, в интервалах же (—5, — 4) и D,5) \<р'(х){<^1, г. е. корни *а и xs можно найти из уравнения A0). 24 Энциклопедия, ьи. 2
370 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ Найдём xt 'из уравнения (9). Пусть xt я« 0 = а. Тогда Gi= 0,05 (О3+ 4) = 0,2, а2 = 0,05 @,23 + 4) = 0,2004, а3 = 0,05 @.20043 -\- 4)«» 0,2004. Так как а3 = а2 (в пределах точности вычислений), то xt <=w 0,2004. Читателю рекомендуется вычислить xv взяв за исходное прибли- приближение хг «з 1 = а. При этом удобно применять «Таблицы Барлоу квадратов, кубов, корней квадратных, корней кубичных и обратных величин» издания 1933 г. Конечно, результат должен получиться тот же: xt s«» 0,2004. Найдём ещё х3 из уравнения A0). Пусть лг3^»— 5 = а. Тогда а, = ^— 104 «а — 4,703, a3 = a8 = «6 = a7 = f — 98,06 ». f/— 96,44^ f — 95,72^ f—95,48 л. f — 95,42^ V'— 95,40 f^ 1^—95,38^ — 4,611, — 4,586, — 4,574, — 4,571, — 4,570, — 4,569, — 4,569. Здесь корни извлекались по таблицам Барлоу; в столбце кубов (стр. 94 и 93) находилось число, близкое к подкоренному (при перенесении запятой на 9 цифр), а в столбце с заголовком п полу- получалось значение корня. Так как а8я»а7 (при вычислениях с тремя знаками после запя* той), то вычисления автоматически обрываются, и мы имеем: х3 ^ — 4,569. В общем случае простейший путь для замены уравнения A) уравнением вида B) при соблюдении условия D) заключается в сле- следующем: так как уравнение х=х — с/(х) A2) при любом постоянном с имеет такие же корни, как и уравнение A), то надо лишь подобрать пострянное с так, чтобы ср'(л:)= 1 —cf'(x) была по абсолютной величине достаточно мала в окрестности иско- искомого корня, а так как в нашем распоряжении сначала имеется лишь
РЕШЕНИЕ ТРАНСЦЕНДЕНТНЫХ УРАВНЕНИЙ 371 приближённое значение а искомого корня, то проще всего с найти из уравнения 1 Имеем: с——тггхг и следовательно, уравнение A2) примет вид A3) и / (х) меняется Если а лежит достаточно близко около медленно, т. е. /' (о^), / (а2) и т. д. мало отличаются от /' (а) (дру- (другими словами, в окрестности иско- искомого корня /" (х) невелика по абсолютной величине), то <р' («i)» 9' (а2), ср' (as) и т. п. будут мало отличаться от нуля, следова- следовательно, условие D) будет выпол- выполнено, и уравнение A3) можно будет решать по способу итера- итерации. Будем иметь: что полностью совпадает с фор- п s /п- 1с'1а' а х мулоп, соответствующей способу Ньютона; следовательно, ах есть абсцисса точки пересечения каса- рис 5. тельной AT (рис. 5) с осью Ох. Но в способе Ньютона и следующее приближение (обозначим его через s2), получаемое по формуле A5) A6) соответствует касательной BL в точке В. По способу же итерации имеем: n —a —fJSlL a*—al Г(а)> что связано с проведением прямой ВМ, параллельной AT; действи- действительно, из рис. 5 имеем: ЧВМх=%=. TC—a_ai, а обе последние дроби в силу A4) и A6) равны /' (а). Ясно, что по способу Ньютона мы быстрее будем приближаться к искомому 24*
372 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ корню, чем при решении уравнения A3) по способу итерации, но зато в последнем случае проще вычисления, так как не надо вычис- вычислять / (а^, /' (а2) и т. д.; кроме того, постоянный делитель f (a\ можно взять с некоторым удобным для вычислений округлением. Отметим, что способ Ньютона есть разновидность способа ите- итерации, так как уравнение f(x) = 0 и уравнение х=х-Ш A7> будут иметь одинаковые корни, если только f(x) не обращается в ос ни при каких значениях аргумента; решение же уравнения A7) по способу итерации равносильно решению уравнения A) по спо- способу Ньютона. § 10. Различные способы извлечения корней из чисел Во введении указывалось на желательность ознакомления уча- учащихся с табличным способом решения уравнений. Однако метод этот связан с большой вычислительной работой, и естественно, у учащихся может возникнуть желание познакомиться с более совершенными приёмами решения уравнений. Многие из способов, изложенных в предыдущих параграфах, доступны пониманию учащихся, если излагать их не в общем виде, а на конкретных примерах уравнений невысоких степеней с бук- буквенными коэффициентами, где можно обойтись без формулы Тей- Тейлора, без понятия производной функции. Ниже даётся применение некоторых из этих методов к решению двучленных уравнений, т. е. к извлечению корней из чисел. Конечно, лучше всего знакомить учащихся с этими способами в порядке кружковой работы, хотя опытный преподаватель, может быть, найдёт уместным кое-что изложить и в классе. Извлечение квадратных корней по способу Лагранжа. Найдём для примера положительный корень xt уравнения х* — 2х — 2 = 0,. A) 1 1 1 2 0 2 2 — 2 2 2 следовательно, 2_у2 — 2у—1=0, 1<СУ1<^2, у=1-\-—: 2 —2 —1 1 2 0—1 2 2
РЕШЕНИЕ ТРАНСЦЕНДЕНТНЫХ УРАВНЕНИЙ 373 следовательно, г2 — 2z — 2 = 0; так как коэффициенты этого урав- уравнения полностью совпадают с коэффициентами уравнения A), то в дальнейшем коэффициенты получающихся уравнений и их корни будут периодически повторяться: г.=24- '-, и, = 1 + - , т), = 24- * , . . ., следовательно, — =[2, 1, 2, 1, 2, ...] 1 (в скобках написаны неполные частные непрерывной дроби). В теории чисел доказывается (см., например, Арнольд «Теория чисел»), что при разложении в непрерывную дробь иррациональных чисел вида А-\-В /С, где А, В, С — рациональные числа, полу- получающаяся непрерывная дробь будет обязательно бесконечной перио- периодической дробью. Следовательно, действительные корни квадратных уравнений и, в частности //V, если TV—неточный квадрат, будут выражаться бесконечными периодическими дробями. Рекомендуем читателю убедиться, что, например, /2 =[1, 2, 2, 2, 2, . . .], /|Г=[1, 1, 2, 1, 2, . . .], /28 = [5, 3, 2, 3, 10, 3, 2, 3, 10, ... 1. _ (В конце книги Арнольда дана таблица разложений /Л/ для всех целых чисел от 2 до 99.) Имея же в своём распоряжении для //V неограниченный ряд неполных частных, можно, составляя подходящие дроби, найти просто и быстро //V с любой точностью. Найдём, например, /28 с точностью до 10~6: Рк Qk Чк 5 1 5 16 3 3 37 7 2 127 24 3 1307 247 10 4048 765 3 1777 2 . . . Так как ___<___< 0,0000008, то /28 *=«4^г- = 5,29150326 ... (с избытком), причем абсолютная величина ошибки меньше 0,0000008.
374 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ Извлечение корней по способу Горнера. Как известно, изу- изучаемый в школе алгорифм извлечения корней квадратных из чисел просто обобщается на случай извлечения корней третьей степени. Схематично процесс можно представить так; \/N=c0, с,... и т. д. Пусть целая часть корня с0 уже найдена, и мы ищем цифру десятых долей, т. е. наибольшую цифру си для которой сумма трёх слагаемых остаётся ещё меньше, чем TV — cl. Найдя с)( а затем и TV— (со~"Ьто) > иш-ем Цифру сотых долей и т. д. Но то же самое делается и в способе Горнера, если пред- представить соответствующее уравнение в виде — лг3-}-Л/=0: найдя со, делаем подстановку х — со=у: 'о со со — 1 — 1 — 1 — 1 О — с0 — 2с„ — Зс0 О —cl 1 -К N V — с' а найдя с„ — подстановку у — ^ = z: — 1 — Зсп -гс1 ю -1 -Зс0-^ -3c0f'- ЙГ ^- К 10 1 О,, '¦Ч 2Cl 10 Cj 10 (Y Z \ обходясь без подстановок у = j0, •г=1п и т. п.). В результате
РЕШЕНИЕ ТРАНСЦЕНДЕНТНЫХ УРАВНЕНИЙ 375 получаем: TV — (со4"Т^) и коэффициенты нового уравнения, кото- которые при подстановке z — щ — " дадут /V—(со4"Го"^Ш) ит-д* Здесь бросается в глаза черта, характерная вообще для спо- способа Горнера: вычисляя /\со-\-тк)> мы используем найденное уже значение / (с0) и лишь несколько «подправляем» его; затем, под- подправив немного /(со + ^))> получаем: / {с0 + ^ + ^ ) и т. д, В этом отношении способ Горнера выгодно отличается от таблич- табличного способа, где значения функции вычисляются независимо друг от друга. Очевидно, при вычислении у TV дело будет обстоять так же, как и при извлечении корня третьей степени. Формулы, вытекающие из обычного и обобщённого способов Ньютона. Используя идею способа Ньютона и его обобщений (см. § 8), можно элементарным путём получить ряд практически удобных формул, пригодных цля извлечения корней любой степени из чисел. Пусть x1=\^N—корень уравнения х" — N=0, B) причём первое приближение его известно: jCj = а -\- а ?=& а. Так как (а-\-а)п — N=0, то имеем: • • Г). C) Взяв _ ' __ _ _ _л €l — ~~ пап~1 ' а — С'3 * * ' получим: ф fj дП ft где И— 1 „ о, «^ п— а 1 2а (если пренебречь членами, содержащими о3, о4, ... ). Но можно подобрать в формуле C) числа clt с2, . . . , с., так, чтобы в правой части исчезли члены, содержащие о, о2 ofc; 1) Здесь биномиальные коэффициенты Сп, С% и т. д. обозначены через. (?), (?) и г. д.
376 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИИ тогда получим формулу, дающую приближение, погрешность кото- которого будет зависеть от (^ —f— 1)-й и более высоких степеней а. Нетрудно убедиться, что, например, для j/jV, если исходное приближение j/N—а-|-а^с, то E) a,=- при k=l при ?—2 при k= 3 следующее приближение 2a3+N as—N (a3—N)a a{a3-\-2N) a, «Г его 2a f& — погрешность 3oa24-a3 a За3 "~ а s3 fa1 2a3 a* За3 • ,(o) G') Если же/Л'=й-}-с(якй1 то следующее приближение при k = 1 при А = 2 cfi — N аBаг- + ЗЛО За5 + 2ЛГ ' (8) (9) его погрешность 2а» а 2а3 (8') (9') Для корня квадратного можно получить особенно простым спо- способом общую формулу. _ Пусть ifN=a-\-a; тогда (—a)m = (a— -/N)m или (— а)т = ат — G) a1"-1 /N -\- (™) am"a Л/ — (™) am~3 А/ откуда где A0) (И) В частности получим: вовое приближение его погрешность при/и=2 при м=3 при т=4 при;л=5 0,* = - 2а ' а3 + 3aN A2) A3) , (I4) ai ~3a^+N' а,** = ¦ a5 4- WasN+5aNs A2') A3') ¦E.'(I41) a'
РЕШЕНИЕ ТРАНСЦЕНДЕНТНЫХ УРАВНЕНИЙ 377 Приведём ещё формулу для -]/~N при k = 2. Если '\fN=a-\- «^ifl, то согласно формулам A0'), A1) и A2) из § 8 где Рассмотрим несколько пояснительных примеров. Пример 1. Пусть |/13 = 4-(-о«а4 = а. По формуле A5) получим: — а*** I я*** — d -j-a, _____________ 12 724 = ^2^ = 3,605553981 . . . 5 Здесь aj*** =5^20 (точно), а так как |а[<^1, то г, полученном числе первые три знака после запятой верные, следовательно, — 0,4<^о<[0, но тогда <х***<^0, причём *** н < 0,00000291. Таким образом, |/13^« 3,605554 (с избытком), причём абсолютная величина ошибки меньше 0,000003. Покажем на этом примере одну интересную особенность, при- присущую обобщённому способу Ньютона, когда он применяется к алге- алгебраическим уравнениям, т. е. когда можно установить простую зави- зависимость между новой и старой погрешностями. Мы получили |/13 с пятью совершенно надёжными цифрами после запятой \f\ 3 = 3,60555. Следовательно, и о «а — 039445,— с пятью верными цифрами после запятой; но тогда тоже по крайней мере с четырьмя верными значащими цифрами. Если теперь прибавим к полученном}'' выше значению at*** эту отрицательную поправку, то получим: /ТЗ «а 3,605551275, где после запятой все знаки верные, кроме, может быть, последнего.
378 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ Пример 2. ^29=3-f-а^З^ а; так как 3,13 > 29, то ^<^0,1. Беря формулу F), получим: , _ 3-B7 + 58) _ 255 - а»— 54 + 29 —83=3,072288 причём о* *«!^< 0,0001, т. е. а ^ 0,072; следовательно, о* ъ 2 '^^ ъ 0,00003, т. е. ^29 ъ 3,07232, где несколько сомнительна лишь последняя цифра. О способе итерации. Любая из формул типа E), F), A2) и т. п. может быть применена многократно; например, найдя по фор- (a** — N)a* муле F) а*, можно вычислить а* = а* *-^ затем о* и т. д. Но это значит, что мы решаем по способу итерации уравнение имеющее те же корни, что и уравнение х3 — Af—0 (лишний корень х = 0 ничему не мешает). Примечание. При этом очень быстрая сходимость процесса вытекает из того, что ,, ._2(x* — N)s 9 W — Cл;а + Nys у а следовательно, если погрешность а исходного приближения \^Nf^a мала, то |ф'(-^)| будет очень мала в окрестности чисел а\, а* и т. д. Отметим, что формула A2) была использована Ньютоном для итеративного улучшения равенства j/TV я« а '). При таком освещении вопроса об извлечении корней становится понятной возможность решения по способу итерации любых урав- уравнений, если они предвгрительно переписаны в подходящей форме. Задачи к главе II 10. Вычислить по способу итерации с точностью до 10~3 иррациональ- ный корень уравнения х = -^ , приняв х =» 0,5 = а. 11. Вычислитыю способу Ньютона с точностью до 0,001 корни уравпеиий: г) х — cos х — 0, б) х — 2 sin х = 0, определив исходные приближения табличным способом с точностью до 0,1. ¦) Интересные подробности об этом читатель найдёт в книге: Уиттекер и Робинсон, Математическая обработка результатов иабиодений, 1933, стр. 77—80.
РЕШЕНИЕ ТРАНСЦЕНДЕНТНЫХ УРАВНЕНИЙ 379 12. Разложив в непрерывные дроби положительные корни уравнений: а) л;3 — 4а — 3 = 0, б) З*2 + 2а — 5 = 0, в) а2 —23 = 0, вычислить их с точностью до 10~е. 13. Применяя формулу A5) из § 10 к приближённым равенствам •^50 =«7, 1^33=^6, 1/^97=» 10, найти для каждого случая следующее при- приближение и оцепить его погрешность. 14. Вывести элементарным путём формулу (соответствующую способу Ньютона) _ _ в3 + Лаа + Ва + С а' ~~ а Заа + 2Аа + В для улучшения приближённого зпачения корня л'=»й уравнения а-3 + Ах3 + Вх + С == 0. 15. Вывести формулы E), F), G), (8), (9), A6), а также E'), F'), G'), (8'), (9'), A7) из § 10. 16. Какому способу решения уравнения х3 — (а3 + г) = 0 соответствует формула r = fljг которую предложил в 1202 г. Леонардо Пизанский для приближённого извлечения корней третьей степени из чисел? 17. Какому способу решения уравнений соответствует известный ешб вавилонским математикам способ извлечения корня квадратного из чисел а способ, предложенный арабским математиком ал-Кархи (XI в.): 7 = *+ зД-, 7 18. Применить способ Ньютона к улучшепию значения мнимого корня уравнения хг + х + 1 = 0, положив л;, =» — 0,5 + 0,85 i «= а. Применить для той же цели обобщённый способ Ньютона — формула A1) из § 8. Сравнить результаты с а", = — у + i ^~ • 1°. В каком виде следует взять уравнение для сходимости способа итерации Jt = tg х или arctg x — xt Вычислить наименьший положительпый корень с точностью до 0,01, найдя табличным способом исходпое приближение.
ГЛАВА III РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ § П. Способ Ньютона Переходя к вопросу о решении систем уравнений, рассмотрим, прежде всего, способ Ньютона, одинаково пригодный как для алге- алгебраических, так и для трансцендентных уравнений. Возьмём для простоты систему из двух уравнений с двумя неиз- неизвестными: «И*. У) = О. Пусть для интересующей нас пары действительных корней (хиух) найдены приближённые значения а и Ь; обозначим погрешности этих приближений через о и р: xt = а -\- а я« а, 1 Разлагая функции ср(х, у) и ty{x, у) в ряд Тейлора по степеням X — а п у — b и заменяя сразу в полученных разложениях хну числами ATj и уи получим: г, Ь) (лг, — а) -\- C) Из этих уравнений надо найти jc, — а и у1 — b (т. е. аи |3). В способе Ньютона, пренебрегая в уравнениях C) членами вто- второй и более высоких степеней относительно хх — а и _у, — й, вместо системы C) решают систему *)а + <й(а ft)P = 0 )
РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ 381 что, естественно, даёт приближённые значения аир искомых по- поправок аир: а= — <р (а, Ь) <е'у {а, Ь) , b) <\'у(а, b) 'f'y(a, b) ii'y(a, b) 9'* {а, Ь) <р (а, Ь) i/'x (a, b) iJy (а, Ь) Прибавив а и $ к приближённым значениям а и Ь, получим: лг, я« at = a -f- a, Если погрешности этих приближённых равенств обозначим через Oj и Pj, то для их определения надо будет решить уравнения, ана- аналогичные D): i=0, ) = 0, J ( что даст нам at и [3j, а следовательно, и а^ = а1-\-а1, и Ь% = Ь1 и т. д. По мере приближения к искомым корням свободные члены Ф (а, Ь), ^ (а, Ь), ф (aj, Ьг), <]/ (aj, ^) и т. д., а следовательно, вообще говоря, и ak, pft будут неограниченно убывать по абсолютной вели- величине, и вычисления можно будет прекратить, когда получаемые при решении уравнений типа D) и F) «поправки» будут достаточно малы (в пределах сохраняемых при вычислении знаков). Действительно, если, например, ак и Cft настолько малы, что (в пределах сохраняемых знаков), то уравнения для определения поправок ak+1 и pft+1 ничем не будут отличаться от уравнений для ak и Pft, следовательно, и новые поправки будут исчезающе малыми. Пример. Рассмотрим систему -5 = 0, \ — 7 = 0. | G) Если построим кривые, соответствующие этим уравнениям, то коор- координаты точек пересечения полученных кривых будут удовлетворять каждому из этих уравнений, т. е. будут корнями системы G).
382 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ Из рис. 6 видно, что система G) имеет четыре пары корней. Если вычертить кривые на миллиметровке, то легко получить": Так как (8) ~дх ду ivy - vy о Hx~~-' Ну'~~гу' то, вычислив значения этих функций при х = а и при у = Ь, легко получить урав- уравнения — 0,14—2,8а + 6 = 0,1 Рис. 6. ' г ' ил") 0,01+« + 5,8 р = 0,{ откуда ар^ — 0,051, ря^ 0,007, следовательно, х1^а1-=а-{-а — — 1,451, J'i ^^ = ^ + P = 2,907. Вычислив значения функций (8) при х = а1 и y = blt получим: 0,0124 — 2,902 <х1 + р1 = 0, \ — 0,0004+а,+5,814 Pj= 0, J откуда aj= + 0,0041, Р!=—0,0006, следовательно, «а8 = а1+а,=—1,4469^—1,447, t Ьъ = Ьх + Pj = 2,9064 «* 2,906. хх Если бы мы вычислили поправки <ха и ра, то они не изменили бы третьи десятичные знаки, т. е. as = — 1,447 = as, й3 = 2,906 = 62; следовательно, эти числа можно принять за приближённые значения искомых корней. Отметим, что при подобного рода вычислениях удобно пользо- пользоваться арифмометром.
РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ 383 Конечно, в том случае, когда из данной системы уравнений A) просто исключается одно из неизвестных, дело можно свести к ре- решению одного уравнения с одним неизвестным. Например, для системы алгебраических уравнений такое исклю* чение всегда возможно; при этом, если даны уравнения /я-й и л-й степеней, то после исключения одного неизвестного согласно тео- теореме Безу *) получается алгебраическое уравнение очень высокой степени, — вообще говоря, степени тп (правда, иногда старшие коэффициенты полученного уравнения могут оказаться равными нулю). Поэтому даже при -отыскании действительных корней системы алгебраических уравнений практичнее применять изложенный выше способ Ньютона или способ итерации, рассмотрению которого будет посвящен следующий параграф. Сущность способа Ньютона остаётся и для систем п уравне- уравнений с п неизвестными та же, что и для двух уравнений с двумя неизвестными: имея приближённые значения корней, поправки для них находят из системы линейных уравнений, которые получаются при отбрасывании членов второго и высших порядков в разложении в ряд Тейлора левых частей уравнений. § 12. Способ итерации Пусть для интересующей нас пары корней (хх, у{) системы уравнений 1 каким-нибудь образом (например, графическим или, более точно, способом Ньютона) найдены приближённые значения Пусть, далее, система A) заменена равносильной ей системой и найдены пары чисел (а„ ?,), (а2, 62), ..., (ап, Ьп), ... по фор- формулам Izltz tl} D) ') О технике исключения неизвестного из системы двух алгебраических уравнений и о теореме Безу подробнее говорится в учебниках высшей алгебры.
384 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ Тогда имеет место Теорема. Если функции Ф (х, у) и W (х, у) таковы, что для всех точек прямоугольной области (с краями, параллельными осям координат), содержащей /почки (хи yt), (a, b), (au bt),..., (ап, Ьп),... выполняются условия дФ дх дФ ду + + ду E) то при возрастании kчисла \хх — ak\ и |_Vi — bk\ могут быть сде- сделаны как угодно малыми. Другими словами, при выполнении условий E) последовательное вычисление по формулам D) пар чисел (аи bt), (а9, #.2) и т. д. мо- может дать значение искомых корней с любой степенью точности. Доказательство. Для корней (xiy yt) системы C) мы имеем точные соотношения *1 = Ф(*,Л) ) F Вычитая почленно из первого равенства F) первое равенство D), а из второго — второе и применяя формулу Тейлора для функций от двух переменных, получим: xl — ak = Q>(xv У1) — Ф(ак_1, bk_l) = — Ьк_1)Щ, G) -bk ЛФ (8) где через Ф*, Ф'у, Wx и Wy обозначены, соответственно, значения дФ дФ дФ dW функций ^— , д- , ^— и -к— при некоторых значениях х и у, лежащих в промежутках {ak_l, x^ и (bk_lt yj. Переход к абсолютным значениям в равенствах G) и (8) даст нам: — bk_1\'\'ifii\. (°) Складывая почленно последние два неравенства, получим: откуда в силу условий E) 1*1 —
РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ Если введём обозначение 385 то, придавая в A0) k значения 1, 2, 3, .... п—1, п, получим: Д,<тД0, A2) Наконец, почленное перемножение соотношений A2) даёт после сокращения: Д„<^ т"Д0 или -*о1Ь A3) что и доказывает теорему, так как limm" = 0 при п -* со Как же, однако, преобразовать систему A) к виду C), чтобы при этом выполнялись условия E)? Иногда это удаётся сделать довольно просто, применяя к каж- каждому из уравнений A) тот или иной искусственный приём и пройдя, может быть, через ряд неудачных попыток. Например, систему уравнений — 5 = 0, 1 —7 = 0, J если нас интересует пара корней: xt ^—1,4 = а0 и можно преобразовать к виду или к виду у=5— х2 J ; = —/5—у, A4) » = ».. A4') A4") но для системы A4') условия E) не выполняются (так как, например, W — Чу , что при у = 2,9=Ь0 даёт большое число 5,8). Для системы же A4") при х = а0 — —1,4 и у = Ье = 2,9 имеем: дх ду 2]А5 —2,9 ' т. е. ду 5Г —U' дх — 2YT+IA 25 Энциклопедия, кн. 2 IA ' <0,4, <0,2.
385 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ Как видно будет из дальнейших вычислений, точки (а1г Ь^), (аа, Ь„) и т. д. и, наконец, (х^у,) будут лежать близко около точки (а0, ba)t а потому соответствующие частные производные функции Ф(х,у) и W(x,y) в прямоугольнике, о котором говорилось в теореме, не могут значительно превышать чисел 0,4 и 0,2. Следовательно, условия E) для системы A4") соблюдаются, и по способу итерации можно с любой степенью точности вычислить искомые корни. Пользуясь таблицами Барлоу (столбцом с заголовком /Юя), найдём: --1,449, а3 = — /2,093 я» — 1,447, 2,898, Ь3 = /8,450 ^2,907, аа=—/2,102 «а—1,450, а4 = — / 2,093 «=— 1,447, Й4=/8,449 ^2,907, Й4=/8,447 яа 2,906. Следующий шаг нам даёт: as = Ф К, *i) «« — 1,447 = а4, ftB = 4T(fl1,ft1)«i 2,906 = ft*, т. е. в пределах точности вычислений можно считать, что а4 и й4 удовлетворяют уравнениям A4"), т. е. xt т — 1,447, ^ ?^ 2,906. В общем случае, если при решении системы C) получим то так как эти числа удовлетворяют (в пределах точности вычисле- вычислений) системе уравнений C). Но далеко не всегда удаётся так просто добиться выполнения условий E) путём преобразования каждого из данных уравнений в отдельности. Однако, как легко убедиться, комбинируя данные уравнения друг с другом, почти всегда можно добиться выполнения условий E) при достаточно малом значении т, что обеспечит быструю сходимость процесса. При этом надо оговориться, что исходное приближение xt яа а0, yl fa bn должно быть тем лучше, чем большие (по абсолютной вели- величине) значения имеют вторые производные функций ф (х, у) и ^ {х, у) в области, заключающей точки (а0, b0), (au bt) и т. д. Действительно, легко видеть, что системе уравнений ) = 0> \ = 0 J
РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ 387 удовлетворяет любая пара корней (xit ус) системы A), каковы бы ни были постоянные а, [3, -у. 8. Если же эти числа удовлетворяют условию A6) то левые части A5) одновременно могут обращаться в нуль лишь при условии, что будут обращаться в нуль ф(лг, у) и ty(x, у) [так как система п однородных линейных уравнений с п неизвест- неизвестными при определителе, отличном от нуля, может иметь только «ну- «нулевое» решение ')]. Следовательно, при условии A6) любое решение системы уравнений A5) будет в то же время решением системы A), т. е. системы уравнений A5) и A) будут эквивалентны. Перепишем систему A5) в виде = Ф(х, У), 1 ( } ), 1 и подберём постоянные а, [3, -у. 8 так, чтобы производные правых частей равенств A5') при х = аа иу=Ь0 были бы равны нулю, т. е. найдём в и р из уравнений & (а0, Ьо) = 0, J ( } Ф; К> К) = а Ъ («о, h) а у и 8 — из уравнений Если у'х(х, у), <р'у(х, у), $'х(х, у) и <\i'v(x, у) в окрестности точки (а0, й0) меняются не очень быстро, т. е. вторые производ- производные ср'х'х(а0, Ьо), ерх'у(а0, Ьо) и т. п. достаточно малы, а числа а0, Ьо достаточно близки к искомым корням, то Ф'х(х, у), Ф'у(х, у), Wx (x, у), Wy (x, у) будут иметь в интересующей нас области значе- значения, мало отличающиеся от нуля, т. е. условия E) будут выполняться. Возьмём для примера уже рассмотренную систему =х*-{-У — 5 = 0, \ =У* + х — 7 = 0. J Так как у'х=2х, <р'у = 1, Xi^— 1,4 = 1) См., например, стр. 73, Л. Я. О кун ев, Кольцо многочленов и поле рациональных функций. 25*
388 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ то уравнения A7) примут вид 1 — 2,8а + В = Следовательно, — 1 1 0 5,8 -2,8 1 1 5,8 Уравнения A8) дадут: Следовательно, Т 0 1 -1 5,8 — 2,8 1 1 5,8 — 5,8 —17,24 ., i »_ - 17,24 A7') -2,8 — 1 1 О —17,24 0,06. A8') — 0,06, S= -2,8 01 -17,24 яа~~ °'16' и система A5') в данном случае будет иметь вид х = х + 0,34(х2 + у — 5) — 0,06 (У+jc — 7) = Ф(*, у), 1 У=У— 0,06(^+^ — 5) — 0,16(y*-\-x—7) = W(x, у). ) A5'() Подставляя в правые части этих уравнений дг = ао = —1,4 и у== = ?0 = 2,9, получим: а, = ф(а0, &„) = —1,4 + 0,34.( — 0,14) — 0,06-0,01=— 1,4482, b1 = W(aQ, 60) = 2,9 —0,06-( — 0,14) —0,16-0,01=2,9068, т. е. в один шаг достигнута почти такая же точность, на которую при первом способе решения потребовалось два-три шага. Отметим, что нет необходимости корни систем линейных урав- уравнений A7) и A8) вычислять с большой точностью, так как будут ли Ф*(а0, Ьй),хр'х(а0, Ьо) и т. п. точно равны нулю или почти равны нулю) — всё равно значения этих производных в точках (av ?>i), (ait b%) и т. д. будут несколько отличаться от нуля, и неточное решение уравнений A7) и A8) мало скажется на условиях E). Может даже случиться, что отклонение от нуля функций Ф'х (х, у), Ф'у(х, у) и т. п. в точке (а0, Ьо) вызовет уменьшение значений этих функций в точках (аи Ь^), (а2, ?2) и т. д. и в конечном счёте отзовётся благоприятно на значении т в условиях E), т. е. на ско- скорости приближения к точным корням системы уравнений A). В силу этого имеет смысл определять а, C, -у, 8 графическим путём; подроб- подробнее об этом будет сказано в главе IV. Отметим, кстати, что способ итерации обладает замечательным свойством: если в процессе вычислений были допущены ошибки, например, при вычислении а3, мы получили немного отличающееся от него число а3, то ошибка эта, если она невелика, может в худ-
РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ 389 шем случае замедлить приближение к искомым корням уравнения (если она удаляет нас от х{); однако сделанная ошибка может слу- случайно и приблизить нас к хи что сократит последующие вычисле- вычисления. Опытный вычислитель, подметив закономерность в последова- последовательных приближениях, может даже намеренно «ошибаться», под- подправляя «на-глаз» вычисляемые по формулам D) значения (ak, bk). Конечно, не следует думать, что вычисления в способе итерации можно проводить небрежно, надеясь на возможность благоприят- благоприятного влияния ошибок, тем более, что ошибка может нас даже вывести за пределы той области, в которой выполняются условия E). . Естественно, что заключительный этап вычислений, при котором устанавливается, что числа (ап, Ьп) совпадают в пределах точности вычислений с (an_v bn_1), должен быть проведён со всей тщатель- тщательностью, и ошибки на этом этапе абсолютно недопустимы. Мы изложили способ итерации применительно к системе из двух уравнений с двумя неизвестными; однако ничего по существу не изменится при решении п уравнений с п неизвестными. Например, если три уравнения написаны в виде x=F(x, у, z), у = Ф(х, у, z), z = W(x, у, z) A9) и в прямоугольном параллелепипеде, заключающем точки (а0, Ьо, с0), (Oj, bv Cj), ..., (xv \>i, zx), соблюдаются условия B0) то по формулам ak==P(.ak~u bk-i> cft-i)> B1) будем получать всё лучшие и лучшие приближения к корням (xi> Уи zi) системы A9), если исходное приближение было: х± я» ав, Ух «й b0, Zx «» сй. Конечно, наиболее сложным является получение достаточно точ- точного исходного приближения, которое обеспечило бы преобразова- преобразование системы уравнений, данной в произвольном виде, к виду A9) с соблюдением условий B0); однако, как увидим в главе IV, гра- графический способ позволяет иногда и эту задачу решить довольно просто (для уравнений с двумя или тремя неизвестными).
390 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ § 13. Замечания о вычислении мнимых корней алгебраических уравнений Вычисление мнимых корней уравнения f(x) = aoxn-\-a1xn-1-}-. . .-\-ап_хх+ап = 0, A) можно свести к нахождению действительных корней системы урав- уравнений с двумя неизвестными. Действительно, положим x=u-\-vi; B) тогда / (*) =/(и + vi) = а0 (и -f vif + а, (о + ЫГ1 + ...+<*„. Если в правой части раскрыть скобки и собрать отдельно все действительные и все мнимые слагаемые, то получим: v) = 0. C) Следовательно, а и г; должны удовлетворять системе уравнений ер (а, г/) = (и, v) = 0. J K ' Приём этот пригоден и для уравнений с комплексными коэффи- коэффициентами. Например, уравнение = 0 E) после подстановки x = u-\-vi принимает вид (к4 -f 4н3та — 6и V — iuv3i -f- г;4) + D + /) (« -f »/) — 2 + 26/ = 0 и распадается на два уравнения: и4 — 6гг2г/2-}-г/4 + 4н — г; — 2 — 0, 1 4я3г/ — 4нг/3 + и + 4г» + 26 = 0. / ^ Легко, например, проверить, что одно из решений системы F) щ = 2, Vj = —1 даёт мнимый корень хх = 2 — i уравнения E). Конечно, даже при небольших значениях п получается весьма сложная система уравнений вида D), так что приём этот интересен главным образом в методическом отношении. Правда, если прибли- приближённое значение мнимого корня хх «з a -J- bi получено заранее каким- нибудь путём [например, по способу Лобачевского, если уравнение A) имеет действительные коэффициенты], то решение системы D) упрощается, так как, считая и1<^а и vx «=«« b за исходное прибли- приближение, остаётся только улучшить его, что можно сделать хотя бы по способу Ньютона (§ ID.t
РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ 391 Отметим ещё, что, зная приближённое значение мнимого корня уравнения A) xt я» а = а -\- Ы, можно улучшить его и по формуле соответствующей способу Ньютона для уравнения с одним неиз- неизвестным '). Задачи к главе III 20. Решить по способу Ньютона и по способу итерации следующие си- системы, вычисляя указаппые корпи с точностью до 0,001: а) 2л:3— у*— 1=0, ,2 v_17. ху*— у — 4 = 0, ЛГ1Е=а • > У1 >'• б) Ar + 31gji:—_уа = 0, лг!=»1,4, уг^=—1,5, с*л лу ил -р 1 V/, Лд —— О,^, _уз -^3 ?,?. 21. Вычислить с точностью до 0,001 четыре пары корпей системы пайдя исходные приближения графически. 22. Вычислить с точностью до 0,001 корпи xt и yt системы приняв за исходное приближение 23. Показать, что действительная часть мнимого корпя нения третьей степени = а-\-Ы урав- урав/(х) = должна удовлетворять уравпению + aax = 0 24. Вычислить по способу Ньютона и по способу итерации с точностью до 0,01 корни системы x—y+3z — 7 = 0, х*+у* — 2а = 0, х— y+2z — 2,5 = 0, приняв 1 У!^>— 1,3, ZtKal.6. ') См., например, А. Н. Крылов, Лекции о приближёппых вычислениях, изд. 5-е, Гостехиздат, 1950,
ГЛАВА IV ГРАФИЧЕСКИЕ МЕТОДЫ § 14. Уравнения с одним неизвестным Графические методы решения уравнений дают, как правило, грубо приближённые значения корней; но если требуется большая точность, то, взяв полученные значения за исходные приближения, можно их уточнить, например, по способу итерации или по способу Ньютона. Если уравнение дано в виде f(x) = 0, A) то для определения действительных корней его достаточно по- построить график функции f(x), т. е. кривую у=/(х), и найти абсциссы хи х2>... точек пересечения этой кривой с осью Ох; эти абсциссы и будут корнями уравнения A), так как для них /(*/)= Л = 0. В некоторых случаях график f(x) строится легко; например, для решения урав- уравнения ах — Ь — 0 (при а и b громоздких) достаточно по- построить по двум не очень близким точкам прямую у —ах — Ъ. Иногда бывает полезен прозрачный транспарант —¦ начерченная на прозрачной бумаге специальная кривая. Рис. 7. „ ¦ иумаге специальная кривая. Например, для решения квадратных уравнений хг 4-рх-\- q' = 0 транспарант с кривой у = х2 дабт сразу корни уравнения, если
ГРАФИЧЕСКИЕ МЕТОДЫ 393 вершину «прозрачной» параболы поместить в точку ( —-, q — J^- чертежа, а ьсъ ее направить параллельно Оу. Действительно, *, ч о i i I i Р \2 i D2 /(x)=*24-p^+$'=U+-^- +^ — ^-; следовательно, есть минимум функции f(x). Уравнение «прозрачной» параболы, расположенной указанным образом, по отношению к осям на чертеже будет; т. е. На рис. 7 показано решение уравнений I. х2 — 1,2* — 2,6 — О, — ^- = 0,6,^—^-^ — 3, *, ^2,4, II. х2 + 5* + 6==0, р_ 5^ р^ 1 » 9. 2 — 2 ' ^ 4 — 4 ' Х* — ^2 — III. X* — 4*4-6 = 0, Так как «прозрачная» парабола уравнения III не пересекает оси Ох, то уравнение это не имеет действительных корней. Для .более сложных уравнений вблизи предполагаемого корня следует найти несколько точек кривой y=f(x) (ниже и выше оси Ох) и провести через них от руки плавную кривую. Казалось бы, уже из самой таблицы можно найти, хотя бы по способу линейного интерполирования, приближённое значение корня, но иногда это грозит большой погрешностью, которую можно устранить построе- построением графика; например, если таблица имеет вид X f(x) 3 — 12 4 — 6 5 -1,2 6 1,2 7 0,8 то способ линейного интерполирования подсказывал бы нам, что JCj ^ 5,5; график же, где ¦ мы приближённо осуществляем параболи- параболическое интерполирование, даёт нам Xi ^ 5,4 (см. рис. 7). Иногда бывает полезно представить уравнение A) в виде
394 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРЧВНЕНИЙ и, построив на одном чертеже (рис. 8) графики функций Ft (лг) и F%(x), найти абсциссы xv x% и т. д. точек пересечения полученных линий; найденные хи лг2 и т. д. и будут корнями урав- y=F,[x) нения B) или A), так как при любом из них .V=JW У\ Рис. 8. Приём этот выгодно при- применять, когда приходится решать ряд однотипных уравнений, для которых функция Fx (x) — одна и та же, а функции F2(jc) хотя и отличаются друг от друга, но их графики строятся просто. Тогда, построив тщательно один раз кривую y = F1(x), наносят на тот же чертёж кривые y=F%(x), соответствующие данным уравнениям. Например, для квадратных уравнений вида х*-\-ах-\-Ь = 0 имеем: х* = — ах — Ь; если на чертеже имеется тщательно построенная парабола у=х*, то остаётся построить при данных а и b по двум точкам прямую _у = — ах—b и сразу «прочитать» на чертеже приближённые зна- значения корней. На рис. 9 показано решение уравнений I. лг2 — 1,5х — 3,5 = 0, *, ^ 2,8, дг2 ^ — 1,3; II. » действительных корней нет, так как прямая у = — 0,8*—1,4 не пересекается с параболой у—х*; III. г2-|-0,02г— 0,1=0, подстановка г = ^ даёт х*-\-0,2х — —10 = 0, на чертеже находим: следовательно, <&1 "-» \JyO If *Cg '"<=> KJjOOm Тот же путь пригоден для уравнений вида [здесь F1(x)=x3]. Для уравнений вида
ГРАФИЧЕСКИЕ МЕТОДЫ 395 удобна прсдварит.ельная подстановка z-=— ад:, которая даст х —х flS x-f- a3 , следовательно, имея на чертеже кубическую параболу у = хъ, мы, наложив соответствую- соответствующим образом на чертёж «прозрачную» параболу у=х2, сразу сможем «прочитать» значения xv хг, х3, а следовательно, и zk=—axk (Л=1, 2, 3). Для уравнений типа sin kz — az — b = О подстановка даёт: х т нанося на чертёж с за- заранее построенной сину- синусоидой >> = sinj: пря- прямые у = —г- х -\- Ь, сразу найдём хи хя,..., а сле- следовательно, и zv zit... Замена уравнения A) уравнением B) равно- равносильна решению систе- системы уравнений y = Ft (x), ) .._*,.* \ C) Рис. 9. при решении которой нас интересуют лишь значения корня х (соответствующие им значения у нам не нужны). Иногда удаётся заменить уравнение A) простой системой более общего вида ц>(х, у) = 0, \ Ф(*. У) = 0, ) D) которая при исключении неизвестного у приводит нас к уравнению A). Например, для уравнения xi-\-axi-{-bx-\~c = 0 E)
396 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ можно взять систему (*_а)« + О'-Р)в-'в = 0. J Исключая из F) у, получим: — 2Р) — 2а* + «2+Р2 — г2 = 0. G) Если взять — с, J то уравнение G) совпадает с E), и система F) даст корни (хи yj, (х& Уъ) и т- д>> где xi> х2,... будут корнями уравнения E). Так как графиками уравнений F) будут парабола у = х* и окружность с центром С (а, C) и радиусом г= ]/а2 -|- Р2 — с, то по,- лучаем изящный способ решения уравнения четвёртой степени, понятный из рис. 9, где дано решение уравнений: I. х4 — Зх2+5х — 4 = 0, а = —2,5, E = 2, r= /6,25-j- 4 + 4?« я«3,73, ^f^ — 2,4, х2*=«1,2, *3 4—мнимые. П. х4 — 5х2— 12^+28 = 0,' а = 6, р = 3, г^А,1, х,,2 = 2 (кратный корень), JC34 — мнимые. III. х4— 13*2 + 4'х-]-2 = 0, а=—2, E=7,' гя«7,15, ^^—3,7, X2^ — 0,3, х3^0,6, х4^3,4. Решение алгебраических уравнений (способ Лилля). Удобным приёмом для быстрого решения алгебраических уравнений с дей- действительными коэффициентами является способ, предложенный в 1876 г. французским инженером Лиллем. Сущность его поясним на примере уравнения четвёртой степени, что нисколько не умень- уменьшит общности наших рассуждений. Итак, пусть дано уравнение аох^ -|- щх3 + а2** 4" агх -\~ ai = 0. (9) Левую часть этого уравнения [обозначим её для краткости через F (х)] представим в виде aJx + ai. (l0)
ГРАФИЧЕСКИЕ МЕТОДЫ 397 Нетрудно при конкретном значении х=х0 последовательно построить отрезки, равные (при выбранной единице масштаба) выражениям Для этого надо построить так называемую схему многочлена F(x); делается это так. Выбрав произвольную начальную точку О и единицу масштаба, последовательно откладывают отрезки: ОА0!=а0—он откладывается вверх при ао^>О и вниз при со< А0А1=а1—•"» » вправо » at^>0 и влево » AlAi=a%—» » вниз » ag^>0 и вверх » А%А3=а3—» » влево >-¦ а3^>0 и вправо » А3Аь=а1—» » вверх » с4^>0 и вниз » Ломаная ОА^А^^А^А^ и будет схемой многочлена F(x). Для уравнений более высоких степеней отрезки для ав, а6, а7, a8v... откладываются, соответственно, так же, как для alt a2, аг, a4,... Если какой-нибудь ко- коэффициент равен нулю, на- например aft = 0, то длина соответствующего отрезка Ak_1Ak также будет равна нулю,- т. е. точки Ak__x и Ak совпадут. ¦ На рис. 10 приведена схема для уравнения Рис. 10. Определив затем при заданном дг0 такой угол ср, лежащий в про- промежутке ( y> ~5~)> для которого tg9=Jc0, строят ломаную OB^BiB^B^ проводя: ОВ0 под углом 9 к отрезку ОА0 до пересечения с А0Аи затем проводя: В0В1 J_ OB0 до пересечения с A1Ai,
398 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ (при 9^>0 Угол откладывается против вращения часовой стрелки а при 9<С^ —по направлению её вращения). Тогда из рис. 10 видно, что 1 = В0А0 = боЛ, tg ф = (аохо -f at) х0, = В, Л, -\-A1Ai = (а^о -\-аг)х0-\- а2, = В, Л2 tg 9 = — В^А2 -]- А^А3 = [(uqXo -\- aj х0 -j- a2] x0 -J- а3, з = ^Из tg 9=J[(a0x0 + aj х0 + а.2] х0 -f а3} х0, A2) В3А, = В3Л3 + А3А, = На рис. 10 показано вычисление F(l) с помощью ломаной ^В1Вфъ (для неё tg <р = 1) и F{—2) с помоа;ыо ломаной 'оВ'ф'ф'з (tg9i= — 2). Мы имеем: что совпадает с результатами подстановки х= 1 в левую часть уравнения A1); точка же В'3 совпала с Л4, следовательно, F(—2) = = ВзЛ4 = 0, т. е. jc= — 2 есть корень ^ ^\ „ Уравнения A1). ' о/ ^-Пя я* Следует обратить внимание на то, что в равенствах типа BkAk+1 = BkAk -f- -f- AkAk+l [см. A2)] мы имеем дело со О сложением направленных отрезков, а в равенствах типа BkAk = Bk_tAktgcp знак г произведения находится в строгом соот- i 1 ветствии со знаками множителей, в Рис. 11. чём читатель без труда убедится по рис. 10. Значение угла ср, дающее корень уравнения, можно найти в общем случае путём нескольких проб, хотя удобнее всего воспользоваться для этой цели прозрачной бумагой, разлинованной в мелкую клетку: наложив такой транспарант на схему уравнения OA^AjA^A^A^ под некоторым углом к основным линиям, легко про- проследить глазом, куда упадут точки Во, Blt Bif B3; вращая же транспарант, легко найти такие положения, при которых точка В3 совпадёт с Л4. Особенно просто находятся подходящие направления для ОВ0 при решении квадратных уравнений, так как в этом случае доста- достаточно найти на среднем звене A0At схемы ОА^А^А^ (или на его продолжении) точку Во, из которой отрезок ОА2 был бы виден под
ГРАФИЧЕСКИЕ МЕТОДЫ 399 Рис. 12. прямым углом; следовательно, строя окружность на диаметре OAit получим точки Во и В'о, дающие корни уравнения. На рис. 11 показано решение уравнения х2 — 4*+2 = 0. При решении уравне- уравнений третьей степени не- невозможно в общем слу- случае, пользуясь циркулем и линейкой, построить ломаную ОВцВф^, даю- дающую корень уравнения. Однако, как видно из рис. 12, пользуясь двумя «прямыми углами», мож- можно, меняя их положе- положение, добиться совпадения точки. ??2 с точкой Л3. В этом смысле и говорят, что задачи на построение третьей степени, в которых искомый отрезок есть корень некоторого уравнения третьей степени (например, знамени- знаменитые задачи о трисекции угла и об удвоении куба), могут быть решены с помощью двух прямых углов. §. 15. Решение уравнений с помощью номограмм Одной из разновидностей графического метода решения урав- уравнений является использование номограмм. Номограммой называют специальный чертёж, построенный для уравнений определённого типа и позволяющий быстро находить действительные корни любого уравнения этого типа. Так, например, можно построить номограммы для решения уравнений следующих типов: ха + />* + ? = 0, A) Xs-\-px-\-q = 0, B) х4 — а = 0, C) xs~\-axi-\-bx-\-c = 0, и т. д. Чем меньше параметров входит в уравнение, тем проще будет и номограмма, тем. быстрее при известных значениях параметров, соответствующих данному конкретному уравнению, можно найти его корни. Мы ограничимся рассмотрением лишь простейших номограмм для уравнений с двумя параметрами типа A), B), C), отсылая sa
400 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ подробностями к специальным учебникам номографии, где, в част- частности, даётся теория построения «номограмм из выравненных точек>^ а также указаны принципы построения номограмм для уравнений с большим числом параметров. В предыдущем параграфе было указано, что для решения урав- уравнений типа ? + \ 0 D) достаточно на чертеже с построенной кривой у=-рх 1,5 2 3 Б т -? -3 -2 -f,S E) -1 построить прямую y^—px — q F) и определить абсциссы то- точек пересечения её с кри- кривой E). Но вместо построения прямых F) можно восполь- воспользоваться транспарантом с начерченным на нём семей- семейством прямых у =—рхпри разных значениях/? (рис 13). Наложив такой транспарант на чертёж в соответствии с размерами начальной орди- ординаты ¦—д прямой F) и вы- выбрав прямую на транспа- транспаранте с числовой отметкой, равной коэффициенту при х в данном уравнении, можно сразу найти корни уравнения D). Однако для построения номограммы уравнений разобранного типа можно использовать и совершенно другой принцип. Рассмотрим, например, уравнение A) Рнс. 13. Действительное число х0 будет корнем уравненияA) в том случае, если коэффициенты рад этого уравнения связаны соотношением д = — x6p— х%. G) Если будем по оси абсцисс откладывать значения р, а по оси ординат — значения д, то соотношению G) будет соответствовать некоторая прямая (с угловым коэффициентом —х0 и начальной, ординатой —xl).
ГРАФИЧЕСКИЕ МЕТОДЫ 401 Координаты любой точки этой прямой будут коэффициентами некоторого квадратного уравнения, одним из корней которого .будет лг0. Например, прямая MN'.q = -~-p—-j на рис. 14 соответ- соответствует дго = — 0,5; поэтому для точек A; 0,25), (—1,5; —1), лежащих на прямой MN, получим уравнения л;2-}~ ^ 4~ 0,25 = 0. х*—1,5лг—1=0, для которых х = — y будет корнем. Начертив семей- семейство прямых G), со- соответствующих раз- различным значениям лг„, получим так называ- называемую се'тчатую но- номограмму уравне- уравнения A): Для определения корней уравнения A) при известных р и q достаточно на номо- номограмме найти точку (р, q) и определить числовые отметки пря- прямых, проходящих че- через эту точку; на- например, через точку (—3, 2) проходят пря- прямые с отметками xt = 1 и лг2 = 2; следо- следовательно, эти числа и будут корнями уравне- уравнения х* — Здг-f 2 = 0. Найдём ещё корни уравнения хг-\-х—1=0. Хотя на рис. 14 нет прямых, проходящих через точку A, —1), но нетрудно на-глаз оценить, что числовые отметки прямых, кото- которые при более частой сетке линий на номограмме прошли бы через ТОЧКу A, —1), были бы: ДГ,«^0,6 И Х2(=*=:—1,6. Конечно, точность решения будет тем больше, чем через мень- меньшие интервалы изменяются на номограмме числовые отметки х. Однако на рис. 14 имеются точки, через которые не может пройти ни одна из прямых номограммы; это значит, что корни соответствующих уравнений будут мнимыми. Легко проверить, „3 что все точки такого рода лежат выше параболы q =^-, т. е. для них ^ — ? <С 0- 26 Энциклопедия, 2 кн. 45' -Z Рис. 14.
402 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ Номограмма, начерченная на рис. 14, называется сетчатой, так как на ней имеется по существу сетка из трёх ') семейств линий: I. Рассмотренные прямые: х=const. II. Прямые, параллельные оси абсцисс: q = const. III. Прямые, параллельные оси ординат: р = const. Недостаток сетчатых номограмм заключается в обилии линий, затрудняющем поиски решения. Значительно удобнее так называемые номограммы из вырав- выравненных точек. г 0.Ш 1 got г 0.0Z 1 ш 1 1 № Г 1 7 0,080.1 г / '•1 о.г /1 7 i / 0.8 С 0.8 --5г r-Z 1 Z V 1 l\l^ 1 1 \\ X til II ЗЬ 810 Е i го 20 а 1 40 1 1 1 80100 i ¦ 80100 'х Рис. 15. Рассмотрим уравнение C) Если нас интересуют лишь положительные корни уравнения C) (при а>0), то, логарифмируя C), получим: lg*=llgo. C<) Пусть на двух параллельных прямых С,Л и CSX построены так называемые логарифмические шкалы, т. е. при выбранной единице масштаба Е для расстояний С,?> и С2В от начал шкал до точек с произвольными числовыми отметками а и х будем соотвег- ственно иметь (рис. 15): М На рис. 14 семейства линий II и III не нарисованы; если номограмма строится на клетчатой бумаге, то достаточно построить лишь семейство линии ь
ГРАФИЧЕСКИЕ МЕТОДЫ 40Э Если на прямой CtC2 взять точку S, для которой =-^е=я, то из С D SC подобных треугольников SCtD и SC^B будем иметь: ^4-ъ = ~?т, т. е. Следовательно, при данных п к а достаточно найти соответ- соответствующие точки S и D на прямых Cfi^ и Cj-Л номограммы и с по- помощью линейки найти точку В, лежащую с точками S и D на одной прямой (номограмма из выравненных точек!). Числовая отметка точки В и даст корень уравнения C). Конечно,' номограмму на рис. 15 можно использовать и для решения уравнения Ьг — а = 0. (9) В этом случае точки с числовыми отметками а и Ь берутся на шкалах CtA и С2Х, а искомое значение z ищется на прямой Cfiv На рис. 15 показано для примера решение уравнений I. дг* — 0,2 = 0, положительный корень xt && 0,45; II. лг3 —20 = 0, *;,*=« 2,7; III. 0,4г — 0,1 = 0, 2^2,5. Опишем, наконец, построение номограмм из выравненных точек для уравнений вида A), B) и т. п. На плоскости Оху построим кривую, заданную уравнениями У=—] ZS (Ю) (здесь г —параметр; если его исключить из данных уравнений, то получим: у= — \s~t-). Придавая различные значения параметру z, нетрудно составить таблицу соответствующих друг другу значений хну. Например, при s = 2 будем иметь: г х У 0 1 0 1 0,5 —0,5 2 V. 3 0,25 ^2,25 4 0,2 -3,2 9 0,1 -8,1 ¦ * * оо 0 —оо —0,5 2 —0,5 -0.9 10 -s,i ? X У —0,99 100 —88,01 —1 ±оо Тос -1,1 — 10 12.1 -1.5 —2 4,6 —2 -1 4 —3 —0,5 4,5 • ¦ • —11 -0,1 12.1 ¦ • • —со 0 +х> 26*
404 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ Если нанесём на чертёж точки, соответствующие найденным парам чисел х и у, проставляя около каждой точки соответствующее ей зна- значение параметра z, то полу- получим «криволинейную шкалу» для переменного z (при s = 2 это будет гипербола, изображённая на рис. 16). Кроме этой криволиней- криволинейной шкалы, нанесём на оси Оу равномерную шкалу pt а на прямой АВ — равномер- равномерную шкалу q. -2 Если при значениях р и q, равных коэффициентам *-' данного нам уравнения г?-\-pz-\- q = О, (И) взять на чертеже точки С (О, р) и D(l, q), то пря- прямая CD пересечёт, вообще говоря, построенную кри- кривую в точках Е и F с чис- числовыми отметками г, и г2 (а при s^>2 могут быть и. ис' ь' другие точки пересечения). Применив известное условие принадлежности трёх течек одной х , , — 2-1-г")» полУчим: 1 0 р 1 1 q 1 z{ 1 = 0 ;-p-TTb=0'откуда или — Соотношение A2) показывает, что числовая отметка точки Е, лежащей с точками С и D на одной прямой, будет корнем урав- уравнения A1). То же, конечно, можно сказать и о числовых отметках других точек пересечения прямой CD с криволинейной шкалой z. Замечая, что положительные числовые отметки z расположены на части кривой, заключённой между прямыми Оу и АВ, можно ограничиться лишь этой частью криволинейной шкалы, что позволит определить положительные корни уравнения A1); для определения же отрицательных корней достаточно в уравнении A1) сделать
ГРАФИЧЕСКИЕ МЕТОДЫ подстановку г= — t и искать положительные корни tit tit нения (—t)s—pt-\-q = O, т. е. при четном s — уравнения — pt + q = O, A3) а при нечетном s — уравнения — q = O. A4) в- 4 - Рис. 17. 405 урав- 9 Тогда —tu —U_, ... бу-дут искомыми отри- д цательными корнями уравнения A1). / На рис. 17 приве- приведена номограмма для ? определения положи- положительных корней урав- нений A) и B), при- „^ чём единица масштаба по оси Ох взята зна- -/ чительно больше, чем по оси Оу. -3 Там же показано для примера решение г* уравнений , г! + 5z — 1,5 = 0 1 г3 — 2zV6=V ~B (г, «=^ — 2,2; положи- -7 тельных корней нет). Конечно, на рис. 14, 15, 17 даны лишь схе- схематические изображе- изображения номограмм. Рабочие номограммы чертятся больших размеров с большим числом числовых отметок на шкалах или с более густой сеткой прямых, снабженных числовыми отметками. § 16. Решение систем уравнений Уже в § 11 при определении исходного приближения корней системы уравнений с двумя неизвестными был использован графи- графический способ. В § 14 оказалось целесообразным заменить уравнение четвер- четвертой степени системой уравнений, допускающей простое графиче- графическое решение.
406 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ Если дана система уравнений Ф(х, у) = 0, W(x, у) = 0, A) то для определения ее действительных корней достаточно опреде- определить точки пересечения кривых, соответствующих этим уравнениям; поскольку точки будут лежать одновременно на обеих кривых, то их координаты (лг„ ух), (xs, _ya) и т. д. будут удовлетворять и тому и другому уравнениям, т. е. будут корнями системы A). Построение кривых сильно упро- упрощается, если уравнения могут быть решены относительно одного из не- , , , известных, или оба неизвестных fj) JJ х можно выразить как функции одного и того же параметра (см., например, § 15—построение рис. 16). ¦0t5\ ^V / Практически удобно строить сна- сначала кривые в мелком масштабе по сравнительно далеко разбросанным точкам, что дает грубо приближён- приближённые значения корней; затем участки кривых, примыкающие к точкам пе- рис. is, ресечения, следует вычертить в круп- крупном масштабе, что даст искомые корни с большей точностью. После этого можно или еще раз повторить этот приём, или же уточнять полученные значения корней по способу Ньютона или по способу итерации. Решим для примера систему х — cos .у — 0,44 = 0, _y-f-sinjkr — 0,23 = 0. Грубый набросок кривых у = 0,23 — sinлг, х= 0,44 -f- cos у показывает, что корни следует искать в окрестности точки (I; — 0,5). Чертим сначала кривые в мелком масштабе, для чего вычисляем координаты их точек'): X у = 0,23 — sic a- 0,5 — 0,25 0,75 — 0,45 1 — 0,61 1,25 — 0,72 1,5 — 0,77 У X = 0,44 + cos у 0 1,44 — 0,25 1,41 — 0,5 1,32 — 0,75 1,17 — 1 0,98 1) При вычислении значений функций, в которых аргумент входит и самостоятельно и под знаком тригонометрических фупкций, удобно пользо- пользоваться таблицами тригонометрических фупкций" с аргументом, выраженным в радианах (см., папример, Н. М. Б е с к и п, Вопросы тригонометрии и её преподавание, Ш50, стр. 132—137.
ГРАФИЧЕСКИЕ МЕТОДЫ 407 Из рис. 18 видно, что кривые пересекаются вблизи точки A,2; —0,7). В окрестности этой точки составляем более подробные таблицы: у = 0,23 — sin х 1,18 0,6946 1,2 0,7020 1,22 0,7091 = 0,44 + cos_y — 0,68 — 0,7 — 0,72 1,2176 1,2048 1,1918 Из рис. 19, начерченного в значительно более крупном мас- масштабе, находим: лг, я« 1,204, yt ^ — 0,704. В общем случае построение кри- кривой, соответствующей, уравнению F (х, У) = ®> связано с утомительны- утомительными вычислениями, так как для опреде- определения значений у, соответствующих определённому значению лг=лг0, надо решить уравнение у) = 0. B) 1,18 -&7Z Рис. 19. Правда, иногда можно привлечь на помощь математический анализ: найти асимптоты кривой, точки перегиба и т. п., но полностью избежать необходимости решения уравнения B), как правило, не удается. Отметим, что особенно просто проводится решение системы линейных уравнений alx-{-bly = cl, C) так как для каждого уравнения достаточно найти лишь две (ке очень близкие!) точки и соединить их по линейке прямой линией. Конечно, при небольших, «круглых» коэффициентах нет нужды применять графический способ; но при громоздких коэффициентах (а такие случаи встречались нам и в § 11, когда мы искали поправки а и р в способе Ньютона, и в § .12 при отыскании коэффициентов а, Р, к, о в способе итерации) графический способ очень удобен.
408 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ Для случая трех уравнений с тремя неизвестными f(x, у, z) = O, D) 9(лг, у, г) = 0, E) ^(х,у, г) = 0 F) геометрическими образами, соответствующими этим уравнениям в прямоугольных декартовых координатах, будут поверхности, а корнями системы — координаты точек, общих всем трем поверх- поверхностям. Простейшим по идее методом, позволяющим на чертеже нахо- находить точки пересечения трех поверхностей, является изображение их в проекциях с числовыми отметками; например, придавая пере- переменному z в уравнении D) какое-нибудь конкретное значение z = z0, получим соотношение между переменными х и у: f(x, у, го) = О, G) которому на чертеже в плоскости Оху будет соответствовать неко- некоторая кривая, называемая горизонталью поверхности D); около этой горизонтали ставят числовую отметку z0. Если для каждого из уравнений начертить на одном и том же чертеже семейства горизонталей, например, с отметками г = 0, 1, 2, 3, ..., —I, —2 то, соединяя точки пересечения горизон- горизонталей (с одинаковыми числовыми отметками) поверхностей D) и E), получим изображение в проекциях с числовыми отметками линии их пересечения; затем так же ищется линия пересечения поверхностей D) и F); координаты общих точек этих двух линий дадут искомые корни (координата z будет равна числовой отметке точки пересе- пересечения линий, определяемой «на-глаз» по числовым отметкам сосед- соседних точек). Поясним описанный способ примером. Пример. Решить систему уравнений х—у-\- 3z — 7 = 0, х* + У* — z* = 0, **—У+ 2* — 2,5 = 0, или у =x+3z — 7, (8) *"+.у« = г», (9) х =у* — 2г-\- 2,5. (Ю) При z=\, 2, 3, 4, ... получим для этих уравнений соответственно семейства прямых, окружностей и парабол. На 'рис. 20 указаны линии пересечения {8—10), (9—10) поверхностей, попарно взя- взятых [линия (8—9) не указана, но она должна пройти через точки А, В, С, D].
ГРАФИЧЕСКИЕ МЕТОДЫ 409 Эти линии проходят через точки А, В, С, D, координаты которых , .. , лг ^15 Jfi=5s I s—1,3, —2,9, — 0,9, — 4, A1) г, я» 2,5, и дают нам искомые корни. Конечно, приближённые значения корней A1) можно графически же исправить, если начертить в более крупном масштабе участки поверхностей, прилегающие к точкам их пересечения. Рис. 20. В общем случае вычерчивание горизонталей поверхностей пред- представляет очень сложную задачу. Иногда помощь могут оказать спе- специальные транспаранты; например, для рассмотренной системы полезна была бы «прозрачная» парабола лг^у. Особенно просто графически решаются системы линейных урав- уравнений, так как для них семействами горизонталей будут семей- семейства параллельных прямых, а прямые пересечения плоскостей и в проекциях с числовыми отметками изображаются прямыми, что делает очень простым их построение. На рис. 21 показано графическое решение системы уравнений 1,5*— 1,5у — 2,2г — 0,5 = 0. ] 0,8x-{-lJy-{-z — 4,2 = 0, 1 2,3*—1Ду + 2*—3,8 = 0. J A2) 27 Энциклопедия, 2 кн.
410 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ Приведя, например, третье уравнение к виду 2г-3,8 —т к определяем при 2 = 0 и Щ-Ш) при двух каких-нкбудь значениях х соответ- соответствующие им значения у, потом то же самое делаем при г=\, что даёт две горизонтали 4 5 w третьей плоскости. </A) / \ Вычисления удобно ^ч У/т) О'Щ проводить на логарифми- " Ш^уС' ' ческой линейке, так как большой точности, как правило, не требуется. Из рис. 21 видим, что Рис.21. ху^2,\ .У!«^1,32,^0,3. Отметим, что системы линейных уравнений и с ббльшим числом неизвестных допускают простое графическое решение, основанное на других принципах*). Графическое же решение систем уравнений общего вида более чем с тремя неиз- неизвестными чрезвычайно сложно. Задачи к главе IV 25. Сколько действительных корней имеет уравнение 10 sin х — х = 0? Найти графически наименьший положительный корень с точностью до 0,01- 26. Найти графически иррациональный корень уравнения Iх— 4,v = 0 с точностью до 0,001. 27. Решить графически систему уравнений 2,41* — 2,15у = 0,32, 0,45* — 1,14у = 1,6. 28. Показать, что подстановкой вида х = аг любое кубическое урав- нение + osx -f- «з = 0 может быть приведено к виду Указать способ графического решения кубических уравнений, опирающийся на это преобразование. *) См., напримео, Д. Н. Головни н, Графическая математика, 1931, стр. 130—134.
ГРАФИЧЕСКИЕ МЕТОДЫ 411 29. Проводя окружности на чертеже с параболой y = xs, решить урав- пепия: а) х4 — 14ха + 24х — 8 = 0, в) х' + 2ха + х+ 2 = 0, б) х1 — lxs — 4х — 20 = 0, г) х'+5х —11=0 (в последнем случае, умножив обе части уравнепия на х, перейти к уравне- уравнению четвёртой степени с лишним корнем: х = 0). 30. Найти по способу Лилля корни уравнений: a) x«- б)х'- в) f-xa + x —7 = 0, j-X»_A;_l=0, x" —2 = 0, г) Зх3 + х —2 = 0, д) ха + 4x + 4 = 0, e) xa —4x + 5 = 0. 31. Найти графически с точпостью до 0,01 наименьшие положительные корни системы y = tgx. 32. Построить в большом масштабе номограммы из выравненных точек уравнений A), B) из § 15 и применить их к решению уравнений; а) Зха—Их —4 = 0, ' б) 5ха + 8х—13 = 0, в) х«- 33. Решить, проводя прямые на чертеже с начерченной параболой у==-х* уравнения: а) л« —0,05х + 0,0007 = 0, б) 60xa —х — 0,01=0 (предварительно сделать подстановки вида x = az). 34. Используя переход к более крупному масштабу, вычислить корни системы A2) из § 16 с точностью до 0,01. 35. Используя переход к более круппому масштабу, вычислить корни системы, состоящей из уравнений (8), (9), A0) из § 16, с точностью до 0,01.
ДОБАВЛЕНИЯ 1. Краткие исторические сведения Сравнительно недавняя расшифровка клинописных табличек, памятников вавилонской культуры, показала, что уже в начале вто- второго тысячелетия до нашей эры математические знания вавилонян были довольно обширны-. Им была, например, известна формула для приближённого извлечения корней квадратных из чисел Они умели решать задачи, приводящие к квадратным и даже к про- простейшим кубическим уравнениям. Например, в одной из дошедших до нас задач дело сводится — в современных обозначениях — к решению уравнения .(напомним, что у вавилонян была в употреблении так называемая' шестидесятиричная система счисления). После умножения обеих частей уравнения на 122 оно было при- приведено к виду A2*)8 + A2лгJ = 4 • 60 + 12, откуда 12лг=6. Решение преобразованных к такому виду уравнений осуще- осуществлялось, вернее всего, с помощью специальных таблиц (также дошедших до нас), которые в наших обозначениях выглядят при- примерно так: если 23 + 22 = 2, то 2=1, если 28 + 22= 12, то 2=2, если 28+22 = 5. 602 + 4- 60+12, то 2 = 26, если 28 + 29 = 5.602 + 40.60 + 12, то 2 = 27 и т. д. '
ДОБАВЛЕНИЯ 413 Египтянам, чья культура развивалась параллельно с вавилонской, решение уравнений второй и третьей степеней было, повидимому, неизвестно; правда, о математических знаниях египтян мы судим в основном по двум математическим папирусам: лондонскому E50 X 32 см?) и московскому E50 X 8 см*). Некоторые из задач, помещённых в -этих папирусах, приводят к уравнениям вида (в современных обозначениях) ах-\-Ьх-\-'сх-\- ... =rf, где а, Ъ, с, ... — некоторые целые числа или дроби, числитель которых обычно равнялся единице. Для решения таких уравнений применялся следующий приём, который впоследствии получил название правила ложного положе- положения (regula falsi): вычисляли при каком-нибудь x=xt значение левой части уравнения axt -f- bxt -f- cxt -\- ... = dlt а затем взятое число х1 делили на полученное число и умножали результатная (л:=-4—). Позже большую роль в разных странах играло так называемое правило двух ложных положений (по существу линейное интерпо- интерполирование), описанное в § 7. Индусы решали с его помощью задачи, которые в нашей трак- трактовке приводили бы к уравнениям первой степени; для них это правило давало точное ре.шение. Арабский математик ал-Кархи (XI в.) получил, повидимому, с помощью линейного интерполирова- интерполирования формулу Леонардо Пизанский (в 1202 г.) аналогичным путём пришёл к фор- формуле уа -J- г я« a -J- Зса _^_ Зд _|_ j. Кстати, отметим, что Леонардо, должно быть применяя способ линейного интерполирования, смог вычислить с большой точностью положительный корень -уравнения лг8-}-2лг2-{- 10дг=20: Xi = = 1° 22' 7" 42'" 33IV 4V 40VI (в шестидесятиричной системе); погреш- погрешность найденного им значения корня была меньше чем 10~10. Сравнительно малое влияние на численное решение уравнений оказала греческая математика. Греческих геометров периода V—-I вв. до н. э. вычислительная математика (логистика), как правило, мало интересовала. Даже в сочинениях, где встречалось извлечение кор- корней квадратных (например, у Архимеда), нет точных указаний на то, как эта операция выполнялась. Впрочем, позже в «Метрике»
*414 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ Герона александрийского (жившего около I — II в. н. э. или несколько раньше) указан способ извлечения корня квадратного, который в наших обозначениях может быть выражен так: где а — приближённое значение корня с недостатком, а ¦ с избытком. а Безусловно, грекам были известны и другие приёмы извлечения корней квадратных и даже кубических, но дошедшие до нас сведе- сведения позволяют делать лишь более или менее вероятные предполо- предположения как относительно сущности, так и относительно теоретиче- теоретической основы этих способов. Авторы некоторых работ по истории математики склонны считать, что греческие математики применяли для вывода приближённых формул линейное интерполирование, хотя весьма вероятно, что источники этих формул следует искать «в гео- геометрической алгебре», столь свойственной греческой математике1). Впрочем, у Птолемея (II в. н. э.) извлечение квадратных кор- корней осуществляется уже в шестидесятиричной системе приблизи- приблизительно так же, как делается в употребляемом теперь алгорифме. .Для геометрических задач третьей степени — см., например, ура- уравнения E), F) введения — греки интересовались больше геометри- геометрическим построением отрезков, являвшихся решением задачи, чем вычислением их длин. Применяемый в настоящее время алгорифм извлечения корней квадратных и кубических из чисел, дающий одну за другой цифры искомого корня, был уже в VI в. н. э. известен (конечно, внешне в другой форме) индусам, создавшим, как известно, позиционную десятичную систему записи чисел. Переданный через арабов в Европу, способ этот в 1600 г. был приспособлен Вьета для вычисления корней алгебраических уравнений. Однако лишь после опубликования (в 1819 г.) правила Горнера, позволяющего легко производить преобразования, встречающиеся в способе Вьета, способ этот приобрёл форму, описанную в § 4. В конце XVII в. Ньютон предлагает свой метод численного ре- решения уравнений, а Рефсон придаёт этому методу ту форму, в ка- какой он описан в § 7. К тому же времени относится зарождение способа итерации. ¦ Исследования Лагранжа (XVII в.) по теории непрерывных дро- дробей привели, в частности, к способу решения уравнений, описан- описанному в § 5. •) См., например С. Я. Лурье, Приближёнпые вычисления в Древней Греции, Архив истории науки и техпики, вып. 4, 1934, стр. 21—47,
ДОБАВЛЕНИЯ 415 Открытый Н. И. Лобачевским') способ решения алгебраических уравнений являлся крупным шагом вперёд, так как дал в руки вычислителей мощное средство для вычисления и действительных, и мнимых корней алгебраических уравнений. Обилие технических расчётов, не требующих большой точности, привело в конце прошлого века к развитию графических методов решения уравнений и к созданию номографии. В настоящее время внимание вычислителей направлено на раз- развитие численных методов решения алгебраических уравнений специ- специального вида (так называемых вековых уравнений), играющих боль- большую роль в механике, астрономии, алгебре и т. д. Один из наиболее практичных методов решения «вековых» уравнений принадлежит акад. А. Н. Крылову. 2. Советы преподавателям и рекомендуемая литература В настоящей статье не исчерпаны, конечно, все существующие способы численного и графического решения уравнений, да в этом и нет необходимости. Нам кажется, что, познакомившись со статьёй и проделав упражнения, читатель убедится в возможности вычисле- вычисления корней любых уравнений и систем уравнений с любой степенью точности (при наличии соответствующих таблиц). Следует, однако, обратить внимание преподавателей на два вопроса, не рассмотренные в настоящей статье: 1) решение уравне- уравнений с помощью построения графиков логарифмов функций, где очень полезным является применение так называемой логарифмической бумаги; 2) графическое решение систем линейных уравнений со многими неизвестными. Оба эти вопроса освещены в указанной ниже книге Головнина; они представляют хороший материал для школьных математических кружков. Приведённые в статье списки задач -без труда могут быть допол- дополнены самим читателем, для чего можно посоветовать либо составле- составление уравнений с заведомо известными корнями, например, / (х) = (х* — 4* -|- 5) (х* — х — 7)=xi — 5*3 -f- 2*2 -f 23л: — 35 = О и т. п., либо решение случайно взятых уравнений или систем урав- уравнений разными способами, что позволяет легко проверять правиль- правильность решения. Считаем полезным обратить особое внимание преподавателей на графические способы решения уравнений, позволяющие, как было показано в § 14 и 16, находить действительные корни систем ура- уравнений с" одним и с двумя неизвестными с любой степенью точ- точности. Решение алгебраических и простейших трансцендентных уравне- уравнений табличным и графическим способами следует рекомендовать 1) См. подстрочное примечание на стр. 353.
416 ЧИСЛЕННЫЕ И ГРАФИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УР\ВНЕНИЙ ещё и потому, что это приучает к пользованию различными табли- таблицами, помогает учащимся осознать роль радианного измерения углов, роль графического изображения функций и т. п. Заметим, кстати, что при построении графиков и вообще при численных способах решения уравнений весьма полезными оказы- оказываются такие приборы, как счёты, логарифмическая линейка и осо- особенно арифмометр; численное решение уравнений будет содейство- содействовать их популяризации в школе. ,Как известно, в средней школе даётся геометрическая интер- интерпретация решения простейших уравнений; важно, однако, создать у учащихся убеждение в том, что графически можно не только интерпретировать решение уравнений, но в некоторых случаях быстрее и проще находить корни уравнений, для чего, может быть, следует даже в классе решать уравнения вроде г —2,47 = 0. Графические методы решения уравнений особенно выгодно использовать в математических кружках; например, поручив кому- нибудь из кружковцев вычертить на миллиметровке кривые у — х"-, у=х\ y—sinx, у=х3-\-х* (см. задачу 28) и т. п. или номо- номограммы (в большом масштабе) для уравнений A), B), C) из § 15, можно затем на кружке провести упражнения на графическое реше- решение уравнений. Тем из читателей, кто захотел бы познакомиться с различными деталями, относящимися к численному и графическому решению уравнений, можно посоветовать прочесть следующие книги: 1. Безикович Я. С, Приближённые вычисления, изд. 6-е, Гостехиздат, Л. — М., 1949. 2. Глаголев А. А., Номография для школьников, 1935.¦ 3. Глаголев Н. А., Теоретические основы номографии, изд. 2-е, ОНТИ, М. —Л., 1934. 4. Головнин Д. Н., Графическая математика,ГОНТИ,М.—Л., 1931. 5. Крылов А. Н., Лекции о приближённых вычислениях, изд. 5-е, Гостехиздат, М. — Л., 1950. 6. Млодзеевский Б. К., Решение численных уравнений, 1924. 7. С у ш к е в и ч А. К., Основы высшей алгебры, изд. 4-е, Гос- Гостехиздат, М. — Д., 1941. 8. Рунге К., Графические методы математических вычислений, перевод с нем., 1932. 9. Скарборо Дж., Численные методы математического ана- анализа, перевод с англ., ГТТИ, М. — Л., 1934. 10. Уиттекер Э. и Робинсон Г., Математическая обработка результатов наблюдений, перевод с англ., ГОНТИ, М. — Л., 1935. И. Runge, Praxis der Gleichungen, 1921.
ДОБАВЛЕНИЯ 417 12. Runge und Ко nig, Numerisches Rechnen, 1924. 13. Willers, Methoden der praktischen Analysis, 1928. Кроме того, обратим внимание читателей на следующие таблицы, очень полезные при вычислениях. * 14. Петере И., Шестизначные таблицы тригонометрических функций, ГТТИ, М.—Л., 1932. В этих таблицах аргумент изменяется через 10". 15. Таблицы Барлоу квадратов, кубов, корней квадратных, корней кубичных и обратных величин целых чисел от 1 до 10 000. изд. 2-е, ОНТИНКТП, М. —Л., 1936. 16. Таблицы значений тригонометрических функций для аргу- аргумента, выраженного в радианах — в книге: Н. М. Б е с к и н, Вопро- Вопросы тригонометрии и её преподавание, 1950, стр. 132—137.
АЛФАВИТНЫЙ УКАЗАТЕЛЬ Автоморфизм нормального поля 282 Алгебраическая дробь 129, 130, 244, 245, 254 , алгебраическая точка зрения 253 i функциональная точка зрения 251, 253, 254 Алгебраические дроби, действия иад ними 245 , равенство 251, 252 Алгебраическое дополнение элемента определителя 33, 35—37 — уравнение, вычисление мнимых корней 350, 390 , разрешимость в радикалах 273, 275, 276, 279, 281 , условие разрешимости в ква- квадратных радикалах 303 р , в радикалах 232 , численные методы решения 317 Алгорифм деления с остатком 145, 147 — Евклида 148, 150, 269, 325 Ал-Кархи 379, 413 Архимеда задача 315 Базис конечного расширения 301 — пространства 13, 18, 20, 62, 64, 121 ортоиормальный 88, 112 Билинейная форма 87 Бюдана-Фурье теорема 331 Вековое уравнение 415 Вектор 11, 19, 42, 43, 82, 84, 101 »— , зеркальное отражение 103 — и-мерный 19 '— собственный 116, 119, 120 Вектор, умножение на число 11, 14, 20, 48 Векторное пространство 42—45, 56, — равенство, правила оперирования 46 Векторы, свойства операций над век- векторами 46—49 Высота члена многочлена 256 Высший член многочлена 256 Вьета 414 — формулы 208—210 Галуа группа уравнения 282, 285, 286 — поле 281, 285 уравнения 232 — теория 299, 300 Гаусс 201 Гаусса леммы 182, 183 Гельфонд А. О. 136 Гомоморфизм 293 Горизонталь поверхности 408, 409 Горнера способ вычисления действи- действительного корня уравнения 332,336 извлечения корня третьей сте- степени 374 — схема 160—162, 320, 321 Граница верхняя отрицательных кор- корней 324 положительных корней 318 — нижняя отрицательных корней 320 положительных корней 324 Границы корней уравнения, вычисле- вычисление способом Маклорена 319,320 , Ньютона 319, 320 Греффе 344 Группа интранзитивная 298 Группа нормального поля 285 — подстановок и-й степени 272 — транзитивная 297, 298 — уравнения 282, 283, 285, 286 , свойства 290—292 Даламбер 201 Даламбера лемма 192 Данделен 344 Двучлеи, условие неприводимости в поле 273 Декарта теорема 331 Деление многочлена на линепный дву- двучлеи 159—161
АЛФАВИТНЫЙ УКАЗАТЕЛЬ 419 Деление многочленов 143 Делимость многочленов 142—145, 148 — целых чисел 142, 148 Делители нуля 140, 165 Делоне Б. Н. 299, 300 Дискриминант уравнения квадратного 209 третьей степени 214 Длина вектора 84, 85 Доморяд А. П. 365 Евклида алгорифм 148, 150, 269, 325 Жирар 201 Задача Архимеда 314 — об удвоении куба 307, 399 — о построении правильных много- многоугольников 399 — отделения корней 317, 324 — о трисекции угла 307, 314, 399 — уничтожения иррациональности в знаменателе 262, 265 Извлечение корня квадратного из действительного числа 372 из комплексного числа 208 и-й степени из действительного числа 375 из комплексного числа 204 третьей степени из действитель- действительного числа 374 Изоморфизм 286, 293 — между кольцом многочленов и трансцендентным расширением 137—139 .— тождественный 290 Инверсия 25 Интерполирование линейное 359 — параболическое 359 Интерполяционный многочлен 358 Кардан 219 Кардана формулы 211 Кольцо многочленов от двух неизве- неизвестных 235 от нескольких неизпестных 235, 237 • от одного неизвестного 135, 137, 141 — с делителями нуля 140 — целых, чисел 145 Координаты вектора 13,19 относительно базиса 62, 63 Корень алгебраического уравнения 163 — многочлена 162 Л-кратный 163 27» Корень и-й степени из единицы 204 — первообразный и-й степени из еди- единицы 204 Корни рациональные многочлена 169—173 Коэффициенты многочлена 131, 237 Крамера правило 41 Кратность корня многочлена 163 — неприводимого многочлена 159 Кронекера-Капелли теорема 70 Крылов А. Н. 415 Лагранжа способ вычисления действи- действительного корня уравнения 338, 338, 341, 414 извлечения квадратных корней 372 Леверье 315 Леонардо Пнзанский 379, 413 Лилля графический метод решения алгебраических уравнений 397 Линдеман 135 Линейная комбинация векторов 11—13, 49 Линейное преобразование (отображе- (отображение), см. преобразование линейное Линейность функции 17 Лиувилль 135 Лобачевский Н. И. 343, 415 Лобачевского способ вычисления мни- мнимых корней 350, 355 решения алгебраических урав- уравнений 343, 344, 415 , случай действительных кор- корней, почти одинаковых по абсо- абсолютной величине 353 Логарифмическая шкала 402 Маклорена способ определения гра- границы корней 319, 320 Матрица 44 — вырожденная 98 — единичная 98 — квадратная 94, 96 — линейного преобразования 106, 109 — обратная 98, 99 — ортогональная 90, 99, 112 — перехода 64, 89 — , произведение на число 44 — симметричная 112 — системы 70 расширенная 70 — суммы и произведения линейных преобразований 107—110 — транспонированная 92 Метрические задачи 87 Минор матрицы 69
420 АЛФАВИТНЫЙ УКАЗАТЕЛЬ Минор определителя 34, 35 Многочлен, алгебраическая точка зре- зрения 130, 167, 244 — , его значение при значениях не- неизвестных 141, 242 — , единственность представления в нормальном виде 131, 132, 239 — над областьюцелостности,свойство 141 — неприводимый в поле 155 , свойства 156, 157 — нулевой степени 145, 155 — однородный 240 — от нескольких неизвестных 236 — от одного неизвестного 131, 134 — приводимый в поле 155 — , признак неприводимости Эйзен- Эйзенштейна 185 — примитивный 182 — противоположный 135 — , разложение на неприводимые мно- многочлены 156—159 — , — по степеням х — с 321 — с действительными коэффициента- коэффициентами 200, 201 — симметрический 254 — с комплексными коэффициентами 199, 200 — с рациональными коэффициентами, разложение на неприводимые многочлены 174, 184, 185 — с целыми коэффициентами, усло- условия отсутствия целых и рацио- рациональных корней 173 — , условие равенства нулю 132, 237, 242 — , функциональная точка зрения ¦ 129, 130, 142, 167, 244 — четвёртой степени, условие непри- неприводимости в поле рациональных чисел 178 Многочлены взаимно простые 150, 153, 154 — над полем рациональных чисел 168 , теория делимости 143, 148, — равные 131, 132, 239, 243 — , совпадающие с точностью до множителя нулевой степени 144 Муавра формула 205 Наибольший общий делитель много- многочленов 148—151 Неизвестное 131, 139 Непрерывность функции в области комплексных чисел 188 Номограмма 399 — из выравненных точек 402, 403 — сетчатая 401, 402 Нормальный вид многочлена 237 Нулевой вектор 49, 57 Ньютон 378, 414 Ньютона способ обобщённый реше- решения трансцендентных уравнений 363, 366, 367, 375, 377 определения границы корней 319, 320 решения систем уравнений 380, 383 , трансцендентных уравнений 357, 359, 360, 362, 371, 372, 375, 379, 414 Область рациональности уравнения 232 — целостности 141 бесконечная- 142, 167, 189 Образ вектора 101, 110 — элемента множества 100 Общий делитель многочленов 148,151 Определитель второго порядка 17, )8 — , вычисление определителя 34, 37 — матрицы 96 — произвольного порядка 21—24, 27—29, 31 — , разложение по элементам ряда 34, 36 — , свойства определителя 17, 18, 21—24, 29—32, 37 — системы уравнений 38 — третьего порядка 24 Остаток 145 — от деления многочлена на линей- линейный двучлен 160, 162 Отображение векторного простран- пространства 101 — гомоморфное 293 — линейное плоскости 103 пространства 103 — множеств 100, 101 Пересечение подпространств 57 Перестановка 24—26 - — нечётная 25 — чётная 25 Подкольцо 135 Подполе 226 Подпоследовательность 197 Подпространство векторного [про- [пространства 56, 57 — нульмерное 76 — , порождаемое множеством век- векторов 58
АЛФАВИТНЫЙ УКАЗАТЕЛЬ 421 Подпространство собственное 58 Подстановка единичная (тождествен- (тождественная) 271 — л-й степени 269 — обратная 272 Подходящая дробь 338—340 Поле 141 — алгебраических дробей 245,247,251 — действительных чисел 302 — комплексных чисел 188, 189, 302 — нормальное (псГпе Галуа) 232, 281, 285, 286 — числовое 19, 188 Последовательность комплексных чи- чисел 195 — ограниченная 196, 197 — расходящаяся 195 сходящаяся 195 , условие сходимости 195 Правило двух ложных положений 357, 413 — Крамера 41 Правило ложного положения 357, 413 Предел числовой последовательности 195 Преобразование алгебраическогоурав- нения 205 — координат 88, 90 ортогональное 90, 91 — линейное 101, 106, 109, 112 вырожденное ПО, 111 , геометрические свойства ПО невырожденное ПО—112, 122 ортогональное 112—114, 119 , представление матрицами 105 , — произведением ортогональ- ортогонального в симметрического 122 , примеры 102 , произведение на сопряжён- сопряжённое 122 симметрическое 119, 120 , условие ортогональности 113, 119 , условия невырожденности 111 — обратное 112 • — плоскости в себя 121 — подобия 116 — положительно определённое 121 — пространства 101 — симметрическое 112, 119 , геометрическая характеристи- характеристика 114 ' плоскости 115—117 трёхмерного пространства 117, 119 — , собственное значение 116 — сопряжённое 117—119 Преобразование сопряжённое произ- произведения преобразований 123 — тождественное 111, 112 — , условие сопряжённости 118 Присоединение элемента к полю 226 Проблема решения алгебраических уравнений в радикалах 232 — резольвент 300 Продолжение изоморфизма 286—¦ 288 Произведение автоморфизмов 283 — алгебраических дробей 245 — матриц 93, 95, 99 — многочленов 132, 134, 237 — отображений 104, 105 — подстановок 270 — примитивных многочленов 182 — функций 168 Пространство л-мерное 20, 42, 43 Птолемей 414 Равенство алгебраических дробей 251, 252 — векторов 11, 13 — многочленов 131, 132, 139, 167, 239, 243 Радикал 202 Размерность векторного простран- пространства 56, 58 — подпространства решений одно- однородной системы 73 — пространства многочленов 59 Разность векторов 12 — многочленов 135, 237 Разрешающее уравнение (резольвента) 267 Ранг матрицы 69, 82 — — , способ вычисления 81 — системы векторов 55, 56, 66 Растяжение пространства 121 Расширение кольца 135—137 — конечное 301, 302 — поля 226 алгебраическое 225, 302 простое 226 — алгебраическое 226 трансцендентвое 226 путём присоединения чисел 230, 231 Резольвента 267, 299 — кубическая 176, 177 Результант системы уравнений 81 Рефсон 414 Решение алгебраических уравнений в радикалах 232 , графический метод Лилля 396
422 АЛФАВИТНЫЙ УКАЗАТЕЛЬ Решение алгебраических уравнений, способ Горнера 332, 336 , — Лагранжа 336, 338, 341, 414 , — Лобачевского 343, 344, 350, 353, 355, 415 — двучленных уравнений 372 — квадратного уравнения 206 , графический метод 392, 394, 399 с помощью номограмм 400, 401 — систем линейных уравнений, гра- графический метод 407, 409 уравнений, графический метод 405, 406, 408 , способ итерации 383, 388, 389 , — Ньютона 380, 383 — трансцендентных уравнений, обоб- обобщение способа Ньютона 363, 366, 367, 375, 377 , способ итерации 367, 369, 371, 372, 378 , — линейного интерполиро- интерполирования 357—359, 360, 362, 413 , — Ньютона 357, 359, 360, 362, 371, 372, 375, 379, 414 — уравнений в радикалах 202 с помошью номограмм 399 , табличный способ 315,330,331, 357, 362, 363 — уравнения третьей степени 211,219 , графический метод 395, 399 четвёртой степени 221, 222 , графический метод 395, 396 Руффини-Абеля теорема 279, 281 Сдвиг 103 Симметрическая алгебраическая дробь 254, 261 — группа л-й степени 272 — функция 254 Симметрические многочлены, прило- приложения 262, 265—267 Симметрический многочлен 254 , выражение через основные симметрические многочлены 258, 259, 261 неоднородный 261 основной (элементарный) 255 , основные свойства 255 Симметрическое преобразование, см. преобразование симметрическое ' Система векторов 64 линейно зависимая 49 независимая 49, 51, 681 максимальная линейно незави- независимая 55 , условие линейной зависимости 50 •— — , независимости 68 — линейных неоднородных уравне- уравнений, совокупность решений 76 , условие единственности решения 61, 62 , — существование ре- решения 60, 61, 70—73 однородных уравнений, сово- совокупность, решений 73 , условие существования решения 72, 73 уравнений 14, 18, 38, 39, 60, 70 , основная теорема 40 с двумя неизвестными 78 с тремя неизвестными, гео- геометрическое место решений 78 — однородных уравнений, соответ- соответствующая данной системе 76 — уравнений, существование реше- решений в различных числовых по- полях 83 — функций Штурма 325, 329 — элементов линейно зависимая 301 независимая 301 Системы векторов эквивалентные 51 — уравнений эквивалентные 81 Скалярное . произведение векторов 84—88, 114 Сложение алгебраических дробей 245 — линейных преобразований 103 — матриц 100 — многочленов 132—134, 237 — рациональных функций 253 Старший коэффициент многочлена 131 — член многочлена 131 Степень конечного расширения 301 — многочлена от нескольких неиз- неизвестных 239, 240 от одного неизвестного 139, 141 — члена миогочлена от нескольких неизвестных 240 Сумма алгебраических дробей 245 — векторов 11, 13, 48 — матриц 44 Сумма многочленов 132, 237 — и-мерных векторов 20 — отображений 104 — функций 168
АЛФАВИТНЫЙ УКАЗАТЕЛЬ 423 Сумма элементов векторного про- пространства 42 Схема многочлена 397 Тейлора формула для многочленов 321 Теорема Бюдана-Фурье 331 — Декарта 331 — Кронекера-Капелли 70 — о делении с остатком 145 — о единственности выражения сим- симметрических многочленов через основные симметрические много- многочлены 261 поля алгебраических дробей 246 — о замене 51, 53, 54 — о непрерывности многочлена 189—191 — о неразрешимости общих алгеб- алгебраических уравнений выше чет- четвёртой степени в радикалах 279, 281 — о разложении многочлена на не- неприводимые многочлены 156—159 — о разрешимости алгебраического уравнения в квадратных радика- радикалах 303 — основная алгебры 188,191,192,199 , следствия 199 о неразрешимости алгебраиче- алгебраических уравнений с симметриче- симметрической группой в радикалах 297 о симметрических многочленах 255, 257 о совместности систем уравне- ' ний 40 — о степени произведения многочле- многочленов 141, 241, 242 Теорема о существовании поля алгеб- алгебраических дробей 247 трансцендентного элемента 136 — Штурма 325—327, 329 Теоремы о конечных расширениях 302 Транспозиция 25, 298 Транспонирование, действие на сумму и произведение матриц 95 — матриц 92 — таблицы определителя 32 Угол между двумя векторами 84 Умножение автоморфизмов 283 — алгебраических дробей 245 — матриц 93, 94, 96, 100 — многочленоз 132—134, 237 — отображений 104 Умножение подстановок 270, 271 — рациональных функций 253 Уравнение двучленное 202, 204\ — квадратное с комплексными коэф- коэффициентами 208, 209 — третьей степени 210, 215 каноническое 210 , неприводимый случай 217 с действительными коэффи- коэффициентами, исследование 216, 217, 219 , условия разрешимости в квадратных радикалах 304, 305 — четвёртой степени 220, 267 , условия разрешимости в квадратных радикалах 307, 308 Уравнения выше четвёртой степени, неразрешимость в радикалах 273 — с симметрической группой 294 Фаддеев Д. К. 300 Феррари 220 Форма т-(\ степени 240 Функции Штурма 325, 327—329 Функция 100 — линейная 17 — непрерывная в области комплекс- комплексных чисел 188, 189 комплексного переменного, свойства 196 — рациональная 252 Центральная кривая второго порядка, упрощение уравнения 124 Частное 145 Чеботарёв Н. Г. 299 Число алгебраическое относительно поля 226 — действительных корней многочлена с действительными коэффициен- коэффициентами 201 уравнения 325, 331 — измерений 56 — комплексных корней многочлена 200 — корней многочлена 164, 165 — отрицательных корней уравнения 327, 331 — положительных корней уравнения 327, 331 — трансцендентное 135, 315 относительно поля 226 Член многочлена с наибольшей сте- степенью 256 Члены многочлена 131, 134, 237 _,
424 АЛФАВИТНЫЙ УКАЗАТЕЛЬ Шатуновский С. О. 299 Эйлера способ решения уравнений Штурма система функций 325, 329 четвёртой степени 222 — теорема 325—327, 329 Эквивалентность систем векторов, — функции 325, 327—329 свойства 51 линейных уравнений 81 Элемент кольца трансцендентный 135, Эйзенштейна признак неприводимости 136 многочленов 185 Элементы поля сопряжёниые 290 Эйлер Л. 222 Эрмит 135