Text
                    М. БОХЕР
Профессор faptapdcnvzo ршюертяпетк
ВВЕДЕНИЕ
ВЫСШУЮ АЛГЕБРУ
ПЕРЕВОД С НЕМЕЦКОГО
иод редакцией А. Г. Курош
с предисловием Д. С. Александрова
ГОСУДАРСТВЕННО!
ЕХНИКО-ТЕОРЕТИЧЕСКОЕ ИЗДАТЕЛЬСТВО
МОСКВА 19SS ЛЕНИНГРАД


Tftg-tft-2 einfChbung in die hohebe algebra топ ИАХ1ИЕ BOCHEB Professor der Mathematik an der Harvard-University Leipzig und Berlhi Ш. Brack mud Yerlag топ В. G. Tenbner
Предисловие автора «...Как показывает заглавие, книга эта должна быть рассматриваема не как систематическое руководство (kompendium), но как введение в высшую алгебру, и потому в ней была сл^елара прцыт^са положить достаточно широкое основание для того, чтобы читатель оказался в состоянии с пониманием продолжить дальнейшее изучение; это представлялось более полезным, чем трактовать какие-либо главы вполне исчерпывающим образом. Вряд ли необходимо .оправдывать пропуск даже столь важных частей, как теория Галуа, и систематическое изучение инвариантов; так как выбор был необходим, то для изложения был предпочтен тот материал, который оказывается особенно важным в геометрии и в анализе так же, как и в алгебре, причем было обращено особое внимание на связь алгебраической теории и геометрии. Но при этом надлежит заметить, *^то прежде всего трактуются вопросы алгебраического характера, а не аналитическая геометрия, так что геометрические исследования носят по преимуществу отрывочный и несколько случайный характер. У изучающего не предполагается никаких алгебраических сведений, кроме знакомства с элементарной алгеброй включительно до квадратных уравнений, и также лишь такое знакомство с теорией определителей и методом математической индукции, которые могут быть легко приобретены начинающим в течение недели или двух. Книга эта, однако, не предполагает совершенно неопытного читателя, адресуясь скорее к студентам, которые занимались в течение двух или трех лет аналитической геометрией и диференциальным исчислением, причем основательное знакомство с элементарной аналитической геометрией является необходимым. Упражнения в конце каждого отдельного параграфа составляют существенную ч$сть книги, ибо они дают читателю возможность не только самому подумать об изложенном, но и во многих случаях содействуют ознакомлению его с основными идеями соприкасающихся (теорий; так* например, с сильвестровым законом «of Nullity» (упражнение 8, § 25), с ортогональными преобразованиями (упражнение к § 52 и к § 60) и с теорией инвариантов (рцарной биквадратичной формы (упражнение к § 90). При первом чтении глав I—VII мЪгут быть частью или совсем опущены § 10, 11, 18, 19, 20, 25, 27, 34, 35. Затем читатель мог бы приняться за изучение или квадратичных форм (главы VIII—ХЩ), или, если он предпочитает, непосредственно перейти к более общим вопросам глав XIV—XIX. Главы об элементарных делителях (XX — XXII) представляют собою наиболее специальную часть этой книги. Читатель, желающий приступить к ее изучению без чтения остальной части книги, мог бы ограничиться ^содержанием § 19Допуская теорему 1), 21—25, 36, 42, 43.
4 ПРЕДИСЛОВИЕ В книге такого рода не представляется возможным давать обширные библиографические указания, равно как и перечисление тех источников, которые были использованы при ее обработке. Однако работы двух математиков, Кронекера и Фробениуса, оказали столь решительное влияние на самый характер книги, что их имена должны быть упомянуты адесь. Автор считает своим долгом выразить благодарность своему коллеге проф, Осгуду за его указания и критические замечания, относящиеся к главам XIV—XVI. Книга эта является результатом лекций, читанных автором в последнее десятилетие в Гарвардском университете»1. М. Б*хв|>. Кембридж, 1909. Выдержка из предисловия к немецкому изданию «Предлагаемое немецкое издание книги проф. Бохеца по существу является дословным переводом; недостает только некоторых примечаний, которые являются специфическими для американской книги, для немецкого же читателя представляют меньший интерес. К этому переводу автор присоединил некоторые упражнения, которых недоставало в оригинале. Нумерация теорем сохранена та же, что и в оригинале, так что обоими изданиями можно пользоваться параллельно». Г. Бек. Ганновер, 1909. Предисловие к русскому переводу Одной из основных особенностей развития математики в последнее время является проникновение алгебраических понятий, методов и идей в самые различные области математической науки. Один из первых примеров такой алгебраизации математических дисциплин дает нам проективная геометрия; несколько сгущая краски, можно сказать, что геометрия проективных аксиом соединения и алгебра наиболее общих алгебраических тел имеют один и тот же реальный субстрат своих построений. В анализе блестящим примером проникновения алгебраических идей является теория интегральных уравнений и начавшийся с нее линейный функциональный анализ, общим понятием линейного оператора захватывающий все более и более широкие области математики и ее приложений. Чтобы не умножать примеров, упомяну еще только о топологии, в последние годы перестраивающейся и во многих своих отделах уже перестроившейся на основе систематической алгебраизации своих основные понятий и приемов исследования. i Выдержка из предисловия к английскому изданию этой книги, помещенная т начале немецкого перевода. i
ПРЕДИСЛОВИЕ 5 При этом приходится отметить одно — наряду с общими идеями современной алгебры, нашедшими свое выражение в основных определениях теории групп, колец и идеалов, основной двигательной пружиной в процессе алгебраизации математики является так называемая линейная алгебра, т. е. алгебра линейных преобразований, матриц, абелевых групп с операторами. Закон дистрибутивности — вот логическая основа, которой держится эта часть математики и которая, составляя основной логический элемент понятия линейного оператора, завоевывает все большие и большие области исследования. Значение как общей, так и специально линейной алгебры в современной математике до сих пор,— можно это прямо сказать, не получило отражения ни в нашем университетском преподавании, ни в изданной у нас до сих пор математической литературе. В Московском университете читаются разнообразные математические курсы, но тем не менее, можно кончить университет по специальности математики и не иметь возмож* нести почерпнуть из пройденных курсов знания того, что называется элементарными делителями матрицы! Одним из первых н/агов к восполнению этого пробела является книга Бохера (Вбспег), в значительной своей части посвященная линейной алгебре. Выбор книги Бохера для перевода нельзя не признать очень удачным — она является одним из лучших в мировой литературе введений в эту часть алгебры. Материал выбран с большим вкусом, в книге нет ничего, что могло бы быть опущено, а это большое и довольно редкое достоинство. Доказательства безукоризненно строги и вместе с тем изящны,—я нигде не встречал, например, столь простого доказательства известной теоремы Лапласа о детерминантах, как то, которое дано в книге Бохера. Рассуждения оживлены многочисленными геометрическими иллюстрациями (в этом отношении можно было бы пойти, впрочем, кое-где еще дальше, например в общей теории линейных уравнений). Однако, оценивая по достоинству все положительное, что есть в книге Бохера, надо, с другой стороны, иметь в виду, что книга написана до переживаемого нами сейчас расцвета идей общей алгебры, поэтому полной перспективы на современное положение разбираемых вопросов *гитатель Бохера не получит. В этом смысле ему можно порекомендовать, прочтя книгу Бохера приступить к изучению Алгебры фан-дер-Вар- дена (van der Waerden), во втором томе которой содержится сжатая, но превосходная трактовка основных вопросов линейной алгебры с более широкой точки зрения. Далее, можно пожалеть об отсутствии у Бохера теории абелевых групп с конечным числом образующих, которая по существу своему занимается тем же, что и теория целочисленных матриц и вполне относится к элементарному курсу линейной алгебры. Но как бы то ни было, книга Бохера есть и остается одним из самых лучших, если не лучшим введением в свой предмет. П. Александров Клязьма, 11-го июня 1933 г.
Оглавление Стр. Предисловие автора 3 Выдержка на предисловия в немецкому изданию 4 Нреднеловне ж русскому переводу — Глава первая Полиномы 1. Полиномы от одной переменной И 2. Полиномы от многих переменных 13 3- Геометрическая интерпретация 17 4. Однородные координаты . . , • 19 5. Непрерывность полиномов 22 6. Основная теорема алгебры 24 Глава вторая Определители (детерминанты) 7. Определения 28 8. Разложение Лапласа 31 9. Теорема умножения 33 10. Окаймленные определители : • . 3£ 11. Присоединенные определители и их миноры • . . . . 37 Глава третья Линейные зависимости 12. Определения и предварительные теоремы 40 13. Условия для линейной зависимости систем постоянных 42 14. Линейная зависимость полиномов 43 16. Геометрическая интерпретация 44 Глава четвертая Линейные уравнения 16. Неоднородные линейные уравнения 48 17. Однородные линейные уравнения 51 13. Основная система решений однородных линейных уравнений . . 53 Глава пятая Ра кг матрицы 19. Общая матрица . • • 57 20. Симметрическая матрица 59 Г..ава шестая Линейные преобразования. Комбинация матриц 21. Матрица как комплексная величина 63 22. Умножение матриц бб 23. Линейные преобразования . . . „ 68
% ОГЛАВЛЕНИЕ Стр. 24. Коллинеаяии < 20 25. Алгебра матрнд. Продолжение .... г 74 2& Множества. Математические системы. Группы 79 27. Изоморфизм . . . . • 82 /лава седьмая Инварианты* Основный понятия и примеры 28. Абсолютные геометрические, алгебраические и арифметические инварианты .,...,... 86 29. Эквивалентность . * -*.»...,... 80 30. Ранг системы тачек или системы линейных форм как инвариаяа? „ 90 31. Относительные инварианты и коварианты 92 32. Некоторые теоремы о линейных формах .» . . . ^ 9в 33. Двойное (ангармоническое) отношение. Гармоническое деление . 98 34. Плоскостные координаты. Контрагредиентные переменные .... 102 35. Линейные координаты в пространстве .»..*. Ю4 Глава восьмая Билинейные формы 36. Алгебраическая теория Ю8 37. Геометрические приложения ПО Глава девятая Квадратичные формы. Геометрическое введение / 38. Поверхности второго порядка; касательные; карательные плоскости. 112 У 39. Сопряженные точки. Полярные плоскости И 5 40» Классификация поверхностей второго порядка в зависимости от v ранга Н<6 41. Нормальные формы уравнения поверхности второго порядка . . 118 Глава десятая Квадратичны* формы 42. Общая квадратичная форма и ее полярная форма . 120 43. Матрица и дискриминант квадратичной формы Ш 44. Двойные точки квадратичных форм 122 45. Приведение квадратичной формы к сумме квадратов 124 46. Нормальная форма. Эквивалентность квадратичных форм .... 127 47. Приводимые формы г28 48. Целые рациональные инварианты квадратичной формы 1-30 49. Другой прием приведения квадратичной формы к сумме квадратов .' . 131 Глава одиннадцатая Вещественные квадратичные формы 5Э. Закон инерции ' Щ; 51. Классификация вещественных квадратичных форм Ш 52. Определенные и неопределенные формы . . . Hi) Глава двенадцатая Система, состоящая из одной квадратичной и нескольких линейных форм 53. Плоскости и прямые в связи с поверхностью второго порядка . 147 $4. Присоединенная квадратичная форма. Инварианты 15$ 55. Ранг присоединенной формы 153
ОГЛАВЛЕНИЕ 9 Глава тринадцатая Пира квадратичных форм Стр. 56. Пара конических, сечении ..,...,.....*...' 16& 57. Инварианты пары квадратичных форм. Их Х-уравнение 157 58. Нормальные формы. Х-уравнение не имеет кратных корней . . 158- 59. Нормальные формы. Форма ф определенная и неособенная ... 161 Глава четырнадцатая Некоторые общие свойства полиномов 60. Делитель. Приводимость 164- 61. Неприводимость общего и симметрического определителя .... KJ6 62. Соответствующие однородные и неоднородные полиномы . • . . 167 63. Деление полиномов 16© 64. Особенное преобразование полинома •• ... 172 Глава пятнадцатая Общий делитель полиномов от одной переменной и бинарных форм 65. Разложение на линейные множители \J& 66. Общий наибольший делитель целых положительных чисел ... 176 67. Общий наибольший делитель двух полиномов от одной переменной 178 68. Результант двух полиномов от одной переменной "181 69. Общий наибольший делитель в форме определителя 183 70. Общие корни уравнений. Исключение 185 71. Случаи я0=0 и Ьй = 0 186 72. Результант двух бинарных форм . . . ." 188 Глава шестнадцйтая Делителя полиномов от двух и более переменных 73. Делители, содержащие только одну переменную 189 74» Алгорифм Евклида для полиномов от двух переменных ..... 191 75. Делители полиномов от двух переменных . . 193 76* Делители полиномов от трех и более переменных 196 Глава семнадцатая Целые рациональные инварианты. Общие теоремы 77. Инвариантность^ множителей инварианта 201 78. Относительные * инварианты, рассматриваемые с более общей точки зрения 202 79. Изобарный характер инвариантов и ковариантов ........ 204 80. Геометрические свойства. Принцип однородности 20& 81. Однородные инварианты 211 82. Результанты и дискриминанты бинарных форм 2IS Глава восемнадцатая СЬшгаетричесвие подииомы 83. Основные понятая. Функции 2 и & 220 84. Элементарные симметрические функции 2^2 85. Степень и вес симметрических полиномов 225 86. Результант и дискриминант полиномов от одной переменной . . 227
10 ОГЛАВЛЕНИЕ Глава девятнадцатая Полиномы симметрические от пар переменных Стр. 87. Основные понятия. Функции S и S 230 88. Элементарные симметрические функции 231 89. Бинарные симметрические функции 9 232 90. Результанты и дискриминанты бинарных форм 234 Глава двадцатая Элементарные делители. Эквивалентность Х-матриц 91. Х-матрицы и их элементарные преобразования ........ 239 92. Инвариантные множители и элементарные делители 245 93. Вычисление инвариантных множителей и элементарных делителей 248 94. Эквивалентность l-матриц; другое определение 250 95. Умножение и деление Х-матриц . 252 Глава двадцать первая Эквивалентность н классификация пар билинейных форм м кол- линеаций 96. Эквивалентность пар матриц 255 97. Эквивалентность пар билинейных форм 258 98. Эквивалентность коллинеаций 260 99. Классификация пар билинейных форм . 261 100. Классификация коллинеаций . • • 266 Глава двадцать вторая Эквивалентность и классификация пар квадратичных форм 101. Две теоремы из теории матриц 269 102. Симметрические матрицы 272 103. Эквивалентность пар квадратичных форм 274 104. Классификация пар квадратичных форм 277 105. Пары квадратных уравнений. Системы форм и уравнений , . . . 278 106. Заключение •...*..... 283 А флвитный указатель 286
Глава первая Полиномы 1. Полиномы от одной переменной. Целой рациональной функцией или, короче, полиномом (многочленом) от х называется функция от х, определенная выражением вида: Ctxei+ С^ва + ... + С4*** (I) где ai9 <ха,...,¾ — целые числа, положительные или равные нулю, в то время как Ct, Са,.. .,СЬ, а равным образом и дг, означают какие угодно вещественные или комплексные величины. Не нарушая общности, можем все числа а предположить отличными друг от друга; при этом предположении выражения Cixi называются членами полинома; Cs будет ковфициентом члена С4ха* a at — его степенью. Наибольшая из степеней всех тех членов, коэфициенты которых отличны от нуля, называется степенью полинома. Необходимо отметить, что только что введенные понятия — члена, коэфициента, степени — относятся прежде всего, собственно, не к самому полиному, но к тому частному выражению (1), в виде которого мы этот полином представили; было бы совершенно допустимым предположить, что одна и та же функция от х может быть представлена двумя различными выражениями вида (1). В дальнейшем, однако (теорема 5), мы увидим, что это будет иметь-место только в тривиальном случае, когда оба выражения отличаются друг от друга только членами с коэфициён- тами, равными нулю. Располагая члены выражения (1) по убывающим степеням х и добавляя, если это необходимо, некоторые опущенные члены с коэфициентами, равными нулю, можем представить полином в так называемой нормальной форме: аьхп + ах хп~1 + ... + дЛ_! х + а„ где п означает некрторое целое положительное число или нуль. Полином этбт будет степени п только тогда (а также всегда тогда), когда я0 ф 0. Определение. Два полинома ft (х) и /2 (х) называются тождественно равными (Дев/з), если они равны для всех значений х. В соответствии с этим говорят, что полином f(x) тождественно обращается в нуль (/ssO), если он равен нулю для всех значений х. Элементарная алгебра изучает вопрос о сложении, вычитании и умножении * полиномов, т. е. об образовании из двух полиномов ft (х) и /2 (х) 1 Более трудный вопрос о делении двух полиномов изучается в § 63.
12 полиномы такого йолинома, который равняется сумме, разности или произведению двух данных. Теорема 1. Если полином f(x)^aQxn + ах **-4 + ... -f ап обращается в нуль при х — а, то существует другой полином ^Wsao^ + V^t-' + Vi' который удовлетворяет тождеству \ /Ws(Jf-a)?1(4 В самом деле, по условию /(a) = 0, а потому Но по элементарному правилу умножения двух полиномов имеем: дЛ_ ais(Ar_ a) (**-' + ад^-2+ ... + а*-1)- Следовательно /(Лг) = (лГ-а)[До(^-« + а^8+... + ап-1) + Для доказательств теоремы достаточно взять за <pt (лг|Ч10я«ном в йря- мых скобках. Если р будет таким значением х, отличным от а, для которого f(x) обращается в нуль, то , /Ш = (Р —a)?i(P) = 0; так какр — афО, то <Pi (^) = 0. Только что доказанная теорема может быть, следовательно, применена к полиному ^ (л:); получается таким образом следующий полином: ^(х)^авхп^ + а^хп^ + ...+ дн_2", Лая которого имеет место тождество: ч Поэтому имеем: f{x)~(x-a)(jl-})n(x). Продолжая это рассуждение, получаем следующий общий результат: Теорема 2. Если av о^,..., аь будут k различных постоянных и если щтчем /(*)^аохп + а1хп-* + ...+а„ (п>Л) що zde /ws(*-<4)(*-0fc)...(*-a*M*%
ПОЛИНОМЫ ОТ МНОГИХ ПЕРЕМЕННЫХ 13 Для случая &=л, т. е. когда полином f(x) обращается в нуль для « отличных друг от друга значений а1У а.А, .*., аНУ получается следующее тождество: /(х)==Ба<> (лг — о^Н* — <*з) • • • (х — ап). Бели поэтому д0 ф 0, то, кроме аи...,ап, не имеется никаких других значений х, которые удовлетворяют уравнению/(лг)= 0. Таким обравом является доказанной Теорема 3. Полином п-й степени от х может обращаться в нуль не больше нем для п различных значений х. Так как единственные полиномы, о степени которых нельзя говори&ь будут, очевидно, полиномы со всеми коэфициентами, равными нулю, и так как такие полиномы, очевидно, тождественно равны нулю, то из теоремы 3 получается такая основная теорема: Теорема 4L. Полином от х обращается тождественно в куль тогда и только тоЬдаЛ если все коэффициенты его равны нулю. Два полинома от х тогда и только тогда тождественно равны, когда их разность тождественно обращается в нуль. Теорема 5. Два полинома от х тогда и только тогда тожде* ственно равны, когда они обладают одними и теми же коафициж- тами. Эта теорема показывает, что, как выше было упомянуто, члены, коЩ фициенты и степень полинома зависят на самом деле только от самого нолмнома, но не от частного способа его представления. 2. Полиномы от многих переменных. Функция от х и у называется полиномом (многочленном), если она дана выражением вида: Сх *V + С2х**у^ +-... + £* жа*УЧ где аи^ означают целые положительные числа или нули. ' В общем случае функция от xt, х%, ... , хп называется полиномом, если она представляется таким выражением: Cixfxf* ...Xn^+CiX^xf* ..xn* + ... + Chxt"*xf*. ..*/*, (1) где a, .{$, ..., V—целые положительные числа или нули. Не нарушая общности, можно предположить, что в этом выражении не имеется двух слагаемых, содержащих одинаковые показатели для всех х; т. е. если даже то V|=|=v« Приватом предположении выражение Cix^*x^t... хпч называется членом полинома, причем Ct — его коэфициентом. Далее, а+ называют тогда степенью этого члена по отношению к х1} р,,—его степенью по отношение к л:2 и т.д.; и, наконец, сумме a,-f-(}, -f" ... +v4 лрисвоено наименование общей степени или просто степени этого ч ^на. Наибольшая из степеней по отношению к xiy которая встречается в
14 полиномы членах с необращающимися в нуль коэфициентами, называется также степенью полиноца по отношению к.х;, в соответствии с этим называют наибольшую общую степень также степенью полинома, причем и здесь подразумевается, что коэфициенты соответствующих членов отличны от нуля. Только что введенные понятия относятся так же, как и в § 1, прежде всего не к самому полиному, но к особому выражению (1), служащему для его представления; однако мы скоро увидим, что по существу имеется только одно единственное представление такого вида. Полином, все коэфициенты которого равны нулю, согласно нашему определению, не имеет степени. Когда говорится о полиноме от п переменных, нет надобности предполагать, что все п переменных в него действительно входят. Одна из &тих переменных или даже некоторые из них могут обладать показателем, равным нулю, в каждом члене полинома и потому отсутствовать Э выражении полинома. Таким образом полином от одной переменной или даже постоянная могут быть рассматриваемы как частный случай полиномов от любого большего числа переменных. Полином, все члены которого обладают одной и той же степенью, называется однородным. Такого рода полиномь! называются также формами *. Причем, смотря по числу входящих переменных, различают би- нарные, тернарные, кватернарные и вообще п-щрные формы. Бинарная форма является, таким образом, формой от двух переменных, тернарная— от трех и т. д. Обращая внимание, напротив, на степень форм, получаем другую классификацию, и тогда говорят о линейных, квадратичных, кубичных формах, степени которых будут соответственно 1, 2, 3. Полиномы со всеми коэфициентами, равными нулю, можно рассматривать по желанию, например, как линейные или как квадратичные формы и т. д., ибо полиномы эти, согласно предыдущему, не обладают степенью. Часто бывает полезно полином от многих переменных располагать по убывающим степеням одной из этих переменных. Нормальная форма, к которой приводится таким образом полином от п переменных, будет, например, следующая: <М*2, "., Хп)Х1т+^(Х29 ..., Xn)XiM"1 + ... + ffm(Xb ..., Хп\ где <р — полиномы от п — 1 переменных д:2, ..., хп. Образование новых полиномов из данных путем сложения, вычитания и умножения составляет предмет элементарной алгебры. Определение. Два полинома от любого числа переменных называются тождественно равными, если они равны для всех значений переменных. В соответствии с этим говорят, что полином тождественно обращается в нуль, если он равен нулю для всех значений переменных. * Некоторые авторы, следуя Кронекеру, присваивают наименование форма всем полиномам. Однородные полиномы в Англии называются квантиками (Quautice).
полиномы от многих ПЕРЕМЕННЫХ 15 Теорема 2. Полином от любого числа переменных тогда и только тогда обращается тождественно в нуль, если все коэфициенты его равны нулю. Достаточность этого условия не нуждается в доказательстве. Необходимость условия получается путем индукции. Для случая одной tie- ременной теорема справедлива (теорема 4, § 1). Теорема, следовательно, будет доказана, если, предполагая ее справедливость для случая п—1 неременных, установим ее для случая п переменных. у Итак, предположим, что полином f(xl9 ..., .*„)£= ?о (*2, ..., *n)xim + Vt(*2> •••• хп)*1т~1 + -~+Чт (х2, -м **> тождественно обращается в нуль. Придавая переменным х%,..., хп произвольные, но определенные значения лг2',..., хп\ видим, что / будет полиномом от одной переменной xv для всех значений хх обращающийся согласно предположению в нуль. По теореме 4, § 1 все коэфициенты этого полинома должны поэтому равняться нулю: ¥<(*2. •-., V) = 0 (/==0,1,...,m). Отсюда следует, что полиномы <р0, <р4> • • • > Чт обращаются в нуль для всех систем значений переменных, ибо #2', ..., хт* были выбраны совершенно произвольно. По предположению теорема справедлива для полиномов от п—1 переменных, а потому все коэфициенты полиномов ¥*> ¥i> • • • > ¥т обращаются в нуль, и так как в своей совокупности они образуют коэфициенты полинома /, то теорема сг^аведлива и, для полинома от п переменных. Два полинома тогда и только тогда тождественно равны, если их раз- ность тождественно обращается в нуль. Отсюда следует такая теорема: Теорема 2. Два полинома тогда и только тогда тождественно равны, когда коэфициенты соответствующих членов в их выражениях равны между собою. Теорема 3. Произведение ft »/2 двух полиномов fx и /а соответственно степеней mt и т% будет степени т1-\-т2. Теорема очевидна для случая полиномов от одной переменной. Докажем ее для общего^ случая путем перехода от п—1 к л. а) Прежде всего рассмотрим частный случай однородных полиномов. Всякое отдельное произведение, входящее в состав суммы и полученное по элементарным правилам, обладает степенью mt~\-mr Достаточно поэтому только показать, что среди всех полученных таким образом членов Д/g имеется по крайней мере один с коэфициентом, отличным от нуля. Для этого располагаем оба полинома ft и /2 по убывающим степеням xt: h (*i» • • •, хп)^ W(x* • • • > xn)xik* + ь! 0*2. • •> х^х^1 + - • •, f2 (ХЬ . . . , Хп) 5= ЪИ(Х2 -*»)*!** + ft" (-½ . .., *п)*1*Г1 + ..., причем можно предположить, что ни <рв', ни <р0" тождественно не обращаются в нуль. Так как ft и /2 однородны, то полиномы ср#' и <р0"
16 полиномы будут, также однородны, причем степени их соответственно равны щ—k% и т% — k.2. В произведении /£/а членами с наивысшей степенью у Хш будут именно те, которые в своей совокупности образуют произведение: , * . . W(*%>•--•> хп) W С*а.. -..-½) v > я так как мы предполагали, что наша теорема справедлива для полиномов от л—1 переменных, то произведение <р0'<р0" будет полиномом степени тг-\- Щ — кг — kv Каждый член этого произведения, коэфи* циент которого отличен от нуля, по умножении на xfM* дает член произведения /j/2 степени, равной m±-\-mv причем коэфициент его также отличен от нуля. Теорема, таким образом, доказана для случая однородных полиномов. б) В общем случае представляем полиномы следующим образом: ft (Л1, .. . , Хп) S3 <pm/ (*i, ...,*») + Чщ'-t (хь ..., хп) + ..., МХъ •••» •*«) = ?т," (*1, •••» Хп) + ^,-1^1. ••-. Xn) + ...t, где <р/ и <р/'— либо однородные полиномы соответственно степени / и j\ либо же тождественно обращаются в нуль. Так как, согласно нашему предположению,^ /t и /2 должны быть действительно степеней mt и /я2, то полиномы <pW|' и <р^" не обращаются тождественно в нуль, но имеют степени, соответственно равные т± и т%. В произведении /j/2 наивысшую степень должны иметь те члены, которые принадлежат произведению <fmi'• ср^". Но так как уЦ'тЦ" есть произведение однородных полиномов, то, согласно вышеуказанному (пункт а), степень этого произведения равна mt + тг Тому же числу равна также степень f±fv что и доказывает* окончательно теорему. Отсюда следует: Следствие* Произведение k полиномов, степени которых соответственно равны т^ /я2,..., /ий, является полиномом, имеющим -степень тх -f- т% -f-... -f- mr Приведем еще следующие две особо важные теоремы: Теорема 4. Если произведение двух или более полиномов тождественно равно нулю, то по крайней мере один из сомножителей тождественно равен нулю., В самом деле, если бы ни один из этих полиномов тождественно не обращался в нуль, то каждый из них имел бы некоторую определенную степень, а потому по теореме 3 обладало бы определенной степенью и их произведение й, следовательно, не могло бы тождественно равняться нулю. Теорема эта позволяет нам в тождестве, на правой стороне которого •стоит нуль, отбросить сомножитель, не равный тождественно нулю. Теорема 5. Если полином f(xlf ..., хп) не обращается тождественно в нуль, то полином <p(jq,..., xj тождественно равен нулю> ясли он обращается в нуль для всех тех систем значений перемен- Mix, для которых f отличен от нуля.
■->.. ■ > t ГЕОМЕТРИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ 1 / Доказательство следует из теоремы 4, ибо произведение /<р тождественно обращается в нуль. Упражнения 1. Два полинома / и <р удовлетворяют тождеству /2===?2. О каких соотношениям между / и у можно заключить отсюда? 2. Два полинома ft и /2 от C^i? • • •» -к») обладают соответственно степенями тх м пц по отношению к jq. Доказать, что произведение Д/2 по отношению к xt оу дет степени т^ + Ш2« 3. Геометрическая интерпретация. В учении о функциях от одной единственной вещественной переменной различные значения, принимаемые переменной, геометрически могут быть представлены точками прямой линии. При этом подразумевается, что, когда мы говорим о точке х> то дело идет о точке этой прямой, которая удалена от некоторой постоянной начальной точки О на расстояние |л:| единиц длины1. При этом точка О также берется на прямой; точка х лежит направо или налево от О, смотря по тому, будет ли х положительно или отрицательно. Таким же образом могут быть представлены геометрически точками на плоскости системы значений переменных в случае функции от двух вещественных переменных. В случае трех вещественных переменных можно пользоваться для интерпретации точками пространства. В. обоих случаях системы значений переменных дают прямоугольные координаты точки. Однако для четырех или более переменных подобная геометрическая интерпретация не является более возможной. Мнимая переменная jt = $-|-*i* зависит от двух независимых вещественных переменных £ и 7] в том смысле, что всякой паре вещественных значений (£, tj) соответствует одно единственное значение ху и обратно. Таким образом различным значениям одной единственной мнимой переменной, где (£, Г|) означают декартовы координаты, могут быть сопоставлены точки плоскости. Однако уже для функций от двух мнимых переменных прием этот не имеет места, ибо две мнимые переменные # = £-|-Г|/, ^ = ^ + ^/ эквивалентны четырем вещественным переменным (3, г4; Zv r,t). Окрестностью некоторой точки х=а прямой называется отрезок этой прямой между точками х=а — а и х = а-\-а (где а означает «некоторую совершенно произвольную положительную постоянную) или, другими словами, совокупность всех тех точек, координаты которых удовлетворяют неравенству: I*—Л|<а. В соответствии с этим окрестностью некоторой точки (а, Ь) плоскости называется, совокупность всех тех точек (х9 у), для которых имеют адесто неоавенства: \х-~а\<а, \у — Ь\<Ъ гле а и (5 — положительные постоянные. Окрестность представляет поэтому внутренность прямоугольника со сторонами, параллельными координатным осям, причем (а, Ь) означает среднюю точку прямоугольника. 1 Символом \г\ обозначается, как всегда, абсолютная величина z.
18 полиномы Окрестностью некоторой точки (а, Ьу с) пространства называется совокупность всех точек (х, у, z\ удовлетворяющих следующим неравенствам: I* —Д|<«» \У — *1<Р. \z-e\<i. Во всех этих случаях окрестность некоторой точки может быть большой или малой, смотря по тому, как выбраны постоянные a, j$, у. В случае одной мнимой переменной ^==--)-4^ П°Д окрестностью некоторой точки а понимается совокупность всех точек х гауссовой плоскости, для которых имеет место неравенство: | х — а |< а. Здесь, как и раньше, а означает вещественную положительную постоянную. Но так как \х — а\ представляет расстояние двух точек х и я, то окрестность точки а составляет внутренность круга радиуса а с центром в точке а. Вся эта терминология может быть с пользою применена также и к случаю любого числа вещественных или мнимых переменных. В случае п независимых переменных (хи лг2, ... , хп) всякую частную* систему значений этих переменных называют точкой пространства п измерений. При этом говорят, что точки вещественны, если все х вещественны, и что точки мнимы, если это обстоятельство места не имеет. Вопрос о том, может ли быть придано геометрическое истолкование понятию о пространстве числа измерений больше трех, оставляете» здесь без рассмотрения; мы пользуемся этими терминами только в вышеприведенном алгебраическом смысле потому, что, с одной стороны, он» имеют преимущество большей краткости перед обычными алгебраическими терминами и, с другой стороны, потому, что, вызывая в нашем уме геометрические образы трех или меньшего числа измерений, терминология эта часто наводит нас на мысль о новых соотношениях, которые иначе могли бы и не представиться нам столь легко. Под окрестностью некоторой точки (ах, а2, .,., ап) понимается совокупность всех точек (хи л;2,..., хп), для которых имеют место неравенства: 1*1 — «il<«b i -^2 —«2I <а2, -.-, |лг —дп|<а№, где av а2,..., ап означают произвольные вещественные положительные постоянные. Если в частности (<zt, а2, ..., ап) означает вещественную точку, то совокупность вещественных точек, удовлетворяющих вышеприведенным неравенствам, можем назвать также вещестьенной окрестностью точки, В качестве примера алгебраического применения понятия об окрестности некоторой точки приведем такую теорему: Теорема 1. Для тождественного обращения в нуль полинома f(xv ..., хп) необходимо и достаточно, чтобы он обращался в нуль везде в окрестности некоторой точки (а17 .. •, ап). Условие это, очевидно, необходимо; для доказательства его достаточности начнем с рассмотрения случая я=1.
ОДНОРОДНЫЕ КООРДИНАТЫ 19 * Итак, предположим, что f(x)=Q везде в некоторой определенной окрестности точки х = а. Если бы полином / (х) не обращался теперь тождественно в нуль, то он имел бы некоторую определенную степень, например £, и потому (теорема 3, § 1) мог бы быть равным нулю не более чем в k точках; но полином, согласно условию, обращается в нуль в бесконечном числе точек, именно во всех точках окрестности х = а. Следовательно, наша теорема для случая п = 1 доказана; положим теперь п = 2. Полином, обращающийся в нуль везде в окрестности |*-л|<о, \У-Ь\<Ь напишем в следующем виде: f(x, у) = <?0(у)хк + <н(у)х*~1+.•. + ?*(». Пусть у0 — некоторая постоянная, удовлетворяющая неравенству^ Тогда f(x, yQ) будет полиномом только от х, обращающимся в нуль для \х — а|<[а, а потому, в силу вышедоказанной части нашей теоремы для n=l9J(x, у9) = 0, т. е. Щ СУо) = ?i (У в) = • • • = П (У о) = 0. Таким образом все эти полиномы <р обращаются в нуль во всякой точке у9 окрестности у=Ь, и следовательно, полиномы эти все тождественно равны нулю в силу опять-таки вышедоказанной части нашей теоремы для я=1. Отсюда следует, что f(x, у) тождественно обращается в нуль. Читателю предоставляется путем математической индукции дать очевидное обобщение этого метода доказательства для случая п переменных. Из только что доказанной теоремы можно получить следующую: Теорема 2, Необходимое и достаточное условие для того, чтобы два полинома от переменных (х±,..., хп) были тождественно ррвны, заключается в равенстве этих полиномов везде в окрестности некоторой точки (av ..., ап). Упражнения 1. Теорема 3, § 1 может быть высказана следующим образом: полином / от одной переменной, степени не больше я, тождественно обращается в нуль, если полином этот обращается в нуль в п + 1 различных точках. Доказать следующее обобщение: если степень полинома f(x, у) по отношению к х не больше /г, а по отношению йу не больше т и если / обращается в нуль в (п + 1)(т-\-1) различных точках (лгг> у$ (/ = 1, 2,..., п'\ / = 1,2,..., т!\ то полином / тождественно обращается в нуль. 2. Теорему упражнения 1 обобщить для полиномов от любого числа переменных. 3. Теорему 4, § 2 доказать помощью теоремы 1, § 3; получить тогда из^ нее теорему 3, § 2. 4. Однородные координаты. Хотя для определения положения точки плоскости достаточно двух величин, однако часто бывает полезно поль- 2*
20 по/л и но мы зоваться тремя, причем важно не точное значение этих величин, но лишь их отношение. Обозначим эти три величины через х, у, t и определим их уравнениями: 7 = * T = Y' где X w Y будут декартовы координаты точки на плоскости. 2 3 Тогда система (2:3:5) означает точку с абсциссой 7 ис ординатой г. О о Всякая система значений, три числа которой пропорциональны (2, 3, 5)f представляет ту же самую точку. Три числа такой системы значений называются однородными координатами рассматриваемой точки. Таким образом всякой системе трех чисел соответствует в этом смысле одна единственная точка (за некоторыми определенными исключениями, о которых речь будет далее); всякой точке принадлежит бесчисленное множество систем трех чисел, которые, однако, все будут друг другу пропорциональны. При ^ = 0 данное определение не имеет смысла. Рассматривая, однако, точки (2*3:1); (2:3:0,1); (2:3: 0,01); (2:3: 0,001); ..., декартовы координаты которых таковы: (2, 3); (20, 30); (200, 300); (2000, 3000), ..., убеждаемся, что все они лежат на прямой, проходящей через начало 8 координат, и угловой коэфициент которой равен -. Таким образом, если { приближается к нулю, причем х и уу одновременно не равные нулю, остаются постоянными, то точка (x:y:t) двигается по прямой линии, проходящей через начало координат, с угловым коэфициентом, равным ~„ Естественно поэтому говорить о (х:у:0) как о бесконечно удаленной точке на прямой, угловой коэфициент которой равен -. Если t приближается к нулю, проходя через отрицательные значения, точка движется по той же прямой, но в противоположном направлении. Однако мы не будем различать этих двух случаев и будем говорить только об одной единственной бесконечно удаленной точке прямой. Легко может быть установлено, что если точка удаляется в' бесконечность по всякой прямой, параллельной только что рассмотренной, то ее однородные координаты приближаются сколь угодно близко к тем значениям (ху у, 0), которые только что были получены. Естественно поэтому говорить скорее о бесконечно удаленной точке в одном определенном направлении, чем о бесконечно удаленной точке на некоторой определенной прямой. Две бесконечно удаленные точки, однородные координаты которых пропорциональны, рассматриваются как тождественные, ибо эти координаты могут быть получены как предельные значения координат одной и той же точки, которая удаляется все дальше и дальше1. 1 С логической точки зрения, говоря о бесконечно удаленных точках, мы поступаем так же, как в § 3 при введении мнимой точки или точки простран-
ОДНОРОДНЫЕ КООРДИНАТЫ 21 Если x=y — t=0, то вообще мы не будем говорить о некоторой точке, ибо однородные координаты х, у и t любой точки могут быть сделаны сколь угодно малыми, и потому величины (0, 0, 0) могут быть рассматриваемы как предельные значения координат любой определенной или переменной точки. Уравнение , A X* + BXY + CY* + DX + EY + F=b в однородных координатах принимает вид: *§ + *§ + C-~+DX7+E^ + F=0 или Ах* + Вху + Сд*+ Dxt + Eyt + Ft* = 0, что является однородным уравнением второй степени. Очевидно, что если координаты Ху Y во всяком алгебраическом уравнении заменяются координатами (х: у: 0, то полученное уравнение будет однородным и той же степени, что данное уравнение. Благодаря этому обстоятельству координаты (х: у: t) и называются однородными. С этим же свойством связаны их главные преимущества. Уравнение Ax + By + Ct=zQ представляет, вообще говоря, прямую линию; но, если Л = Б = 0, С ф0, то оно не означает никакого действительного геометрического места. В этом случае уравнение удовлетворяется координатами всех бесконечно удаленных точек и притом только ими. Поэтому говорят об этом уравнении, что оно представляет бесконечно удаленную прямую плоскости. Читатель легко может проверить, пользуюсь той формой уравнения пряной, в которую входят отрезки по координатным осям*, что бели прямая линия удаляется все далее и далее, то ее однородное уравнение все более и более приближается к виду £ = 0. В пространстве трех измерений точку с декартовыми координатами (X, К, Z) можно представить четырьмя однородными координатами (х* У* z> 0 следующим образом: 1-Х9 j-Y, -j-Z. Система (х: у: г: 0) представляет тогда бесконечно удаленную точку в направлении, определенном (если xl-J-у2-f"z* ^ 0)направляющими косинусами: У х2+у2 + г*' j/jc* + >Л + 20 ' УХ*+У* + г*' ства п измерений, т. е. мы называем «точкой» систему величин, которые //£ являются координатами некоторой «действительной» точки. Единственное различие между двумя случаями состоит в том, что координаты «бесконечно удаленной» точки являются пределами координат «действительной» точки. Является таким образом простой условностью, когда мы говорим, что две бесконечно удаленные точки только тогда тождественны, если их однородные координаты пропорциональны. Без всяких логических затруднений мы могли бы вообще все бесконечно удаленные точки рассматривать как тождественные.
Z2 полиномы система (0:0:0:0) исключается из рассмотрения; /=0 носит наименование уравнения бесконечно удаленной плоскости. Обобщая эту терминологию, часто будем говорить о (л^, xz, ...,-0 не как о точке в пространстве п измерений, но как о точке, представленной ее однородными координатами в пространстве п—1 измерения. Две точки, однородные координаты которых пропорциональны, будут рассматриваться как тождественные; точка, последняя координата которой обращается в нуль, называется бесконечно удаленной, и в случае д. =х _ # # # =хп = 0 мы не будем говорить более ни о какой точке. Этой терминологией будем, однако, пользоваться только тогда, если дело идет об однородных полиномах, и при этом должно быть твердо усвоено, что мы совершенно свободны в выборе той терминологии, которую найдем более удобной. Таким образом, например, если f(xt, х%, х3) — однородный полином второй степени, то уравнение /=0 может быть рассматриваемо как уравнение конического сечения на плоскости (хих%,х3— однородные координаты) или конуса второго порядка в пространстве (xt, х%, xs — обычные декартовы координаты). Однородные координаты могут быть также применены в пространстве одного измерения. Можно было бы точки прямой линии определить двумя координатами (л:, t), причем отношение (x:t) является неоднородной координатой X, т. е. расстоянием точки от начала. Этим представлением пользуются обычно в теории бинарных форм. 5- Непрерывность полиномов. Определение. Функция f(xv ..., хп) называется непрерывной в точке (cv . .., сп), если можно указать столь малую окрестность точки, что разность значений функции для любой точки этой окрестности и для точки (си ..., сп) по своему абсолютному значению меньше наперед заданного сколь угодно малого положительного числа г. Таким образом / будет непрерывна в (си ..., сп), если, выбрав положительное число е, возможно определить другое положительное число S так, что неравенство l/(*i» •••• -О —f(cu ..., сп)|<е имеет место для всех систем значений (xiy . ..,#п), Удовлетворяющих условиям: l*i —*il<«, l*i —<Ц<а» «... I*» —*»1<Я Теорема 1. Если две функции непрерывны в некоторой точке, то их сумма также непрерывна в этой точке* Пусть f± и /2 — две функции, непрерывные в точке (с±, ..., сп), причем kt и £2 — значения их в этой точке. Как бы мало ни было тогда положительное число е, можно выбрать §х и 52 столь малыми, что l/i-"**tl<-g-e для I** —*il<*ti 1 (Л - &2 !< -к е для \x( — ct\< Ъ2-
НЕПРЕРЫВНОСТЬ ПОЛИНОМОВ 23 Тогда имеет место также неравенство: l/i — *i I + I/2 — *2К£ Для I** —^1<*. где 8 обозначает меньшее из двух чисел ot и ё2. Но |Л1 + |В|>(Л+£|, а потому l/t—*l+/2 —*al = K/l+/2) —(*1 + *2)1<8 ДЛЯ |*,—*|<«. Следовательно, сумма Д-|-/2 непрерывна в точке (с1У ..♦, сп). Следствие. Если конечное число функций непрерывно в некоторой точке, то их сумма в этой точке также непрерывна. Теорема 2. Произведение двух функций, непрерывных в некоторой точке, будет также непрерывно в этой точке. Пусть kt и k% будут соответственно значениями двух данных функций Д и /й, непрерывных в точке (с19 ..., сп). Надлежит доказать, что как бы мало ни было число е, можно выбрать 5 столь малым, что |Д/2_ktk2|< 8 ДЛЯ \Xi — Ct\<b. (1) Обозначая через rj положительную постоянную, которая в дальнейшем должна быть взята достаточно малой, выбираем две положительные постоянные it и §2 так, что 1Л — к\\<т\ Для \xt — ^|<8i, Обозначаем снова через 8 меньшую из двух величин 8t и 52; тогда, €СЛИ |х< —<?,|<8, то l/i/a—*AI = l/«(/i —*i) + *i</a —Ъ)К1ЛНЛ—*il + l*il- /2-*il< <{l/2l + l*il)n- Но для |дс. — cJ<J, очевидно, l/d= ^2 + a2-^)!<l^i + l/2"-^KI^l + T), а потому Если kt vi \ k^ одновременно не равны нулю, то подчиняем 7j двум условиям: 2{)*i + *2I} ^ 2 Если &£ s= &й = 0, то выбираем т{ под условием: В обоих случаях неравенство (2) приводится к (1), что и доказывает теорему*
полиномы Следствие. Произведение конечного числа функций, непрерывных в некоторой точке, будет также непрерывно в этой точке. Согласно данному определению непрерывности, постоянная может быть рассматриваема как такал функция от (лгр ..., хп\ которая для всех систем значений этих переменных является непрерывной; то же имеет место в отдельности для каждой из этих переменных. В силу последнего следствия каждая функция вида Cxtk<... хпкл (где k суть целые положительные числа или нули) должна быть поэтому непрерывна в каждой точке. чИз следствия к теореме 1 получаем, таким образом: Теорема 3. Всякий полином является непрерывной функцией для всех систем значений переменных. В заключение дадим простое применение этой теоремы. Теорема 4. Если полином f(xu ..., хп) не обращается в нуль в точке (си ..., £м), то можно выбрать столь малую окрестность этой точки, что f не обращается в нуль ни в одной из ее точек. Положим, что f(cv . ..,ся) = Л. Так как / в точке (си ..., сп) по условию непрерывна, то можно определить столь малую положительную величину S, что везде в окрестности \xi — с J < 5 имеет место неравенство: |/_Л|<1|Л|. В этой окрестности / не может обращаться в нуль, ибо для всякой точки, в которой это имело бы место, мы бы получили: |/-*| = |*|<i.m что абсурдно. * 6. Основная теорема алгебры. До сих пор мы не пользовались теоремой, известной под именем основной теоремы алгебры^ т. е. теоремой, в силу которой всякое алгебраическое уравнение обладает корнями. В более точной форме выскажем это положение следующим образом: Теорема 1Ш Существует по крайней мере одно значение х, для которого полином п-й степени f{x) обращается в нуль (я>1). Хотя эта теорема является основной, но она не необходима для большей части изложенного в этой книге, тем более, что методы доказательства этой теоремы по существу не являются алгебраическими или только частично будут алгебраическими: поэтому мы не предлагаем здесь доказательства этой теоремы, отсылая читателя к любому курсу по теории функций комплексного переменного. В том случае, однако, когда мы найдем это удобным, мы будем предполагать эту теорему доказанной, В этом параграфе мы приведем некоторые непосредственно получаемые следствия этой теоремы". Теорема 2. Если f{x) — полином п-й степени I (х) se акухЛ + я,**- + ... + а^_, х -4- ап (а0 =к0),
ОСНОВНАЯ ТЕОРЕМА АЛГЕБРЫ 25' то существует всегда такая и притом единственная система постоянных а1У а2, ... # ап, что f(x)^а^х~аг)(х — а2) ... (х — ап). Теорема эта очевидна для полиномов первой степени. Применяя метод математической индукции, предположим теорему верной для полиномов степени, меньшей щ если можем установить справедливость теоремы» для полиномов л-й степени, то отсюда следует, что теорема справедлива для полиномов второй степени, ибо она верна для полиномов первой степени, затем для полиномов третьей степени и т. д. Из теоремы 1 видим, что существует по крайней мере одно значение хг для которого f(x) = 0. Обозначая это значение через ах, по теореме 1, § 1 получим: /(*)==(*.— адч(х)9 где <Р (х) == а0хп~* +btxn-% 4-...+ bn.v Так как ср(дг) полином (п — 1)-й степени и, согласно условию, теорема справедлива для таких полиномов, то существуют такие п — 1 постоянных. Oj, ..., ап, что * <р(лг)==д0С*~«fc) ••• С*— ап)« Следовательно, /(.*) == а0 (х — ах) (х — а2) ... (х — ап). Первая часть теоремы таким образом доказана. Остается показать^ что существует только одна единственная система таких величин а. В самом деле, предполагая существование двух таких систем av ..., аЛ и Pi> •••эРл» мы бы имели: /(л:)==а0(лг — -а1) ... (лг-~аи)~д:0(х —^)...(дг —рп); (1> и полагая в этом тождестве х = аи мы получили бы уравнение: ^K-Pi)(ai-p2)-^"-?J = 0; но так как а0+0, то ах должно быть равно одной из величин j3t, . ,.,рЛ. Предположим р пронумерованными так, что at = pt. Отбрасывая в тождестве (1), согласно теореме 4, § 2, множитель а0 (х — а^)9 получим: (^-¾)... {х — ап)^(х — $д ... (д? —р„). Для полинома п — 1 степени теорема справедлива, поэтому постоянные Р2, ..., $Л будут теми же, что и постоянные а2, ..., ап, только- написанными, быть может, в другом порядке, и наша теорема является,, таким образом, окончательно доказанной для полинома /г-й степени. Определение. Постоянные я,, ..., an, о которых шла речь & последней теореме, называются нулевыми точками полинома f {х} или также корнями уравнения f(x) = 0. Вели k из этих копной равны друг другу, но отличны от всех остальных, то их общая величина называется k-кратным корнем уравнения.
26 полиномы В силу теоремы 1, §1 корни представляют единственные точки, в которых /О) обращается в нуль. Теорема 3* Если полином f(xv ..., хп) не равняется тожде* ственно некоторой постоянной, то существует бесчисленное множество систем значений, для которых /ФО, и также при /г>1 бесчисленное множество систем значений, для которых / = 0. Первая часть этой теоремы почти очевидна, так как, если / не тождественно обращается в нуль, то можно найти такую точку, в которой 4>н отличен от нуля, а потому по теореме 4, § 5 также и такую окрестность этой точки, в которой / не обращается в нуль. Окрестность же эта состоит из бесчисленного множества точек. Остается доказать, что / обращается в нуль также в бесчисленном числе точек. Для этой цели выбираем одну из переменных, которая входит ъ f по меньшей мере в первой степени] не нарушая общности, можем предположить, что хх является такой переменной. Тогда f(xl9 .. . , хп) s FQ (дг2, . • • , хп) Xi + /^ (¾ • • • » хп) х1 "Г" • • • + Fk (х2> • • • » хп)> где Ol и F0 не обращается тождественно в нуль. Если (с2, ..., сп) ^сть точка, в которой /^ФО, то f(xv с2, ..., сп) является полиномом k-й степени от одной переменной xv По теореме 1 существует поэтому по крайней мере одно значение х1У для которого полином этот обращается в нуль. Если ct есть такое значение, то, следовательно, f(cv сч> •••» сп) = 0. ^° только что доказанной первой части нашей теоремы существует бесчисленное множество точек (<?2, . ., сп), для которых /^Ф 0, и так как каждая из этих точек определяет по крайней мере одну такую точку (си я2, ..., сп), для которой /=0, то теорема наша окончательно доказана. В заключение приведем без доказательства теорему, на которую в дальнейшем будем ссылаться и которая устанавливает, что корни алгебраического уравнения являются непрерывными функциями его коэфициентов. Теорема 4. Если а есть нулевая точка полинома а^хп + а^х™ +...+ а^х + ап (я0ф 0, п > 0) *, •то как бы мала ни была рассматриваемая окрестность \х — а\<Св точки а, можно указать в пространстве /г-f-l измерений столь малую окрестность точки (а0, av ..., ап), что для любой точки ("•» Ьх > • • • > bj этой окрестности полином Ь<>хп + ъхя*-* + ... + Ь^х + Ьп обладает по крайней мере одной нулевой точкой в окрестности \х — aj<e точки а. Доказательство этой теоремы см. в курсе Вебера, Алгебра. Т. 1, §44. * Теорема остается справедливой, если мы предположим только, что полином «отдет по меньшей мере первой степени, т. е. если некоторые из первых коэфи- щиевтош а0, au..f равны нулю.
ОСНОВНАЯ ТЕОРЕМА АЛГЕБРЫ 27 Упражнения Определение. Полином называется вещественным, если все его коэфициенты вещественны. 1. Будут ли справедливы теоремы 1 и 2, § 3, если мы ограничимся рассмотрением только вещественных полиномов и только вещественных окрестностей вещественных точек? 2. Если а + Ы есть ^-кратная мнимая нулевая точка вещественного полинома / (х\ то а — Ы будет также ^-кратной нулевой точкой. При этом предполагается, что а и Ь вещественны. «*. Всякий вещественный полином /z-й степени от одной переменной обладает при п нечетном по крайней мере одной вещественной нулевой точкой. 4с. Если f(xlt ..., хп) есть вещественный полином, не тождественно равный некоторой постоянной, то существует бесчисленное множество точек, для которых / =ь 0; в том случае, когда п отлично от единицы, а степень / по отношению к jfj есть нечетное число, имеется также бесчисленное множество вещественных -точек, для которых /=0.
Глава вторая. Определители (детерминанты) 7. Определения. Мы предполагаем известными читателю начала теории определителей и вкратце лишь заметим, что определитель я-то порядка ап ап . . • #1» ал\ ап2 • #™ следующее является однородным полиномом я-й степени от я2 переменных — элементов ati определителя. Часто бывает полезно не комбинировать эти я2 элементов в виде полинома, но рассматривать их только в том совершенно определенном порядке, в котором они стоят в определителе. Такого рода квадратное расположение ла элементов называется матрицей. Дадим общее определение: Определение 1. Система тп величин, располооюенных в прямоугольной таблице из т горизонталей и п вертикалей, называется матрицей. Если т = /г, то мы имеем дело с так называемой квадратной матрицей п-го порядка. Если некоторая таблица представляет не определитель, но матрицу, то обычно принято ограничивать ее с обеих сторон двумя вертикальными чертами: " Дц &п • • • ci\n al\ Я-22 "2л 17ml am2 Иногда применяют для этой цели большие круглые скобки, такж; с обеих сторон: х" ап а\2 • • • аи #21 #?2 • • • ^ п v ,;„;./
ОПРЕДЕЛЕНИЯ 29 Также и в случае квадратной матрицы должно быть ясно отмечено, что она не является определителем. В самом деле, матрица *, вообще говоря, не представляет никакой величины, но лишь, систему величин. При замене горизонталей вертикалями определитель, как известно, не меняется, но квадратная матрица переходит в другую квадратную матрицу. Определение 2. Две квадратные матрицы ап апХ ■ а\п . ап ап , апУ <*Ы' из которых каждая получается из другой путем замены горизонталей вертикалями, называются друг с другом сопряженными*. Определители и квадратные матрицы являются, таким образом, совершенно различными вещами. Каждый детерминант определяет некоторую квадратную матрицу (матрица детерминанта или определителя), и всякая квадратная матрица определяет детерминант (детерминант или определитель матрицы). Из всякой матрицы можно получить другие матрицы, вычеркивая отдельные горизонтали или вертикали (или те и другие). В частности можно из нее получить таким путем квадратные матрицы; определители таких квадратных матриц называются также определителями первоначальной матрицы; если эта последняя состоит из т горизонталей и п вертикалей, то ее определители будут всех возможных not рлдков, начиная от единицы до числа, равного меньшему из двух данных чисел т и п 3. Во многих важных задачах обращаются в нуль все те определители, порядок которых превышает некоторое определенное число, важно поэтому знать порядок наивысшего (отличного от нуля) определителя данной матрицы. Дадим поэтому определение: Определение 3. Говорят, что матрица будет ранга г, если она обладает по крайней мере одним отличным от нуля определителем t-го порядка, а все определители высшего порядка, заключающиеся в этой матрице, равны нулю. Матрица будет нулевого ранга, если все ее элементы равны нулю. Для краткости говорят также о ранге определителя, подразумевая под этим ранг его матрицы. * Ср., однако, § 21. 2 Иногда каждую такую матрицу называют еще транспонированной по отношению к другой. 3 Если т = /г, то имеется только одия единственный определитель этого высшего порядка, именно тот, который выше был назван определителем квадратной матрицы.
30 ОПРЕДЕЛИТЕЛИ Определение 4. Определители, получаемые из данного определителя путем вычеркивания некоторых горизонталей и вертикалей^ называются минорами данного определителя К Каждому элементу определителя соответствует определенный «первый» минор, получаемый вычеркиванием из определителя той горизонтали и той вертикали, на пересечении которых лежит данный элемент. Элементы определителя п-ro порядка могут быть рассматриваемы как еГр (я—1)-е миноры 2; таким образом можно каждому минору первого порядка сопоставить минор (п — 1)-го порядка, и обратно. Равным образом каждому минору второго порядка М определителя /г-го порядка D можно сопоставить минор N порядка п — 2, получаемый вычеркиванием в определителе D тех двух горизонталей и вертикалей, которые представлены в М. Оба минора М и N называются дополнительными друг к другу. Таким образом в определителе «11 «12 «13 «14 «15 «21 «22 «23 «24 «25 «31 «32 «33 «34 «35 «41 «42 «43 «44 «45 «51 «52 «53 «54 «55 ооа минора 1 «21 «23 1 1 «31 «38 1 И «12 «14 «15 «42 «44 «45 «52 «54 «55 будут дополнительными. Тем же способом сопоставляют каждому минору третьего порядка минор (п — 3)-го порядка и т. д. Определение 5. Если М будет минором k-го порядка определителя п-го порядка D, то минор N порядка п — &, получаемый вычеркиванием в D всех горизонталей и вертикалей, встречаемых в М^ называется дополнением минора М. Обратно, М является также, очевидно, дополнением минора N. Возвращаясь к минорам первого порядка, которые будут элементами данного определителя, обозначим снова элемент определителя D, стоящий на пересечении 1-й горизонтали и j-ft вертикали, через atj. Пусть, далее, Dtj представляет соответствующий первый минор (п—1)-го порядка. Часто рассматривают не этот минор Dijy но множитель Agj при 1 Часто говорят также в этом смысле о субопределителях (субдетерминантах). Но так как выражение это имеет также и другое значение (субопределители отличаются от миноров на некоторые определенные степени от —1), то предпочтительнее является терминология текста. Также и в последующем терминология отличается от той, которая обычно принята в немецких книгах; так, например, термином дополнение немецкие авторы пользуются в том смысле, который здесь придан выражению алгебраическое дополнение. Обозначения, принятые здесь, находятся в книге Паскаля, Определители (Тейбнер, 1900 г., немецкий перевод), {Прим. к нем. пер.). 2 Под &»м минором понимается, таким образом, определитель (я—А)-гапорядка
РАЗЛОЖЕНИЕ ЛАПЛАСА 31 atj, получающийся при разложении определителя D по элементам /-й горизонтали (/-й вертикали); тогда: Равным образом часто бывает удобно рассматривать вместо дополнения минора его алгебраическое дополнение, которое в только что рассмотренном случае является множителем Аь:, дадим для него следующее определение: Определение 6. Алгебраическое дополнение ЭД минора т-ro порядка М определителя D, в который входят горизонтали kv ..., km и вертикали /t, ..., /w, определяется уравнением: 9^==(- \)К +•"+*« + *1 +—+ lmN, где N означает дополнение минора М. Один важный частный случай получается путем следующего определения: Определение 7. Минор определителя D называется главным минором в том случае, если он получается вычеркиванием в D одноименных горизонталей и вертикалей. В этом случае при обозначениях определения б должно быть также поэтому алгебраическое дополнение главного минора совпадает с era дополнением. До сих пор. мы подразумевали, что порядок миноров, с которыми приходилось иметь дело, меньше порядка п данного определителя. Под. минором я-го порядка определителя я-го порядка D понимается, очевидно,, сам определитель, и говорить о дополнении этого минора, согласно предыдущему определению, не имеет никакого смысла. Мы полагаем, следовательно, что в рассматриваемом случае дополнение равно единице, и, согласно определению б, это будет также и алгебраическим дополнением. Упражнение Если миноры М и N дополнительны, то либо М и N будут алгебраическими, дополнениями друг к другу, либо —N будет алгебраическим дополнением минора Му а —М алгебраическим дополнением минора N 8. Разложение Лапласа. С помощью элементов atj некоторой горизонтали (вертикали) и соответствующих величин At. можно, как это известно из элементарной алгебры, разложить определитель D по определителям низшего порядка. В более общем разложении, найденном Лапласом, пользуются минорами /г-го порядка и их алгебраическими дополнениями, причем миноры эти образуются из любых k горизонталей^ и вертикалей определителя D. Как частный случай этого разложения,.
32 ОПРЕДЕЛИТЕЛИ Лапласа получается вышеупомянутое обычное разложение определителя. Прежде чем перейти к доказательству, установим сперва такую предварительную теорему: Теорема 1. Если переставим горизонтали и вертикали определителя D так, что некоторый определенный минор М займет место в левом верхнем углу, причем порядок следования горизоьРта- лей и вертикалей ни в М, ни в его дополнении N не меняется, то ,знак D или остается без изменения или же меняется, в зависимости от того, будет алгебраическим дополнением минора М ми- *иор N или —N. Для доказательства пронумеруем горизонтали и вертикали определителя D, как обычно, начиная с левого верхнего угла; и пусть указатели горизонталей и вертикалей, встречающихся в М, расположенные в порядке их возрастающей величины, будут соответственно: kv ...,&m и / ..., lm. Для перестановки, упомянутой в тексте теоремы, нужно сперва горизонталь с указателем kx поместить на первом месте, т. е. перенести *ее через kt — 1 других горизонталей; знак определителя меняется при этом kx — 1 раз. Затем поместить горизонталь с указателем k% на втором месте, т. е. перенести ее через /?2—2 горизонталей; знак определителя таким образом меняется k± — 2 раз. Продолжаем тем же путем, *пока Ьт-я горизонталь не будет перенесена на т-е место. Затем подобным же образом перенесем вертикали. В результате определитель D, умножается на множитель (—!)£,+ ... + ^ + ^ + ... + ^-2(1+2+...+^0 = (- l)*, + ... + fcm + z, + ...+;w. Сравнивая этот результат с определением б, § 7, получаем нашу теорему. Теорема 2т Произведение любого минора М определителя D на его ^алгебраическое дополнение состоит только из таких членов, которые встречаются также в разложении определителя D. Пусть в определителе I а\1 • • • а1п I ап\ • • • апп [ имеется минор М порядка т\ обозначим через N дополнение минора М и предположим сперва, что М находится в верхнем левом углу Д так -что N, которое в этом случае явится алгебраическим дополнением, находится в правом нижнем углу. Надлежит тогда доказать, что произведение любого из членов М на любой из членов N всегда является членом D и что этот член D в произведении MN не встречается яв:\ *раза. Всякий член М может быть написан в виде: (-1)^11/^21,,--- <*mim, гае целые числа (l19 /2, ...? /j являются некоторой перестановкой т <1> 2, ..., т\ содержащей {/"инверсий. Равным образом каждый член <мз N имеет вид: , nv
ТЕОРЕМА УМНОЖЕНИЯ 33 перестановка (lm+v ..., /J из (//г-j-l» ..., п) обладает v инверсиями. Произведение обоих этих членов действительно является некоторым членом определителя Д ибо множители а берутся последовательно из 1-й, 2-й, ...,я-й горизонталей Д причем любые два из них не принадлежат одной и той же вертикали, и JA-J-V, очевидно, равно числу инверсий перестановки (lv /^, ...,/ж) т (1, 2, 3, ..., л). Таким боразом теорема доказана для частного случая, когда М находится в левом верхнем углу D. Но в общем случае всегда можно путем перестановки горизонталей и вертикалей поместить М таким образом и, значит, N— в правом нижнем углу. При такой перестановке, согласда теореме 1, знак любого члена D или остается без изменения или шеняется, в зависимости от того, будет ли алгебраическое дополнение минора М равно N или —N. Произведение MN дает, как мы только что видели, члены в разложении измененного таким образом определителя, а потому произведение М на его алгебраическое дополнение даст нам члены разложения первоначального определителя D. Итак, получаем теорему Лапласа, которую выскажем в виде следующего правила: Правило. Вычеркнем в определителе - D любые т горизонтами (вертикалей) и образуем из полученной матрицы все определители т-го порядка. Множим каждые из этих миноров определителя D на его алгебраическое дополнение и складываем все таким образом полученные произведения. Сумма их равна D. Так как по теореме 2 каждое из этих произведений состоит из членов определителя Д то остается еще показать, что каждый из членов Д входит в одно и притом только в одно из этих произведений. Каждый член D содержит по одному элементу каждой из т горизонталей, образующих матрицу, упомянутую в правиле, и так как эти элементы лежат все в различных вертикалях, то они находятся только в одном единств энном из этих определителей /и-го порядка, например в М. Остальные множители рассматриваемого члена определителя D все входят в дополнение N минора М\ поэтому этот член D встречается только в MN и ни в одном #з остальных произведений, упомянутых в йравиле[1*]. Упражнения 1. Пусть квадратная матрица /z-го порядка будет ранга г. Если выбрать из нее 5 горизонталей (вертикалей), то ранг полученной таким образом матрицы ^удет не меньше, чем r + s—п. 2. Обобщить теорему упражнения 1. 9. Теорема умножения» Разложение Лапласа позволяет нам произ* ведение двух определителей представить снова в виде определителя, порядок которого равен сумме порядков двух первых определителей: 3 Б о х е р. Введение в высшую алгебру
34 ОПРЕДЕЛИТЕЛИ Яц • • • <*tn ахА • • • йпл Ь\\ • • • ^lm "ml • • • ^»»m ЛИ • РтпХ • . . аы 0 . . . 0 . апп 0. . . 0 • Ри #11 • • • hm • • ^»n *»tl • • • *mw где p могут быть выбраны совершенно произвольно. Действительно, если стоящий справа определитель разложим по минорам /г-го порядка, образованным из первых п горизонталей, то все отдельные произведения будут равны нулю, за исключением одного, стоящего в девой части. Из этого уравнения можно теперь получить важное следствие, касающееся представления произведения двух определителей равного порядка в виде определителей того же порядка. Для этой цели полагаем в последнем^ уравнении Ру = 0 для i^j,pu = —l. Для краткости ограничимся умножением двух определителей третьего порядка. Имеем: 1 ч ч ч к к к 1 ТГТ2 Тз • ах а2 аг Ьх ь2 ьг q с2 cs ==\ Ч к 7i —1 0 0 «2 к ь 0 —1 0 аз к Тз 0 0 —1 0 0 0 0 0 0 0 0 0 at а2 as h h h ct c2 сг Этот определитель шестого порядка может быть, однако, очень упрощен. Умножаем первую вертикаль на at и складываем с четвертой; умножаем далее первую вертикаль на а2 и складываем с пятой; наконец с шестой вертикалью складываем первую, умноженную на аъ\ тогда последние три элемента четвертой горизонтали равны нулю. Затем множим члены второй вертикали последовательно на Ьи #2, Ьъ и складываем соответственно с четвертой, пятой и шестой вертикалями. Наконец, ум* ножаем члены третьей вертикали на си с2, с3 и складываем произведения снова соответственно с четвертой, пятой и шестой вертикалями. В ре-! зультате определитель шестого порядка принимает следующий вид: «! а2 а3 ait71 + a2^1 + a3r1 Чаъ +<ЧЬ2 +Чсг Ч Ч + <Мз + 4cs \ к к к Mi + Mi + Mi М2 + М2 + М2 Мз + Мз + Мз Ti T2 Тз Ti«i + T2 ^1 + 73¾ Ti 4 + T2 h + 7.1¾ 7i Дз+72*з + 7з*з ~10 0 0 0 0 0—10 0 0 I 0 00—1 0 0 0 и немедленно приводится к определителю третьего порядка: Ч а1 + а2 h + а3 Ci at а2 + а2 ^2 + аз с2 а1 я» + Мз + аз сз к ах + к bi + к ct к я2 4- к h + к Ч к Ч + к h + к ^з 7i#i+ T2^i+7)3^i Ti«2+T2^ + 73^ 71«з + 72^з + *Гз^з J
ОКАЙМЛЕННЫЕ ОПРЕДЕЛИТЕЛИ 35 Таким образом произведение двух 'определителей третьего порядкт снова представлено в виде определителя третьего порядка. Прием доказательства является совершенно общим, и следовательно, для умножения вух определителей /г-го порядка имеем такое правило: Теорема. Произведение двух определителей п-го порядка может быть представлено в виде определителя также п-го порядка, в котором элемент, принадлежащий 1-й горизонтали и k-й вертикали, получается, если каждый элемент i-й горизонтали первого множителя множится на соответствующий элемент k-й вертикали второго множителя, и все эти отдельные произведения складываются. Необходимо отметить, что замена горизонталей вертикалями в одном или в обоих данных определителях не меняет величины произведения, но существенно, однако, меняет его форму. Например: 2 3 4 5 2 3 4 5 2 4 3 5 2 4 3 5 и 1 7 6 9 1 б 7 9 1 7 6 9 1 б 7 9 20 41 34 73 23 39 39 69 26 50 33 66 30 48 38 63 = 66, = 66, = 66, = 66. Подобным же образом произведение всяких двух определителей одного и того же порядка может быть представлено в четырех различных видах. 10. Окаймленные определители. Если к некоторому определителю п-го порядка присоединим одну или несколько горизонталей и так же равное число вертикалей, причем недостающие члены в правом нижнем углу положими равным нулю, то получим снова определитель, называемый окаймленным определителем. Исходя, например, из определителя второго порядка 1а м 1т *г получаем «окаймленные» определители: а р их Т $ «2 t>i v2 0 » V*' V-i а £ щ и{ щ" у I и2 щ' щ" vt v2 0 0 0 V v4 0 0 0 vx" v/' 0 0 0 Ь иг и/ и2 0 0 "'0 0 ,**
36 ОПРЕДЕЛИТЕЛИ Разлагая второй из этих определителей по правилу Лапласа, на дв& определителя второго порядка из двух последних горизонталей, получаем для него выражение: в которое более не входят элементы а, [5, у> 8 первоначального определителя. Сояи третий окаймленный определитель разложим по определителям третьего порядка из его трех последних горизонталей, то получим для него величину, равную нулю. Так же как в двух данных-примерах можно поступить и в общих слу-< чаях; получаем таким образом следующие теоремы: Теорема 1. Если определитель п-го порядка окаймлен присоеди~ пением п горизонталей и п вертикалей, тореличина окаймленного опре* делителя зависит только от величин его окаймляющих. Теорема 2. Если определитель п-го порядка окаймляется присое» динением более чем п горизонталей и вертикалей, то величина окайм* ленного определителя равна нулю. Существенный интерес представляет поэтому только случай, когда опре* делитель окаймляется присоединением числа горизонталей и вертикалей меньшего п. Тогда имеет место теорема: Теорема 3. Если определитель п-го порядка окаймляется присое* динением р горизонталей и р вертикалей (р<Сп)> образованных из независимых переменных, то окаймленный определитель представляет полином степени 2р от окаймляющих величин, причем коэфициенты этого полинома будут р-е миноры первоначального определителя. Об* ратно, каждый р-й минор данного определителя будет коафициентом по крайней мере одного члена этого полинома. В качестве примера рассмотрим частный случай п = 4, ^ = 2, #и #t2 #1з аи ui и1 #21 #22 #;3 #24 и2 Щ #31 #32 #33 #34 иА %' #41 #42 #43 #44 #4 а1 D = ^1 l2 VB ViL 0 0 W vl щ' W о о Если этот определитель разложим по правилу Лапласа (§ 8) на определители второго порядка, образованные из двух последних горизонталей, то получим: " #13 #14 "1 #l' #23 #24 #2 *%' #33 #3* #3 из #43 #44 #4 ик где в правой части стоит б членов. Разложим затем еще каждый из' определителей четвэртого порядка по правилу Лапласа по определителям +•
ПРИСОЕДИНЕННЫЕ ОПРЕДЕЛИТЕЛИ И ИХ МИНОРЫ 37 второго порядка, образованным из двух последниж вертикалей; и тогда для ^казательства нашей теоремы остается лишь представить результат в виДё полинома от и% и vv Представляем читателю пополнить детад* приводимого доказательства [5*]. 11. Присоединенные определители и их лнноры Определение. Если Aii означает алгебраическое дополнение элемента aiz в определителе ^п • • • аЬъ D = апХ то определитель D'= 4t .Д. называется присоединенным к D. Соответствующими минорами определителей D п D* (или, вообще говоря, дзух определителей одного и того же порядка) естественно называть такие, которые получатся, если в D1 вычеркнуть те же горизонтали и вертикали, что и в D. Приняв эти определения, установим следующую важную теорему: Теорема. Если D' означает определитель, присоединенный к D, и если М1 и М будут соответствующими минорами т-го порядка определителей D' и D, то М* равно произведению Dm~l на алгебраическое дополнение минора М. Докажем эту теорему прежде всего для того частного случая, когда миноры М и М находятся соответственно слева вверху в определителях D' и £). Тогда можно, очевидно, написать: Л1' = Переставляя теперь горизонтали и вертикали в определителе #12 • • • • ап\ в= аы образуем по правилу § 9 произведение MD. Получаем:
ОПРЕДЕЛИТЕЛИ MD' = D 0 0 D 0 0 . .0 . .0 . .D m-H 0 0 0 am+l, m+l . . .0 . . .0 . . .0 «,»»4-1 4n ли = Dm . an am+\,n ^m+l.w+l • * * un,m-\-l lm-\-l,n Если мы будем рассматривать здесь alv ..., апп как /г2 независимых переменных, то последнее уравнение будет тождеством, откуда, по сокращении на Ds\=0, получим: M' = Dm-i ат+\,т-\Л ' • • ап,т-\Л т-\-\,п (1) Определитель, явнолаписанный в правой части (1), представляет собой действительно алгебраическое дополнение мийора М, и таким образом наша теорема для рассматриваемого частного случая доказана. Доказательство имеет место также для т = п (ср. следствие 2, приводимое далее). Рассмотрим теперь случай, когда оба минора М и М не находятся более сверху слева в определителях D и D'. Обозначим через а сумму всех указателей горизонталей и вертикалей, входящих как в М, так и в М\ причем нумерация, как это обычно принято, начинается слева сверху. Если N и 9¾ будут соответственно дополнением и алгебраическим дополнением минора М, то, по определению 6, §7 имеем: Я = (—1)вМ (2 Переставим теперь в D горизонтали и вертикали так, чтобы М поместилось слева вверху. Если мы переставленный таким образом определитель назовем через Dv то по теореме 1, § 8 получим; ^ = (-1)¾. Алгебраические дополнения элементов Dt равны <8> ибо перестановка смежных горизонталей (вертикалей) изменяет знак каждого из этих алгебраических дополнений. Определитель D/, присоединенный к Dv получается, таким образоц из D' путем той же перестановки горизонталей и вертикалей^ кагс Dx из D, если при этом еще каждый элемент помножается на (—/)**
ПРИСОЕДИНЕННЫЕ ОПРЕДЕЛИТЕЛИ И ИХ МИНОРЫ 39 Теперь можно вышедоказанный случай нашей теоремы применить к £>/ }йбо миноры /гс-го порядка Мх и М^ находятся соответственно в Dt и Dt' ^лева сверху. Обозначая алгебраическое дополнение минора Мх через Sftj, получим: Mt'=Dr*Mu (4) но так как Мх — главный минор, то его алгебраическое дополнение Щ1 совпадает с его дополнением Л^, равным дополнению минора М в D. Таким образом, пользуясь (3), получаем из (4) уравнение: Л/Ц = Zy-Wt == Df^N = (— Xf С*-*) Dw-W. (5) Элементы Mt' отличаются от элементов М только множителем (—\Щ поэтому Afi' = ( — 1)та№. Подставляя это значение в (5), получим: (—1 )таМ' = (—l)wa • (—ly+D^N. Сокращая обе части на множитель (—1)*** и пользуясь уравнением (2) получаем: АГ = /7^, что и доказывает нашу теорему. Приведем некоторые наиболее часто встречающиеся частные случаи; Следствие 1. Если а^ будет элементом опреде4ителя п-го по* рядка D и а^ — алгебраическое дополнение соответствующего элемента Ах. определителя, присоединенного к Q, то ^ = 0-^,. Это соответствует просто случаю \т = п—1, где только вместо минора (я—1)-го порядка (—iy^atj вводится алгебраическое дополне* ние аИ к А1у Следствие 2. Определитель D', присоединенный к определителю п-го порядка D, равняется Dn~l. Для доказательства достаточно положить т = п. Следствие 3* Если S будет минор (п — 2)-го порядка, получаемый вычеркиванием в определителе D 1-й и k-й горизонталей, а также j~u и 1-й вертикалей, то обозначая через Ац алгебраическое дополнение элемента, находящегося на i-й горизонтали и на f-й вертикалиу получаем: I а! % 1=(-1)1^^ <<*<*> ><<)• Это соответствует случаю т = 2.
Глава третья Линейные зависимости 12» Определения и предварительные теоремы. Две системы постоянных (av bv cv dt) и (a2, b%> cv d^) обычно называются пропорциональными друг- другу, если каждый элемент одной системы может бьгть получен из соответствующего элемента другой путем умножения на один и тот же множитель; так, например, системы (1, 2, 3, 4) и (£, 4, 6, 8) пропорциональны друг другу. Обычно принимают, что каждая из обеих систем мойет быть таким путем получена из другой, и в большинстве случаев это действительно имеет место. Но, например, в случае двух систем (1, 2, 3, 4) и (0, 0, 0, 0) можно перейти от первой ко второй умножением на нуль, но нельзя, очевидно, перейти от второй снова к первой. Для многих целей более удобным будет следующее определение: i Определение 1. Две системы постоянных х1 > х2 * • • • * хп , х1 i х2 > •••# хп называются пропорциональными друг другу, если существуют такие две постоянные сх и с2, одновременно не равные нулю, для которых имеют место уравнения: с^ + с2х/' = 0 (/ = 1, 2, ..., п). Тогда для сх ф 0» имеем: -- t с2 у it v t „ с1 „ и ~ f ^2 v tt •*1 — — Т~ х1 » х2 — ~ х2 у • • •> хп — — "- хп * и соответствено для с% ={s 0: r tf Cl у f г II С\ у. г v ff ci у. г Л1 — ■ -*l , -*2 — ~- л2 , * • •, Xn — -- Xn . L2 c2 62 Обе системы xl ' 2 * • • •# Xn 0, 0, ..., 0 Очевидно, пропорциональны; достаточно только положить ct = 0 и выбрать для сг какое-либо число, отличное от нуля, чтобы выполнить требования данного определения. к> -Понятие о линейной зависимости может быть рассматриваемо как обобщение понятия о пропорциональности. Вместо двух систем постоянных рассмотрим теперь т систем и дадим следующее определение:
ОПРЕДЕЛЕНИЯ И ПРЕДВАРИТЕЛЬНЫЕ ТЕОРЕМЫ 41 Определение 2. т систем, каждая из п постоянных: х^1 xjfi, ..., дгяИ (| = 1, 2, .. т\ называются линейно зависимыми, если существуют такие т постоянные cv с%, ...,ст, не все равные нулю, которые удовлетворяют уравнению: W + <W + • • • +'crfj*\ = 0 (/=1,2 .л); ^ противнем случае системы эти называются линейно независимыми. Тем же путем можно обобщить обычное понятие о пропорциональности двух полиномов. Определение 3. т полиномов fu-/а, ...,/^ называются линейна зависимыми, если существуют такие т постоянные qv cv ..., сда> «е «се равные нулю, которШе удовлетворяют тождеств^: если это места не имеет, то полиномы называются линейно независимыми К Определение это имеет место незавйстю от числа переменных в каждом отдельном ^полиноме. Следующие сами по себе очевидные теоремы о линейной зависимости настолько, однако, важны, что их необходимо точно формулировать. Теорема 1* Если т систем s постоянных (или т полиномов) линейно зависимы, то можно всегда по крайней мере одну из них? выразшт линейно через остальные. Эту систему постоянных (полином} называют тогда линейно зависимой от остальных. Для доказательства этой теоремы достаточно вспомнить, что по крайней мере одно из с должно быть отлично от нуля, а потому на нега можно делить. Теорема 2. Если между т системами постоянных (полиномами)* имеется некоторое меньшее число систем (полиномов), линейно друг от друга зависимых, то и первоначальные т систем (полиномов) будут линейно зависимы. В самом деле, так как / систем постоянных (/ полиномов) линейно зависимы (1<^т\ т0 можно, кроме / значений для с, которые благодаря этому известны, положить остальные /гс,— / множителей равными нулю. Теорема 3. Если одна из т систем постоянных состоит только из нулей (если один из т полиномов тождественно равен нулю), то т систем (полиномов) будут линейно зависимыми. В качестве множителя этой особенной системы (полинома) можно выбрать любое произвольное отличное от нуля число, а остальные т — 1 множителей положить равными нулю. '; 1 Можно было бы вообще установить понятие о линейной зависимости т систем, каждая из п полиномов. Оба случая, рассматриваемые в тексте, заключались» ф* в этом общем как частные случаи.
42 ЛИНЕЙНЫЕ ЗАВИСИМОСТИ. li. Условна линейной зависимости систем постоянных. Рассмотрим снова т систем, каждая из п постоянных: ххт х2Ш, ..., xjn (1 = 1,2, ..., т\: (1) л будем различать два случая: т<л и т>я. а) /га<я. Тогда имеет место следующая важная теорема. Теоремах, т систем (1), каждая из п постоянных, в случае /7г<я, tiydym тогда и только тогда линейно зависимы, если все определители .т~го порядка матрицы II х1 х2 • • • Х% || П х1 х% •••■** равны нулю. Легко убедиться, что это условие необходимо, ибо, если т систем линейно зависимы, то одна из горизонталей может быть линейной комбинацией остальных. Вычитая теперь в любом из определителей т~то порядка из элементов упомянутой горизонтали соответствующие элементы других горизонталей, помноженные на соответствующие постоянные, мы сделаем, очевидно, все элементы этой горизонтали равными нулю, а потому будет равен нулю и рассматриваемый определитель #г-го порядка. Остается доказать, что равенство нулю этих определителей, является достаточным условием» Итак, предположим, что все определители яг-го порядка вышеупомянутой матрицы равны нулю. Примем далее, что ранг г матрицы (определение 3, § 7) больше нуля 1, и, наконец, что определитель r-го порядка в левом верхнем углу матрицы отличен от нуля. Это последнее предположение не нарушает общности, ибо для перенесения отличного от нуля определителя r-го порядка в любое место достаточно только изменить порядок отдельных систем, а также и порядок постоянных в каждой системе; порядки эти в обоих случаях являются совершенно несущественными. Докажем теперь, что первые (г-f-l) систем постоянных линейно зависимы; отсюда по теореме 2, § 12 будет уже следовать, что все т систем линейно зависимы. Обозначим через Си Сй, . ,.,Сг+1 алгебраические дополнения элементов последней вертикали в определителе (r-f-l)-ro порядка, стоящего в матрице слева вверху. Так как все определители (r-f- 1)-го порядка равны нулю, то имеют место соотношения: C1x/ + C2x/'+...+Cr^xjSH^ = 0 (/ = /4-1, г + 2, .,., я). Но так как суммы произведений из элементов некоторой вертикали на алгебраические дополнения соответствующих элементов другой вертикали 1 Вообще будем иметь г = дг — 1, но г может, очевидно, принимать любое зна-J <чение меньшее т. Единственный случай, исключаемый здесь из рассмотрения, будет тот, когда все элементы матрицы равны нулю; но тогда линейная зависи-- адость очевидна без пояснений.
ЛИНЕЙНАЯ ЗАВИСИМОСТЬ полиномов 43 ф всегда равны нузио, то вышенаписанные уравнения также справедзшаы для j =1, % »*.„,/*. Таким образом доказана линейная зависимость первых г-\-1 систем постоянных, ибо Сг+1, будучи определителем г-го порядка, стоящим в левом верхнем углу матрицы, отлично от нуля. ф b) /»>#. Этот случай может быть приведен к только что рассмотренному простым приемом. В самом деле, присоединяя к каждой системе из п постоянных еще т — п нулей, получим т систем, каждая из т постоянных; матрица, образованная из этих систем, заключает в себе только один единственный определитель m-го порядка и притом равный нулю, ибо по крайней мере одна из его вертикалей вся состоит из нулей. Эти т систем, каждая из т постоянных, будут поэтому линейно зависимы, и следовательно тоже можно сказать о первоначальных т системах, каждая из п постоянных. Теорема 2. т систем, каждая из п постоянных^ будут всегда линейно зависимы^ если т<^п. Упражнения Требуется определить, будут ли следующие системы постоянных линейно зависимы иди нет: (За, —26, —Зс, 6d, а, 0, — с, 4d, О, — Ь, 0, — 3£ ( 1, 0, 0, 5, 2. \ 1, 2, 6, 7, - ( 3, 1, 3, 16. ( 5, 2, 1, 3, 4, 3. <! О, 3, О, 0, 8, , ( 15, 7, 3, 9, 7. / 5, —7, 0, 1, —1, 4. \ 1,-3,-2, 3,-1, ( 4, 0, 7, —9, 2. 14. Линейная зависимость полиномов. Необходимое и достаточное условие для линейной зависимости т полиномов от любого числа переменных заключается, очевидно, в линейной зависимости т систем из их коэфициентов. Все теоремы и условия, полученные в предыдущем параграфе могут быть поэтому распространены и на случай полиномов. Упражнения Требуется определить, будут ли между следующими полиномами существовать линейные зависимости или нет: ( 16* + 30*, 1. ] 6х + 2у + бг — 4, { 1Ьх + 9у —18.
44 ЛИНЕЙНЫЕ ЗАЙИ€ИМ0(?ТЙ 3*i + 4х2 — 4*з + 6*4, 7xt +Зх8 + 7*4. 2*t — *2 -¾ -5^ + 9^2- *8 + 4*4 + 8. 2** + 8*у + 6у2 4- 14д: + I2j; — 4, 7*2 + Jf2+ бд;_ 4у, Зл? — б*у+ З.у2 — 5* + 7, 5*2 + 20*у + 15у2 + 35* + 30.У —10. i$* Геометрическая интерпретация. Системы, каждая из н по- !<т<)йнных, с которыми мы имели дело в § 12 и 13, могут быть рассматриваемы (если, разумеется, не все постоянные некоторой системы рябцы нулю) как однородные координаты точки в пространстве п — 1 измерений. Тогда принято говорить о линейной зависимости или независимости этих, точек. Геометрический смысл таких выражений легко поручается из следующих теорем для случая п = 4. *'•' Две точки в рассматриваемом случае будут представлены двумя системами из четырех постоянных: (х^:ух:гхих\ (x2:y2:z2:t2). Системы эти будут тогда и только тогда линейно зависимы, если они пропорциональны, т. е. если обе точки совпадают. Теорема 1. Две точки тогда и только тогда являются линейно зависимыми, если они совпадают. Если три точки Ри Р2, Рш пространства с координатами (*i:yt: zt: *,), (*2:у2: z2 \t2\ (*3:ув: *3: *3) линейно зависимы, то существуют три постоянные cv с2, cv не все равные нулю, которые удовлетворяют уравнениям: *1*1 + С2Х2 + *8*3=0» ^1 + ^2 + ^3===°. *1*1 + C2Z2 + сгц = 0, cttt + c2t2 + с& = 0. Если последовательность точек так выбрана, что с$ ф 0, то можно эти- уравнения разрешить относительно *3, Л> zv U* *3 — ^1*1 + ^2*2» y3 = k1y1 + k2y2t h = & A + hhy причем Если Л* + Ду + С* + .£#**= Q 1
геометрическая инЛ^рШцЩ 45 «Йьуравнение некоторой плоскости, проходящей через точки Рг и Р2, то имеют место уравнения: Axt + Ву± + Czt + Dh = О, Ах2 + Ву2 + С% + »2 = 0. Умножая первое из этих уравнений на ки второе на А2,и складывая, получаем в силу уравнений (1): Следовательно, всякая плоскость, проходящая через точки Pt и Ра, проходит также и через точку Р8, и потому все три точки Pv Р2 и р3 лежат на одной прямой. * Теперь надлежит доказать обратную теорему: три точки на одной прямой будут также всегда линейно зависимы. Итак, три точки Pt, Р2> Р$ чежат на одной прямой. Если две из них (или все) совпадают, то их лнйейная зависимость следует из теоремы I. Предположим поэтому да^и ные три точки различными. Если ^ и к% будут -т» постоянные, не равные одновременно нулю, то, полагая X* = kvXx + AfcXg, yf = kiyl + k^y2t zl^klz1 + k2Z2t убеждаемся, что точка (х* :у' :z': t')t которую обозначим через Р', линейно зависит от Pt и Р2 и потому леашт на РХР^ Остается, следовательно, показать, что нрн надлежащем выборе kt и &2 точка Р' совпадает с точкой Р8. Если теперь ах 4- by-\-cz-\-dt = 6 будет зфавне- нием плоскости, проходящей через Ps, но не через Pt и Pft, то Ps является точкой пересечения этой плоскости с прямой PtP%. Если сможем определить точку Рг так, чтобы она лежала в этой нэюскости, то Р' должна совпадать с Р3, и наша теорема доказана. Но дли того чтобы Р1 лежала в этой плоскости, должно иметь место уравнение: ах' + by + cz' + dt' = Qt причем условие это является также достаточным. Подставляя вместо х', у\ z\ f их значения, имеем: ^ (axt + byt + czt + dt£ + &2 (axz + by^ -f- c% ■+- dt$=6. Ни одио из выражений, стоящих в скобках, не должно обращаться в нуль, так как плоскость ее нроходит через точки Рг и Рг Поэтому можно для kx и &2 пояучйяь такие отличные от нуля значения, чтобы последнее уравнение было выполнено. Отсюда следует такая теорема: Теорема 2. Три точка будут тогда и только тогда линейнп зависимы, если они лежат на одной прямой1. 1 Этим, однако, не утверждается, что они могут быть соединены только одной единственной прямой ляяией; тр же замечание соответственно имеет место и для остальных теорем. V
4G ЛИНЕЙНЫЕ ЗАВИСИМОСТИ Доказательство следующих теорем предоставляется читателю [6*]*. Некоторые из них следуют непосредственно из определения линейной зависимости. Для доказательства других полезно применить условие для линейной зависимости, установленное в § 13. Теорема 3. Четыре тонки будут тогда а только тогда линейно зависимы, если они лежат в одной плоскости. Теорема 4. Пять и более точек будут всегда линейно зависимы. Другое геометрическое приложение получается в результате следующих рассуждений: Система п обыкновенных г величин представляет собой не что иное, как 'мнимое (комплексное) число с п единицами (§ 21). Наше обычное определение линейной зависимости будет поэтому равносильно со следующим: т комплексных величин av а2, ..., аш называются линейно зависимыми, если можно найти т таких обыкновенных величину га, ..., ст) не равных все вместе нулю, что cxaY + с2а2 +...+ стат = 0. Простейшую геометрическую интерпретацию для комплексного числа с п единицами дает вектор в пространстве п измерений2, что и приводит нас к понятию о линейной зависимости векторов. Геометрический смысл такой линейной зависимости усматривается из следующих теорем,, имеющих место для п = 3: Теорема 5. Два вектора будут тогда и только тогда линейно зависимы, если их конечные точки мог^т быть соединены одной прямой линией с их общей начальной точкой. Теорема 6. Три вектора будут тогда а только тогда линейно зависимы, если их конечные точки могупС быть соединены одной плоскостью с их общей начальной точкой. Теорема 7. Четыре и более векторов будут жегда линейно зависимы. Для получения геометрической интерпретации линейной зависимости полиномов мы должны рассматривать не сами полиномы, 'но уравнения, получаемые от приравнивания этих полиномов нулю. Уравнения эти назовем линейно зависимыми, если это имеет место для полиномов. Если мы рассматриваем тогда независимые переменные как прямоугольные координаты, то уравнения эти дадут нам геометрические места в пространстве такого числа измерений, сколько имелось независимых переменных. В случае двух и трех переменных получаем, таким образом, плоские кривые и поверхности. * Здесь возможны две различные точки зрения, смотря по тому, понимаем ли мы под именем обыкновенной величины вещественную или обыкновенную мнимую величину. 2 Очевидно, возможны также и другие геометрические толкования; так, например, в случае п = 4 наши комплексные величины можно рассматривать, как кватернионы и поставить вопрос об интерпретации линейной зависимости двух, трех или четырех кватернионов.
ГЕОМЕТРИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ П Два таких геометрических места не представляют особого интереса, ибо они тогда и только тогда будут линейно зависимы, если совпадают. В случае трех линейно зависимых геометрических мест каждое из них, как это легко показать, должно проходить только через общие точки двух других мест и не через какие другие. Следующие теоремы могут служить для геометрической интерпретации линейной зависимости. 1. Для плоскости (если только рассматриваются точки на, конечном расстоянии): • Теорема 8. Три круга1 тогда и только тогда будут линейно зависимы^ если они принадлежит одному и тому же пучку кругов.. Теорема 9. Четыре круга тогда и только тогда будут линейно зависимы, если они обладают одним общим ортогональным кругом или одной общей ортогональной прямой, или если они все проходят через одну точку. Теорема 10. Четыре круга, из которых каждые два пересекаются в двух различных точках? тогда и только тогда будут линейно зависимы, если точки пересечения двух первых кругов и точки пересечения двух последних лежат на одном круге или на одной прямой. Теорема 11. Пять или более кругов всегда будут линейно зава- сами. 2. Для пространства (если бесконечно удаленные точки приняты в рассмотрение): Теорема 12. Три плоскоспЫ тогда и только тогда будут линейно зависимы, если они имеют одну общую прямую. Теорема 13. Четыре плоскости тогда и только тогда будут линейно зависимы, если они имеют одну общую точку. Теорема 14. Пять и более плоскостей будут всегда линейно зависимы. 1 Чтобы избежать подробных разъяснений, будем понимать здесь под кругами: только такие, которые обладают вещественными уравнениями и радиусами, от* личными от нуля.
Tjaba четвертая Динемные уравнения 16. Неоднородные линейные уравнения. Во всяком элементарном руководстве по теории определителей излагается решение системы п уравнений первой степени с п неизвестными с помощью определителей при условии, что определитель из коэфициентов при неизвестных не равен щзт. Относящееся сюда правило Крамера будет таково: Правило Крамера. Если в системе уравнений alixl+...+ alnxn~ki определитель ап\ *i +• • • + <*пп xH — kn ап . . . аы °vl • • * апп ютличен от нуля, то данные уравнения обладают одной единственной системой решений $ где а% означает определитель п-го порядка, получаемый из а путем замены элементов i-ой вертикали, элементами kt9 /^, ..., кя. Доказательство этого правила, имеющего особенную важность для общей теории линейных уравнений, предполагаем известным [7*]. Рассмотрим теперь систему т линейных уравнений с п переменными: яц*1+- • -+^1^+^1 = 0 Яяч*1 + . • -+атлхя + Ьт = 09 еде тип означают любые целые положительные числа. Необходимо различать три случая: 1. Уравнения не имеют ни одного решения; в этом случае они называются несовместными. 2. Уравнения обладают одним единственным решением. 3. Уравнения имею г более одного решения; тогда получается, как это мы тотчас же увидим, бесчисленное множество решений.
НЕОДНОРОДНЫЕ ЛИНЕЙНЫЕ УРАВНЕНИЯ 49 Из лвух матриц ап <*ml - I ^11 • аы ь «ml ibr» первая а называется матрицей систем уравнений, вторая Ь—расширенной матрицей; ранг матрицы а не может быть больше ранга Ь, ибо всякий определитель матрицы а заключается также в Ь. Поэтому различают только два случая: 1. Обе матрицы обладают одним и тем же рангом. 2. Ранг а меньше ранга Ь> Рассмотрим сперва второй случай и назовем ранг матрицы Ь через г. Тогда Ь должна заключать по крайней мере один отличный от нуля определитель r-го порядка. Этот определитель должен поэтому обладать вертикалью, состоящей из величин Ь, ибо иначе а обладала бы также рангом г. Наконец, предположим, что такой отличный от нуля определитель г-го порядка находится в матрице справа вверху. Предположение это не ограничивает общности, ибо достаточно изменить порядок уравнений или нумерацию дг-ов, чтобы поместить в требуемое положение такой определитель. Теперь введем для левых частей наших уравнений сокращенные обозначения Fx> F9, ...,/7^ равным образом для однородных полиномов, получаемых из F отбрасыванием постоянных членов, воспользуемся обозначениями /t, /2, , fm) так что имеют место тождества: FtEsft + bt (/=1,¾ ...,/я). Рассмотрим первые г из этих тождеств. Так как ранг т меньше гу то полиномы /19 /2, •••, fr * будут линейно зависимы: Отсюда следует: ^1 + ^2/2 + --- +crfr=Q. cxFY + ...+ стРгч=*сфъ + ... + crbr=:C. ., Fr линейно независимы Но ранг b равен г, а потому полиномы Fv следовательно, С ф 0. Поэтому данные уравнения будут несовместны, ибо в противном случае при соответствующем выборе xif ..., хп все F обращались бы в нульэ и подстановка этих значений в последнее уравнение дала бы нам тогда; 0 = СфО. Переходим теперь к случаю 1 и обозначим общий ранг матриц а и Ь через г. Тогда в а имеется по крайней мере один отличный от нуля определитель г-го порядка; такой же определитель входит также и в Ь. Предположим, что определители эти помещаются в каждой из матриц слева сверху. Так как в каждой из этих матриц все определители 04- 1)-го порядка равны нулю, то первые г+1 полиномов F будут линейно зависимы: 'Л + съръ + • • • + crpr + <V+i Fr+\ == 0; 4 Б, о х е р. Введение в высшую алгебру
50 ЛИНЕЙНЫЕ УРАВНЕНИЯ но так как Fv ..., Fr линейно независимы, то cr+t =J= 0; можно поэтому делить на сг+1 и выразить Fr+t линейно через Fv ..., Fr. То же имеет место, если вместо Fr+X возьмем Fr+2 или какое-либо другое из остающихся F. Получаем поэтому следующие'тождетва: ^1^^1 + ... + ^4 (* = l,2,...,m-r). Из этих тождеств очевидно, что во всякой точке (хи ..., хп), где F , ..., /V обращаются в нуль, остающиеся /7 также равны нулю. Другими словами, всякое решение первых г уравнений данной системы необходимо является решением всей системы. Рассмотрим теперь только первые г уравнений; дадим xr+v ..., хп какие-либо определенные значения x'r+v —, х'п и перенесем все члены после г-го в каждом уравнении во вторую часть: anxt + ... + aVrxr = — aw+ixr+t' — ... — аыхп' — bt arixl + • * * + arrxr = anr+\xr+\ — • • • — arnxn — K- Так как правые части этих уравнений являются теперь известными величинами, и определитель из коэфициентов в левых частях отличен от нуля, то мы имеем случай, к которому приложимо правило Крамера. Система уравнений имеет, таким образом, одно единственное решение,, и следовательно, уравнения данной системы совместны. Теорема 1* Необходимое и достаточное условие для того, чтобы система линейных уравнений была совместна, заключается в том, чтобы матрица системы имела тот эюе ранг, как и расширенная матрица» Из предыдущих рассуждений следует также Теорема 2* Если в системе линейных уравнений с п неизвестными матрица системы и расширенная матрица имеют один и тот же ранг г, то значения п — г неизвестных могут быть взяты по произволу; остальные неизвестные определяются тогда единственным образом, п —■ г неизвестных, значения которых могут быть взяты произвольноt должны быть, однако, выбраны под условием, чтобы матрица из коэфициентов при остальных неизвестных была ранга г. Упражнения Решить следующие системы уравнений: / 2х— y + 3z — 1=0 J 4х — 2у— z+ 3 = 0 L \ 2х— y — 4z+ 4 = 0 I Юл: — 5у —б2г+ Ю = 0. / 4лг— у + 2- + 5 = 0 ! 2лг-Зу + 5г+1=0 | х+ V — 2z + 2 = Q { 5.v — 2: + 2 = 0. / 2л:— 3j/ + 4z— «г = 3 J х + 2у- z+2w = l { Зх— у+ z — 7w = 4.
i ОДНОРОДНЫЕ ЛИНЕЙНЫЕ УРАВНЕНИЯ 51 17. Однородные линейные уравнения. Перейдем теперь к рассмотрению частного случая, когда все уравнения однородны, т. е. b равны нулю: tfn*i+. . . +аихп = 0 \ °mi xi+ • . . + атп хп = 0. ) Матрицы а и Ь последнего параграфа отличаются в рассматриваемом случае только одной вертикалью, состоящей из одних нулей; они имеют, таким образом, один и тот же ранг, который может быть назван рангом системы уравнений. Из теорем 1 и 2 предыдущего параграфа получим теперь следующие: Теорема 1*. Система однородных линейных уравнений обладает всегда по крайней мере одним решением. Теорема £. Если ранг системы однородных линейных уравнений с п неизвестными равен г, то значения п — г неизвестных могут быть выбраны произвольно; остальные же определяются тогда одним единственным образом1. Если ранг системы равен я, то имеется одно и только одно единственное решение, а именно: Xi = #2 == • • • ==Хп = 0. Так как ранг не может быть больше я, то имеет место теорема: Теорема 3. Для того чтобы система однородных линейных урав~ нений с п неизвестными xv .. ., хп обладала решением, отличным от х1 = х% —... = хп = 0, необходимо и достаточно, чтобы ранг системы был меньше п. Следствие 1. Если число уравнений меньше числа неизвестных, то имеются всегда другие решения, отличные от xt = х2 =... = = х = 0. Следствие 2. Если число уравнений равно числу неизвестных* то уравнения имеют решение, отличное от хх = х% =... = хп = 0, тогда и только тогда, если определитель из > коэфициентов равен нулю. Для того частного случая, когда число уравнений на единицу меньше числа неизвестных, причем уравнения линейно независимы, докажем такую теорему: Теорема 4. Всякая система значений (xv ...,дгм), удовлетворяющая системе я — 1 линейно независимыха однородных линейных Уравнений с п неизвестными, будет пропорциональна системе опре- 1 Ср. две последние строки теоремы 2, § 16. Теорема остается справедливой и для линейно зависимых уравнений, но так как все определители, о которых идет речь, в рассматриваемом случае равны кулю, то теорема тривиальна, 4*
52 ЛИНЕЙНЫЕ УРАВНЕНИЯ делителей {п —1)-20 порядка, которые получаются из матрицы вычеркиванием сперва первой, потом второй и т. ё. вертикалей, причем эти определители входят попеременно со знаками плюс или минус Обозначим через ак определитель (п—1)-го порядка, матрица которого получается из данной системы уравнений вычеркиванием /г-й вертикали. Так как уравнения должны быть линейно независимы, то имеется по крайней мере один из этих определителей, например aiy отличный от нуля. Дадим теперь xi любое значение с и в каждом уравнении перенесем /-й член направо: апхх + ... + Яы-Л-i + Яы+Л+i + • • • + <hnXn = — (*uc an-i,txi + • • • + an-ui-ixi-i + an-ui+iXi+i + • • • + ап-ьпхп — — ап-ыс Тогда »4 = tz!£k£6 (* = 1( 2, ..., n), откуда ясно, что xu ...txn пропорциональны определителям a±9 —a^ + а3, ..., (—1)-1¾. Теория линейных уравнений была здесь, таким образом, изложена на основании теории линейной зависимости. Возможно, однако, получить дальнейшие результаты только что упомянутой теории, основываясь на теории однородных линейных уравнений. В качестве примера докажем следующую полезную для дальнейшего теорему: Теорема 5. Если система точек (xti .. -,хп) обладает тем свойством, что могут быть найдены k точек системы, от которых все остальные точки системы находятся в линейной зависимости, то любые k-\-l точек системы всегда будут линейно зависимы. Число точек системы при этом может быть конечно или бесконечно. Пусть (*!'..-., *Л <*Л •••.*."). ...,(АГД...,^[М) будут k точек системы, от которых все остальные точки находятся в линейной зависимости, и пусть №',..., хл W,. .., *."). • • •, (*i№1 *n[*+lb любые k~\-l точек Системы. Тогда соотношения: будут справедливы на основании сделанного предположения, если (xJ-% ...,jc„[*)) не являются одной из первых k рассматриваемых точек; если же это имеет место, то соотношения (1) очевидны. Надлежит пока-
ОСНОВНАЯ СИСТЕМА РЕШЕНИЙ ОДНОРОДНЫХ ЛИНЕЙНЫХ УРАВНЕНИЙ 53 зать, что существуют такие k-\-l постояные, Си С2, ..,, Cfc+l, не все равные нулю, которые удовлетворяют уравнениям: CtX/ + С2Х/' +...+Ck+iX/M] = Q (/=1, 2,...,п). Подставляя сюда значения X из (1), видим, что эти уравнения будут удовлетворены, если CW4- <V*"+ ... + aWfe+11=o. Но в системе этой число уравнений меньше числа неизвестных, а потому она может быть удовлетворена системой таких значений С, из которых не все равны нулю (теорема 3, следствие 1). «* Упражнения Разрешить следующие системы уравнений: /11*.+ 8у — 2г + 3ш = 0 ! 2х + Зу — z+ 2w — 0 } 7х~~ У+ z— Зяу = 0 ( 2х — 3y + 5z + 3w = Q 2. \ Ах— у-{- z+ w — 0 [ Зх-— 2у + 3г + 4гсг=0. 18. Основная система решений однородных линейных уравнений. Если (xt\ ..., хп') является решением системы уравнений: ^wi^l + • • • + О-тп^п — 0» то (ел:/, ..., схп') также будет решением. Давая поэтому с всевозможные значения, получим (за исключением случая, когда все х' равны нулю) бесчисленное число решений. Возможно теперь, что таким путем могут быть получены все решения системы (1) (теорема 4, § 17); вообще говоря, однако, это не будет иметь места. Итак, предположим, что (хх'9 ..., хп') и (х"у ..., хп") будут два решения системы (1), тогда ctxt'-\-с^х^', .. .ус^хп*-\-с^хп" будет также решением системы. Если значения неизвестных в двух данных решениях пропорциональны друг другу, то мы не получаем, очевидно, ничего нового по сравнению с тем случаем, когда дается только одно решение. Но если оба исходные решения линейно независимы, то, придавая сх и с2 всевозможные значения, мы приходим к двойной бесконечной системе решений. Возможно, однако, что таким путем также не получаются все решения системы (1). Имея три линейно независимых решения, можем из них построить тройную бесконечную систему решений и т. д. Если, продолжая I)
54 ЛИНЕЙНЫЕ УРАВНЕНИЯ применять этот прием, находим, наконец, конечное число линейно незави* симых решений, через посредство которых все решения могут быть выражены линейно, то говорим, что это конечное число решений образует венозную систему решений. Определение. Система (х^\ . .., х№) (/= 1, 2, . .., k) реиьений данной системы уравнений (1) образует основную систему решений в том случае, если выполняются два следующие условия: 1) k данных решений должны быть линейно независимы; 2) всякое решение (1) должно быть линейно зависимым от этих k решений. Теорема 1* Если ранг г системы уравнений (1) меньше пу то имеется бесконечно большое число основных систем решений^ из кото- рых каждое построено из п — г решений. Рассмотрим первые г уравнений системы (1) в предположении, что определитель г~го порядка в левом верхнем углу матрицы системы рт- личен от нуля. Всякое решение этих г уравнений удовлетворяет также всем остальным уравнениям системы. Все члены, следующие за r-м, перенесем направо и дадим xr+v , хп какие-либо определенные значения хг+/, ..., хп'у не все равные нулю. Тогда по правилу Крамера эти г уравнений имеют только одно решение, которое мы обозначим через х/, ..., хп'). Придавая теперь хг+и ..., хп другие определенные значения xt.+l", ..., хп"> не все равные нулю, получаем второе решение (лг/', . .., хп"). Продолжаем таким образом до получения #— г решений: лг^, ..., хГ9 •"",.,/» • • •> хп', 1 х^п"г^ ... x[n~r] х[п~/] x[n~r] \ Выбирая теперь (что может быть, очевидно, сделано бесконечным числом способов) для этих п — г решений значения xr+v...,xn так, чтобы определитель Хг+\ • • . Хп Хг+1 (2) был отличен от нуля, получим, что эти п — г решений будут линейно независимы. Имеем, таким образом, бесконечное число п — г решений, удовлетворяющих первому условию определения. Для доказательства того, что эта система решений будет удовлетворять также второму условию, обозначим через (Xt, ...,Хп) любое решение г первых уравнений. Последние п — г этих величин X могут быть рассматриваемы как линейно зависящие от тех п — г систем значений, которые мы взяли для xr+v ..,, хп, ибо здесь число систем постоянных более числа постоянных в каждой системе (теорема 2, § 13) и определитель (2) отличен от нуля.
ОСНОВНАЯ СИСТЕМА РЕШЕНИЙ ОДНОРОДНЫХ ЛИНЕЙНЫХ УРАВНЕНИЙ 55 Поэтому Xi = cix/ + e9xt,'+...+ cHWn'r} (i=r+If г + 2, ...,я) (3) t Принимая теперь снова хг+х, ..., хп известными и разрешая первые т уравнений (1) по правилу Крамера, приходим к соотношением такого вида: х, = А/Хг+х + A/'xr+2 + ... + А}*-*хп U = 1,2,..., г). Придавая xr+v ..., хп частные значения, получаем уравнения: х; =А/х;+1 +АГх'г+1 +...+А$»1х1 xf^ = A)x^ + A;/ гЗД + ... + Af-^x^\ xi =а;хг+1 + ,^^+...+^-¾ (/•-1,2, ...,г). } (4) Умножая первые п — г из этих уравнений соответственно на ct, ...,£„_,. и складывая, имеем [в силу (3)]: W/ + ...+*-, Ъ[п-Г] = A/Xr+i + ...+ Af*"r* > п Следовательно, по уравнениям (4): Xj = схх/ + ...+ сп_г х/п~г] {J = 1, 2, ..., г). ко) Уравнения (3) и (5), рассматриваемые вместе, доказывают нашу теорему. Совокупность всех решений системы (1) образует систему точек, удовлетворяющую условиям теоремы 5, § 17. Отсюда следует: Теорема 2. В системе однородных линейных уравнений с п неизвестными ранга г всегда п — /-—[— 1 решений будут линейно зависимы. В заключение докажем следующую теорему: Теорема 3. Чтобы система решений некоторой системы однородных линейных уравнений с п неизвестными ранга г была основной системой решений, необходимо и достаточно, чтобы она состояла из п — г линейно независимых решений. Линейная независимость этих решений следует из нашего определения. Число решений необходимо должно равняться п — г; это следует из того что по теореме 2 число независимых решений не может быть больше п — г> И) кроме того, / линейно независимых решений никогда не образуют основной системы, если 1<^п — г; в самом деле /+-1 решений, по теореме 5, § 17, должны быть линейно зависимыми, и то же поэтому должно было бы иметь место для всякой системы п — г решений, тгк как п — /•>/-{-1; в силу же теоремы 1 это не может иметь места. Докажем теперь, что оба условия являются также достаточными. Пусть *Д х%®...,хя[*\ (/=1,2,...,az-~/-)
56 ЛИНЕЙНЫЕ УРАВНЕНИЯ —какая-либо система п — г линейно независимых решений данной системы уравнений и (л^, , х^ — любое произвольное решение. Тогда по теореме % существуют всегда п — r-j-l постоянные с2, , cn_r+v не равные одновременно нулю, которые удовлетворяют уравнениям: ct х/ + с2х/' + ... + сп_г г/"-7"1 + cn^^txf = О (/==1,2,...,«). Но так как п — г данных решений линейно независимы, то сп_г+1 ф 0, а потому эти последние уравнения позволяют нам выразить решение (xv ..., хп) линейно помощью п — г данных решений; это и доказывает, что эти п — г решений образуют основную систехму решений. Упражнения 1. Доказать, что все основные системы решений системы однородных линейных уравнений заключаются в той бесконечной системе решений, которая встречается при доказательстве теоремы 1. 2. Даны три плоскости в пространстве их уравнениями в однородных координатах. Каково их относительное положение, если ранг системы уравнений равен 1, 2 или 3? 3. Даны три плоскости в пространстве их уравнениями в неоднородных координатах. Каково их относительное положение для всевозмо кных различных пар значений ранга матрицы и ранга расширенной матрицы?
Глава пятая Ранг матрицы 19. Общая матрица. Для доказательства того, что матрица обладает- рангом г, необходимо прежде всего показать, что имеется по крайней^ мере один определитель r-го порядка, отличный от нуля, и затем, что все определители (г-\- 1)-го порядка равны нулю. Это доказательства может быть значительно сокращено такой теоремой: Теорема L Если некоторый определитель r-го порядка данной матрицы отличен от нуля, причем все определители (r-f- 1)-гэ порядка^ заключающие его в качестве минора, равны нулю, то равны нулю все определители (г-\-1)-го порядка данной матрицы. Не нарушая общности, можно таким образом предположить, что отличный от нуля определитель /--го порядка находится в левом верхнем углу матрицы II "И • - • а\п 1 {{ ат\ • • • атп || По теореме 1, § 13 г-f-l систем, каждая из п величин, которые находятся в первых г-f-l горизонталях матрицы, будут линейно зависимы. В самом деле, хотя мы раньше и принимали, что все определителя (r-f-l)-ro порядка равны нулю, но при доказательстве пользовались этим свойством только для тех определителей (r-f-l)-ro порядка, которые здесь мы принимаем равными нулю. Но так как теперь г систем постоянных, стоящих в первых г горизонталях данной матрицы, линейно независимы, то отсюда следует, что (г—|— 1)»я горизонталь линейно зависит от первых г горизонталей. Также точно заключаем, что всякая следующая горизонталь линейно зависит от первых л Поэтому по теореме 5, § 17 любые г-j-l горизонталей будут всегда линейно зависимы. Следовательно, по теореме 1, § 13 все определители (r-f- 1)-го порядка данной матрицы рав:1ы нулю, что и доказывает нашу теорему. Другой прием, облегчающий определение ранга матрицы, заключается в применении таких преобразований формы матрицы, которые не меняют ее р"нга. Определение 1* Элементарным преобразованием матрицы называется одна из следующих операций: а) перемена места двух горизонталей или двух вертикалей; \Ь) умножение каждого элемента горизонтали (вертикали) на один и тот же отличный от нуля множитель;
Ъ8 РАНГ МАТРИЦЫ с) сложение одной горизонтали (вертикали), умноженной на произ- вольный множитель, с другой горизонталью (вертикалью). Если помощью одной из этих операций можно перейти от некоторой матрицы а к матрице Ь, то, очевидно, можно и обратно получить матрицу а из Ь помощью одной из упомянутых элементарных операций. Определение 2. Две матрицы называются эквивалентыми, есла от каждой из них можно перейти к другой помощью конечного числа элементарных преобразований. Теорема £. Эквивалентные матрицы обладают одним и тем же рангом. Преобразования а) и Ь) (определение 1), очевидно, не меняют ранга .матрицы, ибо преобразования эти, вообще говоря, не влияют на равенство или неравенство нулю любого определителя этой матрицы. Остается, таким образом, еще показать, что также и операция с) оставляет ранг матрицы неизменным. Преобразование с) состоит в том, что с р~& горизонталью матрицы и складывают q-ю горизонталь, умноженную на k, получая таким образом матрицу 6. Пусть ранг матрицы а равен гу докажем прежде всего, что ранг этот элементарным преобразованием с) не может быть увеличен, т. е. что все определители (г-\- 1)-го порядка матрицы Ь равны нулю. По предположению все определители (r-f- 1)-го порядка матрицы а равны нулю, и некоторые из этих определителей, очевидно, не меняются преобразованием, а именно те, которые не содержат p~ft горизонтали или которые содержат обе горизонтали, /?-ю и #-ю. Остальные определители, содержащие /г~ю горизонталь, но не содержащие ^-й, после преобразования принимают вид: A±kBt где А и В — определители (г -\- 1)-го порядка матрицы а ранга г, и потому Л = 0, В = 0. Таким образом видим, что преобразование с) никогда не увеличивает ранга матрицы. Но ранг Ь не может быть также меньше ранга а, ибо тогда существовало бы некоторое элементарное преобразование с) для перехода от Ь к а; преобразование это должно было бы увеличить ранг Ь, что невозможно, как мы только что в этом убедились. Теорема эга может быть с пользою применена для определения ранга матрицы, так как помощью элементарных преобразований часто ^бывает нетрудно существенно упростить матрицу. Упражнения Определить ранг следующих матриц: II 14 12 6 8 2 II 6 104 21 9 17 7 6 3 4 .1 Г 35 30 15 20 5
СИММЕТРИЧЕСКАЯ МАТРИЦА 59 75 0 116 — 39 О 171 —69 402 123 45 301 0 87 —417 —169 114—46 268 82 30 3. Всякая матрица ранга г помощью элементарных преобразований может быть приведена к следующему виду: элемент в /-й горизонтали и в /-й вертикали равен единице (/<,/% все же остальные элементы матрицы равны нулю. 4. Две матрицы, каждая из т горизонталей и п вертикалей, всегда эквивалентны, если они обладают одним и тем же рангом. 5. Условие, необходимое и достаточное для того, чтобы матрица ап :и обладала рангом, равным нулю или единице, состоит в том, что существуют такие т + ж постоянных» al5 ..., ат, р4,..., ри, для которых а,ц = <t$j. 20. Симметрическая матрица. Определение. Квадратная матрица а = #21 а22 а9л (а также и ее определитель) называется симметрической, если эле- менты ееу симметрично расположенные по отношению* к главной диагонали, равны между собою, т. е. если at~a.. Докажем, что ранг симметрической матрицы может быть определен путем рассмотрения только главных миноров. Это может быть сделано помощью следующих трех теорем. Теорема 1. Если в симметрической матрице а один главный минор Мг порядка г отличен от нуля, а все главные миноры (r-f- 1)-го и (/•-(-2)-го порядков, получаемые из Мг присоединением одной горизонтали и соответствующей вертикали (а также двух горизонталей и соответствующих вертикалей), равны нулю, то ранг матрицы а равен г. Пусть отличный от нуля главный минор Мг находится в а слева нверху; обозначим через Ва$ определитель, получаемый из Мг присоединением а-й горизонтали и р-й вертикали. Если докажем, что для аф р всегда Вар = 0, то наша теорема следует из теоремы 1, § 19. Обозначим черев С определитель, образованный из Мг присоединением а-й и (5-й горизонталей, а также а-й и р-й вертикалей, где а ф р; тогда по предположению Мг ф 0, Ваа — 0, В$ ==0, С = 0. Пусть М./-— главный минор второго порядка определителя, присоединенного к С, который соответствует дополнению Мг в С; тогда по следствию 3, § 11 М2' = СМг = 0.
60 РАНГ МАТРИЦЫ Но следовательно, Теорема 2. Если в симметрической матрице а все главные ми- норы (р-ф 1)-го и (р 4-2)-го порядков равны нулю, то ранг матрицы а или равен р или меньше р. Для р = 0 равны нулю все главные миноры второго порядка, аи'а5) — aij%~^ а также все элементы главной диагонали. Отсюда следует аи = а^ — О, а — о. Таким образом все элементы равны нулю, и матрица обладает рангом 0. Следовательно, для этого частного случая теорема справедлива. Допустим теперь справедливость теоремы для p = k, т. е. предположим, что ранг а меньше k-\- 1, все же главные миноры (£-)-1)-го и (к -)- 2)-го порядков равны нулю. Тогда ранг должен быть меньше /г —{— 2, если все главные миноры (£-(-2)-го и (k-\- 3)-го порядков равны нулю. В самом деле, если в рассматриваемом случае один главный минор (k -f- 1)-го порядка не равен нулю, то по последней теореме ранг в точности равен k -f-1; если же все главные миноры (k -f- 1)-го порядка равны нулю, то по предположению ранг меньше k -j-1. Но теорема справедлива для р==£, поэтому она справедлива также и для p = k-\-l; следовательно, теорема имеет место для всех значений рг ибо для р = 0 она была доказана. Теорема 3. Если ранг г сичметрической матрицы а не равен нулю, то имеется по крайней мере один главный минор r-го порядка, отличный от нуля. В самом деле, все главные миноры (г-|-1)-го порядка равны нулю. Если бы также все главные миноры r-го порядка были равны нулю, т > на основании последней теоремы ранг матрицы а был бы равен г— 1 или меньше. В заключение установим еще одну особого рода теорему, которая окажется полезной для дальнейшего (упражнения 4—б, § 50): Теорема 4. Если ранг г симметрической матрицы а не равен нулю, то всегда можно переставить горизонтали и вертикали таку что никакие два последовательные главные минора в системе: M0i ми м2, ..., мг не равны нулю, и Мг ф 0. При этом MQ означает 1, остальные М являются теми главными минорами а, порядок которых указывается индексом и которые после перестановки находятся в левом верхнем углу а. Если переставим 1-ю и k-ю горизонтали, то для симметричности а необходимо также одновременно переставить /-ю и k-ю вертикали.
СИММЕТРИЧЕСКАЯ МАТРИЦА 61 Согласно определению М0 ф 0. Оставляя на время в стороне рассмотрение частного случая, когда все элементы главной диагонали равны нулю, предположим, что аи ф 0. Перенесем 1-е горизонталь и вертикаль на первое место; имеем Mt ф 0. Оставим теперь первые горизонталь и вертикаль на месте и займемся только перестановкой остальных. Для этой цели рассмотрим главные миноры второго порядка, получаемые присоединением к Mt одной горизонтали и соответствующей вертикали. Случай, когда все эти главные миноры второго порядка равны нулю, оставим снова в стороне и предположим, что минор, образованный из Мх и г,-х горизонтали и вертикали, отличен от нуля. Переместив /t-e горизонталь и вертикаль на второе место, получим Ж2 ф 0. Тогда рассмотрению подлежат главные миноры третьего порядка матрицы а, для которых Ж2 является первым минором и т. д. Таким образом можно, очевидно, достичь того, чтобы для некоторого определенного места ни одна из величин М^ Mv ..., Мг, не равнялась нулю. Пусть, например, первые k горизонталей и вертикалей так составлены, что, хотя величины ЛТ0, Ми ..., Мк все отличны от нуля, но все главные миноры (£-|~1)-го порядка матрицы а, в которые Мк входит как первый минор, равны нулю; тогда, как бы мы ни располагали остальные п — k горизонталей и вертикалей, всегда Mfc+1 = 0. Исследуем затем главные миноры (k-\-2)-vo порядка, в которые Mfc входит как второй минор1. Миноры эти по теореме 1 не все равны нулю, ибо иначе ранг матрицы а, равный г, был бы ky меньше г. Следовательно, можно так расположить остальные горизонтали и вертикали, что Мк^ ф 0. Поэтому горизонтали и вертикали а могут быть так расположены,^ что никакие два друг за другом следующие М не равны нулю. Если Мг_г == 0, то Мг ф 0. Но также, если Мг±х ф 0, то горизонтали и вертикали могут быть так расположены, что Мг ф 0, ибо по предположению2 равны нулю все определители, получаемые присоединением к МГ_А двух горизонталей и соответствующих вертикалей. Но если бы после присоединения одной горизонтали и соответствующей вертикали получались разные нулю определители, то ранг а по теореме 1 был бы равен г— 1. Симметрическая матрица называется правильно расположенной, если она удовлетворяет требованиям теоремы 4, т. е. если никакие два друг за другом следующие М не равны нулю и Мгф0, Упражнения 1. Определить ранги следующих матриц: | 2 1 11 2 II || 0 4 10 1 | 1 0 4—1 48187 11 4 56 5 ' 10 18 40 17 ' 2—15 —6 1 7 17 3 1 Здесь подразумевается, что. для k = r—1 число г меньше п, ибо тогда символ Мк+2 был бы лишен смысла. Случай г = /г здесь, очевидно, не может иметь места, ибо тогда было бы Мй+1 = аф0. 2 Здесь мы снова предполагаем г<п, ибо для г = п было бы Мг = дф0.
62 РАНГ МАТРИЦЫ 0 1b d \ 1 0 с е Ь с 2bc cd + Ъе\ d е cd + be 2de | 2. Косыми определителями (матрицами) называются такие, для которых йц~ = — ajt и, следовательно, аи = 0. Установить для таких матриц теоремы, аналогичные теоремам 1, 2, 3. & Косой определитель нечетного порядка всегда равен нулю. (Доказать путем перестановки горизонталей и вертикалей.) 4. Ранг косой матрицы всегда равен четному числу. J 1 0 0 1 4 0 10 2 5 \ 0 0 1 3 б | 1 2 3 14 32 | 4 5 б 32 77
Глава шестая Линейные преобразования. Комбинация матриц 21. Матрица как комплексная величина. В § 7 было замечено,, что матрица из т горизонталей и п вертикалей обозначает не величину, но систему из тп величин. Это утверждение остается правильным,., однако, только тогда, если мы ограничим понятие величина вещественными или комплексными величинами элементарной алгебры. Понятие о величине, которым пользуются в арифметике и алгебре, было постепенно обобщаемо, начиная от первоначального понятия о целом положительном числе, путем применения термина величина для обозначения таких понятий, которые не удовлетворяли первоначальному определению, например для отрицательных чисел. Предпримем и теперь такое же обобщение, благодаря чему учение о матрицах может быть изложено с общей точки зрения, и введем для этого общие комплексные величины. Совокупность объектов различных родов, которые могут быть исчислены или измерены, дают нам конкретные примеры таких комплексных величин, например 5 лошадей, 3 коровы и 7 овец. Такое комплексное число можно обозначить символом (5, 3, 7), где первое число означает число лошадей, второе — число коров и третье—- число овец. В теории комплексных величин становятся, однако, на отвлеченную точку зрения и не различают конкретных предметов, но рассматривают лишь системы чисел (числовые пары, числовые тройки и т. д.), причем каждое из этих чисел занимает вполне определенное место в нашем символе. Для удобства часто обозначают тогда такую комплексную величину одной буквой: а = (а, bt с) так же, как это принято в элементарной алгебре для дроби (например -г) t о которая хотя является комбинацией двух чисел, но может быть обозначена одной буквой. Обыкновенные величины а, Ь, су из которых слагается а, могут быть названы первым, вторым, третьим компонентом (слагающим) а. Две комплексные величины называются тогда и только тогда равными, если компоненты одной равны соответствующим компонентам другой. Равным образом говорят, что комплексная величина тогда и только тогда равна нулю, если все ее компоненты равны нулю. Рассмотрение такого рода системы величин как комплексной величине Приобретает интерес прежде всего потому, что оказывается полезным
64 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ. КОМБИНАЦИЯ МАТРИЦ совершать над ними определенные алгебраические операции. Суммой и разностью двух комплексных величин at = (av Ьх, q), а2 = (а2, b2, с2) называются соответственно две комплексные величины: «1 + «2 = (Яi + а2> &1 + h> с1 + С2) И Ч — а2 = (а1 — аъ h — ьъ ci — с2) *. Не так просто обстоит дело с вопросом об определении произведения двух комплексных величин. Необходимо тогда установить определенное правило, следуя которому но двум данным комплексным величинам определяется третья, называемая их произведением. Можно дать бесчисленное множество таких правил; каждое из них определит другую систему комплексных величин2. Из сказанного ясно, что матрица из т горизонталей и п вертикалей, как система из тп вещественных или обыкновенных мнимых величин, расположенных в определенном порядке, может быть рассматриваема как комплексная величина, состоящая из тп компонентов. В качестве частного приложения вышеизложенных утверждений о комплексных величинах можно дать следующие определения: Определение 1. Матрица называется нулевой тогда и только тогда, если все ее элементы равны нулю. Определение 2. Две матрицы тогда и только тогда называются равными, если они обладают равным числом горизонталей и равным числом вертикалей, и каждый элемент одной из них равен соответствующему элементу другой. Определение 3* Суммой (разностью) двух матриц, из которых каждая заключает т горизонталей и п вертикалей, называется новая матрица из т горизонталей и п вертикалей, каждый элемент которой равняется сумме (разности) соответствующих элементов двух данных матриц. Для того чтобы отличить матрицы от обыкновенных величин алгебры (т. е. вещественных и обыкновенных комплексных величин), эти последние называются скалярными величинами. 1 Вышеупомянутый конкретный пример убеждает нас в том, что это определение суммы и разности комплексных величин является правильным и естественным. 2 Желая в частности получить систему обыкновенных комплексных величин, пользуемся числовыми парами: 01 = (^1, *|), «2 = 0*2> h) и определяем их произведение помощью формулы: а1<*2 = («1^2 — hh> alb2 + а2Ь\\ Для ознакомления с дальнейшими деталями вопроса см. Burckhardx, i^unk- iionen-theorie, § 2, 3.
УМНОЖЕНИЕ МАТРИЦ 65 Определим теперь произведение матрицы на скалярную величину. Определение 4. Произведением k*a или a-k матрицы а на скалярную величину k называется такая матрица, каждый элемент которой равен k-кратному соответствующему элементу матрицы а1. Из этого определения следует: Теорема. Все законы обыкновенной алгебры сохраняют силу для сложения и вычитания матриц, так же как и для умножения мат- рицы на скалярную величину. Если обозначим через k и I скалярные величины и через а, б, С — матрицы, то, очевидно, имеют место уравнения: a + b = b + a, * а + (Ъ + с)=(а + Ъ) + с, ka + kb=z k(a + b), ka + la=(k + l)a2. Упражнение Ранг R суммы двух матриц соответственно рангов rt и г2 удовлетворяет условию: 22. Умножение матриц. До сих пор мы рассматривали матрицы из т горизонталей и п вертикалей. Для простоты дальнейших рассуждений ограничимся теперь только квадратными матрицами, т. е. случаем т = п. Это не нарушает общности, если мы условимся рассматривать матрицу из т горизонталей и п вертикалей, где тфй, как эквивалентную квадратной матрице, порядок которой равен большему из двух чисел т и w, и где недостающие горизонтали и вертикали первоначальной матрицы заполнены нулями. Является теперь, однако, вопрос, каким образом можно определить произведение двух квадратных матриц одного и того же порядка. Совершенно ясно, что с логической точки зрения мы свободны здесь лать определение дю нашему усмотрению. Среди различных определений, которые могут быть встречены, ни одно не имеет a priori преимущества; только впоследствии одно может оказаться полезнее другого. Выберем следующее определение, пользуясь теоремой умножения определителей 3. Определение 1. Произведением аЬ двух квадратных матриц п-го порядка называется новая квадратная матрица п-го порядка, для которой элемент на пересечении 1-й горизонтали и j-й вертикали получится у если каждый элемент 1-й горизонтали а умножим на соответствующий элемент j-й вертикали Ь и сложим все таким образом полученные отдельные произведения. 1 Во всей этой книге для обозначения матриц будем пользоваться буквами жирного шрифта. 2 К этому может быть добавлено в качестве обозначения также и следующее. Ъ (—1)а = — а. 3 Кели был приведен к этому определению рассмотрением составления линейных преобразований (§ 23). ф Б Б о х е р. Введение в высшую алгебру
66 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ. КОМБИНАЦИЯ МАТРИЦ Пусть элементы на пересечении /-й горизонтали и у-й вертикали в матрицах а и Ь будут соответственно а^ и Ь%у Еще короче можно сказзть, что элемент (/, у) в матрице а будет aiJt а в матрице Ь будет £^, Тогда согласно нашему определению элемент (i, у) произведения ab равняется Я*1^ + ai2 hj + • • • + Aft» #n/> а элемент (/, у) матрицы ba будет: «ii ^1 + a2j bi2 +. .. + <zni £f„. Выражения (1) и (2), вообще говоря, не равны между собою, поэтому имеет место теорема: Теорема 1\ Умножение матриц не подчиняется переместимель- ному закону, т. е. вообще ab ф Ьа. Рассмотрим теперь третью матрицу С, для которой элемент (/, у) будет ciy Для элемента (/, у) произведения (аЪ) С получаем тогда выражение: (ail hl+ ai2 h\+ • • • + ain Ьп\) C\j + + (¾ Ьп + ЯьФ 22 + • • • + ain b*&) c2j + + + (aa bu + ai2bbi+ . • • + ain bnn) cnj. (3) Но элемент (/, у) матрицы a (be) равен: bn (&u сц + bn c2j + ... + bln cnj) -j- + ai2 (^21 clj + Ь&йц + • • • + b2ncnj) + 4- + ain (Kl c\j + bn2 c2j+ • • • +bnn Cnj). v*> Оба выражения (3) и (4) равны между собою, а потому имеет место теорема: Теорема 8. Умножение матриц подчиняется сочетательному закону, т. е. (ab) с~а (be). Так как элемент (/, /) матрицы а(Ь-\-с) равен сумме элементов (/, у) в матрицах ab и ас, то имеет место следующий закон: Теорема 3. Умножение матриц подчиняется распределительному закону, т. е. a(b-\-c)~ab + ac. Кроме переместительного, сочетательного и распределительного законов, имеется еще один принцип, постоянно применяемый в элементарной алгебре, согласно которому произведение только тогда равно нулю,, если по крайней мере один из сомножителей равен нулю. Простые при-
УМНОЖЕНИЕ МАТРИЦ 67 меры покажут, однако, что это утверждение не имеет места в алгебре матриц. Например, мы имеем: ап ап 0 «?1 «22 0 «31 «32 ° 0 0 hi 0 0 ^32 0 | 0 #J3 J; || О О О II = 0 0 0 U о, 0 0 0 (5) каковы бы ни были значения а и Ь. Теорема 4. Произведение двух матриц может быть равно нулю и в том случае, если ни один из сомножителей не равен нулю. Недопустимо, таким образом, из тождественного равенства двух матриц отбрасывать множитель даже в том случае, если известно, что он отличен от нуля. Из определенил произведения двух матриц следует: Теорема 3* Определитель произведения двух, матриц равен произведению определителей этих матриц. На понятии о сопряженных матрицах, введенном в определении 2, § 7, основывается следующая важная теорема: Теорема О. Матрица, сопряженная с произведением некоторого числа матриц, равняется произведению матриц, с ними сопряженных, но взятых в обратном порядке. Из определения произведения матриц непосредственно следует справедливость этой теоремы для произведения двух матриц. Остается, таким образом, еще только доказать, что если теорема верна для произведения п — 1 матриц, то она также имеет место и для произведения п матриц. Итак, пусть Ъ = 02 а3 • • • ап. Так как теорема справедлива для произведения п — 1 матриц, то где помощью верхних знаков обозначены сопряженные матрицы. Отсюда следует: (а^ • •. апУ = (atb)f = Ъ'а^ = ал' • - - а{а{% что и доказывает нашу теорему. В заключение дадим следующее определение: Определение 2. Матрица называется особенной, если ее определитель равен нулю. В силу условия, принятого в начале этой главы, все не квадратные матрицы являются особенными. Упражнения 1. Определение. Матрица а называется делителем нуля, если можно найти такую отличную от нуля матрицу Ь> что или ab = 0 или Ъа = 0.
68 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ. г КОМБИНАЦИЯ МАТРИЦ Всякая матрица, в которой одна горизонталь или вертикаль состоит из нулей, является делителем нуля. 2. Если можно перейти от а к Ь помощью элементарного преобразования (определение 1, § 19),^0 имеется либо одна обыкновенная (неособенная) матрица £, для которой <zc = b, либо одна обыкновенная матрица d, для которой da = b. 3. Если все элементы некоторой матрицы вещественны, и если произведение этой- матрицы на сопряженную с ней равно нулю, то сама матрица равна нулю. 4. Если соответствующие элементы двух матриц а и Ь будут комплексными сопряженными величинами, и если Ь' означает матрицу, сопряженную с Ь, то из уравнения следует, что а = & = 0. 23. Линейные преобразования. Прежде чем продолжать дальнейшее изучение теории матриц, рассмотрим в ближайщих двух параграфах одно из главнейших применений этой теории, а именно учение о линейных преобразованиях. В алгебре и анализе вместо неизвестных или переменных часто вводят новые неизвестные и переменные, которые рассматриваются как функции первоначальных. Подобная замена переменных называется преобразованием. Простейшее и для многих целей важнейшее преобразование состоит в том, что функции, о которых идет речь, являются линейными однородными полиномами. Оно называется тогда линейным однородным или короче линейным преобразованием. Если первоначальные переменные обозначим через xv ..., хпУ а новые — через xt\ , xj, то линей- Hoe преобразование определяется следующей системой уравнений: хп = ап х1 + ... -\- £in хш хп = ап\ х1 + • • • + апл ХП' Квадратная матрица аи • • • аы а — \\ °п\. • • • апп называется матрицей преобразования; ее определитель, обозначим его через я, называется также определителем преобразования. Так как преобразование вполне определяется его матрицей, то для краткости можно говорить о преобразовании а. Для многих задач, встречающихся в учении о преобразованиях, важно уметь переходить от новых переменных обратно к начальным переменным, и для этой цели необходимо не только выразить дг/,..., хп' кзк функции от х^ ..., хп, но и, обратно, выразить х^ ..., хп как функции от ■*!,...,#„. В случае линейного преобразования, вообще говоря, это может быть сделано, ибо уравнения преобразований могут быть рассматриваемы как неоднородные линейные уравнения относительно хи..., хл.
ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ 69 Если, следовательно, Определитель а преобразования отличен от нуля, то, разрешая эти уравнения, получаем: J *i — a ^1+--- + a *n> A a L ' ' a n где a *u> • J ^nn 11> означают алгебраические дополнения элементов в определителе а. Преобразование А называется обратным преобразованию а; но при этом нужно помнить, что оно существует только, если афО. Линейное преобразование, для которого а == 0, называется особенным преобразованием. Если преобразование а неособенное, то обратное преобразование А также не будет особенным, ибо определитель преобразования >А равен а"1 (следствие 2, § 11). Определение. Частное линейное преобразование вида Xi = Xfr Х<£ — АГ2, • • •, Xnf = Хп с матрицей 1 = 1 0. 0 1 . .0 .0 о о, . 1 называется тожоественным преобразованием. Определитель преобразования в рассматриваемом нами случае равен единице. ' Займемся теперь вопросом о составлении преобразования, т. е. вопросом о выражении новых переменных х" через начальные переменные х, если х" определены как функции х\ а переменные х' заданы как функции начальных переменных х. Если оба преобразования, подлежащие составлению, линейны, то результирующее преобразование, про которое можно сказать, что оно составлено из данных преобразований, также линейно. Для простоты ограничимся случаем трех переменных, на котором остановимся подробнее, ибо из него легко усматривается закон составления для общего случая. Пусть два данные линейные преобразования будут: [ Х1=^апх1 + апх2 + а13хд а < Х2' = a2lXi + «22*2+ Д23*3 [ x^ = anxl + ati2xz + amxil *i" = hi *i' + Ьп х</ + bu xjf х2" = bn Xj! + b22 x2' + #23 xi X*' = hi *i' + £32 xi + fc33 x3'. Тогда, заменяя в Ь х' его аначениями из а, получим:
70 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ. КОМБИНАЦИЯ МАТРИЦ хг" = (ап Ьп + ап Ьп + я31 Ьш) хх -f- + («12 ^11 "Г" «22 ^12 + «32 ^1з) i*2 + + («13 ьп + «23 ^12 + «зз ^13) *3' •*г" = («11 ^21 + «21 ^22 + «31 ^2з) *1 + < + («12 *21 + «22 ^22 + «32 ^23) *2 + + («13 ^21 + «21 ^22 + «33 ^2з) х'& Хз" = («И ^81 + «21 ^32 + «31 &3з) *1 + + («12 ^31 "+" «?2 ^32 + «32 ^33) х2 + + («13 ^31 + «23 ^32 + «33 ^ЗЗ) -^3- Мггрица этого преобразования, очевидно, равна Ьа- Теорема. Если от переменных х к переменным х' переходим помощью линейного преобразования с матрицей а, и если, далееу переход от х1 к х" совершается путем линейного преобразования с матрицей Ь, то х" получается непосредственно из х помощью линейного преобразования с матрицей Ьа *. 24. КодДинеации. Приступим теперь к важному геометрическому црименению линейных преобразований. Для простоты начнем со случая трех переменных, рассматривая их как однородные координаты точек плоскости. * Уравнения: х' = atx + Ьху + c{t, yt=^a2x-\-b2y + C2ty tf = aBx + bdy + c3t U) определяют тогда некоторое преобразование точек этой плоскости. Это значит, если (x:y:t) будут координатами некоторой любой точки, то можно помощью уравнений (1) найти координаты (V :у* :f) второй точки, в которую, как принято говорить, преобразуется первая точка. Единственное исключение имеет место, если вычисленные значения для x\y\t* все равны нулю; тогда не существует ни одной точки, в которую преобразовалась бы данная точка. Этот исключительный случай, очевидно, будет иметь место только тогда, если определитель преобразования равен нулю. Но если мы имеем дело с обыкновенными (неособенными) линейными преобразованиями, то не только каждой точке (x:y:t) соответствует одна определенная точка (x*:y':t)9 но и, обратно, каждое точке (V:у' :f) может быть сопоставлена также точка (x:y:t), ибо тогда преобразование (1) дает место обратному преобразованию: -^^ + 4^ + D D D' DX ^ Dy ^ D ' D х J Dy ^ D ' (2) J с* гот результат легко удержать в памяти, если применить следующие во многих случаях полезные символические обозначения: преобразование а обозначим через х — а (дг), преобразование Ь обозначим также через х" = Ъ (#'); тогда результирующее преобразование будет: х" = Ь [а (х)]9 или проще хп = Ьа(х).
КОЛЛИНЕАЦИИ 71 где D — определитель системы (1), а Л., В(, Ci означают алгебраические дополнения, элементов D. Точки (х :у: t) прямой линии «* + ЙУ + т' = 0 (3) помощью обыкновенного линейного преобразования (1) преобразуются в точки некоторой новой прямой * как в этом можно убедиться, применяя уравнения (2). Обратно, каждой точке прямой (4) соответствует точка прямой (3), что ясно видно из уравнений (1). Преобразование устанавливает, таким образом, взаимно однозначное соответствие между точками обеих прямых (3) и (4); говорят, что оно преобразует прямую (3) в прямую (4). В силу этого свойства, а именно, преобразовывать одни прямые линии в другие, преобразование это называется коллинеацией. Преобразование это носит наименование проективного преобразования, ибо легко доказать [8*], что оно может быть выполнено проектированием одной плоскости на некоторую другую из некоторой точки пространства. Все вышеизложенное может быть без существенных изменений распространено и на случай трех измерений. Преобразование x' — ciiX + biy + CiZ + dit, \ у' = а2х + Ь^у + c2z + dtt, ! z' = агх + bsy + сгг + drf, С tf = aix + biy + ciz + ditt ) представляет, в случае если его определитель отличен от нуля, взаимно однозначное преобразование точек пространства; оно называется также кол- линеацией или проективным преобразованием пространства, так как оно преобразовывает плоскости в плоскости, а потому также прямые линии —в прямые. Обобщение на случай п измерений не представит теперь никаких трудностей. Особенно важен случай /1===1. Тогда преобразование x'^atx + btf, \ ,е. t'=:a2x + b2tt / v ' если его определитель отличен от нуля, представляет взаимно однозначное преобразование точек прямой линии. Говорят тогда о проективном преобразовании прямой, так как термин коллинеация в рассматриваемом случае, очевидно, неприменим. Проективные преобразования (6), (1), (5) для одного, двух и трех 1 Предлагается читателю доказать, что уравнение (4) действительно представляет прямую, т. е. что все его коэфициеяты не могут бьгь одновременно равны нулю.
72 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ. КОМБИНАЦИЯ МАТРИЦ измерений можно выразить (хотя во многих случаях это является нежелательным) в неоднородных координатах: Y,_ a1X-{-b1 a2X-\-b2 * Л - azX+b3Y + c3> a2X + b2Y + c2 azX+b,Y^cz ' w gtX+ b1Y+c1Z + dt 'v "" aKX+bkY+cKZ + dK* у,__ a2^+b2Y + c2Z + d% акХ+ЬкУ + Сьг+<1к' Zt _ дз* + hY + csZ,+ d* azX-\-bkY-\-ckZ + dk' Эти уравнения могут быть с пользою применены, если знаменатель дробей приводится к постоянной. Этот частный случай, известный под именем аффинного преобразования, может быть кратко характеризован тем, что точки, кЪторые лежат на конечном расстоянии, всегда преобразуются в таковые же *. Эти аффинные преобразования имеют особенное значение для механики, где они известны под именем однородных или линейных деформаций2. Тгк как детальный разбор особенных преобразований предоставляется читателю (см. упражнение 1 в конце этой главы), то мы ограничимся здесь лишь одной теоремой, к ним относящейся: Теорема 1. Если точки Р19 Р2, • • • преобразуются в Р/, Р2', • • • помощью особенного проективного преобразования^ то точки Р' все совпадают, если рассматривается преобразование для случая одного измерения, для случая двух измерений все они лежат на одной прямой; для трёх измерений—в одной плоскости, и т. д. Докажем теорему для случая двух измерений. Так как определитель системы уравнений (1) предполагается равным нулю, то полиномы в правых частях линейно зависимы, т. е. существуют такие три постоянные kt, k.2f &3, не все равные нулю, для которых при всех значениях х, у, t имеют место уравнения: ^хг + к2У+к^' = 0. . (10) Есе точки (x'-.y'it') лежат, таким образом, на однейГпрямой. Для остальных случаев доказательство аналогично. 1 Если, кроме того, постоянные члены в числителях (8) и (9) равны нулю, то аффинное преобразование оставляет начало координат без изменения. Уравнения (о) и (9) имеют тогда соответственно вид (6) и (1). Уравнения (6) могут быть тогда рассматриваемы или как выражения для общего проективного преобразования прямых (х и г —однородные координаты) или как частные аффинные преобразования плоскости (неоднородные координаты). Равным образом (1) может быть рассматриваемо как общее проективное преобразование пловкости или как частное аффинное преобразование пространства. ^ См., например, Webster, Dynamic, стр. 427—444 (Leipzig, Teubner). С7) (8) т
КОЛЛИНЕАЦИИ 7$ Теорема 2. Имеется всегда одно и только одно проективное пре~ образование, которое любые три отдельные точки прямой преобра~ зует в три наперед заданные отдельные точки той же прямой. Пусть однородные координаты трех точек Ри Р2, Р3 будут: (*i: У» (*2: к\ (*з: h\ и пусть эти точки должны быть преобразованы соответственно в точки; Pt\ Р2', Р3' с однородными координатами: • М'-Ю> Wk% W:V). Проективное преобразование лт' = а* + р/, приводит точку (x:t) в новое положение (х': ^), которое зависит от значения коэфициентов а, р, у, 5- Наша теорема будет, таким образом,, доказана, если удастся найти такую систему из семи величин рх, р2, р3^ а, f$, у, 5 (причем первые три должны быть отличны от нуля), которые определены с точностью до одного общего отличного от нуля множителя и удовлетворяют следующим шести уравнениям: ( p1r1' = arl + ^1, ( fejtf == «r2 + ОД* Г рз*з' = а*з + Р^ Так как х и t все известны, то мы имеем шесть однородных уравнений с семью неизвестными. Имеются, следовательно, всегда решения,, не все состоящие из нулей; число независимых решений зависит от ранга матрицы, составленной из коэфициентов. Написав эти уравнения в виде: xxa + t$ — х/р х^а +1$ »1 t -*« -k \ p2 -x^ -4 'p. Рз = 0, = 0, =o, =0, = 0, = 0, дг8а + ^ ^.Y + ^Ч убеждаемся, что ранг матрицы равен б. Чтобы это доказать, образуем определитель D из первых шести вертикалей, переставляя вторую и; третью горизонтали и меняя знаки в двух последних вертикалях: xt tt 0 0 Xi' 0 х2 t2 0 0 0 *2' 0 U xL tt tt' 0 0 0 х2 t2 0 t{ хг t% 0 0 0 0 D-. 0 0 лг3 /3 ° ° Так как точки Pv Р2, Рд не совпадают, то существуют такие две постоянные сх и с%у отличные от нуля, которые удовлетворяют уравнениям! ctx:l + e2x2 + x9 = 09 c1ti + c2t2+t9=0.
J4 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ. КОМБИНАЦИЯ МАТРИЦ Складывая теперь с пятой горизонталью первую, умноженную на ci9 и вторую, умноженную на с2, а также присоединяя к шестой горизонтали третью, умноженную на ctf и четвертую, умноженную на с2, получаем: Z> = хх tt О 0 хх' О х2 t2 0 0 0 х2' О 0 xi tx h О о о лг2 гг о # 0 0 0 0 схх{ с2х2' 0. 00 0 ctV с2*2' = ^2 ДГ1 /t *2 *2 величина эта отлична от нуля, ибо Р/ и Р2' так же, как Pt и Р2, не совпадают. Тем же путем можно установить, что определитель, получаемый вычеркиванием из матрицы шестой или пятой вертикали, отличен от нуля. По теореме 4, § 17 уравнения обладают, таким образом, решением, для которого ни одна из величин рх, р2, и р3 не равна нулю; все остальные решения будут пропорциональны одному из них. Все эти решения дают одно и то же проективное преобразование прямой. Следствие* Преобразование, о котором шла речь выше, не будет особенным. Это следует из теоремы 1 ввиду того обстоятельства, что все три точки Р/, Р2', Р3' не совпадают. Упражнения 1. Исследовать особенные проективные преобразования для случая одного, двух и трех измерений. Принять во внимание влияние ранга матрицы преобразования прежде всего на точки, которым в силу преобразования не соответствуют никакие новые точки, и затем на точки, которые помощью преобразования не могут быть получены. 2. Существует всегда одна и только одна коллинеация, которая любые четыре точки плоскости (причем любые три из них не лежат на одной прямой) преобразует в четыре наперед заданные точки, обладающие тем же свойством. 3. Обобщить теорему для случая п измерений. 4. Преобразование координат, помощью которого от одной системы однородных координат переходят к другой, есть неособенное линейное преобразование. Рассмотреть случаи одного, двух и трех измерений. 5. Проективное преобразование в пространстве может быть выполнено т; :, что каждую плоскость (прямую) преобразуют проективно и вместе с тем одновременно изменяют положение плоскости (прямой). 25. Алгебра патриц. Продолжение. Перейдем теперь к изучению дальнейших свойств матриц, обращая при этом внимание читателя на упражнения в конце этого параграфа. Теория линейных преобразований содействует выяснению некоторых свойств матриц. Теорема 1. Матрица / = 1 0, 0 1 , о о .0 .0
АЛГЕБРА МАТРИЦ 75 обладает свойством, выражаемым следующим уравнением: Ia = al=a, где а означает совершенно произвольную матрицу. В самом деле линейное преобразование с матрицей а, очевидно, не изменится, совершим ли мы предварительно или после тождественное преобразование, обладающее матрицей /. Если мы не желаем пользоваться линейными преобразованиями, то теорема может быть также доказана непосредственным вычислением произведений/а и а/. / таким образом играет в алгебре матриц ту же роль, как число 1 в обычной алгебре. Поэтому / называют также единичной матрицей. Рассмотрим теперь произвольное неособенное линейное преобразование и ему обратное. Выполняя оба преобразования одно за другим, приходим, очевидно, к тождественнбму преобразованию. Замечание это привэдит нас тотчас к теореме: Теорема 2: Если в неособенной матрице <*и аи ап1 • • • агт с определителем а обозначим, как всегда, через Atj алгебраические дополнения элементов, то матрица du . . . d"1 а ' ' ' а A in . , . Ann а а называется матрицей, обратной матраце а9 или короче обратной а. Матрица эта является неособенной и обладает двммя свойствами, выражаемыми следующими уравнениями: aa~i = aria = J, если для обозначения этой матрицы принять символ а'\ Она будет к тому же единственной матрицей, обладающей этими двумя свойствами. Этим путем мы приходим к понятию о степенях матриц с целыми положительными и отрицательными показателями. Определение А Под символом ар будем понимать произведение 4Х*а — а р множителей, равных а: при этом а может быть совершенно произвольной матрицей. Если матрица а неособенная, то степени с отрицательным показателем или с показателем, равным нулю, могут быть определены помощью формул: пР& этом в обоих случаях р обозначает целое положительное число.
76 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ. КОМБИНАЦИЯ МАТРИЦ Отсюда следует Теорема 3. Законы показателей степеней имеют место для всех матриц» если показатели р и q — целые положительные числа: если эюе р и q — целые числау то оба закона сохраняют свою силу для всех неособенных матриц. Обратимся теперь к рассмотрению вопроса о делении одной матрицы на другую. Естественно определить деление как операцию, обратную умножению. Так как умножение не подчинено переместительному закону, то получаются два различного рода деления: а, деленное на Ьх с одной стороны, может обозначать такую матрицу х, для которой а=Ьх> а, с другой стороны,—матрицу у, определяемую уравнением: а~ уЪ. В силу этой двойственности термин деление обычно не применяется. Однако, как легко видеть, имеет место следующая теорема: Теорема 4L. Пусть а означает произвольную матрицу и Ь 6ydeni неособенной матрицей) существует всегда одна и только одна такая матрица х9 которая удовлетворяет уравнению: а~Ьх, равным образом имеется всегда одна и только одна матрица у, для которой имеет тесто соотношение: a—yb. Обе эти матрицы определяются следующими формулами: x = b~ia, y = ab'K Особенной простотой обладают матрицы следующего вида: | k 0. . .0 6 £ ... о II 0 0 ... k Матрицы эти носят название скалярных матриц по, причине непосредственно ясной из следующих соображений. Обозначим через k вышенаписанную скалярную матрицу и через ау произвольную матрицу того же порядка; тогда ak = ka. (1) Пусть, далее, / означает некоторую другую скалярную матрицу, кавдый элемент главной диагонали которой равен /; тогда имеют место два уравнения: Л+1 = 14-* = (* + /)/, (2) иг =.-= ik = ш. / з> = £/,
АЛГЕБРА МАТРИЦ 77 Формула (1) показывает, что скалярная матрица, если дело идет об умножении ее на некоторую другую матрицу, может быть заменена обыкновенной скалярной величиной. Из формул (2) и (3) следует, что скалярные матрицы при комбинировании их между собою подчиняются не только законам обыкновенных скалярных величин, но каждая такая скалярная матрица может быть заменена обыкновенной скалярной величиной, находящейся на ее главной диагонали при условии, что в конечном результате скаляр заменяется соответствующей скалярной матрицей- На этом основании в алгебре матриц всякая скалярная матрица может быть заменена соответствующей обыкновенной скалярной величиной и обратно. Единичная матрица / может быть тогда представлена также символом 1. Определение 2. Матрицей Л, присоединенной к матрице а, называется матрица того же порядка, в которой элемент i-й горизонтали и }-й вертикали является алгебраическим дополнением того элемента матрицы а9 который стоит в j-й горизонтали и i-й вертикали г. Если а неособенная матрица, то можно положить А = аа-К (I) В то время как всякая матрица обладает присоединенной матрицей, обратная матрица существует только для неособенных матриц. Из уравнения (4) имеем: Аа = аА~а1. (5) Это уравнение имеет место не только тогда, когда а является неособенной матрицей, но также и в том случае, если определитель а равен нулю, к*к в этом можно убедиться путем непосредственного перемножения. В заключение займемся еще некоторыми важными теоремами о ранге произведения двух матриц. Прежде всего убеждаемся непосредственно в том, что ранг такого произведения не всегда вполне определяется числами, выражающими ранг сомножителей. Это видно из примеров: формула (5),§ 22, где сомножители (вообще) обладают соответственно рангами 2 и 1; ранг же произведения равен нулю. Те же ранги, а именно 2 и 1, имеют (вообще) сомножителей в формуле: Яц 012 0 #21 а22 ° ап аш 0 1 II 0 0 0 . 0 0 1 || 0 0 0 : = 0 0 ff,2 0 0 %> 1 0 0 Д32 произведение же теперь, однако, обладает рангом 1. Хотя (как показывают эти примеры) ранги сомножителей (а также v порядки отдельных матриц) не позволяют определить ранг произведения, тем не менее существуют важные неравенства между числами, выражающими эти ранги, получением которых мы теперь займемся. 1 Здесь надо обратить внимание на перемену месг горизонталей и вертикалей, которая в случае присоединенных определителей не имела места, ввиду того что там она была несущественной и даже иногда неудобной.
78 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ. КОМБИНАЦИЯ МАТРИЦ Для этой цели рассмотрим две матрицы: а = аи tfin Ь = и1п ип\ • • bn и произведение ab. Теорема о. Всякий определитель k-zo порядка матрицы аЬ может быть представлен в виде совокупности определителей k-го по* рядка матрицы Ь, из которых каждый умножается на некоторый полином от а\ равным образом тот же определитель может быть представлен в виде совокупности определителей k-го порядка матрицы а* каждый из которых множится на некоторый полином от 6. В самом деле, всякий определитель &-го порядка матрицы аЬ может быть разложен на сумму определителей £-го порядка таким образом,, что каждая вертикаль каждого из этих определителей содержит одно и то же Ъ в качестве множителя *. Отбрасывая эти множители, получаем определитель от а, который либо тождественно равен нулю, либо будет опрепелителем &-го порядка матрицы а. Равным образом можно определитель &-го порядка матрицы аЬ разложить на сумму таких определителей &-го порядка, что каждая zopuзoнmaль каждого из них обладает одним и тем же а в качестве множителя. Освобождаясь снова от этих множителей, получаем определители, которые либо тождественно равны нулю, либо являются определителями &-го порядка матрицы 6. Отсюда ясно, что при равенстве нулю всех определителей &-го порядка в а или в Ь равны нулю также и все определители &-го порядка в аЬ. Следовательно, имеет место теорема: Теорема 6. Panz произведения двух матриц не может быть больше ранга каждого из сомножителей 2. В одном важном частнрм случае эта» теорема позволяет определить вполне ранг произведения, а именно, когда одна из двух матриц а или b будет неособенной. Предполагая, например, что а будет неособенной матрицей и обозначая ранг й через г, ранг аЬ через /?, по теореме 6 имеем /? < г, рассматривая теперь Ь как произведение а"1 на а&, по теореме б имеем условие г</?. Сравнение обоих результатов дает нам r=R. С другой стороны, если Ь — неособенная матрица, a R и г означакт соответственно ранги аЬ и а, то по теореме 6 /?<г; но из уравнения (аЪуЪ-i^a следует г</?. Поэтому снова r=R. Таким образом получаем теорему: * Читатель хорошо сделает, полностью написав матрицу ab. Пусть гх и т2 будут ранги обоих множителей и R— ранг их произведения, тогда R<^rb R <^ г2, что и составляет первую половину теоремы Сильвестра, вызываемой законом «of Nullity»; вторая половина гласит: R^rt + г2 — Щ где л — порядок матрицы (ср. ниже упражнение 8). Сильвестр называет «Nullity» матрицы разность между ее порядком и рангом и выражает открытый им закон следующим образом: «The nullity of the product of matrices is at least as great as the nullity of either factor, and at most as great as the sum of the nullities of the factors».
МНОЖЕСТВА. МАТЕМАТИЧЕСКИЕ СИСТЕМЫ. ГРУППЫ 7£ Теорема 7. Если матрица ранга г умножается в каком угодно* порядке на некоторую неособенную матрицу, то произведение будет также ранга г. Упражнения 1. Две матрицы а и Ь одного и того же порядка тогда и только тогда будут эквивалентны (§ 19), если существуют две неособенные матрицы end, которые удовлетворяют уравнению dac=b. Ср. упражнение 2, § 22 и упражнение 4, § 19. 2. Две матрицы а и Ь одного и того же порядка тогда и только тогда будут эквивалентны, если существуют такие четыре матрицы с, d9 е> /, что имеюг место следующие два уравнения: йас = 6, a =fbe. 3. Всякая матрица ранга г может быгь представлена в виде суммы г матриц, ранга 1 *. 4. Матрица будет тогда и только тогда делителем нуля (упражнение 1, § 22),. если она особенная. 5. Матрица, обратная произведению любого числа неособенных матриц, равна произведению матриц, обратных этим матрицам, но взятых, в обратном порядке. Получить отсюда подобную же теорему, касающуюся матрицы, присоединенной к произведению любого числа матриц, имеющую место как в том случае, когда эти матрицы особенные, так и в противном случае. Какая теорема получается отпода для определителей? tf. Матрица, сопряженная с обратной от неособенной матрицы, является обратной сопряженной матрице. Матрица, сопряженная с присоединенной к какой-либо» матрице, будет матрицей, присоединенной к сопряженной, 7. Матрица, произведение которой на всякую матрицу того же порядка подчинено переместительному закону, будет скалярной матрицей. 8. Если R есть ранг произведения двух матриц л-го порядка соответственно- рангов rt и Г& то R>rx + r2 — n 2. Для доказательства надо взять прежде всего один из множителей в частном виде, упомянутом в упражнении 3, § 19, и воспользоваться упражнением 1, § 8. Общий случай приведется тогда к рассматриваемому частному случаю на основании упражнения 1. 26. Множества. Математические системы. Группы. Эти три: понятия встречаются во всех отраслях математики; первые два из них действительно обладают такой общностью, что их можно рассматривать как логическое основание всей математики 3. В этом параграфе после * Гиббс (Gibbs) называет матрицу ранга 1 диадой, ибо она может быть рассматриваема как произведение двух комплексных величин (ait а^ ..., ап) и (bl,b2, -»-,bn). Сумма любого числа диад называется диадическим полиномом или короче диадиком («Dyadic»). Всякая матрица поэтому является диадиком и обратно. Гиббсова теория диадических полиномов для случая п=3 изложена в книге Gibbs-Wilson, Vector Analysis гл. V. В этом изложении пользуются исключительно геометрической интерпретацией: комплексные величины (at, аь а3) и (Ьь Ь2. #з)> из которых построены диады, интерпретируются как векторы в пространстве трех измерений. 2 Ср. подстрочное примечание к теореме 6. 3 Популярное изложение предмета с точки зрения, здесь лишь вкратце намеченной, находится в речи автора «The Ftindamenial Conceptions and Methods, of Mathematics», St Louis Congress of Arts and Science, 1904.
80 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ. КОМБИНАЦИЯ МАТРИЦ краткого определения этих трех основных понятий покэжем некоторые непосредственные приложения их. Объекты (мы пользуемся этим словом в самом широком смысле; математики могут быть самого различного рода. С одной стороны, мы имеем дело, упоминая лишь о некоторых из наиболее важнейших, с различными видами величин, начиная от целых положительных чисел до комплексных величин и матриц. Далее, в геометрии, кроме точек, прямых, кривых и поверхностей, встречаем еще движение (вращение, перенесение и т. д.), коллинеации и, вообще говоря, геометрические преобразования. В различных отделах математики приходится, кроме того, иметь дело с подстановками, т. е. с перемещениями в определенной последовательности юпределенных объектов, причем эти подстановки сами по себе снова также могут являться объектами математического исследования. Наконец, в механике встречаем дальнейшие объекты для исследования (силы, силовые пары, скорости и т. д). Эти объекты, равно как и все те остальные, которые могут быть подчинены математическому рассмотрению, обычно представляются нам не в единственном числе, но в виде множеств. Такие множества могут состоять из конечного или неограниченного числа объектов или элементов. Например: 1) все простые числа; 2) все прямые, встречающие две данные прямые пространства; 3) все плоскости симметрии данного куба; 4) все подстановки из пяти букв; 5) все вращения плоскости вокруг некоторой прямой, к ней перпендикулярной. Составив себе таким образом приблизительное представление относительно общности понятия о множестве, заметим,-что в математике с такого рода множествами часто соединяется представ 1ение об одной или многих операциях, помощью которых из отдельных пар элементов получаются н^вые элементы, снова принадлежащие множеству, либо нет. В качестве примера такого рода операций или законов композиции, упомянем процессы сложения и умножения в обыкновенной алгебре и в алгебре матриц, или закон композиции, помощью которого из двух различных точек в геометрии получается прямая линия, их соединяющая, или, наконец, сложение двух движений в одно единственное и т. д. Если множество в этом смысле связано с одним или с несколькими законами композиции, то мы говорим, что оно образует математике- с <ую систему 1. Перейдем теперь к одной особенной математической системе, которой 1 Олределение это является достаточно общим для нашей непосредственной цели. Вообще говоря, однако, желательно сделать допущение, касающееся не законов композиции, но лишь соотношений между элементами математической системы. Законы композиции должны тогда совершенно отсутствовать. С этой точки зрения целые положительные числа должны образовать математическую систему уже только с соотношениями «больше» и «меньше», даже если и яе вводи\ъ никакого закона композиции вроде, например, сложения и умножения. К этому можно добавить, что законы композиции могут быть рассматриваемы как соотношения между тремя элементами (см. упомянутую в предыдущем примечании речь автора).
МНОЖЕСТВА. МАТЕМАТИЧЕСКИЕ СИСТЕМЫ 81 присвоено наименование группа и для которой имеет место следующее определение: Определение, Математическая система, состоящая из данного множества объектов, подчиненных некоторому закону композиции, обозначаемому символом о, называется группой, если имеют место следующие свойства 1. Из любых двух (не необходимо различных) элементов а9 b множества может быть образован новый элемент aob, также принадлежащий множеству *. 2. Имеет место сочетательный закон, а именно: для любых трех элементов а, Ь, с множества всегда: {а о Ь) о с ==. а о (Ь о с). 3. Множество содержит элемент I, так называемый единичный (тождественный) элемент, который, будучи комбинирован с любым данным элементом множества согласно предписанному закону ком- позиции, воспроизводит этот данный элемент: ioa = aoi~a. 4. Если а — какой-либо элемент множества, то в этом последнем существует такой второй элемент а', называемый обратным элементу а, что а' о а = а о a' = i. В \ силу этого определения, положительные "и отрицательные ' целые числа, включая сюда и нуль, образуют группу, если вышеупомянутым законом композиции ^влчется процесс сложения. В рассматриваемом случае нуль есть тождественный элемент, а элемент, обратный данному числу, будет то же число, взятое с обратным знаком. То же множество не образует, однако, группы, если в качестве правил?, композиции выбрано умножение; первые три условия тогда действительно удовлетворены (причем число 1 является тождественным элементом), но обратные элементы не встречаются во множестве. Множество всех вещественных чисел образует группу при условии, что законом композиции является сложение, но не умножение, ибо нуль не имеет обратного элемента. Исключая нуль из этого множества, получаем группу, если законом композиции является умножение, но уже не сложение. В качестве примепа группы с конечным числом элементов укажем на множество из четырех чисел: + 1, -1, + усгт, - */=!, где законом композиции является умножение. Перенесение плоскости в направлении лежащих в этой плоскости 1 Про математическую систему, удовлетворяющую условию 1, иногда говорят, что она обладает групповым свойством. В старых трактатах по этому вопросу это свойство является единственным, явно выраженным, остальные три лишь подразумеваются. 6 Б о х е р. Взеденмс в высшую алгебру
82 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ. КОМБИНАЦИЯ МАТРИЦ прямых дает нам пример группы геометрических операций. Всякое такое перенесение по величине и по направлению можег быть представлено стрелкой, лежащей в плоскости. Два такого роДа следующие друг за другом перенесения могут быть сложены в одно единственное, стрелка которого получается из двух данных, применением известного построения правила параллелограма сил. Множество всех рассматриваемых перемещений образует, таким образом, при только что принятом законе композиции группу, если мы включим в это множество тождественное перенесение^ т. е. такое перенесение, которое оставляет в покое каждую точку плос* кости. Это тождественное перенесение и образует тождественный элемент; два перенесения будут друг другу обратными, если соответствующие им стрелки имеют равную величину, но противоположное направление. Вышеперечисленные группы, кроме четыре* условий, упомянутых в определении, удовлетворяют еще пятому: соответствующая им операция композиции является переместительной {коммутативной). Такие группы называются коммутативными или абелевыми группами. Вообще говоря, однако, группы не обладают i этим свойством. В качестве примера неабелевых групп упомянем прежде всего о группе из всех неособенных матриц данного порядка, где законом композиции является умножение, а также о группе из всех матриц данного порядка с определителем ztzl при том же законе композиции. Эта вторая группа? называется подгруппой первой, ибо все ее элементы заключаются среди элементов первой группы, и закон композиции в обоих случаях один и тот же. Подгруппой этой последней группы будет в свою очередь группа всех матриц данного порядка с определителем -|-1> где законом композиции будет опять умножение *. Некоммутативные группы могут быть легко построены в любом числе, если в качестве элементов выберем линейные преобразования или кол- линеации. Абелевы группы могут быть образованы из матриц, если в качестве закона композиции вместо умножения примем процесс сложения. 27. Изоморфизм Определения. Две группы называются голоэдрически изоморфными (просто изоморфными) если между их элементами может быть уста~ новлено такое взаимно однозначное соответствие, что если элементам a, b первой группы соответствуют элементы а\ Ь' второй, та и элементу а! о Ь' соответствует элемент а^Ь1. ч Для иллюстрации этого определения приведем несколько примеров, оставляя читателю доказательство сделанных утверждений. Во всех слу- 1 Такие матрицы иногда называются унимодулярными или точнее собственно унимодулярными; матрицы с определителем —1 тогда могут быть названы несобственно унимодулярными. Эти последние матрицы не образуют группы, ибо они не удовлетворяют первому условию данного определения. 2 Это понятие об изоморфизме может быть легко распространено на математические системы какого угодно рода, если они подчинены одному и тому же числу законов композиции, так, например, две математические системы, состоящие соответственно из всех скалярных величин и из всех скалярных матриц, изоморфны (в обоих случаях законами композиции являются слЪжение и умножение). На этом основании можно, не вызывая недоразумений, не обращать внимания на разницу между скалярными величинам;: и скалярными матрицами.
ИЗОМОРФИЗМ 83 чаях, где недоразумение невозможно, опускаем упоминание о соответ* ствующем законе композиции. Пример 1. а) Группа из четырех элементов 1, V=l9-\,-V=l (закон композиции — умножение). Ь) Группа из четырех вращений: на 0°, 90°, 180°, 270° вокруг данной прямой. Изоморфизм обеих этим групп может быть установлен сопоставлением попарно элементов этих групп в том порядке, в каком они здесь написаны. Пример 2. а) Группа из четырех матриц (о l) • ( о -1) ' (о - 1 ) • ( О 1 ) (закон композиции — умножение). b) Группа следующих четырех преобразований: тождественное преобразование; отражение в плоскости; отражение во второй плоскости4 перпендикулярной к перво^; вращение на 180° вокруг линии пересечения этих двух плоскостей. c) Группа, состоящая из тождественного преобразования и трех вращений на угол в 180° вокруг трех прямых линий, проходящих через одну точку и взаимно перпендикулярных. Две группы примера 1 не изоморфны с тремя группами примера 2, хотя все эти группы содержат одно и то же число элементов, ибо в группы примера 1 входят два элемента, квадраты которых не являются тождественными элементами. Пример 3. а) Группа всех вещественных чисел (закон композиции — сложение). b) Группа всех скалярных матриц &-го порядка (сложение). c) Группа всех перенесений в пространстве параллельно данной прямой. Пример 4. а) Группа всех неособенных матриц п-го порядка (умножение). Ь) Группа всех неособенных однородных линейных преобразований с п переменными. С этими двумя последними группами не будет, однако, голоэдрически изоморфна (как это можно было бы принять с первого взгляда) группа всех неособенных коллинеаций в пространстве п—1 измерения. В самою деле установленное нами соотношение между коллинеациями и линейными преобразованиями не является взаимно однозначным: всякому линейному преобразованию сортветствует одна коллинеация, но всякой коллинеаций соответствует бесчисленное множество линейных преобразований (с пропорциональными коэфициентами) *. Тождественной коллинеаций соответствуют, например, все преобразования, матрицы которых скалярны. 1 Этим, однако, не утверждается, что группы не могут быть голоэдрически изоморфными, ибо мыслимо установление некоторого другого соотношения между их элементами, которое было бы взаимно однозначным и доказывало бы таким обра* * е-
84 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ. КОМБИНАЦИЯ МАТРИЦ Такие группы можно было бы назвать мероэдричесш изоморфными (многократно изоморфными). Группу геометрических преобразований, голоэдрически изоморфную группе всех неособенных матриц я-го порядка, можно получить, рассматривая переменные дг19 ..., хп как неоднородные координаты в пространстве п измерений и образуя все неособенные однородные линейные преобразования этих х. Совокупность этих преобразований представляет такую аффинную группу в пространстве п измерений, от преобразования которой начало координат не меняется (см. подстрочное примечание на стр. 71). Группа всех неособенных матриц я-го порядка является таким образом голоэдрически изоморфной некоторой определенной подгруппе группы коллинеаций в пространстве п-то измерений, но не группе вес неособенных коллинеаций в пространстве п — 1 измерения. Существенное различие между этиму двумя группами состоит в том, что одна из них зависит от я2 параметров (я2 коэфициентов линейного преобразования), другая же только от /г2 — 1 параметров {отношений коэфициентов коллинеаций). Желая получить группу матриц голоэдрически изоморфную группе всех неособенных коллинеаций в пространстве п—1 измерения, будем рассматривать две матрицы как равные друг другу, если элементы одной из них получаются из элементов другой путем умножения на одну и ту же отличную от нуля постоянную. Следуя указанию проф. Е. Мура (Е. Н. Moore, Chicago), назовем такие матрицы дробными матрицами и введем для них обозначения: аЛ #22 ail #12 #13 #21 #22 #23 #31 #32 #33 И Т. Д. Условливаясь, что дробные матрицы могут быть умножаемы так, кяк это установлено для обычных матриц, получаем, что группа всех неособенных коллинеаций в пространстве п — 1 измерения будет голоэдрически изоморфна группе всех дробных матриц я-го порядка, определители которых отличны от нуля *. Равным образом группы примера 2 будут голоэдрически изоморфны группе из четырех дробных матриц: 1 О О О —1 О 1 О 1 аом изоморфизм этих групп; то обстоятельство, что обе группы зависят от различного числа параметров, не решает вопроса. Но из упражнения 7, § 25 вытекает, что группы не могут быть изоморфными, ибо единственная неособенная кол- линеация, переместительная со всеми коллинеациями, есть тождественное преобразование; между тем все линейные преобразования со скалярными матрицами обладают этим свойством: 1 О величине определителя дробной матрицы можно, очевидно, только тогда говорить, если определитель равен нулю, ибо умножение всех элементов матрицы на с оставляет матрицу неизменной, но умножает определитель на с». В частности для таких матриц нельзя применять термин «унимодулярная матрица»; мож.ю, одпакэ, говорить о ранге матрицы.
изоморфизм 85 где законом композиции является умножение. Если элементы эти рассматриваем как обыкновенные матрицы, то убеждаемся, что они не удовлетворяют первому условию определения груплы. Читателя, желающего углубиться в изучение теории групп, в особенности групп линейных преобразований, отсылаем к следующим трем сочинениям, ^взаимно дополняющим друг друга: Weber, Algebra, t. 2. Klein, Vorlesungen liber das Ikosaeder. Lie-S с heifers, Vorlesungen iiber kontinuierliche Gruppen. Упражнения Определение. Говорят, что группа будет порядка п, если она содер жит п и только п элементов. 1. Если группа я-го порядка обладает подгруппой, то порядок этой подгрупп!.;: есть делитель п. Указание: пусть элементы подгруппы будут аь ..., аъ и пусть Ь — элемент группы, не принадлежащий этой подгруппе. Надлежит показать, что элементы Ъаъ Ьа2, • • -ybak отличны друг от друга и от элементов а и Ь и в то же время принадлежат группе. Если таким путем не получают всех элементов группы, то рас- смафивают следующий элемент с и образуют элементы саъ ..., сак и т. д. 2. Тождественный элемент группы конечного порядка можно получить, если езять любой элемент а этой группы и умножить его самого на себя достаточное "пело раз. Определение. Показатель наинизшей «степени» элемента а, равной тождественному элементу, называется периодом элемента а. 3. Всякий элемент группы я-го порядка имеет периоа, равный одному из делителей п (включая 1 и п). Определение. Если все элементы группы являются степенями одного из ее элементов, то группа называется циклической. 4. Все циклические группы я-го порядка изоморфны группе вращения на углы О, (о, 2(о, ...,(/2-1)(0 вокруг некоторой оси, где(о= —. Обратно, всякая такая группа будет циклической. 5. Всякая группа, порядок которой простое число, будет циклическая. 6. Все не циклические группы четвертого порядка изоморфны группам примера 2. Группа такого рода называется четверной группой («Vierergruppe»). 7. Образовать все типы групп, которым будут изоморфны все группы шестого порядка. 8. Образовать все типы rpjni, которым будут изоморф ты все группы восьмого порядка.
Глаьа седьмая Инварианты. Основные понятия и примеры 28. Абсолютные геометрические, алгебраические и арифметические инварианты. Если некоторую геометрическую фигуру подвергнем преобразованию, то одни из е^ свойств изменяются, другие же остаются без изменения. Если рассмотрим не одно преобразование, но целую систему их, то те свойства фигур, которые не нарушатся ни от одного из преобразований системы, называются инвариантами по отношению к этой системе преобразований. Таким образом, если наша система преобразований есть группа всех перемещений, то свойства двух прямых линий быть параллельными или перпендикулярными одна другой, а также, например, свойство кривой быть окружностью являются инвариантными свойствами, ибо после перемещений прямые остаются параллельными или перпендикулярными, а кривая продолжает быть окружностью. Если, однако, мы рассматриваем вместо перемещений группу всех неособенных коллинеаций, то ни одно из трех вышеупомянутых свойств не является более инвариантным. Инвариантные свойства по отношению ко всем неособенным коллинеациям сыграли стодь важную роль в развитии геометрии, что им было присвоено особое наименование так называемых проективных свойств. В качестве примера таких проективных свойств упомянем о свойстве трех точек принадлежать одной прямой, о свойстве четырех точек лежать в одной и той же плоскости, о касании двух кривых и двух поверхностей или одной кривой и одной поверхности и т. д. Определение 1. Если с некоторым геометрическим образом связана некоторая величина так, что при всех преобразованиях некоторой определенной системы она остается без изменений, то величина эта называется инвариантом геометрической фигуры относительно преобразований этой системы. Например, инвариантами относительно группы перемещений будут расстояния двух точек и угол между двумя прямыми. От этих геометрических инвариантов естественно приходим к рассмотрению алгебраических инвариантов. Рассмотрим два полинома: Atx + Bty + Cu л (1) А2х + В2у + С2 г и подчиним переменные (х, у) преобразованиям системы: Ar' = ^cose+^sine+ а, \ ,9 У = ~ .rsin© +j/cosB -f- Р, ' "
АБСОЛЮТНЫЕ ИНВАРИАНТЫ ' 87 где а, ($, 0 являются параметрами, принимающими произвольные значения. Преобразование (2) приводит полиномы (1) к виду: AV + Z^'y + d', \ А2'х' + В2У + С2*. f {d) Коэфициенты в (3) легко могут быть выражены помощью параметров a, jS, О и коэфициентов (1); при этом имеют место уравнения: Оба выражения Al'A2t-BL'BJ = AlA2+BLB2. f W AiB2-A2Bh ^2 + ¾¾ (5) называются инвариантами системы полиномов (1) относительно системы преобразований (2) в соответствии со следующим общим определением. Определение 2. Функция, коэфициентов системы полиномов от любого числа переменных называется инвариантом (правильнее «абсолютным инвариантом») относительно системы преобразований с теми же переменными, если она не изменяется^ когда полиномы эти подвергнем всем преобразованиям системы. Связь рассмотренного выше примера с геометрией становится ясной, если вспомним, что алгебраические преобразования (2) выражают движение плоской фигуры в ее плоскости, если х и у означают прямоугольные координаты точек. Если теперь рассмотрим не полиномы (1), но прямые линии, получаемые приравниванием этих полиномов нулю, то имеем дело с движением этих прямых. Инварианты (5) сами по себе не имеют геометрического смысла, но, приравнивая их нулю, мы получаем необходимое и достаточное условие для того, что бы две прямые были соответственно параллельны или перпендикулярны, что и представляет, как мы упоминали выше, инвариантные свойства по отношению к перемещениям. Частное от деления двух инвариантов (5) дает нам тангенс угла между двумя прямыми — геометрический инвариант. В качестве второго примера рассмотрим прямую и точку. Алгебраически это значит, что мы имеем дело с системой Ах + Ву + С, X <а\ состоящей из одного полинома и одной пары переменных. При этом координаты xl9 уг должны быть подчинены тому же преобразованию, как и переменные х> у, или, как мы будем говорить (см. ниже определение 3): (л:, у) и (х19 уА) являются когредиентными переменными. Подчиняя тогда систему (6) преобразованию системы (2), получим новую систему А'х' + В'у' + С, X ,~ «ричем простым вычислением убеждаемся в том, что A'xj! + В'у{ + С' = AxY + ByL + С.
88 ИНВАРИАНТЫ. ОСНОВНЫЕ ПОНЯТИЯ И ПРИМЕРЬ. Выражение Axt -f- Вух -\- С называют поэтому ковариантом системы (б) (см. далее определение 4). Ковариант этот сам по себе не имеет никакого геометрического смысла, но условие равенства его нулю является условием необходимым и достаточным для того, чтобы точка (xlf ух) лежала на прямой Ах -f- Ву-\-С = 0. Вышерассмотренный пример позволяет дать следующие общие определения: Определение 3. Говорят что системы переменных (х, у, 'г, ... ), (xvyl7 zt, ...), (х2, у3, г%, ... ), ... будут системами когредиентных переменных^ если выполнено следующее условие: как только одна из., систем подвергнута некоторому преобразованию, то тому оке преобразованию будут подвергнуты все остальные системы переменных. Определение 4. Если имеем систему', состоящую из некоторого числа полиномов от (x9y,z, ...) и некоторого числа систем перемен» ных, когредиентных (х, у, zy ...), то всякая функция коэфициентов этих полиномов и когредиентных переменных называется ковариантом (точнее абсолютным ковариантом) системы по отношению к преобразованиям некоторой системы^ если функция эта остается без изменения, когда переменные (х, у, z, ...) подвергнуты всем преобразо* ваниям этой системы. Инварианты могут быть поэтому рассматриваемы как частный случай ковариантом. Среди геометрических инвариантов имеются такие, которые по своей природе должны быть обязательно целыми числами; такого рода инварианты называются арифметическими инвариантами. В качестве первого примера укажем на число углов полигона, которое является арифметическим инвариантом как по отношению к группе перемещений, так и по отношению к группе неособенных коллинеадий. Вторым примером будет наибольшее число вещественных точек пересечения алгебраической кривой с прямой линией, — число это будет инвариантным только па отношению к неособенным вещественным коллинеациям. Эти арифметические инварианты играют важную роль также и в алгебре,, как мы это увидим далее. В качестве примера упомянем о степени формы, которая будет инвариантной по отношению ко всем неособенным линейным преобразованиям *. Упражнения 1. По отношению к преобразованиям (2) fa — xtf + iyz — ytf и ■Ч У\ 1 хгу2 1 *гУ$ 1 являются ковариантами системы (хь yt), (лг2, у^у (хз> -Из)- 1 В действительности степень будет инвариантной по отношению ко всем линейным преобразованиям, за единственным исключением только такого преобразования, в котором все коэфициенты преобразования равны нулю.
ЭКВИВАЛЕНТНОСТЬ № 2. Выражения А + С и В*-АС по отношению к преобразованиям (2) будут инвариантами полинома Ах2 + 2Вху + Су* + 2Dx + 2Еу + F. Каково будет геометрическое значение этих инвариантов? 3. Л2 + В% по отношению к преобразованиям (2) является инвариантом полином» Ас гВу + С. Выражение же Аъ + Ок + С У~А* + В* будет ковариангом системы (6). Каково будет их геометрическое значение? 29* Эквивалентность Определение 1т Если А и В являются двумя геометрическими: образами, или двумя алгебраическими выражениями, или системами таких выражений, то А и В тогда и только тогда называются эквивалентными по отношению к некоторой системе преобразований9 если существует такое преобразование системы, которое преобразует А в В, а равным образом и такое преобразование системы, которое переводит В в А, Понятие об эквивалентности двух фигур по отношению к группе перемещений совпадает с понятием о конгруентности фигур, излагаемым в элементарной математике. Из теоремы 2, § 24 следует далее, что две системы из трех различных точек на некоторой прямой линии всегда эквивалентны по отношению к неособенным проективным преобразованиям. В обоих рассмотренных случаях система преобразований образует группу, и тогда определение эквивалентности может быть еще упрощено, и-бо для преобразования, переводящего А в В, существует обратное, тоже принадлежащее системе и преобразующее В в А; таким образом имеем: Теорема. А и В тогда и только тогда будут эквивалентными по отношение к преобразованиям некоторой группы, .. если одно пре» образование группы превращает А в В. Теорема эта является важной, ибо вопрос об эквивалентности будет подлежать рассмотрению, если только дело идет о группах преобразования. Рассмотрим теперь для большей определенности группу геометрических преобразований. Если две фигуры эквивалентны по отношению к этой группе, то всякий инвариант первой фигуры равен соответствующему инварианту второй. Если, например, два треугольника эквивалентны по отношению к группе перемещений, то все стороны и углы одного равны соответствующим сторонам и углам другого. То же имеет место относительно высот, медиан, радиусов вписанных кругов и т. д., ибо все эти величины являются инвариантами. Одна из главнейших задач элементарной геометрии состоит теперь в том, чтобы из всех этих инвариантов треугольника изыскать возможно меньшее число таких, равенства
90 ИНВАРИАНТЫ. ОСНОВНЫЕ ПОНЯТИЯ И ПРИМЕТЫ которых влечет за собою эквивалентность обоих треугольников. Для этого достаточно, как известно, равенства двух сторон и заключенного между ними угла, или двух углов и прилежащей к ним стороны, или равенства всех трех сторон. Принято говорить тогда о полной системе инвариантов треугольника по отношению к группе перемещений, так как два треугольника, имеющие общими все инварианты такой системы, будут эквивалентны и, следовательно, будут иметь общими все другие инварианты. Определение 2% Система инвариантов некоторого геометрического образа (или некоторого алгебраического выражения) образует полную систему инвариантов *, если две фигуры (или два выражения), имеющие эти инварианты общимщ будут эквивалентны. Из этого определения следует, что все инварианты некоторой фигуры или некоторого алгебраического выражения однозначно определяются полной системой инвариантов. В заключение остановлмся еще на приложении к матрицам понятий об инвариантах и эквивалентности. Рассмотрим матрицы я-го порядка а и те преобразования вида аАЬ = В, которые преобразуют матрицу А в матрицу /?, где а и Ь будут какие угодно неособенные матрицы я-го порядка. Преобразование это обозначается символом (а, Ь), причем эти символы, очевидно, могут быть комбинированы по формуле: (а2, &2)(«i» &i) = (a20i, Ъфъ). Иэ этой формулы легко следует, что рассматриваемые преобразования образуют группу. Согласно нашему общему определению эквивалентности, две матрицы А и В должны быть тогда и только тогда рассматриваемы как эквивалентные, если существуют две неособенные матрицы а и 6, которые удовлетворяют уравнению (1). Из упражнения 1, § 25 ясно, что это определение эквивалентности приводится к ранее высказанному. 30. Ранг системы точек или системы линейных форм как инвариант. Пусть (xt :yt: zt: tx\ (л:2: y2: г2: Q, (хг: у3:г9: ts) — какие- либо три различные точки на некоторой прямой, так что ранг матрицы 1 *i л ч 1 *2 У2 Ч \ х3 Уз Zj Ч 1 '* h 1 1 В классической теории алгебраических инвариантов это выражение применяется в несколько другом, более узком смысле. Там приходится иметь дело с целыми рациональными относительными инвариантами (§ 31). Под именем полной системы таких инвариантов системы алгебраических форм понимается тогда такая система инвариантов, помощью которой каждый инвариант системы такого рода может быть представлен целым и рациональным выражением. См. Clebsch, BinSre Formen, стр. 109. 2 Можно при этом ограничиться матрицами с вещественными элементами.
РАНГ СИСТЕМЫ ТОЧЕК ИЛИ СИСТЕМЫ ЛИНЕЙНЫХ ФОРМ КАК ИНВАРИАНТ 91 равен 2. Преобразуя теперь пространство помощью неособенной колли- неации, получаем три новые точки, которые будут также различными, и снова лежат на некоторой прямой, так что ранг их матрицы снова равен 2. Убеждаемся, следовательно, в том, что ранг системы течек в этом случае сохраняется яри неособенной коллинеации. Пусть, далее, ахх -\- Ъ±у + схг + dtt = О, а2 к + Ь2У + C2Z + d2t = О, адх + ЬзУ + сгг + ^ = °. #4* -\-ЬцУ + 4Z + dkb = ° будут четыре плоскости, имеющие только одну общую точку, так что ранг их матрицы равен 3. Помощью неособенной коллинеации из данных получаем четыре новых плоскости, которые снова имеют только одну общую точку, так что ранг матрицы их коефициентов тоже равен 3. Следовательно, таким преобразованием ранг этой системы плоскостей не меняется. В качестве обобщения сказанного установим такие теоремы: Теорема 1. Ранг матрицы т точек x±W7 х^, *.., xnW (/== 1,2,..., т) будет инвариантом по отношению к неособенным линейным преобразованиям. Пусть неособенное линейное преобразование Xi = cnx1+ ... +сыхл \ X* — cnl х1 + • • • + спп хп преобразует точки (xtW, ..., хпЩ в точки (Х±М, ..., ХпЩ. Предположим теперь, что некоторые k из этих точек (xJ-% ..., xj^)y например первые £, будут линейно независимы* Тогда существуют k постоянных с19 ..., скУ не равных одновременно нулю, удовлетворяющих уравнениям: elX;+с,*/ + •.. + V/*1 (У = 1, 2, ..., л). Но в силу преобразований (1) имеем тогда: поэтому • • • + <>(?l*n + *А* + — + <W*3) (/= 1» 2, ..^ п\ Но в силу (2) выражение это равно нулю, и следовательно, первые k точек (ЛТД ..., XnW) будут линейно зависимыми. Так как преобразование (1) является неособенным, то безразличию, какую систему точек рассматривать как начальную. Этим доказывается, что если какие-либо k точек одной системы линейно зависимы, то соответствующие k точек другой системы будут тоже линейно зависимы. Если ранг матрицы точек х равен г, то существует по крайней мере одна система г точек х, линейно независимых; но всякая система (r-f-0 Д)
92 ИНВАРИАНТЫ. ОСНОВНЫЕ ПОНЯТИЯ И ПРИМЕРЫ точек х будет уже линейно зависима. То же имеет место для точек X, а потому матрица точек X также обладает рангом г. Теорема 2. Ранг матрицы т линейных форм fi(xx хп)£= аахг + ai2x2 + ... +ainxn (/=1, 2, ..., т) будет инвариантом по отношению к неособенным линейным преобразованиям. Доказательство этой теоремы, совершенно аналогичное только что приведенному доказательству теоремы 1, предоставляем читателю [10*]. Инварианты, рассмотренные в этом параграфе, являются арифметическими инвариантами. 31. Относительные инварианты и ковариантьт. Рассмотрим систему п линейных форм от п переменных: ап х1 + <*12 х2 + .. • + аы хн, \ а21 хх + а22 х2 + ... + а2п хп, в ап1х1 + ап2х2^ Г* *tmxn Определение 1. Определитель ап • • •аы 1) ап1 • • ""11П называется результантом системы (1). Подвергнем теперь систему (1) линейному преобразованию хп — cni х± ~\- ... -\~ спп хп. Тогда получается новзя система форм: ап xi + • • • + а1п хп> кЩ где ™п\ х> + ' ' • + &гт хп » aij = anc\j + aac2j + -.. + aincnj. Из этих уравнениЛ, на основании теоремы об умножении матриц, получаем: <3ц . . . ain' ani • . . аПп вц • • • «1я ^wl ^ц • . .сы сп1 (4) что и доказывает такую теорему:
ОТНОСИТЕЛЬНЫЕ ИНВАРИАНТЫ И КОВАРИАНТЫ 93 Теорема 1. Если система п линейных форм от п переменных с матрицей а подвергнута линейному преобразованию с матрицей с, то преобразованная система обладает матрицей ас Ч Переходя в обеих частях (4) к определителям, убеждаемся, что результант системы (1) не является абсолютным инвариантом; при линейных преобразованиях, однако, он меняется весьма простым образом, а именно умножается на определитель преобразования, что и приводит к следующему определению: Определение 2. Всякая рациональная функция 2 от коэфициентов некоторой формы или некоторой системы форм, которая умножается только на ji-/o степень определителя преобразования (\х равно целому числу) 3, если эти формы подвергнуты какому-либо неособенному линейному преобразованию, называется относительным инвариантом веса р. данной формы или, данной системы форм 4. Самые формы тогда называются основными формами. Абсолютные инварианты будут поэтому просто относительными инвариантами веса нуль. Выше доказанное свойство результанта может быть теперь проще выражено так: Теорема 2. Результант системы п линейных форм от п переменных есть относительный инвариант веса 1. Соответствующим образом обобщим теперь понятие о ковариантах: Определение S. Всякая рациональная функция от коэфициентов некоторой системы форм от п переменных и от координат некоторого числа точек (yv ..., уп), (zv —, zn), ..., которые все когре- диентно преобразуются с переменными (xv ..., хп) форм, называется относительным ковариантом веса \х систем этих форм и точек, если функция эта умножается только на \х-ю степень (\х равно целому числу) определителя преобразования*, когда (х1У ..., хп) преобразуются путем неособенного линейного преобразования 6. . * Необходимо обратить внимание на то, что в теореме 1 и в определении 2 линейное преобразование должно быть дано в виде (2), т. е. х должны быть выражены помощью х'} но не обратно. 2 Кроме этих рациональных инвариантов можнб рассматривать также иррациональные (§ 90), где показатель \l не необходимо должен бьпь целым числом. 3 Сделанное здесь предположение, что р должно быть целым числом, может быть отброшено, ибо его можно дрказать. Доказательство того, что jjl не может быть дробью,, весьма просто, но то, что ц не может быть иррациональным или комплексным числом, не устанавливается чисто алгебраическим путем. 4 Всякий относительный инвариант является поэтому абсолютным инвариантом по отношению к линейным преобразованиям с определителем 4-1. Ср. с упражнением 7 в § 81, 5 Ср. примечание 1. 6 Во многих руководствах при исследовании ковариантов пользуются одними и темц же буквами (хи ..., хп) для обозначения точки и переменных форм. Хотя к этому нет особых препятствий, и иногда это бывает даже удобно, тем не менее мы предпочитаем то обозначение, при котором ясно, что переменные форм не имеют иной связи с координатами Tj4eK, кроме когредиентности.
94 ИНВАРИАНТЫ. ОСНОВНЫЕ ПОНЯТИЯ И ПРИМЕРЫ Инварианты могут быть рассматриваемы как граничнмй случай кова- риантов, когда число точек равно нулю. Другой граничный случай будет, если число формы равно нулю. Для этого случая имеем следующую георему: Теорема S. Определитель , XL . . . хп i xi • • • хп будет относительным ковариантом веса 1 системы точек (*i', • • • > *л W •.. *л • •. <*iw. ... *тМ). В самом деле, выполняя преобразование xi = СцХх + ... + с1пХп, хп — с«Л + • • • + сппхп, имеем: Хх' . . .*/ I 1^11^+...+^^...^^ + ...+^¾1 Л») М с*ЯР+ ... +сыХ%К..сп1хМ+ ... +cMXW\ сп. сп\ Xf1. . .X™ или А' • • XJ хф • • • х£] сы <-п% ' х{ Ля] •М Другой очень простой случай будет тот, когда имеется одна единственная форма и одна единственная точка. Теорема 4. Система, состоящая из формы f(xv ..., хп) и точки (ylt ..., зО> обладает абсолютным ковариантом f (у\, ... , уп) по отношению к линейным преобразованиям. В самом деле, напишем / в несколько более явном виде: /(flj, &2> • •<• '■> Хи •••» Хп), где а'*, я2, ... — коэфициенты /; после преобразования имеем: , fW. aj. . • •; х{, ..., *n')s/(a„ аа, ... ;Xi .... *«)• где dfj, а2', ... являются коэфициентами преобразованной формы. Так как это тождество имеет место для всех х, то оно остается таюке спра-
ОТНОСИТЕЛЬНЫЕ ИНВАРИАНТЫ И КОВАРИАНТЫ 95 ведливым при замене х на у. Но тогда х' переходит в у\ ибо х и у когредиентны, и потому 1(а{,а2',... ;ух'. ...,.ул') ==/(^,а2,... ;yv... ,уп), что и требовалось доказать. Три вышеприведенные примера инвариантов и ковариантов все представляют полиномы от коэфициентов форм и от координат точек. Такого рода инварианты будем называть целыми рациональными инвариантами и ковариантами 1. Теорема 5. Вес целого рационального инварианта не может быть отрицателен 2. Пусть аи а^ ...; Ьи ft2, ...; ... — коэфициенты форм в системе c^ — коэфициенты преобразования.,Коэфициенты at'f#2', ...; ft/, ft/, ...;... преобразованных форм являются, очевидно, полиномами от а, ft,... и с^ Пусть теперь / некоторый целый рациональный инвариант веса ja; / (а±', а{,...; Ъ£, b2\ ...;...) = с? I (аь a2t.^;bvb^...; ...), где с означает определитель преобразования. Если бы р. было отрицательным, например ja =— v, где v — положительно, то мы имели бы: сЧ(а{, я2', ...; bx', Ь2\ ...; ...) = /(^, *.,; Ьь ...; ...). Согласно данному выше доказательству, уравнение это имеет место для всех тех значений ct„ для которых с ф О- Но так как выражения в обеих частях уравнения (5) являются полиномами от a, ft,... и ctJ9 то на основании теоремы 5, § 2 заключаем, что уравнение будет тождеством. Положим теперь, что a, ft,... равны каким-либо постояным, так что I(ai9...; bv...; ...)ф0. Тогда /(a/,...; ft/,...; ...) будет полиномом от одних cij9 который на основании (5) не равен тождественно нулю. Тождество (5) утверждает, таким образом, что произведение двух полиномов от сгл постоянно- Но это невозможно, ибо первый из этих полиномов с* обладает степенью, большею нуля. Условимся теперь под именем инвариантов и ковариантов понимать только инварианты и коварианты по отношению ко всем неособенным линейным преобразованиям. Если придется иметь дело с инвариантами и ковариантами по отношению к Другим системам преобразований, например, по отношению к вещественным линейным преобразованиям, то это всегда будет явным образом оговорено. В заключение дадим геометрическое истолкование, связанное с упомянутыми в этом параграфе инвариантами и ковариантами, причем ограничимся случаем трёх переменных. Обращение в нуль результанта четырех линейных форм является необходимым и достаточным условием для того, 1 Все рациональные инварианты и коварианты могут быть представлены как: частные от деления цецых рациональных инвариантов и ковариантов. Ср. упражнения 4 и 5, § 78. 2 Он не может быть также равен нулю. Ср. теорему 5, § 79.
96 ИНВАРИАНТЫ. ОСНОВНЫЕ ПОНЯТИЯ И ПРИМЕРА чтобы четыре плоскости, получаемые от приравнивания нулю этих форм, проходили через одну точку. Равенство нулю коварианта теоремТа 3 является необходимым и доста-. точным условием для того, чтобы четыре точки лежали в одной плоскости. И, наконец, ковариант теоремы 4 тогда и только тогда равняется нулю, если точка (у^-У^Уг^Уд лежит на поверхности / = 0. Во всех этих случаях приходим поэтому к проективному свойству (ср. § 80, 81). 32. Некоторые теоремы о линейных формах Теорема 1. Две системы из п линейных форм от п переменных Sydym эквивалентны по отношению к неособенным линейным преобра- зотниям, если ни один из обоих результантов не равен нулю. Пусть две данные системы: ап хх + ... + аи хп ) *п1-Ч хг+...+ал ^обладают результантами' bilxl+...+ bln хп bnixt + ...+bn (И (¾ аы ип\ ' иП . ъ. и • Ьп тго предположению отличными от нуля. Преобразования ап xt + ... + а. ы xit = bnxl+.*.+ blnxn, 1 ^ппхп хп — ап1 х1 + • • • ~Ь апп хп> ) . хп — &Ш х1 + приводят обе системы к нормальному виду: » Так как ни а, ни Ь не равны нулю, то преобразования а и Ь\ обладают обратными преобразованиями, которые (3) переводят обратно соответ^ ственно в (1) и (2). Преобразование b~la приводит такш* образом (1)к(2). Теорема 2. Единственными целыми рациональными инвариантами системы п линейных форм от п переменных будут постоянные крат- ные степеней результанта 1. 1 Кроме того, система обладает арифметическим инвариантом, упомянутым в теореме 2, § 30.
НЕКОТОРЫЕ ТЕОРЕМЫ О ЛИНЕЙНЫХ ФОРМАХ 97 Пусть с будет определителем неособенного линейного преобразования, которое систему (1) с результантом л преобразует в следующую: <*u'-*i'+ ••• +аи'хп', \ Обозначая результант системы (4) через а\ имеем: а* эг ас. Если теперь /(alt,..., апп) — целый рациональный инвариант веса ja системы (1), то полагая имеем: Допустим теперь на время, что a =j= 0, и рассмотрим частный случай преобразования, приводящий (1) к (3). В этом частном случае а'=\9 следовательно, также ас = \. Обозначим через к постоянное частное значение, которое /' имеет в атом частном случае; тогда или /= kcP. (5) Это уравнение, в котором к не зависит от коэфициентов а^, получено, однако, для таких значений aijy для которых афО. Но так как по теореме 5, § 31 ja не может быть отрицательным, то отсюда мы можем заключить, что уравнение (5) является тождеством. Таким образом доказано, что / отличается от степени результанта только постоянным множителем. Следствие* Система т линейных форм от п переменных не имеет, кроме постоянных, никаких целых рациональных инвариантов, если т<^п. В самом деле, такой инвариант должен был бы быть также целым рациональным инвариантом системы п линейных форм, которую получим присоединением к данной системе п — т новых форм; поэтому инвв- риант этот должен бы быть постоянным кратным степени результанта этой новой системы. Степень эта имеет показателем нуль, и инвариант может быть только постоянным, ибо иначе он должен был бы заключать коэфициенты присоединенных форм и, следовательно, не мог4 бы быть инвариантом системы первоначальных форм. Упражнения 1. Две системы п + 1 линейных форм от п переменных, матрицы которых будут обе ранга п, являются тогда и только тогда эквивалентными по отношению к неособенным линейным преобразованиям, если все результанты любых п форм одной системы пропорциональны соответствующим результантам другой системы. 2. Обобщить предыдущую теорему. (« 7 Бохер. Введение в высшую алгебру
98 ИНВАРИАНТЫ. ОСНОВНЫЕ ПОНЯТИЯ И ПРИМЕРЫ & Всякий целый рациональный инвариант системы т линейных форм от п переменных (т > п) будет однородным полиномом от результантов каждых п и» этих форм. 4. Обобщить теоремы этого параграфа, а также три вышеприведенные упражнения, на случай, когда система линейных форм заменяется системой точек. 33. Двойное (ангармоническое) отношение. Гармоническое деление. Рассмотрим на прямой какие-либо четыре различные точки: (*1 '• *i), (*2: *2)t (xs: t3) (лг4: tk). (1) По теореме 3, §31, каждый из шести определителей х\?2 — Х2?Ь х1^$ — Х%^Ъ *А — xifb ХЪ*1 — х$%* %$2 '— -^2^4» «^2*3 — х%*% (2> будет ковариантом веса — 1. Частные от деления двух любых таких определителей являются, таким образом абсолютными ковариантами и по аналогии с абсолютным ковариантом, упомянутым в упражнении 1, § 28, можно было бы ожидать, что они имеют определенное геометрическое истолкование. Обстоятельство это, однако, не имеет места, в чем убеждаемся, замечая что частное меняет свою величину, если координаты точки умножить на один и тот же отличный от нуля множитель, от чего положение точки, как известно, не меняется. Образуют поэтому новый абсолютный ковариант четырех точек (1) *: (1 2 3 4) — l*i *2— х2 h) (хз h— xi *z) (х2 ^8— -*3 ^2) (xi *1— xl tl) » и называют его двойным (ангармоническим) отношением четырех точек 1, 2, 3, 4 (в указанной последовательности)2. Для того чтобы уяснить себе геометрический смысл двойного отношения четырех точек, предположим сперва, что четыре точки находятся на конечном расстоянии, так что t^t^t^ ф 0. Тогда двойное отношение (1, 2, 3, 4) можно представить в неоднородных координатах этих точек: (1,2,3, Ч-^-Х^-Х^ <*, Обозначая точки через Pv Р2, Р3, Р4, можем очевидно, также написать: (1,2, 3, V-psp2 \рърк -piPx \pkP% • W Получаем таким образом двойное отношение четырех точек, лежащих на конечном расстоянии, если образуем частное двух частных отношений, в которых вторая и четвертая точки подразделяют отрезок между первой и третьей точками. Можно также сказать, что отрезок между второй и четвертой точками подразделяется первой и третьей точками, и затем эти частные отношения снова делятся друг на друга. При этом 1 Изменение знака у второго множителя в знаменателе несущественно; его однако, делают по причине, которая в дальнейшем станет очевидной. 2 Если четыре точки взяты в другой последовательности, то получают другие двойные отношения; (1, 2, 4, 3), (1, 4, 3, 2) и т. д. Ср. упражнение 1.
двойное (ангармоническое) отношение, гармоническое деление 99 в качестве частного отношения, в котором точка С подразделяет отрезок АВ, была принята дробь AC/ВС, так что отношение будет отрицательно, если С лежит между А и В, и положительно, если отрезо:с подразделен внешним образом. При этом предположении можно теперь сказать, что бесконечно удаленная точка прямой, проходящей через А и В, разделяет отрезок АВ в отношении, равном -j- 1; ибо, действительно, чем более точка С удаляется по прямой, тем более приближается отношение к + 1. Тогда из формулы (3) следует, что первое определение (5) остается справедливым, если вторая или четвертая точка лежит в бесконечности; второе определение (5) сохраняет силу, если первая или третья точка удаляется в бесконечность. Таким образом получается во всех случаях простое геометрическое истолкование Двойного отношения четырех различных точек прямой линии. Особенно важен случай, когда четыре точки Ри Р.2, Р3, ^4 так Рас" положены, что (1, 2, 3, 4) = — 1. Тогда имеют место также соотношения: (1, 2, 3, 4) = (1, 4, 3, 2) = (3, 2, 1, 4) = (3, 4, 1, 2) = (2, 1,4,*3) = = (2, 3, 4, 1) = (4, 1, 2, 3) = (4, 3, 2, 1) = -1. Имеем таким образом соотношения между двумя парами точек Рх,Рг и Р2, Р4, взятых в любом порядке; тогда принято говорить, что эти 'две пары точек делят друг друга гармонически. Из геометрической интерпретации двойного отношения убеждаемся/ что если четыре точки находятся на конечном расстоянии, то пары Р1? Р3 и Р9У Р4 тогда и только тогда делят друг друга гармонически, если Р2 и Я4 делят РгР3 внутренним и внешним образом в одном и том же отношении, или, что приводит к тому же, если Pt и Р3 разделяют /\Я4 внутренним и внешним образом в том же самом отношении. Если Р2 или Р4 лежит в бесконечности, то имеет смысл только первая половина теоремы; если же на бесконечном расстоянии находится точка Pt пли Р„ то пользуемся только второй половиной теоремы. Если три из четырех точек, например Р1? Р2, Р3, совпадают, то конфигурацию этих четырех точек продолжакгг рассматривать как предельный случай предыдущего, причем обыкновенно продолжают говорить, что пары точек делят друг друга гармонически. Определение. Две пары точек Pt, Р3 и P^Pk делятся гармонически, если точки эти различны, причем их двойное отношение {Р1у Р2, Р3, Р4) = —1, а также если по меньшей мере три из этих точек совпадают. Свойство двух пар точек делить друг друга гармонически является проективным свойством в пространстве одного измерения. Наиболее важные приложения двойного отношения имеют место в геометрии двух, трех и большего числа измерений, где точки определяются не Двумя однородными координатами (или одной неоднородной координатой), но большим числом их. Если четыре различные точки Pv Р„. ^i> Q2 лежат на прямой в пространстве трех измерений, а координаты 7*
100 ИНВАРИАНТЫ. ОСНОВНЫЕ понятия И ПРИМЕРЫ ч точек Рр и Р2 будут соответственно (xx:yt: zx:tt) и (х^:у%:г%:^ то координаты точек Qx и Q2 могут быть представлены так: (*14- **2 • У\ + \Уг: *i + Ь2: f t + Щ, (хх + tura :^i + ИЛ : *i + № : *i + i^a). Пусть теперь Ax + By + Cz + Dt=Q (6) некоторая плоскость, проходящая через Qv но не через Ра, так что (Ахх + Вух + Czt + Dtx) + X (Л*2 + By2 + 0¾ + Dt2) = 0, откуда, так как Р2 не лежит в плоскости (6), имеем: Axx + Byl+Cz1+Dtx = __ х Лх2-4-Яу2+Сгг+Ь*2 В неоднородных координатах, напротив, получим: ЛХх + BYx-\-CZx + D__ _ Ц Если Pt^| и Р4М2 будут перпендикуляры из Рх и Р2 на плоо кость (6), то Pt Ot Pt Aft i4Xt + £Kt + CZt 4- D^ _Щ P2 Qt — Р2М2"~ ДХ2 + ЯК2 + CZ2 + D h * Таким же образом получим: Р2 Q2 *t * Поэтому PiQi . Pt О? X Р2 Ol ' '°2 Q* I» ' Но это есть двойное отношение четырех точек, взятых в последовательности Pt, Q,, Р2, Q2. Вышеприведенные рассуждения остаются по существу правильными, если Qx или Q2 лежит в бесконечности; двойное отношение и тогда тякже остается равным -. Если одна из точек Рх или Р2 лежит в бесконечности, то, написав координаты Qx и Q2 в виде: (Si: TQi: Ci: ^i) и (^:¾¾^ можем координаты точек Pt и Р2 представить соответственно так: ($1 — ^2 • Ч — ^2 ' Cl ~ ^2 : Ч — т2)« На основании ранее доказанного - будет тогда двойным отношением четырех точек, взятых а последовательности Q,, Р{, Qit Р2. Но это
двойное (ангармоническое) отношение, гармоническое деление 101 изменение последовательности не меняет двойного отношения, а потому во всех случаях имеем теорему: Теорема 1. Двойное отношение четырех различных точек Р\ (-ti^i^i^i). Р* (^3^2^2), Q2 (xt + *x2 :yt + jiy2 :Zi + \LZ2 : tx -+- jt/2), взятых в последовательности PXi Qv Pv Qif равно -. Отсюда непосредственно следует Теорема 2. Двойное отношение четырех точек прямой является инвариантом по отношению к неособенным кдллинеаииям про- странст&а 1. В самом деле, четыре точки Pv Р2, Qlt Q^ о которых шла речь в теореме 1, помощью неособенной коллинеащии преобразуются в следующие четыре точки: Л'(*1'"-Л':*!':'Л Р*'М'.У*".Ь':Ц). QiW + W : У{ + W •• *i' + W • V + Щ')> Q2 W + vxj: yt* + т' • *t" + №'' V + **Л причем двойное отношение этих точек, взятых в последовательности pi> Qt> pz'i Qs> таюке Равн0 "• Соответствующие теоремы имеют место для случая двух и вообще п измерений и точно так же могут быть доказаны. Упражнения 1. Если шесть определителей (2) обозначим следующим образом: (1,2), (1, 3),(1,4), (3,4), (4,2), (2,3) и кроме того, положим Л = (1,2)(3, 4), 5 = (1,3)(4,2), С = (1,4)(2,3), то из четырех точек, меняя порядок их последовательности, можно всегда подучить только шесть двойных отношений, равных отрицательным значениям шести отношений, которые можно образовать из А, В, С. 2. Установить справедливость соотношения А +В+С—0 и доказать, что если I является одним из двойных отношений, то остальные имеют значения: 3. Шесть двойных отношений четырех различных точек будут отличны друг от друга, за исключением только следующих двух случае— 1 Это следует также из упражнения 5, § 24.
102 ИНВАРИАНТЫ. ОСНОВНЫЕ ПОНЯТИЯ Н ПРИМЕРЫ <х) если четыре точки расположены гармонически; двойные отношения имеют тогда следующие значения: —1, 2, ~ ; (О если точки находятся в «эквиангармоническом» положении, тогда двойные отношения равны: ~ :£ -х V — 3, 4. Теорема 2, § 24 может быть доказана, пользуясь тем, что двойное отношение любых четырех точек на прямой не меняется при неособенном проективном преобразовании прямой. 5. Под двойным отношением четырех плоскостей, имеющих общую прямую, понимается двойное отношение четырех точек, в которых эти плоскости пересекаются с любой прямой линией, не встречающей общей линии пересечения этих плоскостей. Для оправдания этого определения надлежит доказать, что, если уравнения данных четырех плоскостей будут А=0, ^1 + ^2==0,^2 = ^^1 + ^2 = ° (Р\ и Рч — однородные линейные полиномы от х, j/, z, t), то двойное отношение четырех точек, в которых любая линия, не встречающая линии пересечения плоскостей, пересекает эти плоскости будет равна -. 6. .Двойное отношение четырех плоскостей, имеющих одну общую прямую, инвариантно по отношению к неособенным коллинеациям. 31. Плоскостные координаты. Коитраградиентныв переменные. Пусть uv #а, #8, ug постоянные, не все равные нулю; тогда уравнение "Л + «2*2 + «3*3 + «4*4 = ° (1) представляет плоскость, если xv х.2, xS9 хк будут однородными координатами точки в пространстве. Так как значения и определяют положение этой плоскости, то их можно рассматривать как координаты плоскости. Можно поэтому говорить как о точке (xt: х2 :хг: лг4), так и о плоскости {их: и^: иг: и4). Плоскостные координаты будут также однородны, так как умножение всех и на один и тот же отличный от нуля множитель оставляет положение плоскости без изменения. Предположим теперь х постоянными и будем рассматривать и как переменные, которые принимают значения, удовлетворяющие уравнению (1). Тогда уравнение (1) представляет бесчисленное множество плоскостей; все они проходят через определенную точку (xt: х% : х9: л;4), причем каждая плоскость определяется некоторой частной системой значений и. Уравнение (1) может быть поэтому рассматриваемо как уравнение точки в плоскостных координатах, ибо оно удовлетворяется координатами движущейся плоскости, которая «облекает» эту точку; так же точно, как при постоянных и и при переменных х уравнение это явится уравнением плоскости в координатах точки, ибо оно удовлетворяется корди- натами движущейся точки, пробегающей эту плоскость 1. Таким же образом однородные уравнения высшей степени от и удовлетворяются координатами движущейся плоскости, которая будет, вообще 1 Подобным же образом уравнение ^^+^2 + ^3^3 = 0 представляет в плоскости прямую линию в координатах точки (хх: х2: хг), если и постоянные, или точку в координатах прямой (щ: щ: и3). еслл х постоянные.
ПЛОСКОСТНЫЕ КООРДИНАТЫ. КОНТРАГРЕДИЕНТНЫЕ ПЕРЕМЕННЫЕ 103 говоря, огибать некоторую поверхность. Уравнение называется тогда уравнением этой поверхности в плоскостных координатах К Преобразуем теперь пространство помощью коллинеации с **' = СцХ\ + СцХ2 + cizxb + саХц (i = 1, 2, 3, 4) с определителем с, отличным от нуля. Если алгебраические дополнения элементов этого определителя обозначим через Cijy то преобразование, обратное с, может быть представлено так: <.-! Xi==^Xlf+^x^ + ^LXdt + ^iXi! (;=1,2,з,4). Подставляя это выражение в (1), приведем уравнение плоскости *с виду: ufxi' + н2'лг2' + й/лг3' = и4'лг4' =г 0, (2 где d ^=^ + ^ + ^ + ¾^ (,=:1,2,3,4). Таким образом и оказались также подвергнутыми линейному преобразованию (но отличному от преобразования над х)9 а именно преобразованию, матрица которого является сопряженной с С1 (определение 2, § 7). Это преобразование d в плоскостных координатах будет, однако, только другим выражением для коллинеации, которую мы до сих пор представляли помощью преобразования с в координатах точки. 05е системы переменных х и и называются контрагредиентными переменными. Определение 1. Две системы, каждая из п переменных, называются контраградиентными, если при неособенном линейном преобразовании одной из них другая испытывает преобразование, матрица которого является сопряженной с обратной матрицей первого преобразования. То же рассуждение, как и выше для случая четырех переменных, приводит к следующей теореме: Теорема. Если две системы контрагредиентных переменных jct,..., хп и uv , ип помощью линейного преобразования переходят в лг/,..., X,! и Hj',..., ип\ то выражение и1х1 + и2х2 + ... +ипхп преобразуется в «i'*i' +^2+...+"An'2- В связи с контрагредиентными переменными надлежит ввести понятие о контравар иантах так же точно, как были введены коварианты в связи с когредиентными переменными. 1 Пример дан в § 53. 2 Эта теорема принадлежит, собственно, к теории билинейных форм. Ср. следующую главу.
104 ИНВАРИАНТЫ. ОСНОВНЫЕ ПОНЯТИЯ И ПРИМЕРЫ Определение 2. При рассмотрении системы, состоящей из форм от (xv ..., хп) и из переменных (ut\ .... ип'), (и%", ..., ип"), контрагредиентных х, всякая рациональная функция от и и от коэфициентов форм называется контр авариантом веса ja, если при неособенном линейном преобразовании х функция эта умножается только на ja-/o степень (ja — целое число) определителя преобразования. Теорема о том, что результант п линейных форм от п переменных является инвариантом веса 1, может быть теперь выр^кена так: Если мы имеем п систем, каждая из п переменных (а/,..., ип'), ..., (»tWf .. .»aew), причем все они контрагредиентны переменным (^,..., хп), то определитель и будет контравариантом веса 11. Отсюда ясно, что введение понятия о контра вариантах, хотя часто бывает удобным, но не является необходимым, ибо контрагредиентные переменные могут быть всегда рассматриваемы как коэфициенты линейных форм; а тогда контраварианты явятся только инвариантами. То же имеет место для еще более общего понятия о смешанных конкомитантах (или промежуточных формах), в которые, кроме коэфициентов форм и контрагредиентных переменных, входят еще системы когредиентных переменных а; понятие это приводится к обычному понятию о ковариантах, если контрагредиентные переменные сновз рассматриваются как коэфициенты линейных форм. 36. Линейные координаты в пространстве. Прямая определяется двумя ее точками (ух :у%:у$:уА) и (zt:z2:z9:2k)9 но, очевидно, не все восемь координат необходимы для определения прямой. Можно легко убедиться, что шесть определителей />12» Р\%> PU* Ри> Р&> />23» где вполне определяют линию и могут быть поэтому использованы как линейные координаты. Другими словами, р можно считать определителями второго порядка матрицы II У\ У г УъУь II II z\ z2 ZZ zk V если не обращать внимания на знак определителя, полученного вычеркиванием первой и третьей вертикалей. Если точки у и z различны, то эти шесть р не все равны нулю. Они связаны соотношениями: PizPu + РпРм 4- PuPw = ° 3> (2) 1 Другие примеры контравариантов, в которые входят также коэфициенты, встретятся в XII главе. 2 Примерим для этого является выражение «1^+ и2х% -(-. ..+ипхп, причем вышеприведенная теорема утверждает, что это будет абсолютным смешанным* конкомитантом. * Ср. упражнение 2, § 33.
ЛИНЕЙНЫЕ КООРДИНАТЫ В ПРОСТРАНСТВЕ 10* в чем можно убедиться, разлагая равный нулю определитель Ух Уъ Уг У к Ч Ч Ч г\ У\ Уг Уъ Ух zi гг г3 zk по минорам второго порядка, образованным из первых двух горизонталей.. Из следующих двух теорем вытекает, что р действительно могут быть использованы, как линейные координаты. Теорема 1. Для всякой заданной прямой величины р.. определяются однозначно с точностью до одного одщего всем им отличного* от нуля произвольндго множителя. Все р могут быть умножены на произвольный отличный от нуля множитель: это следует из того, что при умножении координат у и z обеих точек, через которые проходит прямая, на произвольный отличный от нуля множитель не меняется положение этой прямой. Следует также еще показать, что р остаются друг другу пропорциональными, если от у и z перейдем к любым двум другим различным», точкам: * (Vt:Y2 У3:П), (^ : Z,: Z3: Z4), лежащим на прямой. Тогда Yi = схуь + c2zif Zt = kty>i + V* (/ = 1. 2, 3, 4, ), p.._| Yi Yi |_| *1 C2 I. I Л -V/ Г ^ ^-I Zt Z,|-| kx k2 I I Zi zj |-*A* где К ф ^э ибо Y и Z различны. Теорема 2. Дюбые шесть величин pip удовлетворяющие тождеству (2), но не равные все одновременно нулю, могут быть использованы как линейные координаты одной единственной прямой линии. Установим прежде всего, что они не могут быть координатами нескольких прямых. В самом деле, если они представляют прямую, то на ней могут быть взяты две различные точки у и 2, координаты которых удовлетворяют соотношениям (1). Предположим для определенности, что /?12 ф 0 *, и рассмотрим точку с координатами суу(-{-с^2.. Давая сх и £2 сперва значения —гх и yt и затем значения —z.2 и j>2, получим две точки: (0 •*Pi2'Р\г:Ри)> (P2i '0-P2Z:Ръ)> (3) где pt. = — ри по определению. Эти две точки различны, ибо для первой из них первая координата равна нулю, а вторая отлична от нуля У второй же точки, наоборот, первая координата отлична от нуля, но вторая равна нулю. Эти точки определяют поэтому положение прямой, л так как они заданы при помощи /?, то через р однозначно определяется также и прямая. 1 Доказательство изменяется только немного, если по крайнеЯ мере одна из* величин р . тличмз от нуля.
106 ИНВАРИАНТЫ. ОСНОВНЫЕ ПОНЯТИЯ И ПРИМЕРЫ Остается еще доказать, что любые шесть величин р^, не все равные нулю и удовлетворяющие уравнению (2), действительно определяют прямую. Предположим снова /?12 ф 0 * и рассмотрим обе точки (3), которые тогда являются различными. Прямая, ими определенная, имеет тогда линейные координаты: Рп> PnPiv Pi^u» —РтРи>—РиРм> PiiPg* PiAs- Четвертая координата, вследствие уравнения (2), равняется рпРи] и так как множитель /?12 может быть везде опущен, то получается действительно прямая, координатами которой будут данные р^. При систематическом построении геометрии пространства линейные координаты играют столь же важную роль, как координаты точек или плоскостные координаты. Алгебраические теории, свшнные с ними, рассматривают выражения, обладающие инвариантными свойствами и в которые эти линейные координаты входят так же, как координаты точек в коварианты и плоскостные координаты в контраварианты. Такого рода выражения могут быть рассматриваемы как обыкновенные коварианты, ибо линейные координаты являются только функциями координат двух точек. Полученные таким образом коварианты будут, однако, совсем особого рода, ибо координаты каждой из данных точек входят только в комбинации (1). Рассмотрим, например, четыре точки (** .'Л :*:'*) (/==1- 2' 3' 4>- Определитель этих шестнадцати координат будет (теорема 3, § 31) жовариантом веса — 1. Обозначим через рц и /?//' соответственно линейные координаты прямых, проходящих через две первые и две последние точки. Разлагая затем определитель четвертого порядка по минорам второго порядка двух первых горизонталей, получим: РпРг" + Ръ'Рп + PviPv" + Pis" Рш+ рф>ъ" + Ри'Рп- W Выражение это, содержащее только линейные координаты, обладает тогда свойством инвариантности. Обращение в нуль определителя четвертого порядка, из которого мы исходили, является условием для того, чтобы четыре точки лежали в одной плоскости. Поэтому обращение в нуль выражения (4) дает необходимое и достаточное условие того, что прямые р' и р" лежат в одной плоскости или1, что одно и то же, имеют одну общую точку. Упражнения 1. Доказать, что если координаты точек подвергнуты линейному преобразованию: х/ = cnxt + ci2v2 + с1Ъхъ + <гя*4 (/ = 1, 2, 3, 4), то линейные координаты преобразуются следующим образом: Pt/ = teity — ci<>cji)Pi2 + teity — ci3cji)Pi3 + teity — cucji)Pu + + testy — Cacp)Pu + (£»4ty — £*2ty)/>42 + (^2ty — ci3cj2)Pto- Ср. предыдущее примечание.
ЛИНЕЙНЫЕ КООРДИНАТЫ В ПРОСТРАНСТВЕ 107 2. Плоскость определяется точками: (zt: z2: zs: 24), (wt: w2: а>з : a/4). Доказать, что определители третьего порядка матрицы этих трех точек могут быть использованы как координаты этой плоскости, и что эти координаты могут отличаться только знаком от координат плоскости, определенных в § 34. 3. Прямая линия, определяемая двумя из ее точек, называется по П люк еру лучом, и в соответствии с этим вышеприведенные координаты называются лучевыми координатами; но если прямая определена пересечением двух плоскостей, то Плюкер называет ее осью. Пусть (щ : «з: щ: д4) и будут координатами обеих плоскостей, тогда шесть величин #12' QlP 4lk #34' 042» 4%V где Qi) = *i°} — Wit могут быть рассматриваемы как осевые координаты линии пересечения пло скостей. Доказать обе теоремы этого параграфа для осевых координат. 4. Доказать, что лучевые и осевые координаты существенно не отличаются лруг от друга. Для прямой qy, написанные в последовательности упражнения 3, пропорциональны р, взятым в последовательности:' Ры> Pl2> P%& Pl2* Pw Pli- 5. Точка определяется пересечением трех плоскостей (ах: иг: щ: и,), (vt: v2: v3 : vk), (Wi: w2: wB: wg). Определители третьего порядка матриц этих трех плоскостей могут быть рассматриваемы как координаты точки и будут отличаться от обыкновенных координат точки по большей мере только знаком. Доказать отсюда, что все коварианты могут быть рассматриваемы как инварианты.
Глава восьмая Билинейные Формы 86. Алгебраическая теория. Прежде чем перейти к изучению квадратичных форм, составляющему предмет' ближайших пяти глав, кратко рассмотрим один весьма частный вид квадратичных форм от 2я переменных, а именно так называемые билинейные формы, которые, как показывает само название, представляют естественный переход от линейных к квадратичным формам. Определение 1. Полином от 2п переменных (хи ....,хп), (yv..- J'tt) называется билинейной формой, если каждый из его членов будет первой степени как по отношению к х, так и по отношению к у. Общая билинейная форма для случая п = 3 имеет поэтому вид: 4- <ЧЛЛ +,в*ЛЛ + *»■***• Обозначая дня краткости эту форму так: з 1 имеем тогда в соответствии с этим обозначением для общей билинейной формы от 2л переменных такое выражение: п 1 причем матрица ип1 называется матрицей формы (1); равным образом ее определитель называется также определителем формы; ее ранг — рангом формы *. Билинейная форма называется тогда и только тогда особенной, когда ее определитель равен нулю. 1 Билинейная форма вполне определяется помощью ее матрицы; не окажется поэтому никакой неясности, если мы будем говорить о билинейной форме а. Если две билинейные формы имеют матрицы at и а^, то сумма их обладает матрицей at -f а2 Билинейная форма с матрицей а\а^ не является, однако, произведением двух форм (иногда называют ее символическим произведением).
АЛГЕБРАИЧЕСКАЯ ТЕОРИЯ 109 Билинейная форма (1) может быть получена так: берут систему п линейных форм от у с матрицей а, умножают эти формы соответственно на хи х,1у ..., хп и затем складывают. Но можно также, очевидно, исходить из системы п линейных форм от х, матрица которой будет сопряженной с а; формы эти умножить соответственно на уи у^ ..., уп и затем сложить. Останавливаясь на первом способе образования формы, подвергнем у линейному преобразованию с матрицей d\ билинейная форма преобразуется тогда в новую также билинейную форму с матрицей ad (теорема 1, § 31). Напротив, при втором сяособе, подвергая х линейному преобразованию с матрицей с, получаем новую билинейную форму, причем матрица, сопряженная с матрицей этой формы, будет а'С (значки сверху справа озвачают сопряженные матрицы), Матрица же самой формы будет тогда (по теореме б, § 22) с'а 1. Итак, имеем теорему: Теорема 1. Вели в билинейной форме (1) с матрицей а подвергнем х и у линейным преобразованиям соответственно с матрицами С и d, то получим новую билинейную форму с матрицей dad, где с' означает матрицу, сопряженную с с. Рассматривая теперь только определители матриц, получаем: Теорема 2. Определитель билинейной формы умножается на про- изведение определителей тех линейных преобразований, которым под- вергнуты х и у 2; Из теоремы 1 в соединении с теоремой 7, § 25 следует важный результат 3: Теорема 3. Ранг билинейной формы является инвариантом по отношению к неособенным линейным преобразованиям х и у. ■ Определение 2. Билинейная форма называется симметрической, если будет симметрической ее матрица {определение § 20). Теорема 4L. Симметрическая билинейная форма остается симметрической, если х и у преобразуется помощью одного и того же линейного преобразования. В самом -деле, если с — матрица этого преобразования, то по теореме 1" матрица билинейной формы, преобразованной из формы а, будет с'ас Так как а по предположению симметрическая матрица, то она будет своей собственной сопряженной, а потому, по теореме б, § 22, матрица С1 ас будет также самосопряженной; следовательно, преобразованная форма буает также симметрической. Упражнения 1. Две билинейные формы тогда и только тогда будут эквивалентны по отношению к неособенным линейным преобразованиям х и у, если они обладают одним н тем же рангом. 1 Эти результаты могут быть также легко установлены без помощи ранее доказанных теорем. 2 Эта теорема утверждает, что определитель билинейной формы является относительным инвариантом в обобщенном смысле. Такие инварианты форм от многих систем переменных называются также комбинантами. 3 Эта теорема может быть также получена из теоремы 2, § 30.
по БИЛИНЕЙНЫЕ ФОРМЫ 8. Билинейная Форма тогда и только тогда может быть разложена на произведение двух линейных множителей, если ее ранг равен нулю или единице. 3. Всякая билинейная форма ранга г может быть помощью неособенного линейного преобразования х и у приведена к нормальной форме *tVi + Х2У2 + • • • + xryr. 4. Останутся ли теоремы упражнений 1— 3 справедливыми, если ограничиться только вещественными билинейными формами и вещественными линейными преобразованиями? 5. Билинейная форма *ьУ1 + ЧУ 2 + • • • + *пУп тогда и только тогда не изменяется от линейных преобразований хну, если эти преобразования контрагредиентны. 37. Геометрические приложения. Рассмотрим билинейное уравнение з 1 где (х1:х^:ха) и (yt :у2 :у3) означают однородные координаты точки на плоскости. Пусть теперь у означает определенную точку Р, тогда линейное уравнение (1) с переменными х представит прямую линию р (единственное исключение будет иметь место, если коэфициенты этого линейного уравнения все равны нулю, что, однако, невозможно, если определитель билинейной формы отличен от нуля). Таким образом, если билинейная форма неособенная, то уравнение (1) устанавливает соответствие прямых плоскости точкам плоскости, причем каждой точке Р соответствует одна единственная прямая /?. Обратно, если Axx + Bx2 + Cxz = 0 (2у представляет прямую линию р плоскости, то существует одна и только одна точка Ру ей соответствующая в силу (1), при условии, однако, что билинейная форма (1) — неособенная. В самом деле, если Р имеет координатами 0^:^:^), то (1) будет уравнение прямой линии, ей соответствующей; необходимое и достаточное условие для того, чтобы эта прямая совпадала с (2), заключается в том, что <*1%У1 + а12У2 + а1гУз = tA> а2\.У\ + а22У2 + а2гУд = Р^' апУ\ + аз2У2 + амУъ = РС> где р означает отличную от нуля постоянную. Для данного значения р система этих уравнений обладает одним и только одним решением (Л 1У> -У$), иб° определитель а отличен от нуля. При изменении р все у умножаются на один и тот же множитель; но так как мы имеем дело с однородными координатами, то получаем только одну точку А Теорема. Неособенное билинейное уравнение (1) устанавливает взаимно однозначное соответствие между точками и прямыми плоскости.
ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ lit Такие геометрические свойства, определяемые билинейными уравнениями^ называют корреляциями. Упражнения 1. Исследовать особенные корреляции плоскости для случая, когда ранг билинейной формы равен 2 или 1. ~2. Исследовать билинейное уравнение для л = 4 при всевозможных предположениях относительно ранга формы. 3. Три или более прямых на плоскости встречаются тогда и только тогдя в одной точке, если точки, соответствующие им посредством неособенной корреляции, лежат, на одной прямой. 4. Двойное отношение любых четырех прямых, проходящих через одну точку* будет равно двойному отношению четырех точек, соответствующих этим прямым посредством неособенной корреляции. 5. Пусть точке Р плоскости посредством неособенной корреляции соответствует прямая р плоскости. Прямые, соответствующие посредством корреляции точкам р, тогда и Только тогда проходят через точку Р, если билинейная фирма, дающая корреляцию, будет симметрической. 6. Установить аналогичную теорему для точек и плоскостей в пространства трех измерений. Форма должна быть тогда симметрической или косой К * Корреляция, получаемая рассмотрением симметрической билинейной формы? дает место так называемой «полярности». Из формул ближайших глав действительно следует, что в этом случае каждой точке плоскости соответствует ее поляра по отношению к некоторому определенному коническому сечению, и каждой точке пространства — ее полярная плоскость по отношению к некоторой поверхности второго порядка. Косое билинейное уравнение дает в плоскости только одну весьма частную особенную корреляцию; в пространстве же, напротив,— одну в высшей степени важную, вообще говоря, неособенную корреляцию*, известную под именем нулевой системы. (Ср. какой-либо курс по линейной геометрии, где, однако, предмет обычно трактуется с другой точки зрения.)
Глава девятая квадратичные Формы; геометрическое введение 38. Поверхности второго порядка; касательные, касательные плоскости. Пользуясь однородными координатами (xt: хг: х3) всяко» коническое сечение (см. § 4) можно представить в следующей форме апХ^ + Я22*г2 + «33*32 + 2«12*1*2 + 2«13*1*3 + 2«23*2*з = 0. Подобным же образом в пространстве трех измерений общее уравне* иие поверхностей второго порядка будет таково; «n*i2 + «22*22 + «зз*з2 + «4i*42 + 2«i2*i*2 + 2апхххъ + Ча^^ + -j- 2^34.^3-^4 ~Г 2#42*4*2 "Т~ 2#23*2*3 :== 0* Уравнение, это может быть приведено к более симметрическому виду, если наряду с коэфициентами а12, а13, а14, а34, а1Ъ а23 ввести шесть других постоянных ап, azv #41, а43, я21, я32, определяемых уравнениями: aHz=aji' Тогда действительно можно уравнение поверхности второго порядка представить следующим образом апх^ + «12*1*2 + 013*1*3 + «14*1*4 + + «21*2 Ч + «22*22 + «23*2*3 + «24*2*4- + ~Ь «31*3*1 + «32*3*2 + «33*34 4" «24*3*4 + + «41*4*1 + «42*4*2 + «48*4*3 + «44*42 = ° «ли короче: 4 2«*-j*i*j = 0. (1) 1 Определение 1. Матрица а, шестнадцати величин расположенных таку как это имело место в последнем уравнении, называется матрицей поверхности второго порядка (1); определитель этой матрицы называется дискриминантом поверхности; ее ранг—рангом поверхности. Если дискриминант равен нулю, то поверхность второго порядка называется особенной. Во скольких точках встречает поверхность (1) прямая yz, соединяющая две различные точки ОТ'-Уа'-Л'-Л) и (zt '• z% ' ез: zifi Однородные координаты 'любой (отличной от у) точки этой прямой могут быть представлены так: (*i + Ъ>1: *2 + 1У%: Н + \Уш: Н + 1Уд-
ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 113 Чтобы эта точка лежала на поверхности (1), необходимо и достаточно выполнение условия: 4= 1 т. е. 4 4 * 2 *%*** ^+2х2^^ zi+Х2 2 ^л^в°- <2> 1 1 1 Но если точка .у не лежит на поверхности (1), то (2) является уравнением «второй степени от X, и каждому корню этого уравнения соответствует одна точка, в которой прямая пересекает поверхность. Таким образом прямая, проходящая через уу не лежащую на поверхности второго порядка, пересекает эту поверхность либо в двух различных точках, либо в одной единственной точке. С другой стороны, если у лежит на поверхности (1), то уравнение (2) приводится к уравнению первой степени при условии, что 2#.л/.г. ф 0. В этом случае прямая также встречает поверхность в двух и только в двух различных точках, а именно в точке j/ив точке, соответствующей корню уравнения первой степени (2). Если, наконец, то левая часть уравнения (2) — постоянная величина, и таким образом уравнение (2) не будет удовлетворено ни одним значением X или же всеми значениями X (именно, если также еще 2#^2, = 0). В первом случае поверхность имеет с прямой только одну общую точку у; во втором — прямая лежит вся на поверхности. Таким образом доказана теорема: Теорема 1. При пересечении поверхности второго порядка с прямой могут иметь место только следующие три случая: L Поверхность пересекается прямой в двух различных точках", прямая называется тогда секущей. 2. Прямая встречает поверхность только в одной единственной точке и называется тогда касательной 1. 3. Всякая точка прямой принадлежит также поверхности. Прямая называется тогда образующей. Исследуя сечение поверхности второго порядка y2 + z2—Zt = Q с координатными осями, убеждаемся в том, что все эти три случая действительно могут встретиться для одной и той же поверхности. Из доказательства, данного для теоремы 1, вытекает следующая теорема: 1 Мы будем различать истинные касательные и псевдокасательные; также бу- д^м часто говорить: поверхность второго порядка пересекается касательной в двух -совпадающих точках. 8 Бокер. Введение в высшею алгебру
114 КВАДРАТИЧНЫЕ ФОРМЫ*, ГЕОМЕТРИЧЕСКОЕ ВВЕДЕНИЕ Теорема 2. Если для некоторой определенной точки у поверхности (1) имеет место тождество: 4 2^ед=о\ (3) то всякая прямая, проходящая через у, является касательной или образующей поверхности; если же тождество (3) места не имеет, то всякая прямая, проходящая через у, будет касательной или образующей поверхности в том случае, когда она лежит в плоскости А 1 все остальные прямые, проходящие через у, будут секущими. Отсюда непосредственно получаем следующую важную теорему: Теорема 3. Если на поверхности (1) имеется точка у, для которой имеет место тоэюдество (3), то поверхность второго порядка будет конусом с двойной точкой (вершиной) в у; и обратно, если поверхность (1) будет конусом с вершиной в у, то имеет место тождество (3). Определенные 2. Плоскость называется касательной плоскостью к поверхности (1) в точке Р, если всякая прямая плоскости, проходящая через точку Р, является касательной или образующей. Если поверхность (1) будет конусом, то, согласно этому определению,, всякая плоскость, проходящая через двойную точку, будет касательной плоскостью; но среди этих плоскостей находятся такие, которые в геометрии не могли „ бы быть названы касательными плоскостями. (Соответствующее замечание имеет место и для ранее данного определения касательных.) Поэтому надлежит различать истинные касательные плоскости (истинные касательные) и псевдокасательные плоскости (псевдокасательные). Определение 3. Прямая (плоскость), касающаяся поверхности второго порядка в некоторой точке, которая не является двойной точкой, называется истинной касательной (истинной касательной плоскостью). Все остальные касательные (касательные плоскости) называются псевдокасательными (псевдокасательными плоскостями). Упражнения 1. Если Р будет точкой (которая, однако, не является двойной точкой) некоторой поверхности второго порядка F и р— касательной плоскостью в этой точк^, то имеет место один из следующих трех случаев: а) Две и только две прямые плоскости р будут образующими поверхности F. Прямые эти пересекаются в Р. б) Одна и только одна прямая плоскости р будет образующей и проходит через Р* в) Всякая прямая р является образующей поверхности F. 1 Вследствие а^ = а^ очевидно, также 2ацХ$У} =5 £д^ха
СОПРЯЖЕННЫЕ ТОЧКИ. ПОЛЯРНЫЕ ПЛОСКОСТИ 115 2. а) Если имеет место случай а) упражнения 1, то поверхность не будет конусом, и обратно, если поверхность не является конусом, то всегда имеет место случай а). б) В случае б) упражнения 1 плоскость р касается поверхности во всех точках образующей. в) В случае б) упражнения 1 поверхность F является конусом с одной и только одной двойной точкой, которая лежит на образующей. Обратно/ если F будет конусом только с одной двойной точкой, то всегда имеет место случай б). г) В случае в) упражнения 1 на плоскости р имеется прямая g, каждая точка которой будет вершиной (двойной точкой) F, причем других вершин у F тогда не имеется. F состоит тогда из двух плоскостей с осью g; одна из этих плоскостей будет р, другая же отлична от р. §9. Сопряженные точки. Полярные плоскости. Две точки обыкновенно называются сопряженными по отношению к поверхности второго порядка 4 ^atsxixj = 09 (1) 1 если прямая, их соединяющая, делится гармонически точками пересечения этой прямой с поверхностью. Чтобы включить все'предельные случаи, дадим следующее определение: Определение. Две различные точки называются сопряженными по отношению к поверхности (1), если а) прямая, их соединяющая, является касательной или секущей и делится гармонически точками пересечения этой прямой с поверхностью, б) прямая, их соединяющая, является образующей. Всякая точка поверхности называется самосопряженной, однако, две совпадающие точки лишь тогда называются друг с другом сопряженными, когда они принадлежат поверхности. Пусть координаты обеих точек будут (yt :у% :уъ :yg) и (г±: гг: zB : zg); предположим, что точки эти различны, не принадлежат поверхности, и. прямая, их соединяющая, является секущей. Тогда точки пересечения, прямой zy с поверхностью могут быть представлены следующим образом" (Ч + \V%: Ч + *Л: zz + \У, 'z* + W (' = 1. 2)> где \ и Х2 являются корнями уравнения (2), § 38. Для того чтобы данные точки делились гармонически этими двумя последними точками, необходимо и достаточно соблюдение условия: двойное отношение ^:1^ равно —1. Условие это может быть написано в виде Xt -j- Х2 = 0, или в силу уравнения (2), § 38: 4 2 *цУ1** = Ь (2) 1 Читателю предоставляется доказать, что во всех ^стальных случаях обе точки у и z будут, согласно нашему определению, тогда и только тогда сопряженными, если выполнено уравнение (2): 8*
116 КВАДРАТИЧНЫЕ ФОРМЫ; ГЕОМЕТРИЧЕСКОЕ ВВЕДЕНИЕ Теорема 1. Две точки у и z тогда и только тогда будут сопряженными по отношению к поверхности (1), если имеет место уравнение (2). £ Теперь можно тотчас же нанисать уравнение геометрического места всех точек х, которые являются сопряженными с некоторой определенной точкой у по отношению к поверхности (1): 2«у^^=0. (3) 1 Если левая часть этого уравнения не обращается тождественно в нуль, то точка х лежит на плоскости, а именно на так называемой полярной плоскости точки у. Как мы видели в последнем параграфе, левая часть (3) тождественно обращается в нуль, если цоверхность будет конусом с двойной точкой в у. Это будет притом единственным случаем, когда (3) имеет место тождественно; в самом деле, если у будет любой другой точкой поверхности, то уравнение (3) удовлетворяется только точками касательной плоскости; но если у не принадлежит поверхности, то левая часть (3) также не обращается тождественно в нуль, ибо она отлична от нуля при замене х на у. Теорема 2. Если поверхность (1) не является конусом, то каждая точка у имеет определенную полярную плоскость (3). Для конуса каждая точка, отличная от вершины, имеет определенную полярную плоскость*, для вершины уравнение (3) удовлетворяется тождественно. Так как коллинеация в пространстве преобразует, очевидно, две сопряженные точки снова в две точки, которые являются сопряженными по отношению к преобразованной поверхности, то свойство плоскости быть полярной плоскостью некоторой данной точки по отношению к поверхности втароро порядка будет проективным свойством. Теорема 8. Если полярная плоскость точки Pt проходит через точку Ръ то полярная плоскость точки Р% проходит через точку Р1т Справедливость этой теоремы вытекает из того, что Р± и Ра являются сопряженными точками. 40. Классификация поверхностей второго порядка в зависимости от ранга. Теорема 2 последнего параграфа может быть выражена также следующим образом. Необходимое ч достаточное условие для того, чтобы поверхность 1 была конусом с вершиной в точке (yt :у% :у3 :yg), таково: 4
КЛАССИФИКАЦИЯ ПОВЕРХНОСТЕЙ ВТОРОГО ПОРЯДКА Ц7 Тождество это эквивалентно четырем уравнениям: ЯЦ У\ + <*12 У 2 + «13 Уъ + Ч\ У1 = °> } ^21 ^1 + ^22^2 + ^23^3 + ¾ Л = °> К ^31^1 + ^32^2 + ^33^3 + ^34^4 = ¾ Г W аП У\ + й42 ^2 + ^43 -Уз + Hi У*. = °' ' Эта система уравнений обладает решением, отличным от (0, 0, 0, 0) тогда и только тогда, если равен нулю определитель, составленный из коэфициентов. Но определитель этот мы назвали дискриминантом поверхности. Поэтому имеем следующую теорему: Теорема 1. Поверхность второго порядка тогда и только тогда (%$ет конусом, если дискриминант ее равен нулю. Если ранг поверхности равен четырем, то поверхнош» поэтому не будет конусом. Если ранг равен трем, то система уравнений (3) обладает единственным решением (произвольный множитель,, на который у могут быть еще умножены, не имеет значения, ибо мы имеем дело с однородными координатами). В этом случае поверхность является так называемым обыкновенным конусом, т. е. конусом с одной единственной вершиной. Для поверхности с рангом два уравнения (3) обладают двумя линейно независимыми решениями, от которых линейно зависят все остальные (ср. § 18). В этом случае конус обладает прямой линией, каждая точка которой является вершиной (пара различных плоскостей). Для поверхности ранга один уравнения (3) имеют три линейно -независимых решения, от которых линейно зависят все остальные. Тогда имеется такая плоскость конуса, каждая точка которой будет вершиной (двойная плоскость). В случае ранга, равного нулю, строго говоря, мы не имеем поверхности второго порядка. Но можно, впрочем геометрическое место уравнений (1) рассматривать как конус, для которого каждая точка пространства будет вершиной. Свойство некоторой поверхности второго порядка быть конусом является очевидно, проективным свойством, равным образом как и свойство некоторой точки быть вершиной конуса. Можно поэтому высказать такую теорему: Теорема 2. Ранг поверхности второго порядка является инвариантом по отношению к неособенным коллинеациям. Упражнения 1. Определение. Если р будет полярной плоскостью точки Р по отношению к поверхности второго порядка, то Р называется полюсом плоскости р по отношению к поверхности. 1. Доказать, что по отношению к неособенной поверхности второго порядка каждая плоскость обладает одним единственным полюсом. 2. Если поверхность будет конусом, то плоскости, не проходящие через вершину, не обладают полюсом. Установить, что имеет место для плоскостей, приходящих через вершину. 41. Нормальные формы уравнения поверхности второго порядка. Так как двойное отношение является инвариантным по отношению к неособенным коллинеадиям, то поверхность второго порядка F> точка Р и ее полярная плоскость р по отношению к F помощью такой колли- неации преобразуются соответственно в F\ Р\ р\ где р' снова являемся
118 КВАДРАТИЧНЫЕ ФОРМЫ; ГЕОМЕТРИЧЕСКОЕ ВВЕДЕНИЕ полярной плоскостью Р1 по отношению к поверхности F'. Если точка (Уг'-Уъ'-Уъ'-Уъ) не лежит на поверхности 4 то она не может находиться в своей полярной плоскости, в чем убеждаемся, заменяя х через у в уравнении 4 1 Поэтому путем соответствующей коллинеации эту точку можем преобразовать в начало координат и ее полярную плоскость в бесконечно удаленную плоскость пространства *. Тогда для новой поверхности начало координат будет центром, ибо всякая хорда, проходящая через начало, делится им и бесконечно удаленной точкой гармонически. Уравнение полярной плоскости точки (у[*У2:Уг:У!к) по отношению к преобразованной поверхности I будет 4 1 причем это уравнение приводится к простой форме: aVLx\ + a2Lx2 + Дз4'*3 + aM*l = °» рккак (у[:Уг\Уъ'-У^) представляет координаты начала (0: 0: 0:1). Для того чтобы полученное уравнение представляло бесконечно удаленную плоскость, должны $ыть соблюдены еще условия: а потому ура вне н ;е преобразованной поверхности принимает следующий вид <hi'xi* + Ou'ti'xJ + arixi'xj -f- + ая!х2'х{ +¾^ + <*&xix'3 + + a^'xjxi' + л32' r8'*/ + Дзз^з'2 + + au'xp. Можно было бы преобразование выполнить так, чтобы точка {У\:Уъ1Уъ:Уд преобразовалась в бесконечнэ удаленную точку на оси хи 1 Имеется бесчисленное число коллинеации, ебладающих этим свойством, так как любые пять линейно независимых точек могут быть преобразованы соответственно в пять наперед заданных линейно независимых точек помощью одной единственной коллинеации. Ср. упражнения 2, 3, § 24.
НОРМАЛЬНЫЕ ФОРМЫ УРАВНЕНИЯ ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 119 а ее полярная плоскость — в плоскость дг2дг3. Тогда из членов, содержащих jCj, остается только член с х*. Подобным же образом можно, очевидно, освободиться от членов с х± или с дг3, оставляя только члены соответственно с дг22 или с дг32. Всякая поверхность второго порядка помощью коллинеаций может быть приведена к такой форме, что ее уравнение не содержит ни одного члена с xi9 кроме члена с л;Д коэфициент которого будет тогда отличен от нуля. Так как / может принимать значения 1, 2, 3, 4, то получается таким образом четыре различные «нормальные формы» для уравнения поверхности второго порядка. Так как каждая из них может быть еще получена помощью бесконечного числа коллинеаций, то является вопрос, нельзя ли выполнить одновременно все четыре приведения. Вообще говоря, это действительно возможно, как показывает следующее рассуждение. Пусть у — точка, не лежащая на поверхности, и z— точка полярной плоскости для точки у> которая также не должна принадлежать поверхности; ее полярная плоскость проходит тогда через у. Пусть теперь w — какая-либо точка прямой пересечения * этих двух полярных плоскостей, которая, однако, не лежит на поверхности; тогда полярная плоскость для w проходит через обе точки у и z. Три плоскости встречаются в одной точке и, которая не лежит в плоскости, проходящей через у, & и w. Тетраэдр uyzw называется тогда полярным тетраэдром поверхности, ибо каждая из его вершин является по отношению к поверхности полюсом противолежащей плоскости тетраэдра. Так как четыре точки yt z, wf и линейно независимы, то возможно путем коллинеаций преобразовать их соответственно в начало координат и бесконечно удаленные точки координатных осей. Таким образом мы достигнем того же, что и при вышеупомянутых отдельных преобразованиях, т. е. уравнение поверхности примет следующий вид: ап V2 + *22'*2'2 + язз'*з'2 + Ч№ = 0. Рассуждение это, однако, предполагает, что действительно существую^ такие точки уу z, wt которые удовлетворяют вышеуказанным условиям и не лежат на поверхности. Предоставляем читателю убедиться в том, что если поверхность не является конусом, то это всегда имеет место, причем эти точки могут быть получены бесчисленным множеством способов. Конус, напротив, не обладает никаким полярным тетраэдром, и для него поэтому сделанное выше приведение невыполнимо. Упражнения 1. Если дискриминант поверхности второго порядка равен нулю, то помощью соответствующей коллинеаций уравнение поверхности может быть приведено к форме, в которую не входит координата лг4. 2. Если конус обладает двойной точкой на конечном расстоянии, то коллинеаций, примененные в упражнении 1, могут быть представлены в следующей форме: *i' = *\ + *хь ,*s' = *8 + T*4. *4' = *f.
Глава десятая ' Квадратичные «гэрмы 42. Общая квадратичная форма и ее полярная форма. Общая квадратичная форма от п переменных имеет следующий вид: и ^ ац хь Xj s= ап xf + а12 х±х2+...+ аы xt хп 1 + Л21 х2 XY + «22 х22 + • • ' + а2п х2 хп I С*) где а.. = а~ *. Билинейная форма. 1 называется тогда полярной формой предыдущей формы (1). Подвергая форму (1) линейному преобразованию /x1 = cllxif+.»..+сыхп' Т* • * • "I спп хп » получим новую квадратичную фо|>му: Zj a*J Xi' */• (2) Преобразуя у и z в полярной форме для данной формы (1) помощью преобразования су получаем следующую билинейную форму: 2 ***.'*> Докажем, что а^ — ау. 1 Ограничение это является тольо уеэловным, но отнюдь не необхоодимым. Квадратичная форма не приобретет и,не потеряет ничего в своей обШности если мы опустим это требование
МАТРИЦА И ДИСКРИМИНАНТ КВАДРАТИЧНОЙ ФОРМЫ 121 Имеют место тождества: п п 1 п п 2 ачя zj ~ 2 *'*Уь' **' (4> 1 1 Каждое из них можно рассматривать как тождество по лг', у\ z\ так как х, у, z будут только сокращенными обозначениями для определенных полиномов от х\ У, z\ Полагая у/ == zl = х[ (/=1, 2, ..., п)> приведем тождество (4) к виду: 2^ йц х% Xj га 2^ atj *i xj. l l .... Пользуясь (3), получаем тогда: , п п 2 ац xi х/ з ^ aij'x/ х/. г 1 Следовательно, ан=^ан' и а^ + а^ = atj + ^/- Но так как а^'=ау/ (как коэфициенты некоторой квадратичной формы), и по теореме 4, § 36 имеем atj = а^ то отсюда заключаем, что ач=ач\ Таким образом из (4) непосредственно следует: п п 1 1 п Теорема» Полярная форма V а*Лг,- является абсолютным кова- 1 п риантом системы, состоящей из квадратичной формы ^ДцХгх, и 1 двух точек (yv .. ., уп) и (zv . .., zn). 43. Матрица и дискриминант квадратичной формы. Определение. Матрица ап • • •аы jj ^»t • • • апп называется матрицей квадратичной формы 2d %xixj
122 КВАДРАТИЧНЫЕ ФОРМЫ Определитель матрицы а называется дискриминантом формы; ранг а — рангом квадратичной формы. Если дискриминант равен нулю, то форма называется особенной. Матрица квадратичной формы будет также матрицей ее полярной формы. Если, как в последнем параграфе, х в (1) подвергнуты линейному преобразованию, причем таким же образом преобразованы у и z в полярной форме для формы (1), то матрица новой квадратичной формы будет также матрицей новой билинейной формы. На основании теоремы 1, § 36 нам известно, каким образом меняется матрица билинейной формы при линейном преобразовании переменных; поэтому из сказанного вытекает: Теорема 1. Если переменные квадратичной формы (1) с матрицей а подвергнем линейному преобразованию с матрицей с, то получим новую квадратичную форму с матрицей с'ас, где cf означает матрицу, сопряженную с с. Так же как и в § 36 получим отсюда: Теорема 2. Ранг квадратичной формы является инвариантом по отношению к неособенному линейному преобразовйнию. Теорема 3. Дискриминант квадратичной формы явлкется относительным инвариантом с весом 2. 44. Двойные точки квадратичных форм. Определение. Двойной точкой (вершиной) квадратичной формы п 1 называется такая точка (cv с*,..., tn), для которой не все с равны нулю, причем имеет место тождество: п 1 Квадратичная форма, очевидно, обращается в нуль во всех своих двойных точках. Определение это может быть выражено также еще следующим образом: Теорема 1. Точка {cv с%,... ,сп) тогда и только тогда будет двойной точкой формы (1), если ее координаты с являются решением (со* стоящим не из одних только нулей) системы уравнений: аи ci +• • •+ аы сп = 0» \ ............ г №
ДВОЙНЫЕ ТОЧКИ КВАДРАТИЧНЫХ ФОРМ 123 Так как определитель этой системы уравнений равен дискриминанту (1), то имеем: Теорема 2. Квадратичная форма тогда и только тогда обладает двойной точкойу если ее дискриминант равен нулю. Если г будещ рангом квадратичной формы, то существуют п — г независимых двойных точек\ каждая точка, линейно от них зависящая, является тогда также двойной точкой. В частности заметим, что если дискриминант квадратичной формы равен нулю, то точка (AiV Аа..., Ain) является двойной точкой при условии, что не все А равны нулю. При этом через Atj, как это обычно принято, обозначаем все алгебраические дополнения отдельных элементов дискриминанта. Особое значение имеет следующее тождество [ср. (21), § 38]: п п п я 2 (hi i*t + Ы) (Zj + Щ) га 2*У Zi zi + 2 Х 2 аЧ Zl yi + Х* 2 ***У*У*' (4) 1 111 Соотношение (4) может быть рассматриваемо как тождество по отношению ко всем буквам, в него входящим. Если только (cv <?2, ..., £п) п является двойной точкой квадратичной формы J^aijxixj> то два послед 1 ние члена в правой части (4) при замене у нг с равны нулю, а потому имеем: и я 2 av (^+icJ (*j+х^) — 2 a'j Zt Zj' (5) i i Обратно, если имеет место тождество (5), то (cv с2, , сп) является двойной точкой, если не все с равны нулю. В самом деле, заменяя в (4) у на с и вычитая отсюда (5), получаем: п п 2*2^**^+Х22^^~0' 1 1 что представляет тождество как относительно X, так и относительно z поэтому что и доказывает следующую теорему: Теорема 3. Точка (сх, £2, ..., сп) тогда и только тогда является двойной точкой квадратичной формы (1), если не все с равны нулю, и как для \, так и для zv ..., zn имеет место тождество (5).
124 КВАДРАТИЧНЫЕ ФОРМЫ Упражнения 1. Если (cit с2, ..., сп) будет двойной точкой формы (1), которая обращается в нуль в точке (yit у2)>.. .,ynt то форма обращается в нуль также во всякой точке, линейно зависящей от с и у. 2. Формулировать и доказать обратное. 45. Приведение квадратичной формы в сумме квадратов* Если в квадратичной форме п Ф (хь..., хп) ===2 <hj*i *j (1) i коэфициент аи отличен от нуля, то форму можно упростить помощью преобразования, данного еще Лагранжем. Разность Ф (хи..., хп) — — (anxt +...+ ain дгп)8 не зависит от xv в чем легко убедиться непосредственным вычисление!. Обозначая ее через Ф1> имеем, следовательно: Ф == J- (ап ^ + ...+ ашхп? + Ф* 9-и Путем неособенного преобразования х^ = aiixi + ai2x2+- - -+ аыхп х2 = х2 х? 1 } (2 ) хп дадим квадратичной форме Ф вид: где х{ входит только в выражение первого члена. Вообще говоря, приведение это может быть выполнено различными путями; только тогда, если коэфициенты всех членов с квадратами переменных в первоначальной форме равны нулю, вышеуказанный прием приведения теряет силу. Если в новой квадратичной форме Ф± не все члены с квадратами переменных обладают коэфициентами равными нулю, то тем же приемов можно совершить дальнейшее приведение этой формы, подвергая пере** менные х%9..., хн' соответствующему неособенному линейному преоб* разованию. Преобразование это может быть рассматриваемо также, как неособенное линейное преобразование всех х\ если положим лг/'^лг/. Таким образом форма (3) приведется к виду: Г ^"2 + 7Г *2"2 + Ф2 ix*"> -'" х^ (4) aii Cljj 1 Эта строка отпадает, если /asl.
ПРИВЕДЕНИЕ КВАДРАТИЧНОЙ ФОРМЫ К СУММЕ КВАДРАТОВ 125 К Ф2 может быть применен тот же прием; следовательно, помощью некоторого числа последовательных неособенных линейных преобразований форма Ф может быть окончательно преведена к следующему виду: ^Л2 + '2*22 + • • • + Сп*п*. (б) Эти друг за другом следующие преобразование могут быть, очевидно, заменены одним единственным неособенным линейным преобразованием, а потому имеет место теорема: Теорема. Всякая квадратичная форма от п переменных может быть приведена к форме (5) помощью неособенного линейного преобразования. Теорема эта, однако, еще не доказана вполне; а именно, если, совершая это приведение, встретимся с такой квадратичной формой Фр которая не содержит ни одного члена с квадратами переменных, то даль- «ейшее приведение не может быть совершено. Превде чем приступить к рассмотрению этого случая, дадим сперва численный пример, освещающий все ранее сказанное: Пример. Фхз | +*2*i— Зж22 + 9лг2дг32 \^Т(2хх + х2 + Вх9)^ + Фи где Ф13-^<лг2 + 8*3)2 — а*#+ ia*fc*8 +2*^=3 7 ез — Y *22 + 5*2*3 + Ьх*х2 --З^з2 еев 2/7 , . \« 160 9 s — у ( — yx2 + Sxs) —~j-xi- Таким образом помощью неособенного линейного преобразования х1'=2х1 + Хъ + 8х9 \ xj = — у .¾ + 5х3 > х% == хъ / форма Ф приводится к виду: . 1,2,, 180 ,2 ~2ХП —"у"^4--*^" 3 Здесь выполнено было только одно приведение, хотя, как это следует из предыдущего, были возможны три приведения, именно, после пепвого тяга еше два.
126 КВАДРАТИЧНЫЕ ФОРМЫ Дополним теперь доказательство нашей теоремы. Итак, предположим, что коэфициенты всех членов с квадратами переменных в Ф равны нулю *, но ап ф 0. Тогда Ф {хь ..., хп) ss 2ап хх х2 + 2хг (ап хг +... + аы лгЛ) + я з 2 == — (я12 х2+...+ alnxn) (a2lxt +...+ а2п хп) + Ф^ "12 ч где Ф1^ —— (^1^8+--+ *!»■*») (^23*3 + . • •+ Д2п-*л) + 2 ^J** "*> й12 Поэтому неособенное линейное преобразование х\ = ctvl х2 + ^13 -^з + • • • + аы хп х{ = a21xt + а2Ъхъ + ... + а2пхп дг3 = Л?з у» ' — приводит форму Ф к виду: 2 Помощью следующего неособенного линейного преобразования *з" = X " = 1 1 J эта последняя квадратичная форма переходит в Мы предполагали, что а12 отлично от нуля. Если бы а12 = 0, но а^ Ф 0, то достаточно было бы в вышеуказанном приведении только иначе перенумеровать указатели. Единственный случай^ когда приведение делается невозможным (но также и ненужным) будет тот, когда все коэфициенты квадратичной формы равны нулю. Таким образом мы убеждаемся, что когда приведение Лагранжа не имеет места, то можно применить вышеуказанный метод; это и доказывает окончательно теорему. 1 Развитый ниже метод может быть применен также, если только да = а22 = О, независимо от того, будут ли остальные коэфициенты аи равны нулю или нет.
НОРМАЛЬНАЯ ФОРМА. ЭКВИВАЛЕНТНОСТЬ КВАДРАТИЧНЫ! ФОРМ 127 Упражнения 1. Квадратичную форму от пяти переменных, для которой atj-=\i—j\f привести к виду (5). 2. Привести к виду (5) квадратичную форму: 9*2 — 6У2 — 8*2 + бху — 14xz + ISxw + Syz + Ylyw — 4zw. 3. Если (yly у2, ..., yn) будет точка, для которой данная квадратичная форма не обращается в нуль, то может быть всегда найдено (и притом бесчисленным; множеством способов) такое линейное преобразование, которое точку у преобразует в (0, 0, ..., 1) и полярную форму Ъацугг^ в kzn. Преобразование это исключает из квадратичной формы все члены, содержащие хп, кроме члена с xn2t коэфициент которого отличен от нуля. 4. Преобразования упражнения 3 являются единственными, обладающими вышеуказанным свойством. ' 5. Установить непосредственно, что оба метода приведения этого параграфа являются частными случаями преобразования упражнения 3. 46« Нормальная форма. Эквивалентность квадратичных форм. При выполнении приведения, указанного в предыдущем параграфе, может случиться, например, что мы придем к следующему выражению:. где форма Фк тождественно обращается в нуль. Тогда дальнейшее приведение не нужно, и в уравнении (5) последнего параграфа с1&1 = = cfc+2 = ... = сп = О, в tq время как все предшествующие с отличны от нуля. Для того чтобы увидеть когда подобный случай может иметь- место, рассмотрим матрицу ct О О с2 . О .0 00...¾ приведенной.формы (5), §45. Ранг этой матрицы, очевидно, в точности равняется числу отличных от нуля с. Но ранг преобразованной матрицы будет тот же, чтс» и первоначальной, а потому имеет место теорема: Теорема 1. Квадратичная форма тогда и только тогда может бить приведена неособенным линейным преобразованием к виду C\X$-\- ... -\-сгхг2 (где все с отличны от нуля), когда она обладает рангом г. Величина г коэфициентов cv ..., сг (за исключением того требования, что они должны быть отличны от нуля) несущественна, в чем мы непосредственно убеждаемся, применяя к форме (1) преобразование: xt = vf*.' , А. ■ v У сг ~г (' хг+1 — Хг+1 (2). •** — Х71
128 КВАДРАТИЧНЫЕ ФОРМЫ где Aj, ...,£п—совершенно произвольные величины, все отличные, однако,' от нуля. Преобразование это будет тогда неособенным и приводит форму (1) к виду: *Л'2 + .-.+ krXr% (3) Теорема 2. Всякая квадратичная форма ранга г помощью не- особенного линейного преобразования может быть приведена к виду (3), где k — совершенно произвольные наперед заданные величины, все отличные однако, от нуля. Полагая все k равными единице, получим следующую теорему: Теорема 3. Всякая квадратичная форма ранга г помощью неособенного линейного преобразования может быть приведена к нормальной форме: Xf+...+Х,*. (4) Отсюда далее следует Теорема 4. Две квадратичные формы тогда и то^ко тогда будут эквивалентны по отношению к неособенным линейном преобразованиям^ когда формы эти обладают одним и тем же рангом. Необходимость этого условия следует из того, что рамс являемся инвариантом. Условие это будет также и достаточным, иЙ6 каждая из обеих форм может быть преобразована к виду (4). Нормальная форма (4), кроме своей симметрии, не имеет никаких существенных преимуществ перед другими любыми формами, получаемыми из (3) при различных частных значениях постоянных. Так, например, вместо (4) можно было бы образовать так же нормальную форму: которая с геометрической точки зрения обладает тем преимуществом, что дает место геометрическому образу, заключающему бесчисленное множество вещественных точек. В заключение заметим еще, что преобразования, которыми мы пользовались в этом параграфе, не необходимо являться вещественными, есля мы ограничимся вещественными формами. Упражнение Применить результаты этого параграфа к изучению поверхностей второго порядка. 47. Приводимые формы. Квадратичная форма называется приводимой, если она тождественно равна произведению двух линейных форм, т. е. если п 2 аи xt xj ===:(b1x1 + b2x2-\-... + bn xn) (cLxt + c2x2 4- ... + cnxn). (1). * 1 Отыщем теперь необходимое и достаточное условие для этого. Допустим прежде всего, что тождество (I) имеет месгЪ, и рассмотрим
ПРИВОДИМЫЕ ФОРМЫ 129* последовательно случаи, сперва, когда оба множителя правой части линейно независимы, и затем, когда они пропорциональны. 1. В первом случае Ь и с не являются все друг другу пропорциональными; соответствующей заменой указателей можно всегда достигнуть того, чтобы Ьи &2 не были пропорциональны си сг Тогда преобразование xx' = blxi + b2x2 -t-.. Х2 = С\ Xi -f- с2 х2 -f- . •'Л-Ьл хп } } \ Хп Хп ) будет неособенным и приводит нашу квадратичную форму к виду: Так как матрица этой формы обладает рангом 2, то и первоначала ная форма будет также ранга 2. 2. Пусть теперь в тождестве (1) оба множителя в правой части пт>о* порциональны; тогда, очевидно: я ^iaijXixj^C(btxL+..^bnxn)^ где СфО. Если только не все Ъ равны нулю (в этом случае ранг квадратичной формы был бы равен нулю), то, не нарушая общности, можно положить, Ьх ф 0, так что линейное преобразование *t'=A*i+ ... + *«■*« ) Х2'= X2v | будет неособенным, и преобразует квадратичную форму в Сх&\ причем, эта форма обладает рангом, равным единице. Таким образом доказано, что приводимая квадратичная форма обладает рангом, равным одному из чисел 0, 1, 2. Докажем теперь, что всякая квадратичная форма, ранг которой равен одному из этих чисел, будет приводимой. Форма ранга нуль, очевидно, приводима. Форма ранга 1 помощью неособенного линейного преобразовании *'ожет быть приведена (теорема 3 § 46) к виду: п Заменяя здесь xt' через ху убеждаемся, что форма приводима. 9 Б о х е р. Введение в высшую алгебру
ISO КВАДРАТИЧНЫЕ ФОРМЫ Форма ранга 2 может быть приведена к виду: я 2 а„ X, Xj =5х±* + xj*= (х{ + V~l х2>) (x,f - V=l х{). 1 Заменяя здесь снова х/ и л:2' через дг, убеждаемся в приводимости формы. Теорема. Квадратичная форма тогда и только тогда будет приводима, если ранг ее меньше или равен 2. 48. Целые рациональные инварианты квадратичной формы. Дискриминант а квадратичной формы будет (теорема 3 § 43) инвариантом веса 2. Всякая степень а с показателем, равным целому числу, будет, следовательно, тоже инвариантом, равно как и всякое произведение такой степени на постоянную. Докажем теперь обратную теорему: Теорема. Всякий целый рациональный инвариант квадратичной формы отличается только постоянным множителем от степени дискриминанта. Начнем с рассмотрения того случая, когда квадратичная форма п 1 будет неособенной; обозначим через с определитель линейного преобразования, приводящего форму (1) к виду: *l/2 + *2'2+...+ *„'2. (2) Пусть теперь 1(4Ш ..., апп) будет целым рациональным инвариантом веса ji формы (1), который, будучи образован для формы (2), принимает значение k; ясно, что k должно быть постоянной, т. е. не должно зависеть от коэфициентов atj формы (1), и Так как дискриминант а имеет вес 2 и для формы (2) принимает значение, равное единице, то 1 = с*а. Возвышая в степени, получаем два уравнения: откуда следует: Уравнение это имеет место для всех тех систем значений коэфициен- тов a€j для которых а ф 0; из теоремы 5 § 2 следует, что уравнение это имеет место также и для а = 0, т. е. представляет собою тождество относительно ai4. Второй множитель правой части (3) будет, оче-
ДРУГОЙ ПРИЕМ ПРИВЕДЕНИЯ КВАДРАТИЧНОЙ ФОРМЫ К СУММЕ КВАДРАТОВ 131 видно, степени ji по отношению к апг. Следовательно, ji должно быть четным числом, ибо степень /а также есть четное число. Положим поэтому р. = 2у, из упражнения 1 § 2 получаем тогда, что имеет место одно из следующих двух тождеств: В обоих случаях наша теорема доказана. Сравнение этого результата с теоремой 4, § 46 делает особенно ясным упомянутое в § 29 различие между обоими понятиями о полной системе инвариантов. В соответствии с определением 2, § 28 ранг квадратичной формы будет полной инвариантной системой, и в силу следствия, выведенного в подстрочном примечании к этому определению, дискриминант является полной инвариантной системой. 49. Другой прием приведения квадратичной формы к сумме квадратов. Кроме приведения квадратичной формы к сумме квадратов по методу Лагранжа существуют еще и другие пути для достижения той же цели, из которых мы изложим здесь еще один, в высшей сте* пени полезный. Метод этот основывается на трех теоремах. Доказательство первой теоремы, данное Кронекером, устанавливает в высшей степени простым путем, что квадратичная форма ранга г может быть представлена с помощью только г переменны^, как это было уже доказано другим путем (теорема 1, § 46)« Теорема 1. Если ранг г квадратичной формы п Ф (хи ..., дги)== 2<tyXt Xj (Ц 1 будет более нуля, и указатели переменных xv ..., хп так расположены, что определитель r-го порядка в левом верхнем углу матрицы отличен от нуля 2, то помощью неособенного линейного преобразований можно ввести новые переменные л;/, ..., хн' таку что х>~хг (* = г+ 1,...,, п), причем форма (1) переходит в i п \ 2jatjxi'x/- Коэфициенты этой новой квадратичной формы имеют, следовательно, те же значения, что и в первоначальной форме. Пользуясь уравнениями (3), § 44, найдем прежде всего двойную точку (сп • • •, О формы О)- Так как определитель г-го порядка в левом верхнем углу матрицы отличен от нуля, то величины £rfl,..., сп могут быть взяты произвольно, 1 При этом везде принято k ф 0; теорема наша, однако, очевидно, имеет мест© также и для k = 0. 2 Возможность подобного расположения указателей следует из теоремы 3, § 20.
132 КВАДРАТИЧНЫЕ Ф0РЫЫ 'и уже по ним вполне определяются остальные ' ¢. Полагая ^1=* .= cr+2 = ... = cn_t = 0, £п=1, получаем двойную точку (ch ...,сг, О, ..., О, 1). Применяя к ней тождество (5), § 44, имеем: Ф (xt-\-lcv ..., xr + lc„ xr+h ..., xn_v лгм + Х)==Ф (xlt ..., хя). Полагая здесь Х = — хпУ получим следующее тождество: Ф (хг — с±хп,..., хг — crxny xr+h ..., хп_ь 0)г Ф (^, ..., дтп). Таким образом помощью неособенного линейного преобразования1 *<' = *< —***n (/=-1,-.., /"), *;'==*, (/ = /• +1,..., л) форма (1) переходит в 1 Но так как это представляет собою квадратичную форму ранга г от п — 1 переменных, для которой левый верхний определитель матрицы отличен от нуля, то форма эта, согласно только что изложенному приему f приводится к виду: п-2 1 Примененное при этом линейное преобразование будет неособенным, причем имеет место уравнение **" = ■*/ (i = r+l, ...,/1-1). Присоединяя к этому еще уравнение хп" = хп\ получаем преобразование от п переменных, которое будет также неособенным. Слагая это преобразование с предыдущим, получаем неособенное результирующее преобразование, для которого х" = *i (i = r+h •••> я). Помощью этого преобразования форма (1) переходит тогда в п-2 . 2^ aij xi xf- 1 Идя тем же путем далее и повторяй эти рассуждения, убеждаемся в справедливости теоремы. В двух следующих теоремах Л^у как всегда, обозначает алгебраическое дополнение элемента atj в дискриминанте а квадратичной формы (1). * Ср. упражнение 2, § 41.
ДРУГОЙ ПРИЕМ ПРИВЕДЕНИЯ КВАДРАТИЧНОЙ ФОРМЫ К СУММЕ КВАДРАТОВ 133 феорема 2. Если Аьп ф 0, то помощью неособенного линейного преобразования можно ввести новые переменные */,.„., хп' щак, что хп = хп> пг)ччен форма (1) переходит в «-1 1 Дискриминант квадратичной формы п равен 4i Ы ап-М • • • ап-1,п-1 ап-1,п ani ап,п-\ апп А = а-*Апп-Г-=0. Помощью неособенного линейного преобразования того же рода, как в предыдущей теореме (особенно важно, что xj — xn), получим' я-1 кь Xj Л хп-х=х у aij Xi Xj, l i n n—l 2*"*'- У, atj xt xj = 2 <*ij xi x/ + -£- xn* ж*ш лют гь. МЛ 1 1 Теорема 3. Если имеют место соотношения: то помощью неособенного линейного преобразования можно ввести такие новые переменные л:/,..., хп\ что хп-1 ==: хп-1, хп == ХП> причем форма (1) переходит в V 2а aij xi xj = ~л хп хп-\ Обозначим через В определитель, получаемый из а вычеркиаанчем °feu последних горизонталей и вертикалей. Тогда (следствие 3, § 11): aB=z ^*л,п-1 <*пп \— — А. m-i4* *4>
134 1СВАЯРАТЙЧНЫЁ ФОРМЫ Рассмотрим теперь квадратичную форму: п 2а 2^aijxixj- n.n—l ' Хп ЛГл—1» т Ее дискриминант ап ... л1|Я-1 3«—1,1 • • • ^w-l.w-l ап-1,п д ПуП—1 • <2« ™_1 ' ■ и,и-1 — А й А й т>( а V - Лй,й-1 л»,л-1 V^Tt^-l / равняется нулю, в чем мы убеждаемся помощью (2). Оба его главные минора, получаемые вычеркиванием последней горизонтали и последней вертикали или предпоследних горизонтали и вертикали, также равны нулю, ибо они соответственно равны Апп и А^_х v Вычеркивая, однако, обе последние горизонтали и вертикали одновременно, получаем определитель, равный /?, а потому, в силу (2), отличный от нуля. Следовательно (теорема 1, § 20), определитель (4) обладает рангом п — 2. Пользуясь теоремой 1, можно поэтому форму (3) помощью неособенного линейного преобразования, для которого Хп_\ — X, п-1» лп представить в виде: > atj xt Xj 2 хп хп-\ = Zu а^ Xi' Xi'' отсюда следует: м-2 2а /j aij хъ xj = ^j aij xi Xj » A Xn Xn-l - nji-1 tsie&cmeue. При условии теоремы 3 можно квадратичную форму (1) помощью неособенного линейного преобразования представить в виде: 2и aij Xi Xj" ' 2а Лп,п—\ (4'-12-*«"2). Для того чтобы убедиться в этом, достаточно совершить сперва приведение теоремы 3 и затем следующее неособенное преобразование:
ДРУГОЙ ПРИЕМ ПРИВЕДЕНИЯ КВАДРАТИЧНОЙ ФОРМЫ К СУММЕ КВАДРАТОВ 135 [xi =хГ I -V-i' = *-i"-хл" (/=1,2, .... л-2). ^ Эти три теоремы дают метод представления квадратичной формы в виде суммы квадратов. Если форма (1) является особенной, то, применяя теорему 1, приводим форму к виду: 1 причем г означает ранг формы. Если не все главные миноры (г—1)-го порядка в дискриминанте формы равны нулю, то можно расположить указатели переменных xv ..., хг так, что приведение, данное в теореме 2t делается возможным. Линейное преобразование, о котором идет речь, может быть тогда рассматриваемо как преобразование всех п переменных, и не является особенным. Но если все главные миноры (г—1)-го порядка равны нулю, то среди алгебраических дополнений элементов имеется по крайней мере один, отличный от нуля, например Агл соответствующим изменением указателей переменных можно достигнуть того, что, например, ^4гг-1ф0. Тогда приведение возможно в силу следствия теоремы 3. Следуя по этому пути, приходим, наконец, как и в теореме 1, § 46, к результату, что квадратичная форма ранга г помощью неособенного линейного преобразования может быть всегда представлена в виде: CtX^ -4- • • • + <V* Д Порядок операций, произведенных в этом параграфе, в известном смысле является обратным тому, который был указан в § 45. Здесь орй ходе доказательства не меняются коэфициенты неприводимой части формы, и меняются только переменные, в нее входящие. В § 45t наоборот, переменные остаются без изменения, меняются же тадык» коэфициенты неприводимой части формы.
зЗЪгава одиннадцатая Вещественные квадратичные евдэрмьз &©. йакон инерции. Перейдем теперь к изучению вещественных квадратичных форм в связи с теорией вещественных линейных преобразований. Все операции, о которых шла речь в последней главе, были рациональны (сложение, вычитание, умножение и деление), за единственным исключением операции извлечения корней в формулах 2, § 46. В частности приведение в § 45 (а также и в § 49) было совершено только с помощью рациональных операций; но операции эти в применении к вещественным величинам дают вещественные результаты, а потому имеет место такая теорема: УВворвма 1. Вещественная квадр атичная форма ранга г помощью вещественного неособенного линейного преобразования может быть приведена к виду: Wi2 + с г**14- •. • + crxj\ ' i 1) где коэфициенты cv с3> ..., сг^все вещественны и отличны от нуля. Приведение к этому виду, как мы убедились в предыдущей главе может быть достигнуто различными путями, причем для коэфициентов «р ...,£г при различных приемах приведения получаются различные значения. Оставляя в стороне вопрос о порядке чередования этих коэфи- ащентов, заметим, однако, что знаки их не зависят от того или иного «частного приема приведения формы, как это показывает следующая важная открытая одновременно Якоби и Сильвестром теорема, назван- шя Сильвестром законом инерции квадратичных форм. Теорема 2. Если вещественная квадратичная форма ранга г приведена двумя вещественными неособенными линейными преобразованиями соответственно к виду (!) и к виду *1*Г2 + k2x2"2 + ... 4- К *г"\ (2) то как форма (1), так и форма (2) обладают одним и тем же числом положительные коэфициентов. Для доказатепьства предположим, что указатели у х' и х" расположены так, что из коэфициентов с первые jjl, а из коэфициентов k первые * являются положительными, нее же остальные коэфициенты в обеих формах отрицательны. Надлежит доказать, что jjl = v. Если бы это обстоятельство места не имело, то одно из этих чисел, например jx, было бы больше другого. Докажем теперь, что это предположение приводит к противоречию.
алкон инерции 137" Если мы будем 'рассматривать х' и х" просто как сокращенные обозначения некоторых определенных линейных форм от х> то формы (1) и (2) будут тогда обе тождественно равны первоначальной квадратичной форме и, следовательно, также тождественно равны друг другу: *л'2 + • • • + <W2 -1 <v+i l *f+i'2 -• • •- kr i *r'2= Рассмотрим теперь систему линейных однородных уравнений с переменными (xv ..., хп): xf = О, ..., х," = 0, д^' = 0, ...,, хп' = 0, <4> т. е. систему v-[-fl— |1<Сл уравнений. По следствию 1 теоремы 35 § 17, существуют поэтому такие решения этих уравнений, для которых не все значен** неизвестных равны нулю. Пусть такое решение будет (yv.., jyj. Обозначим через уг'у у." значения, принимаемые хг\ х{\ если в них, xv...> хп заменить через yv.*., уп. Тогда имеет место уравнение: W* + • • • + VV'2 = -1 Vi I J\+i"2~... - I *r I3V"2. Выражение в левой части не может быть отрицательным, выражение в правой части не может быть положительным, а потому оба выражения должны быть равны нулю, что возможно только, если yL' = ... =у/ = 0- Но в силу (4) имеем: ^'=...==^' = 0. Отсюда следует, что ()^,..., уп) представляет собою решение, не состоящее исключительно из одних нулей, такой системы п линейных одно* родных уравнений с п неизвестными: *i' = 0, х2' = 0, ... , хп' = 0. Определитель этой системы уравнений, следовательно, равняется нулю, а потому линейное преобразование, приводящее х к х\ должно быть особенным, что противоречит условию. Теорема наша является, таким образом, доказанной. Каждой вещественной квадратичной форме можно сопоставить, следовательно, два целые числа Р и N, т. е. число положительных и число отрицательных мо&фициентов, которые получатся, если помощью веще» ственного неособенного линейного преобразовзЕИя форма будет приведена к нормальному виду (1) По отношению к таким преобразованиям оба эти числа будут, очевидно, арифметическими инвариантами, ибо две вещественные квадратичные формы, переходящие одна в другую помощью такого преобразования, могут быть приведены, очевидно, к одной и тай же нормальной форме (1) *. Оба эти инварианта Р и N связаны с инвариантом г уравнением: P + N=r. (5) Р иногда называют указателем инерции квадратичной формы.
138 ВЕЩЕСТВЕННЫЕ КВАДРАТИЧНЫЕ ФОРМЫ Одно из этих чисел является, таким образом, лишним. Будем поэтому «пользоваться не Р и N в отдельности, но их разностью: s = P — N (6) и назовем вместе с Фробениусом число 5 сигнатурой квадратичной формы. Определегте* Сигнатурой вещественной квадратичной формы называется разность между числом положительных и числом отри- цатсмьных коэфициентов, которые получатся, если форма помощью вещественного неособенного линейного преобразования будет приведена к виду (1). Так как целые числа Р и N являются арифметическими инвариантами, то их разность s будет также арифметическим инвариантом; надлежит, однако, заметить, что $ не должно быть необходимо положительным. • Теорема 3. Сигнатура квадратичной формы является арифметическим инвариантом по отношению к вещественным неособенный линейным преобразованиям. Упражнения 1. Ранг и сигнатура квадратичной формы будут либо оба четные, либо оба нечетные числа; кроме того 2. Любые два целые числа г и s (f*]>0), удовлетворяющие условиям упражнения 1, могут быть всегда рассматриваемы соответственно как ранг и сигнатура некоторой вещественной квадратичной формы. 3. Вещественная квадратичная форма ранга г и с сигнатурой s тогда и только тогда может быть разложена на два вещественные линейные множителя, когда либо г<2, либо г = 2, 5 = 0. 4. Квадратичная форма ранга г называется формой правильно расположенной {ср. теорему 4, § 20), если указатели х расположены так, что в последовательности ап . . . alr \ arl . . . с„ \ никакие два соседние А не равны одновременно нулю, и Д.ф0, Если форма вещественна и какое-либо А равно нулю, то два соседние А имеют противоположные знаки. (Для этого и для следующих обоих упражнений обратить внимание на § 49.) 5. Сигнатура правильно расположенной вещественной кваиратичной формы равна числу постоянств знака минус число перемен знака в последовательности А; при этом Л, равные нулю, могут по произволу считаться положительными иди отрицательными. С. Определим символ sgnx (sighum х) помощью уравнений: Q sgn* = +l #>0, sgn х — 0 х = 0, sgn х = — 1 х < 0. Ло=1, Av~aib Л< I a2i #22 А,= \
КЛАССИФИКАЦИЯ ВЕЩЕСТВЕННЫХ КВАДРАТИЧНЫХ ФОРМ -139 Доказать, что сигнатура правильно расположенной вещественной квадратичной формы ранга г равняется: sgn (>Vi) + sgn (AtA2) + ... + sgn (АГ_ГАГ). 51. Классификация вещественных квадратичных форм. В предыдущем параграфе нами было доказано, что вещественная квадратичная форма по отношению к вещественным неособенным линейным преобразованиям обладает двумя инвариантами, а именно ее рангом и ее сигнатурой. Главный результат настоящего параграфа (теорема 2) будет состоять в доказательстве того, что эти два инварианта образуют полную систему. Если в § 46 с и k вещественны, то преобразование (2) тогда и только тогда будет вещественным, если каждое с обладает таким же знаком, как и соответствующее k. Из дальнейших следствий этого же па-ряграфа можно поэтому теперь только заключить, что если вещественная квадратичная форма ранга г приводится вещественным неособенным линейным преобразованием к виду: *i*t2 + • • • + <v*A то такого же рода преобразованием она может быть приведена к другому виду: ktVi2 + ... + krxr2> где k — любые вещественные наперед заданные отличные от нуля по« стоянные, причем каждое к обладает тем оюе знаком^ как и соответствующее ему с. Пользуясь снова Р и N для обозначения числа положительных и отрицательных с> можем, очевидно, выполнить преобразование так, что первые Р коэфициентов с будут положительны, последние же TV — отрицательны. Поэтому можно каждый из Р первых k коэфициентов принять равным -f-1, каждый из последних 7V равным —1. Из уравнений (5) и (б), § 50 следует, что Р и N помощью ранга и сигнатуры формы выражаются следующим образом: Итак, имеем теорему: Теорема 1. Вещественная квадратичная форма ранга г и с сигнатурой s вещественным неособенным .лицейным преобразованием может быть приведена к нормальной форме: Xn2+...+Xp+i2-XP*-...-XA (2) где Р определяется по формуле (1). Теперь можно доказать следующую основную теорему:( Теорема 2. Необходимое и достаточное условие для эквивалентности двух вещественных квадратичных форм по отношению к вещественным неособенным линейным преобразованиям заключается в равенстве рангов и сигнатур этих форм.
140 ВЕЩЕСТВЕННЫЕ КВАДРАТИЧНЫЕ ФОРМЫ Необходимость условия следует из инвариантности ранга и сигнатуры. Достаточность вытекает из того, что две формы, обладающие одним и тем же рангом и одной и той же сигнатурой, могут быть приведены к одной и той же нормальной форме (2). Определение. Все вещественные квадратичные формы, эквивалентные по отношению к вещественным неособенным линейным преобразованиям некоторой данной форме и, следовательно, также эквивалентные друг другу, называются формами, принадлежащими одному и тому же классу 1. Таким образом все вещественные неособенные квадратичные формы от четырех переменных подразделяются на пять классов, причем соответствующие нормальные формы будут такбвы: *12 + *22 + *32--*42, #12 + *22 —*32 — *42> / 3} XL2— ЛГ22— ЛТ32— ДГ42, — х£ — Х#—Х# — Xg*. ) Все такие формы принадлежат одному из этих пяти классов, характеризуемых следующими числами: ( * = 4, 2, 0, —2, —4, г = 4. Рассматривая, однако, как это имеет место для многих геометрических задач, квадратичные формы не сами по себе, но лишь уравнения, получаемые от приравнивания их нулю, уменьшаем число классов приблизительно наполовину, ибо две формы, отличающиеся только знаком, дают место одному и тому же уравнению. Имеется поэтому только три класса неособенных поверхностей второго порядка, уравнения которых вещественны, их нормальные уравнения получатся приравниванием нулю трех первых форм (3). В неоднородных координатах уравнения эти выражаются следующим образом: ,^2+^2 + 22 = -1, Л2+У2+ ^2 = +1, А'2+У2 — Z2= + l. Первое из них представляет уравнение мнимой сферы (т. е. поверхности с вещественным центром, но без вещественных точек). Второе уравнение дает вещественную сферу (т. е. сферу с оо2 вещественными точками). Наконец, третье представляет однополый гиперболоид, образованный вращением равнобокой гиперболы вокруг ее мнимой оси. Легко показать, что эта последняя поверхность может быть также образована вращением каждой из двух прямых у = гу х~ it Z вокруг оси Z. 1 Выражение это может быть применяемо в том же самом смысле, каково бы ни оыло определение эквивалентности.
ОПРЕДЕЛЕННЫЕ И НЕОПРЕДЕЛЕННЫЕ ФОРМЫ 141 Теорема 3. Существует три и только три класса неособенных поверхностей второго порядка с вещественными уравнениями. Поверхности первых двух классов не обладают никакими вещественными образующими; поверхности первого класса не обладают также ни оаной вещественной точкой, поверхности второго имеют вещественные точки; и, наконец, поверхности третьего класса обладают как веще- ственными точками, так и вещественными образующими *. Эта классификация является полной с принятой нами точки зрения, при которой все такие поверхности, которые могут быть преобразованы одна в другую помощью вещественной неособенной коллинеации> рассматриваются как эквивалентные. Обычная классификация исходит из другой (непроективной) точки зрения, и тогда различают в нашем втором классе эллипсоид, двуполый гиперболоид и эллиптический параболои/i, а в третьем:— однополый гиперболоид и гиперболический параболоид. Упражнения 1. Существуют - (/г -f- 1) (п + 2) классов вещественных квадратичных форм от п переменны^. 2. Классиф щировать особенные поверхности второго порядка с вещественными уравнениями по отношению к вещественным неособенным коллинеация.и. 52- Определенные и неопределенные формы. Определение. Вещественная квадратичная форма называется неопределенной, если в нормальной форме (2)", §51, к которой она может быть приведена помощью вещественного неособенного линейного преобразования, имеются как положительные, так и отрицательные знаки. Все остальные вещественные квадратичные формы называются определенными 2. В случае определенных форм говорят о положительных или отрицательных формах, смотря по тому, будут ли коэфи- циенты в нормальной фопме (2) все положительны или все отри- цательны. Другими словами, вещественная квадратичная форма ранга г и с сигнатурой s будет определенной только тогда, если s = z±zr, во всех остальных случаях форма будет неопределенной 3. Термины «определенная» и «неопределенная»^ форма устанавливаются на основании свойства, выражаемого следующей теоремой* 1 Если мы будем рассматривать не вещественные квадратичные формы, как здесь имеет место, но вещественные однородные квадратные уравнения, то инвариантом явится не s, но \s\. Вместо \s\ иногда пользуются так называемой характеристикой квадратичной формы, т. е. меньшим ъз двух чисел Р и N, причем эта характеристика равна - (г — \s\). 2 Некоторые авторы оставляют наименов^ие определенная форма только для неособенных форм и называют особенные определенные формы полу определенными. 3 Другими словами, определенными формами бупут те, для которых характеристика равна нулю (ср. подс!рочное примечание к теореме 3, § 51).
142 ВЕЩЕСТВЕННЫЕ КВАДРАТИЧНЫЕ ФрРМЫ Теорема 1. Положительная определенная форма для всех вещественных систем значений переменных равна нулю или положительна; отрицательная определенная форма всегда равна нулю или отрицательна. Неопределенная форма для вещественных значений переменных принимает как положительные, так равным образом и отрицательные значения. Подлежит доказательству, очевидно, только вторая половина теоремы. Помощью вещественного преобразования неопределенная форма приводится к нормальному виду: xt* + .... + V2 - W* -...- х%% (1) где х' снова означают определенные вещественные линейные формы от х. Рассмотрим теперь систему п — Р однородных линейных уравнений *W = 0, -W = 0,..., дгм' = 0. (2) Так как эти уравнения вещественны и число их меньше числа неизвестных, то они обладают вещественными решениями, не состоящими исключительно из одних нулей. Такого рода решение (у1у ... , уп) не может удовлетворить всем уравнениям х/ = 0,...,*р'==0, (3) ибо системы уравнений (2) и (3) образуют вместе систему п однородных линейных уравнений с п неизвестными, определитель которой отличен от нуля, как определитель линейного преобразования, помощью которого первоначальная квадратичная форма приводится к нормальной форме (1). Подставляя, следовательно, в первоначальную форму вместо xv ..., хп значения yv . •., уп, получаем положительный знак, как это ясно из нормальной формы (1). С другой стороны, подставляя теперь в первоначальную форму вместо х вещественное, не состоящее из одних только нулей решение системы уравнений: Xi =0, ..., Хр' = 0, Хр+2 = 0, хп = 0, видим, что форма эта принимает отрицательное значение, как это показывает также приведенная форма (1). Перейдем теперь к некоторым теоремам, значение которых читатель лучше всего усвоит себе, интерпретируя их геометрически для случая п = 4» Теорема 2. Если неопределенная квадратичная форма в вещественной точке (уг, ... , уп) положительна, а в вещественной точке (zu ..., zn) отрицательна, то существуют две вещественные точки, линейно зависящие от у и г, но линейно не зависящие друг от другау для которых квадратичная форма обращается в нуль, причем ни одна из этих точек не является двойной точкой. Условием того, что квадратичная форма йцХьХ) {Ц г 2
ОПРЕДЕЛЕННЫЕ И НЕОПРЕДЕЛЕННЫЕ ФОРМЫ 143 обращается в нуль в точке {yt + l9v ..., Л+Ю, будет, очевидно: п п п 11 1 Эго квадратное уравнение относительно X обладает двумя различными вещественными корнями, ибо из предположения, что форма (4) в точке у положительна, а в точке z отрицательна, следует: п п п (2 **& **) ~ (2 ***№*) (2 ач z> zi) > °- 1 1 1 Обозначим эти корни через \ и \. Тогда форма (4) обращается в нуль для двух вещественных точек: Cyi + W • •'•».У» + Wi линейно зависящих от то»ек у и z. Так как точки у и г линейно независимы, то два целые числа / и / могут быть выбраны так, что последний определитель правой части очевидного равенства \Уг + \Ч yj + h*j\ = \l h\\yjyj\ fGv \Уг + Ч*г yj + kzjl 11 Х2| \г€ z$\ ; будет отличен от нуля. Следовательно, определитель левой части (6) также не равняется нулю, т. е. обе точки (5) будут линейно независимы. Остается только показать, что ни одна из двух точек (5), которые мы для краткости обозначим через (УЬ --->Уп)> (*1> •-•» 2п\ не будет двойной точкой. Полагая X -Х- 1 получим: -¾ = vyf~Y*i (' = 1, 2, ..., л), а потому имеет место уравнение: п п п п 1 1 1 1 Так как форма (4) в точках Ки Z обращается в нуль, то в (7) пер» вый и последний члены правой части должны быть равны нулю. Если бы точка Y или Z была двойной точкой, то средний член также должен был бы быть равен нулю, что невозможно, ибо левая часть (7) по предположению отрицательна. Таким образом наша теорема окончательно Доказана. Для полноты приведем еще такое очевидное следствие данной выше теоремы.
114 ВЕЩЕСТВЕННЫЕ КВАДРАТИЧНЫЕ ФОРМЫ Следствие. Единственными линейно зависящими от у и г точками, в которых квадратичная форма обращается в нуль, будут точки, линейно зависящие от Y или Z; при этом ни одна из них не будет двойной точкой. Особую важность для теории вещественных квадратичных форм имеет следующая теорема: Теорема 3. Вещественная квадратичная форма тогда и только тогда будет определенной, если кроме своей двойной точки и начала координат (О, 0, ..., 0) форма эта не обращается в нуль ни в од- ной вещественной точке. Предположим прежде всего, что мы имеем вещественную квадратичную форму, которая кроме своей двойной точки и системы значений (О, 0, ..., 0) не обращается в нуль ни в одной вещественной точке. Если бы эта форма была неопределенной, то по теореме 1 существовали бы две вещественные точки у и г, из которых для первой форма была бы положительной, для второй — отрицательной. По теореме 2 заключили бы отсюда тогда о существовании двух линейно зависимых от у и z вещественных точек Y и Z, для которых квадратичная форма обращалась бы в нуль. Так как эти точки должны быть линейно независимыми, то ни одна из систем значений (Y1% ..., Уп) и (Zv ..., Zn) не могла бы состоять исключительно из одних нулей. Кроме того, ни точка К, ни Z не должна была бы быть двойной точкой. Поэтому форма должна была бы быть определенной, и условие нашей теоремы оказывается достаточным. Остается еще показать, что определенная форма может обращаться в нуль только в своих двойных точках и в точке (0, 0, ..., 0). Предположим теперь, что форма (4) является определенной, и допустим, что она обращается в нуль в вещественной точке (уи ... , уп). Тогда, очевидно, имеет место тождество: и п п 2 аЧ (*< + *Л) (xj + Щ = 2 аУ Xi xi + 2а 2 aV XiyJ' i l-i Предполагая теперь, что у не будет ни двойной точкой, ни точкой п (0, 0, . ^, 0), видим, что выражение "Vai.xiyi не обращается тожде- 1 ственно в нуль, а потому можно найти такую вещественную точку {^i> . • •, ги), для которой п 1 Полагая затем ^ п х
ОПРЕДЕЛЕННЫЕ И НЕОПРЕДЕЛЕННЫЕ ФОРМЫ 145 имеем и 2М*, + ХЛ)(*, + Х^) = £? + 2М. ' (8) 1 Для данного вещественного значения X левая часть этого уравнения дает значение квадратичной формы (4) в некоторой определенной вещественной точке. Так как правая часть (8) для очень больших положительных и очень больших отрицательных значений X будет противоположных знаков, левая же часть своего знака менять не может, то наше предположение, что у не является ни двойной точкой, ни точкой (О, 0, ..., 0), приводит к противоречию, что и доказывает окончательно теорему. Следствие. Неособенная определенная квадратичная форма обращается в нуль для системы вещественных значений переменных, лишь если все переменные имеют значения, равные нулю. Из этого следствия легко вытекает такая теорема: Теорема 4» Б неособенной определенной форме ни один член с квадратом переменной не может иметь коэфигщентау равного нулю. В самом деле, форма (4) обращается в нуль, если аи — 0 в точке Х\ = • •. s= x^i = xi+i = ...== хп = 0, #1 = 1; а потому, если форма неособенная, то она не может быть одновременно и определенной. Упражнения 1. Определение. Ортогональным преобразованием i называется такое линейное преобразование, которое переменные хь ..., хп приводит к новым переменным Xi, ..., xnf, причем имеет место тождество: *12 + *22+ ... + Хя*=*Х1* + Хг* + ...+Хп*. Доказать, что всякое ортогональное преобразование будет неособенным и что 'его определитель равеа +1 или — 1. 2. Все ортогональные преобразования с п переменными образуют группу; также образуют групну все ортогональные преобразования с п переменными, обладающие определителем -+- 1 3. Линейное преобразование тогда и только тогда будет ортогональным, если оно оставляет инвариантным «расстояние* V(yi-*i)2 + (У2-*# + ... -т-(У*-*п)3 каких-либо двух точек (уи ..., уп) и (zb ..., zn). 4L Если для случая л=3 переменные хь хг^хг интерпретируются как неоднородные прямоугольные координаты в пространстве, то ортогональное преобразование представляет либо вращение вокруг начала координат, либо перемещение, состоящее из такого вращения, комбинированного с отражением в плоскости, проходящей через начало координат. В нервом случае определитель преобразования +1, во втором — 1. 1 Матрица такого преобразования называется ортогональной матрицей, а ее определитель — ортогональным опреаелитедем. Ю Б о х е р. Введение в эысшую алгебру _
i-46 ВЕЩЕС7ВЕНКЫЕ КВАДРАТИЧНЫЕ ФОРМЫ б. Обозначая коэфициенты линейного преобразования, как всегда, чеёз с^ доказать, что преобразование тогда и только тогда будет сртогинальяым, сели имеют место уравнения: *n2 + <fc2 + -.- + '«i2=l (/=1,¾ ..., п) сцсц + C2icv +... + cnlcnj =о | j = j; J ;;; ; J| / ф ;. Соотношения эти представляют также необходимое и достаточное условие * для» ортогональности преобразования, если у всех с перестав ^ь об i ука^теля L'. . i Вышеприведенные уравнения дают — п (п 4-1) соотношения между п2 коэ- фициентами преобразования. Отсюда следует возможность выразить все эти коэфициенты через „2_ п(п + У _ п(п-1) п 2 ~~ 2 из них или представить их посредством - п (л—1) других параметров. Для изу* чения исследований Келй, сюда относящихся, см. книгу Паскаля «Die Determi- nanten» § 47. Формулы Кели, однако, неполны, ибо некоторые ортогональные преобразования получаются из них только путем перехода к пределу. 2 Затруднение, упомянутое в предыдущем подстрочном примечании, было преодолено Липшицем («Untersuchungen uber die Summen von Quadraten», Bonn 1886) помощью метода, который не может быть еще и до сих пор представлен вполне элементарно. Реферат по этому вопросу, равно как и улучшение метода Липшица, находится у Картана («Encyclopedic des sciences mathematiques») т. f, стр. 463—-464), где приведена также еще и дальнейшая литература. Для случая л-3 извест-* ные формулы Эйлера дают все искомые значения, причем для элементарного получения этих формул существует несколько Л|иемов (Darboux, Theorie des surfaces, IV, Paris 1896, Note 5, стр. 433; KwKn und S omm erf eld, Ober die Theorie des Kreisels, Leipzig 1897, I, § 2, § 3. S t u d y, Hauptsa4ze der Quaternio- nentheorie, «Mitt, des naturw. Vereins fur Neuvorpommern und Ktigen», 1899). (Прим. нем. пер J.
Глава двенадцатая Система, состоящая из одной квадратичной и нескольких линейных Форм 53. Плоскости и прямые в связи с поверхностью второго порядка. Если плоскость «1*1 + «2*2 + ЩХ3 + w4*4 = ° W является истинной касательной плоскостью поверхности второго порядка 4 1 то существует такая точка (у%%-У<&'Уъ'-У\)> которая лежит в плоскости (1) (точка касания) и для которой полярная плоскость 4 2 *у *,>>,= О . (3) совпадает с (1). Два уравнения первой степени могут, * однако, только тогда представлять одну и ту же плоскость, если их кОэфициенты пропорциональны. Поэтому имеют место уравнения: «11 Ух + Д12.У2 + Д13.УЗ + «14^4 ~ Р«1 e2lJ\ + «22^2 + ^23^3 + Л21Л — P«> «31^1 + «32^2 + ДЗЗ-УЗ + ^34^4 — ?ui Ч\ У\ + ЧъУг + <*4з.Уз + Ч\У\ — ?ui ь Так как точка у лежит в плоскости (1), то справедливо также и следующее соотношение: ЩУ1 + «2^2 + %УЗ + «4^4 = 0. (5) Уравнения (4) и (5) получены в предположении, что плоскость (1) является истинной касательной плоскостью поверхности (2), но они имеют место также и для псевдокасательной плоскости. Действительно, тогда поверхность представляет конус, одна из .двойных точек которого должна лежать в плоскости (1). Если у будет этой двойной точкой, то уравнение (5) имеет место, но теперь левая часть (3) тождественно равна нулю, и уравнения (4) удовлетворяются при р =^=0. Таким образом доказано, что во всех случаях, когда плоскость (1) является касательной плоскостью поверхности (2), существуют пять постоянных уъ у^ у^ yv ру которые удовлетворит уравнениям (4) и (5) и из которых первые. четыре не все равны нулю* №
148 СИСТЕМА из одной КВАДРАТИЧНОЙ И НЕСКОЛЬКИХ ЛИНЕЙНЫХ ФОРМ 3 Поэтому #11 #12 #13 aU #1 #21 й22 #23 #24 #2 #31 #32 #33 #31 #3 аП #12 #43 #41 #4 #1 «2 «з «4 О = 0. (в) ;£ Обратно, если последнее уравнение имеет место, то существуют Пять постоянных уи Уъ> уВ9 yg, р, не все одновременно равные нулю, которые удовлетворяют уравнениям (4) и (5). Но также и первые четыре из этих пяти величин не могут все равняться нулю, ибо в противном случае из уравнений (4) и из того, что все и не могут быть одновре- менно равны нулю, следовало бы р = 0. Таким образом мы видим, что если уравнение (6) имеет место, то существует точка (у^'У^Уъ -yg) в плоскости (1), координаты которой вместе с некоторой постоянной р удовлетворяют уравнениям (4). При р = О следовало бы, что поверхность является конусом с двойной точкой в у и что плоскость (1) будет, если не истинной касательной плоскостью, то по крайней мере псевдокасательной плоскостью. Но если р ф 0, то полярная плоскость (3) точки у совпадает с плоскостью (1), как это видно из (4). Но тогда следует из геометрического рассмотрения, что точка у лежит на поверхности, в чем можно также убедиться, умножая уравнения (4) соответственно на yv у^ yZJ yg и складывая их; в этом случае плоскость (1) является истинной касательной плоскостью. Отсюда* имеем следующую теорему. Теорема 1. Плоскость (1) тогда и только тогда будет касательной плоскостью к поверхности (2), если имеет место уравнение (6). Теорема эта* однако, не дает способа различать истинную касательную плоскость от псевдокасательной плоскости для конусов. Если поверхность неособенная, то она не имеет псевдокасательных плоскостей, и потому уравнение (6) может быть тогда рассматриваемо как уравнение поверхности в плоскостных координатах. Если поверхность обладает рангом 3, т. е. если она представляет конус с единственной двойной точкой, то координаты (и±: и^ги^ги^) вся- пой плоскости, проходящей через эту двойную точку, удовлетворяют уравнению (6), так что это уравнение представляет теперь не конус, но одну единственную точку *. Если ранг поверхности меньше 3, то координаты всякой плоскости в просгранстве удовлетворяют уравнению (6), ибо всякая плоскость проходит тогда через двойную точку и может быть поэтому принята за касательную плоскость. Это обстоятельство можно проверить, замечая, что; уравнение (6) может быть представлено в виде: ^AtjUiUj^Q, 1 Дейегвлгельно, невозможно представить конус одним единственным уравне-. кием в плосягмвтных координатах.
с плоскости И ПРЯМЫЕ в связи С ПОВЕРХНОСТЬЮ ВТОРОГО ПОРЯДКА 149 где, как всегда, Atj означают алгебраические дополнения отдельных элементов в дискриминанте поверхности. Перейдем теперь к условию, выражающему, что прямая линия касается поверхности (2). Представим эту прямую, как пересечение плоскости (1) плоскостью * 1*1 + v*4 + ^3*8 + *Л = 0. (7) Если линия пересечения обеих этих плоскостей будет истинной касательной к поверхности (2), то существует на ней такая точка (УГ-^'Л :^*)> именно точка касания, полярная плоскость которой (3) содержит эту прямую. Поэтому уравнение этой полярной плоскости может быть представлено следующим образом: 2^ei + w*)^ = °fc- (8) и в самом деле соответственным выбором постоянных ]х и v коэфи- циенты (8) могут быть сделаны не только пропорциональными, но и равными коэфициентам уравнения (3): «и 34 + «12 У2 + ЧгУг + «а У\ — *Щ — vt^ = 0, \ «21 -У 1 + «22 У 2 + «23 У г + «21У К ~ *Щ>— ™2 = °> ' «81^1 + «32.У2 + «З3-Уз + «34^4 ~ №■— vV3 = < «4l3'l + «423'2 + «43^3+ «44^4—^4—v^4 ^2==0, ! ^ = 0, \ (») Так как точка у лежит на линии пересечения плоскостей (1) и (7), то имеют место уравнения: «1 У\ + "2^2 +"3-УЗ + "4.У4 = 0» \ ЩУх + ЪУъ + ЪУл + ЧУь^О- / (Ю) Шесть уравнений (9) и (10) удовлетворяются шестью величинами Уи Уъ> Угу У4> J1» v> из которых не все равны нулю, а потому: «11 «12 «18 «14 «1 «21 «22 «23 «24 и2 «31 «32 «33 «41 «42 «43 «1 «2 и3 Vt V2 VZ «34 «41 «4 *>l «3 «4 0 0 V\ v2 Щ *4 0 0 = 0. (11) Уравнение это было получено в предположении, что линия пересечения плоскостей (1) иг (7) является истинной касательной к поверхности (2); однако оно имеет место для псевдокасательных и образующих, в чем читатель может убедиться сам. Равным образом предоставляем читателю доказать, что линия пересечения плоскостей (1) и (7), если уравнение (11) имеет место, будет либо истинной касательной, либо псевдокасательной, лцбо, наконец, образующей поверхности (2), т. е. что имеет место теорема:
150 СИСТЕМА ИЗ ОДНОЙ КВАДРАТИЧНОЙ И НЕСКОЛЬКИХ ЛИНЕЙНЫХ ФОРМ Теорема £. Линия пересечения плоскостей (1) и (7) тогда и толь- ко тогда будет касательной или образующей поверхности (2), если имеет место уравнение (11). Разлагая определитель (11), убеждаемся, что он представляет квадратичную форму от шести плюкеровских линейных координат д., (ср. упр. 3, § 35), а потому уравнение (11) можег быть рассматриваемо как уравнение поверхности в линейных координатах, если поверхность неособенная или представляет собою конус с единственной двойной точкой. Если ранг поверхности равен 2, то она состоит из двух отдельных плоскостей; уравнение (11) дает тогда линию пересечения этих плоскостей. Если ранг поверхности 1 или 0, то уравнение (11) удовлетворяется тождественно. Упражнения Определение. Две плоскости называются сопряженными по отношению к неособенной поверхности второго порядка, если каждая из них проходит через полюс другой. 1. Доказать, что плоскости (1)и(7) тогда и толькоцтогда будут сопряженными по отношению к неособенной поверхности (2), если определитель ап ап ап аи и1 #21 #22 а23 #24 и1 аП #32 ад& аШ Щ #41 #42 #43 #44 #4 Vt V2 Z>3 vi 0 :-2л^^ равняется нулю. Какова будет геометрическая интерпретация положения двух сопряженньх плоскостей по отношению к особенной поверхности второго порядка, если условием для этого явится опять равенство нулю того же определителя? 2. Три плоскости Nrorда и только тогда пересекаются на неособенной поверхности второго порядка, если равняется нулю определитель седьмого порядка, получаемый окаймлением дискриминанта поверхности координатами трех плоскостей. 3. Примем геометрически очевидным, что прямая тогда и только тогда касается неособенной поверхности второго порядка, если две проходящие через нее касательные плоскости совпадают. Доказать, что линия пересечения плоскостей (1) и (7) тогда и только тогда касается неособенной поверхности (2), если 2^И'"Л( 2Л<^^ ~(2ло-^ =°- 4. Доказать алгебраическим путем, что условие упражнения 3 эквивалентно уравнению (11). 54. Присоединенная квадратичная форма. Инварианты. Перейдем теперь к случаю п переменных и начнем прежде всего с рассмотрения системы одной квадратичной формы и одной единственной линейной формы: п 1 2й* -г<- (2)
ПРИСОЕДИНЕННАЯ КВАДРАТИЧНАЯ ФОРМА 151 Геометрические рассуждения последнего параграфа естественно наводят на мысль рассмотреть такого рода выражение: ^Aij^uj — — ап . . . а1п и, . а, ПП "71 (3) Выражение это будет квадратичной формой от переменных uv ... ? ип> матрица которой будет, очевидно, присоединенной к матрице формы (1). Назовем поэтому также форму (3) присоединенной формой к форме (1). На инвариантность (3) непосредственно указывает то обстоятельство, что для случая п = 4 обращение в нуль формы (3) дает место некоторому проективному свойству. В самом деле, мы можем доказать такую теорему; Теорема 1. Присоединенная форма (3) является инвариантом веса 2 пары форм (1) и (2). Так как к, как мы видели в § 34, являются контрагредиентными х, то форму (3) можно также назвать контр^вариантом (ср. определение 2, § 34). Для доказательства теоремы 1 подвергнем х линейном/ преобразованию *i = *и *i' + - • • + Cin *п> \ определитель которого назовем с. Пусть а' и и! будут соответственно коэфициенты той квадратичной и той линейной форм, к которым вышеуказанным"^ преобразованием приводятся формы (1) и (2). Введем теперь вспомогательную переменную t и рассмотрим квадратичную форму от Хлч • •.« хм г: Ус V *i XJ + 2t (« xi + • ••• + «» -О- (¾ 1 Дискриминант этой формы будет определителем (3), т. е. дискриминант равняется взятой с обратным знаком присоединенной форме к форме (1). Преобразуем теперь форму (5) помощью линейного преобразования, получаемого из уравнений (4) путем присоединения к ним еще уравнения *=*'. (в) Определитель этого преобразования попрежнему равен с% а форма (5) теперь переходит в к 2 «,/ */ х,' + 2Р (щ' Xi' + • • • + а,,' хп').
1БЙ СИСТЕМА ИЗ ОДНОЙ КВАДРАТИЧНОЙ И НЕСКОЛЬКИМ ЛИНЕЙНЫХ ФОРМ Но дискриминант формы (5) является инвариантом веса 2, и потому имеем соотношение, одновременно доказывающее и нашу теорему: ап'. . • CL\% Щ! вп1 . =3ff2 an . • • aln a\ 1 . . un 0 \ Примененный метод доказательства может быть обобщен следующим образом: Теорема 2. Для системы, состоящей из одной квадратичной формы и р линейных форм от п переменных^ получим инвариант веса 29 если окаймим дискриминант квадратичной формы р горизонталями и р вертикалями^ из которых каждая состоит из коэфициентов одной из линейных форм. Доказательство предоставляем читателю. Если дискриминант а квадратичной формы (1) отличен от нуля, то можно образовать новую квадратичную форму, матрица которой будет обратной матрице формы (1). Эха квадратичная форма известна под именем обратной или взаимной формы к форме (1) и представляет не что иное, как присоединенную форму к форме (1), разделенную на дискриминант я. Докажем относительно обратной формы такую теорему: Теорема 3. Неособенная квадратичная форма (1) может быть преобразована в обратную форму помощью неособенного линейного преобразованиях х{ = аах+... + ainxn (/ = 1, 2, ..., л). (7) В самом деле но из (7) имеем: следовательно, 2fltf***i — 2 *'*''• Xi— —xt -+-...-1- —*«. 2 ***** г » У?А**г'х/ *i 2d ~n Xi *) * что и доказывает нашу теорему. Если квадратичная форма (1) вещественна, то преобразование (7) также вещественно. Отсюда следует: Теорема 4. Вещественная неособенная квадратичная форма и ее обратная форма имеют равные сигнатуры.
РАНГ ПРИСОЕДИНЕННОЙ ФОРМЫ 158 Упражнения п 1. Для системы, состоящей из квадратичной формы ^ацХ{х4 и двух виней- 1 п п ных форм 2 ***ь 2d v*Xi> Ф°Рма aU • • • а1п и1 AijUiVj-z- ani • • • апп ип Vt. . . Vn О будет инвариантом веса 2. 2. Теорему упражнения 1 обобщить для случая, когда число линейные форм* больше двух. 3. Если одна квадратичная форма приводится к другой помошью линейного преобразования с матрицей с, то присоединенная форма к первой форме преобразуется в присоединенную форму ко второй помощью такого линейного преобразования, матрица которого будет сопряженной с матрицей, присоединенной к с. 4. Доказать соответствующую теорему для билинейных форм. 5. Установить и доказать для билинейных форм теорему, соответствующую» теореме 3. 65. Ранг присоединенной формы* Пусть г будет рангом дискриминанта а квадратичной формы п i и пусть дискриминант А присоединенной формы п обладает рангом /?. Если тогда г<я — 1, то все опреаелители1 \п — 1)-го порядка в а равны нулю, но так как эти определители являются элементами в Ау то /?=0. Если г = п — 1, то в А имеется па крайней мере один отличный от нуля элемент, но все определители второго порлдка в А обращаются в нуль, ибо каждый из них, согласно §11, обладает множителем а, и следовательно в этом случае /?--== 1. Если, наконец, г=я, то также и /? = #; в самом деле если бы было /?<>, то А должен был бы быть равен нулю, и так как А = ап~1, то и а = 0, что приводит к противоречию к требованием г=/г. Теорема 1. Обозначая ранги квадратичной формы и ее присоединенной формы соответственно через г и R, имеем только следующие три случая: r=n—ly #=1, л<л~ 1, /? = 0.
154 СИСТЕМА ИЗ ОДНОЙ КВАДРАТИЧНОЙ И НЕСКОЛЬКИХ ЛИНЕЙНЫХ ФОРМ Исследуем подробнее случай г™ я — 1. Тогда /? = 1, т. е. присоединенная форма является квадратом некоторой линейной формы: П I п » п 2^^-(2^) =2^-^- Сравнением коэфициентов получаем: Не все с равны нулю, ибо в противном случае было бы R = 0. Пусть сх ф 0. Имеем поэтому также следовательно, не все величины (^хц ..., AXn) равны нулю, и потому, в сил/ § 44, точка (ЛХ1, Alv . .., ЛХп), а следовательно, также и точка icv • • •» О является двойной точкой первоначальной квадратичной формы. Теорема 2. Если квадратичная форма от п переменных обладает рангом п—1, то присоединенная форма будет квадратом линейной формы, коэфидиенты которой являются координатами двойной точки первоначальной формы. Так как в рассматриваемом случае все двойные точки квадратичной ■формы линейн^ зависят от одной из них, то теорема 2 вполне (до постоянного множителя) определяет линейную форму, о которой идет речь.
Глава тринадцатая Пары квадратичных «8»c»peui 56. Пара конических сечений. В этом параграфе дадим краткое геометрическое введение в теорию пар квадратичных форм, ограничиваясь случаем двух измерений. Пусть и и v — два конические сеченил, которые пересекаются в четырех различных точках А, В, С и D и притом только в них одних. Через эти четыре точки проходит, однако, бесчисленное множество конических сечений, которые образуют, как принято говорить, пучок конических сечений. Среди конических сечений, принадлежащих пучку, найдутся непременно три особенные, т. е. такие конические сечения, которые состоят из пар прямых; именно пары прямых АВ, CD; BCt DA\ AC, BD. Точки пересечения Р, Q и R прямых каждой пары являются соответственно двойными точками этих особенных трех конических сечений. Из свойств полного четырехугольника * следует, что общие хорды А В и £Х> всех конических сечений пучка гармонически лелятся точкой пересечения их с прямой QR и точкой Р. Поэтому QR является полярой точки Р по отношению ко всем коническим сечениям пучка, равным образом PR будет полярой Q, и PQ — полярой R опять-таки по отношению ко всем коническим сечениям пучка. Треугольник PQR будет, таким образом, общим полярным треугольником (§ 41) всех конических сечений пучка. Помощью коллинеации, преобоазующей точки Я, Q и R соответственно в начало координат и бесконечно удаленные точки на осях х и у, уравнение всякого конического сечении пучка освободится от всех членов, содержащих произведение различных координат. Таким образом доказана теорема: Теорема. Если два конические сечения пересекаются в четырех и только четырех различных тдчках, то существует неособенная кол- линеация, одновременно приводящая их уравнения к следующим нор* малъным формам: А*12 + Л2лт22 + Л3лгз2 = 0, \ BLxf+B22x22+BsX<?=zQ. / 1 См. какое-либо руководство по новой геометрии.
156 ПАРА КВАДРАТИЧНЫХ ФОРМ Для того чтобы это приведение выполнить аналитически, представил* уравнения конических сечений и и v в виде з з 1 1 Тогда для пучка конических сечений имеем следующее уравнение: з 2^ (a{j — lbti) х4 xj = 0. (2) Точнее говоря, уравнение это представляет для всевозможных значений X все конические сечения пучка, за единственным исключением конического сечения v. Особенные конические сечения пучка получим, таким образом» приравнивая нулю дискриминант формы (2): Д21 ■— ^#21 ^22 — ^22 а2Ь — ^23 д31 —Х^з! Дз2 — ^32 Даз — Цй = 0. (3> Назовем это уравнение ^уравнением двух конических сечений. Разлагая по степеням X, придаем этому уравнению вид: — Д1« + 9^2- ОХ + Д = 0, где А и А' будут дискриминаты и и v. Кроме того, (4) аП а\2 ^13 а2\ а22 ^23 #31 д32 ^33 + *U bU й13 fl21 ^22 а23 л31 ^32 й33 + Ьп а^ #13 #21 а2% а2Ъ ^31 й32 й33 а 0' получается из 9 путем перестановки букв а и Ь. Легко доказать (см. следующий параграф), что коэфициенты в и в', равно как и Д и Д', являются инвариантами веса 2. Если дискриминант Д' формы v отличен от нуля, то уравнение (4) будег третьей степени, и три корня его, которые в рассматриваемом случае, бчевидно, все различны, будучи подставлены в (2), дадут три особенные конические сечения пучка. Тот случай, когда конические сечения пересекаются не в четырех различных точках, будет рассмотрен в главе XXII помощью метода элементарных делителей *. Здесь мы предполагали только дать геометрическое обоснование для следующего параграфа. 1 Элементарное исследование Х-уравнения (Pequation en X двух) конических сечений находится во французских учебниках по аналитической геометрии, например, Briot et Bouquet Lesons de Geometrie analytique, 14-е изд., стр." 349, или Niewenglowski, Cours de Geometrie analytique, т. I, стр. 459.
ИНВАРИАНТЫ ПАРЫ КВАДРАТИЧНЫХ ФОРМ 157 57. Инварианты пары квадратичных форм. Их ^-уравнение. Рассмотрим две квадратичные формы: 9C*i»"4 ■*») = 2Zd i i(xit...,xn)zsJ>ibijxiXj l и образуем из, них систему форм и. п 1 Дискриминант этой системы ailL — \Ьп . . . я,п —> Х£1п л*1 — ^л1 • • • апп — ^пл = F(X) будет полиномом от X, вообще говоря, степени я, который может быть также представлен следующим образом: /^) = 00-9^ + ... +(-l)«ejt\ Коэфициенты этого полинома будут сами полиномами от а^ и Ъцу причем вв и 0Л являются дискриминантами соответственно <р и ф, a 0fc будет суммой всех определителей, получаемых заменой /г вертикалей дискриминанта <р соответствующими вертикалями дискриминанта ф. Теорема!. Коэфициенты 60, ..., вп полинома F(l) будут целыми рациональными инвариантами веса 2 2 пары форм <р и ф. Для доказательства рассмотрим линейное преобразование с определителем с, которое формы <р и ф приводит к виду: п V'zsj^at/xt'x/, 1 п Обозначая далее полином, от а,у и bj9 получаемый из в, путем замены а и Ъ на а! и #', через в/, мы, очевидно, докажем нашу теорему, «ели установим справедливость тождеств: 6/ = ДО, (/ = 0,1,..., л). 1 Вейерштрасс, Кронекер и другие авторы говорят о системе билинейных или квадратичных форм в том же смысле. 2 См. упражнение 13, § 90.
158 ПАРА КВАДРАТИЧНЫХ ФОРМ Но так как F(k) как дискриминант формы у — Хф является инвариантом веса 2, то где F (X) означает дискриминант формы <р' — Хфг. Но соотношение это представляет собою тождество как относительно X, так и относительно а и Ь, и потому коэфициенты у одинаковых степеней X должны быть в обеих частях равны. Таким путем мы и получаем искомые тождества Ч Уравнение ДХ) = 0 называется 1-уравнением двух форм фиф. Так как неособенное линейное преобразование воспроизводит, как мы видели, F с точностью до некоторого отличного от нуля множителя, то корни Х-уравнения не изменяются от такого преобразования. Но корни эти являются иррациональ- ными функциями от 0, а потому также от а и Ь; следовательно, имеет место теорема: Теорема 2. Корни \-уравнения пары квадратичных форм будут абсолютными иррациональными инвариантами этой пары форм по отношению к неособенным линейным преобразованиям. Кратность корня при неособенном линейном преобразовании также сохраняется: Теорема 3. Кратности корней 1-уравнения являются арифметическими инвариантами пары квадратичных форм по отношению к неособенным линейным преобразованиям. Для пары квадратичных форм: корни Х-уравнения будут а19..ш, ап. Этот пример показывает, что инварианты, упомянутые в теореме 2, могут принимать совершенно произвольные значения, и что также арифметические инварианты теоремы 3 подчинены только тому условию, что они являются целыми положительными числами, сумма которых равна я. 58. Нормальные формы. Х-уравнение не имеет кратных корней. Хотя наше внимание в этом параграфе будет обращено, главным образом, на тот случай, когда Х-уравнение не обладает кратными корнями, тем не менее установим прежде всего теорему, имеющую более общее значение. 1 Метод, помощью которого здесь были найдены инварианты системы двух квадратичных форм, допускает важное обобщение: если известен целый рациональный инвариант/ веса ц одной единственной формы k-й 'степени от п переменных, то можно найти весьма большое число инвариантов системы ср1у ср2> • • •» <Рз» состоящей из р формы &-Й степени от п переменных, если образуем выражение / для формы Xtfpi'4-. •. + VfV Выражение ё'то является полиномом от X, коэфициенты которого будут так же, как и в тексте, целыми рациональными инвариантами веса |а в системе форм <р.
НОРМАЛЬНЫЕ ФОРМЫ 159> Теорема 1. Если \ будет простым корнем 1-уравнения пары квадратичных форм <р и ф от п переменных, то помощью неособенного- линейного преобразования обе эти формы могут быть приведены к виду: Vl*l2+<Pl(*2. •••• *п)> \ (1у где ct будет постоянная, отличная от нуля, a fy, ф1 — квадратичные формы от п—1 переменных z%y ..., zn. Для доказательства рассмотрим систему форм: ( т_Хф = ?_Х1ф + (Х1 —Х)ф. (2> Форма <р —^ф будет особенной, ибо \ является корнем Х-уравнения. пары форм <р и ф, а потому форма эта помощью соответствующего неособенного линейного преобразования может быть освобождена от одно1 о из переменных, например от хх: Если это преобразование переводит ф в ф', то мы имеем: * - Хф ss ?' (*/, .... хп') + & - X) <|/ (лу, .... xnf), (3> Так как Xt является только простым корнем }.-уравнения пары форм ер и ф, то дискриминант квадратичной формы, стоящей в правой части, содержит множитель Xt — X только в первой степени. Отсюда следует, чго в квадратичной форме ф' коэфициент у члена х^ отличен от нуля. В самом деле, в противном случае лискриминант формы правой части (3) имел бы нуль, в левом верхнем углу, и таким образом все элементы первой горизонтали- и также первой вертикали обладали бы множителем (\ — X)2, что противоречит предположению, согласно которому 1Х должен быть только простым корнем. Так как коэфициент при л:/2, как только что доказано, отличен от нуля,, то можно совершить приведение Лагранжа [формулы (2), (3), § 45]. Получаем, таким образом, неособенное линейное преобразование: Z2 =■ Х'2 Ztl — хп, приводящее ф' к виду: *i*i2 +'М** -•> *п) (*1*0), причем правая часть (3) переходит тогда в ?' (z2, ..., zn) + (h — *) <[>i (ч> • - >*п) + (h —l) c\*i2- Оба вышеприведенные линейные преобразования могут быть заменены одним единственным неосббенным-.преобразованием, которое и даст нам, если мы еще положим
160 ПАРА КВАДРАТИЧНЫХ ФОРМ такое приведение Приравниванием коэфициентов у одинаковых степеней X получаем формы (1), что и доказывает нашу теорему. Допустим теперь, что форма ф неособенная, чем одновременно утверждается, что Х-уравнение будет я-й степени. Предположим, далее, что корни Xt, Ха Хп этого уравнения все отличны друг от друга. Тогда помощью неособенного линейного преобразования формы <р и ф могут быть превращены в формы (1). Х-уравнение этих двух форм отличается ют Х-уравнения пары форм <pt, ф1 только множителем Хх — X. Поэтому Х-уравнение пары форм <pt и ф1 обладает корнями Х2, ..., Хп, которые все будут отличны друг от друга. Приведение, данное теоремой!, можно, следовательно, применить к двум формам <ft и ф1э причем помощью неособенного линейного преобразовани г2,... ,zn формы эти приведутся к виду: Ц^ + Ы*?'» .... О* Присоединяя еще уравнение г{ = гь 'можно это линейное преобразование рассматривать как неособенное линейное преобразование zv ..., гпУ которое таким образом формы <р и ф приводит к виду: Vt*i* + W2'2 + ъ W уЛ €&*+ ад*+ +1(^--. *»')• Следуя по тому же пути, приходим окончательно к теореме: Теорема 2. Если <р и ф будут квадратичными формами от xv ..., *п, причем ф—неособенная форма, и их Х-уравнение обладает корнями lv ..., Хя (ice эти корни отличны друг от друга), то пен мощью неособенного линейного преобразования обе данные формы можно привести к виду. Ч<4*1* + >A*s* + • • • + *»АЛЛ <?Л* + W + -- + 4*»*. .где с означают отличные от нуля постоянные. Так как ни одно с не равно нулю, то линейное преобразбвание У1 = Усм' (/ = 1, 2, ..., л) ^удет неособенным. Помощью этого преобразования получаем дальнейшее упрощение: Теорема 3. Пользуясь условиями теоремы 2, можно неособенным линейным преобразованием привести формы <р и ф к виду: Уг2 + У*2 +..-+ У*2- Отсюда тотчас следует:
НОРМАЛЬНЫЕ ФОРМЫ 161 Теорема 4. Две пары квадратичных форм <р, Ф и <Р\ ф\ из которых две формы ф к ф' неособенные, тогда и только тогда будут эквивалентны (предполагается^ что ни одно из обоих Х-уравнений не обладает кратными корнями), если оба \-уравнения обладают одними и теми же корнями, или, что приводится к тому же> если инварианты 00, 61? ..., 0л первой пары форм пропорциональны соответг апвующим инвариантам 00', 6/, ..., 0л' второй пары. Упражнение Доказать, что приведение пары квадратичных форм к нормальным формам в теореме 3 при поставленных там условиях возможно по существу одним только способом, т. е. только знаки у любого числа переменных нормальной формы могут быть выбраны иначе. 59. Портальные форты. Форта ф определенная и неособенная. Рассмотрим теперь систему двух вещественных квадратичных форм rf и ф в предположении, что форма ф определенная и неособенная. Приведение к нормальным формам должно быть совершено теперь с помощью вещественного линейного преобразования. Теорема 1. Для случая, когда форма ф определенная и неособенная, Х-уравнение двух вещественных квадратичных форм <р и ф не может иметь ни одного мнимого корня. Допустим, что существует такой мнимый корень a-f-£5/, где а и (J вещественны и (J отлично от нуля. Тогда квадратичная форма <р— аф—/£>ф будет особенной, и следовательно, помощью неособенного линейного преобразования *i' = (Рп + Чп) xi -г ■ • • + (Ры + Щы) *п \ V *»' = (Ли + 1Яп\) ■*! + -.. + (Рпп + «О ХЛ ) может быть приведена к сумме к квадратов (k<^n): ср _ 4 _ Щ = х^2 + Г2Ч + . . . + хрл (1) Полагая теперь У1=РпЧ + ~- + Р\пхп> (3) *i = Яг\Х\ + • • • + qin*n' &) так что xi=yi + i*i' «айдем сравнением коэфициентов у /в (1) тождество: - рф == 2 v,^ + 2y2z2 +...+ 2укгк. (4) Определим теперь xv ..., хп так, чтобы обращалась в нуль правая часть (4), полагая, например: У\=У2== .--=ук = 0. Таким образом, как это следует из уравнений (2), имеем систему k вещественных однородных линейных уравнений с п неизвестными, причем для xv ..., хп могут быть найдены вещественные значения, не все 11 Б о х е р. Введение в высшую алгебр у.
162 ПАРА КВАДРАТИЧНЫХ ФОРМ равные нулю, которые удовлетворяют этим уравнениям. Из (4) следует, что для этих значений х форма ф обращается в нуль, что невозможно, ибо по предположению ф определенная и неособенная (следствие из теоремы 3, § 52). Теорема 2. Если <р—какая-либо вещественная квадратичная форма и if — неособенная определенная квадратичная форма, то пара форм у и ф помощью вещественного неособенного линейного преобразования может быть приведена к виду: где \,...9 \п будут корнями ^-уравнения, и в обоих случаях знак берется верхний или нижний, смотря по тому, будет ли определенная форма ф положительная или отрицательная. Доказательство может быть проведено совершенно подобно тому, как это имело место в теореме 2, § 58. Прежде всего надлежит показать, как в теореме 1, § 58, что «риф помощью вещественного неособенного линейного преобразования могут быть приведены к виду: Для доказательства рассмотрим систему форм: ?_Хф = т —X^ + (it —Х)ф. Так как \ по теореме 1 вещественно, то <р — ^ф будет вещественной особенной квадратичной формой, и потому помощью вещественного неособенного линейного преобразования можно освободиться от одной переменной: <р —^SSf'taj', ..., хп). Если это преобразование приводит ф к ф', то мы имеем: ?-Хф = 1'(*2', ..., O + Oi-*)*' Wr .-. *«')• (7) Теперь, однако, имеется существенное различие по сравнению со случаем, рассмотренным в § 58, ибо \t может быть здесь кратным корнем дискриминанта формы в правой части (7). Для доказательства того, что в ф' коэфициент у х^ отличен от нуля, нужно, следовательно, рассуждать иначе. Для этой цели достаточно заметить, что ф и, следовательно, также и ф' являются неособенными определенными формами, и потому, по теореме 4, § 52, ни один из коэфициентов у членов с квадратами переменных не может быть нулем. Показав таким образом, что коэфициент у л:/2 в ф' отличен от нуля, можно применить к ф' метод приведения Лагранжа, причем приходим к формам (6) так же, как при доказательстве теоремы 1, § 58 (надлежит заметить, что примененное преобразование теперь является вещественным). В формулах (6) ?х и ф1 будут вещественные квадратичные формы от п—1 переменных z2, ..., zn. Но так как форма ф(*„ .... * )3=^2+4^(¾ г»)
НОРМАЛЬНЫЕ ФОРМЫ 163 определенная и неособенная, то то же имеет место и для формы ф1# В самом деле, если бы форма фх была либо особенной, либо неопределенной, то должны были бы существовать такие значения 22, ..., г 9 не все равные нулю, которые обращали бы фх в нуль; присоединяя к ним еще значение zx = 0, видим, что эта система значений удовлетворила бы также уравнению ф = 0, что невозможно в силу следствия из теоремы 3, § 52. Х-уравнение двух форм <р1} Ф1 отличается от Х-уравнения двух форм (риф, очевидно, только отсутствием множителя X — Хг Поэтому корни: Х-уравнения пары форм <р1э ф1 будут Х2, ..., Хл. Применяя, следовательно, теперь метод приведения к формам <plf ф1э что возможно, ибо они удовлетворяют всем условиям, налагаемым на ^ и ф, получим: ?i(** •••• 2n)^hC2Z22 + b(z3> ••- zn)> Продолжая так же и далее, приведем обе формы <р и ф помощью вещественного неособенного линейного преобразования окончательно к виду (р == ^1У12 + • • • +Vn-V«2 \ ,fiN Так так ф — определенная форма, то постоянные с19 ..., сп будут все положительные или все отрицательные, смотря по тому, будет ли форма ф положительна или отрицательна. Помощью вещественного неособенного линейного преобразования * = У\Ь\У1 (/=1.2. — я) формулы (8) могут быть еще приведены к виду (5), что и доказывает окончательно нашу теорему. Упражнения 1. Вещественная квадратичная форма <р от п переменных ранга г может быть вещественным ортогональным преобразованием от п переменных приведена к виду *1*12 + ^2*2* + • • • + <V*-2 (ср. упражнение к § 55). 2. Определитель ортогонального преобразования упражнения 1 может быть по произволу выбран равным +1 или —1. 3. «Метрическая» классификация поверхностей второго порядка с вещественным Уравнением может быть установлена следующим образом. Берут уравнение в неоднородных прямоугольных координатах и преобразуют его к другой" прямоугольной системе координат, обладающей тем же началом. Совокупность членов второй степени будет одного из следующих пяти типов: Ахх£ + Агх22 + А&& Ai*i2 +А^-Азх^ А&* 4- А2х2\ Aix? — A2x2\ Atxfr ГД£ Аь Аъ Аъ — положительные постоянные. Каждое таким образом полученное неоднородное уравнение должно быть теперь упрощено дальнейшим преобразованием координат. Этим путем получаем окончательно канонические уравнения эллипсоида, гиперболоида, параболоида, ко- нУса, цилиндра, пары плоскостей и двойной плоскости (кроме того, мнимые поверхности), которые исследуются в элементарных учебниках аналитической геометрии трех измерений. _*_
Глава четырнадцатая Некоторые общие свойства полиномов * 60. Делитель. Приводимость. В этом параграфе будут установлен^! некоторые понятия, представляющие особенную важность для всех по<| следующих изысканий. Определение 1. Множителем или делителем полинома f от люЛ бого числа переменных называется такой полином <р, который удов* летворяет тождеству: где ф означает также полином. Всякая отличная от нуля постоянная будет, следовательно, множите*! лем всякого полинома; всякий полином является множителем полинома^ тождественно обращающегося в нуль. Полином, состоящий только ищ одной постоянной, отличной от нуля, не имеет, кроме постоянных, ни* каких других множителей. Полином от хх, ..., хп, не обращающийся тождественно в нуль, не| может иметь множителем никакого полинома, в который действительно! входили бы еще и другие переменные. Понятие о приводимости, с которым мы уже встретились в одном| частном случае (§ 47), определим следующим образом: " | Определение £. Полином называется приводимым, если он то* ждественно равен произведению двух полиномов, из которых ни один1{ не состоит только из одной постоянной. ) В учении о вещественных полиномах является целесообразным даль-i нейшее ограничение понятия о приводимости. Тогда имеют дело с по->| нятием о приводимости в вещественной области, которая определяется * следующим образом: ■ \ Определение 3. Вещественный полином называется приводимым] в вещественной области, если он тождественно равен прЬизведению\ двух вещественных полиномов, из которых ни один не состоит иъJ одной только постоянной. \ Во многих отделах алгебры играет важную роль еще другое видоиз- , менение понятия о приводимости. Для пояснения дадим следующее под- \ готовительное необходимое определение. | л *г> ) Определение d. Система чисел образует*рациональную область, | если она обладает следующим свойством: пусть а и b какие-либо] числа системы, тогда числа а-\~Ь, а — b, ab и -^ (в случае 6 ф 0) так-й же принадлежат системе.
ДЕЛИТЕЛЬ. ПРИВОДИМОСТЬ 165 Таким образом совокупность всех вещественных и мнимых чисел образует рациональную область так же, как и совокупность всех вещественных чисел. Простейшей рациональной областью, за исключением только той, которая состоит из одного единственного числа, равного нулю, является область, образованная из совокупности всех рациональных чисел. Более сложная рациональная область будет та, которая состоит из всех чисел вида a-\-b\/^l, где а и Ь не только вещественны, но также и рациональны. Этих немногих примеров достаточно для того, чтобы уяснить себе значение данного выше определения *. Определение 5. Полином, все коэфициенты которого принадлежат некоторой определенной рациональной области /?, называется приводимым в этой области, если он тождественно равен произведению двух полиномов, коэфициенты которых также принадлежат этой об ласти у причем ни один из этих полиномов не состоит только из одной постоянной. Определения 2 и 3 являются лишь простыми частными случаями этого последнего определения, а именно, когда рациональная область состоит соответственно из всех чисел и из всех вещественных чисел. По определению 2 полином х1 +1 будет приводимым, ибо он тождественно равен (х-\~]/—1) (х — \/—l). В вещественной области полином этот, напротив, неприводим и тем более неприводим он в области рациональных чисел. С другой стороны, х* — 2 в вещественной области приводим, но неприводим в области рациональных чисел и, наконец, полином дг2—4 приводим уже в области рациональных чисел. Определение б. Два полинома называются взаимно простыми, если кроме постоянных они не обладают никаким общим множителем. Определение 7. Два способа разложения полинома на множа" тели не считаются существенно различными, если в обоих случаях входит одно и то же число п множителей, причем эти множители так могут быть расположены, что для всех значений k от 1 до п включительно, k-e множители пропорциональны. Упражнения 1. Доказать что всякий полином вида '(х)+у будет неприводим [f (х) является полиномом только от х]. Будет ли это также справедливо для полинома вида Пх)+у*? 1 Через R{ab с2,..-, а*) обозначают рациональную область, состоящую из всех чисел, которые получаются из elf ..., ап помощью рациональных процессов (сложение, вычитание, умножение, деление). Таким образом область рациональных чисел может быть представлена проще всего как R(l), а последняя упомянутая в тексте рациональная область —как /?(1, V—1) или R(V—1). Однако это обозначение неприменимо ко всем случаям (рациональная область всех вещественных чисел), ибо тогда следовало бы пользоваться бесконечным числом аргументов.
16b НЕКОТОРЫЕ ОБЩИЕ СВОЙСТВА ПОЛИНОМОВ 2. Если полиномы /, <р» Ф от любого числа переменных удовлетворяют тождеству причем коэфициенты / и ? принадлежат некоторой определенной рациональной области, то в той же области находятся и коэфициенты <|» при условии, что <р тождественно не обращается в нуль. 61. Неприводимость общего и симметрического определителя. Теорема L Определитель D = > а2п • а>п ап1 ап2 • • • "яп является неприводимым полиномом от своих п* элементов, рассматриваемых как независимые переменные. Предположим, что определитель приводим, т. е., например: D=f{a и» ») ¥ fan* аПп)> где ни ф, ни / не являются постоянными. Разлагая D по элементам первой горизонтали, убеждаемся, что он будет первой степени относительно ап. Один из &вух полиномов / и <р должен быть поэтому первой степени относительно а119 а другой полином нулевой степени. То же рассуждение покажет, что по отношению к любому элементу а^ определителя D один из двух полиномов / и <р должен быть первой степени, другой же полином этой переменной вообще не содержит. Допустим теперь, что / будет тот полином, который содержит элемент аи главной диагонали D. Тогда в <р не входит ни один элемент ни i-й горизонтали, ни i-й вертикали, ибо, если бы это было, то, так как / первой степени относительно аш а <р нулевой, их произведение D должно было бы заключать члены, содержащие произведение вида аиа^ или аиа.и что противоречит определению определителя. Следовательно, если / содержит какой-либо элемент главной диагонали D, то он содержит также все элементы той же горизонтали и все элементы той же вертикали, причем ни один из этих элементов не может войти в <р. Если бы <р заключал какой-либо другой элемент а^ главной диагонали D (/=(=*), то по предыдущему atj и ajt не должны были бы войти ни в /, ни <р, что приводит к противоречию. Таким образом, если / содержит какой-либо элемент главной диагонали Z), то он содержит также и остальные и потому вообще все элементы определителя. Поэтому <р должно приводиться к некоторой постоянной. Теорема 2. Симметрический определитель аи а1п D^\ (<*ij = aji)
СООТВЕТСТВУЮЩИЕ ОДНОРОДНЫЕ И НЕОДНОРОДНЕЙ пШИНОМь! будет неприводимым полиномом от своих ~п(п-\-1) элементов, рассматриваемых как независимые переменные. Доказательство теоремы 1 применимо также и здесь и притом почти текстуально; единственное различие состоит в том, что D по отношению к элементам главной диагонали будет первой степени, а по отношению к каждому из остальных элементов, напротив, второй степени. Небольшие изменения, которые надлежит отсюда сделать в предыдущем доказательстве, предоставляем самому читателю. Упражнения 1. Общий окаймленный определитель I Л11 • • • Чп ип • • • и1р I anl • • • апп ип1 • • • иар 1>и. . .1>,Л 0 . . . О | ** ... Vpn 0 ... О j при р < п будет неприводимым, если а> и я v рассматриваются как независимые переменные. 2. Предполагая в определителе упражнения 1 с^ = а$ь щ$ = Vji9 получаем новый определитель, также неприводимый, если р <Сл. 3. Будет ли определитель 8 „ I j ап . . . аы 1 j ап\. • • • апп I оставаться неприводимым, если только для некоторых, но не для всех значений / и / имеет место уравнение а^ = (iji9 причем в остальном а являются независимыми? 4. Косой определитель (ср. упражнения 2^ 3, § 20) будет всегда приводимым; если его порядок четное число, то он является полным квадратом. (Следствие 3, § 11, также теорема 6 и упражнение 1, § 76). Имеет ли еще силу эта теорема, если элементы вещественны и дело идет о приводимости в вещественной области? 62. Соответствующие однородные и неоднородные полиномы. Часто бывает полезно рассматривать одновременно два полинома, один однородный, другой неоднородный, которые находятся друг к другу в таком же отношении, как, например, левые части уравнений плоской кривой или поверхности, если первый раз пользуемся однородными, а второй раз — неоднородными координатами. Такие полиномы будут называться соответствующими. Определение. Если из неоднородного полинома k-u степени от любого числа переменных (хи.. .,хп^±) образуем новый полином путем умножения каждого члена первоначального полинома на соответствующую степень новой переменной хп> так что все члены будут степени k, то полученный таким образом однородный полином называется соответствующим данному полиному
168 НЕКОТОРЫЕ ОБЩИЕ СВОЙСТВА ПОЛИНОМОВ Например, два следующие полинома будут соответствующими: 2*» + 3*2у —5г*2— yz +2-2:2 +х _зу —9, (1> 2& + £*y — 5x3fi—yzt + 2aflt + x& — 3yft — 9t*. • (->) Если <f(xv ..., xn_t)— неоднородный полином &-й степени, то соответствующий однородный полином может быть написан так: у. к „ (х\ х2 xn-i\ Каждому неоднородному полиному соответствует один и только один единственный однородный полином. Обратно, каждому однородному полиному от п переменных соответствует, вообще говоря, п различных неоднородных полиномов, которые получим, полагая любую из переменных равной единице. Таким образом полиному (2) соответствует не только неоднородный полином (1), но также и следующие: 2*«+ 3*2 —5**2--sf +Ъ& + хР~ 3*2 — 9#> (4< '2гЧ-Злг2_У— 5дг —yt 4-2/ +х*2—Зу*2_9я (.:-) Но если в однородном полиноме одна из переменных входит в каждый член, то, полагая эту переменную равной единице, получим не соответствующий неоднородный полином, но некоторый полином меньшей степени. Таким образом в случае, когда каждый член однородного по» линома содержит все переменные, не имеется никакого соответствующего полмнома; примером этому может служить полином x2yz + xy2z + xyz2. Теорема L Если один из двух соответствующих полиномов приводим, то приводим также и другой, причем и множители обоих по- линомоз будут также соответствующими. Предположим, что однородный полином ¥(xv ..., хп) будет степени (&-(-/) и обладает двумя множителями соответственно степеней k и /: (?ш(х1> •••> xn)^h(xh •••> *п)Ул(хЬ •••> Хп)> (в) Пусть соответствующий неоднородный полином, о котором идет речь,, будет тот, который получится, если положить хп=1. Тогда Операция эта, однако, по предположению не меняет степени полинома в левой части; поэтому степень ни одного из множителей правой части (6) также не может понизиться, и ни один из множителей правой части (7) не будет постоянным. Следовательно, неоднородный полином приводим, и оба его множителя соответствуют обоим множителям правой части уравнения (6), так как они будут соответственно степеней k и /.
ДЕЛЕНИЕ ПОЛИНОМОВ 169 Рассмотрим теперь неоднородный полином Фы(хь •••> хп-\) и предположим, что Ф*+1(*1. •••. *п-1) = Фк(хи •••> хп^Хг(х19 ..., л^)* где указатели означают степени полиномов. Однородные полиномы, соответствующие неоднородным полиномам Ф, *Р, Ху обозначим через <рНг? Фл+1, W Тогда для ^п^0- Умножая на хпш9 получаем: и так как это уравнение имеет место для всех отличных от нуля значений хпУ то (теорема 5, § 2) оно является тождеством, что и доказывает окончательно нашу теорему. Получение условия для приводимости неоднородного квадратичного полинома от любого числа переменных представляет простой пример* приложения только что доказанной теоремы. Прилагая теорему § 47' к соответствующему однородному полиному, получаем критерий приводимости для неоднородного полинома второй степени. Теорема 2. Неоднородные полиномы f и <f тогда и только тогда будут взаимно простыми, если соответствующие полиномы F и Ф являются взаимно простыми. В самом деле, если бы / и <р обладали общим множителем ф, отличным от постоянной, то однородный полином ХУ, соответствующий ф, был бы по теореме 1 общим множителем F и Ф и также не был бы постоянной. Обратно, если бы *Р, отличный от постоянной, был общим множителем Fn Ф, то, по теореме 1, / и <р обладали бы общим множите-" лем ф, не приводящимся к постоянной и соответствующим полиному Ч;. 63. Деление полиномов. Рассмотрим прежде всего два полинома только от одной переменной: f(x) = а0х" + atxn-i +...+*. 9[х) е= Ъ,х™ + Ьхх~-1 +... + Ьт. ) W' В элементарной алгебре рассматривается вопрос о делении / на <р, т. е. о нахрждении «частного» Q (х) и «остатка» R(x). Самое существенное при этом выражается следующей теоремой: Теорема 1. Если f и <р — два полинома от х> причем <р не обращается тождественно в нуль, то существует всегда одна и притом только одна пара полиномов Q и /?, которые удовлетворяют тождеству.
170 НЕКОТОРЫЕ ОБЩИЕ СВОЙСТВА ПОЛИНОМОВ f(x) = Q(x)v{x) + R{x), <2) при этом степень R меньше степени <р или # = 01. Докажем прежде всего, что существует по крайней мере одна пара таких полиномов Q, /?. Если степень / меньше степени <р (или если / == 0), то достаточно только положить 0==0, /? =3/. Если степень / по меньшей мере равна степени <р, то в уравнениях (1) агожно предположить: яо Ф 0, Ьй Ф 0, п > /я. Лемма. Если степень <р яе яьшг степени /, ?ж) существуют два полинома Q± и Rv удовлетворяющие тождеству: f(x)^Q1(x)^(x) + R1(x)9 причем R± = 0 г/ли степень Rt меньше степени полинома /> Полагая "о убеждаемся в справедливости этой леммы. Если /^ = 0 или степень #t меньше степени <р, то Qt и /?t могут быть подставлены в уравнение (2) вместо Q и R. Если это места не имеет, то, применяя лемму к двум полиномам Rt и <р, получим: /^*) = #2 (*)?(*) +#2 (*)* причем /?2==0 или степень /?2 меньше степени Rv Тогда можно написать: /(г) еее [Q! (*) + Q2 {х)] * (*) + /¾ (*). Если /?2 = 0 или его степень меньше степени <р, то вместо Q и R в уравнение (2) могут быть подставлены Qt -j— Q2 и Rr Если это места не имеет, то снова применяем лемму к полиномам /?2 и <р. Продолжая таким образом, получаем ряд полиномов Rv R2y ..., степени которых постоянно уменьшаются. Следовательно, после некоторого числа операций мы должны получить полином Rp который или тождественно обращается в нуль, или будет степени меньшей степени <р. Поэтому имеем f{x) еее [Qt (х) + Q2 (х) + ... + (¾ (х)] * (x) + Ri (x), чем и доказывается, что существует по крайней мере одна пара полиномов Q и /?, удовлетворяющих условиям теоремы2. Допустим существование второй такой пары Q' и /?\ Тогда получим: 0 ==(<?-<?')¥ +(#-#')• (8) Отсюда можем заключить, что 0HSQ' и /?===/?'. 1 Надлежит при этом помнить, что, согласно нашему определению, полином, тождественно обращающийся в нуль, не имеет степени. 2 Читатель мог бы легко убедиться, что примененный здесь метод представляет не что иное, как обыкновенное элементарное деление.
ДЕЛЕНИЕ ПОЛИНОМОВ 171 В самом деле, если бы Q и Q' не были тождественны, то первый член правой части (3) был бы по крайней мере /я-й степени, в то время как второй член в той же части вовсе не содержал бы хт. Перейдем теперь к полиномам от многих переменных: f{xv..., хк) ess д0 (х2, ..., хк) х? + at (лг2, ...,**) х^ + ... + ап (х2, ..., хк), л <? (хи...,хк)sssЬь(х* ....хк)ххт + Ьх (х2, ...,хк)*Г-1 + ... + Ъш(х2, ...,хъ). /( ' Обычный метод деления дает нам частное и остаток в виде не полиномов, но рациональных дробных функций. Чтобы этого избежать, установим следующую теорему: Теорема 2. Если f и <р будут полиномами от (х19 ..., хк\ причем у не обращается тождественно в нуль, то существуют три новых полинома Q, /?, Р (Р не обращается тождественно в нуль и не заключает х±)у которые удовлетворяют тождеству: Р(х2, -.., xk)f(xv ..., xk)=~Q(xv ..., xk)y(xlt ..., xk) + R(xv ..., xk), (5) де R = О, или степень R относительно xt меньше степени <р относительно xv Доказательство аналогично только что данному доказательству теоремы 1. Если степень / по отношению к хг меньше степени <f или если / = 0, то достаточно просто положить P=l, Q = 0 и /?=/. Предполагая теперь, что / по отношению к х± будет по меньшей мере той же степени, как и <р, можем в уравнениях (4) положить: й9ф0, Ь0 =р 0, п > т. Лемма. Если степень <р по отношению к хг не выше степени /, то существуют два полинома Ql9 Rv удовлетворяющие тождеству: Ь0(х^ ..., xk)f(xb ..., xk)^Qt(xu ..., хк)?(Хь ..., xk) + R1(xv ..., хк), где степень Rt относительно xt меньше степени f по отношению к тому же переменному xv или же Rt == 0. Чтобы установить справедливость леммы, достаточно, очевидно, только положить: Если ^esO или его степень по отношению к х± меньше степени <р по отношению к х19 то вместо Q, R, Р в тождество (5) можно подставить Qv /?!, £0. В противном случае для полиномов Rt и <р лемма дает тождество: £0(лг2, ..., r4) /?i (Jfi, .... х$ = Q2(xl9 ...,**)* (*ь ..., xk) +■ /¾C*i> -• -, **). где степень полинома R% (если только он не обращается тождественно в нуль) по отношению к хх будет меньше степени Rv Таким образом имеем: г Ъ&= Г М?1-4-CV> ф 4-/?9.
172 НЕКОТОРЫЕ ОБЩИЕ СВОЙСТВА ПОЛИНОМОВ Если /?2 = 0 или его степень по отношении/ к хх меньше степени <р относительно х1У то полиномы b(iQl-\-Qiy /?2, &в2 можем подставить в (5; вместо Q, /?, Р. Иначе применяем снова лемму к полиномам /?2 и у и т. д.; получаем таким образом ряд полиномов Rv /?2, с постоянно уменьшающимися степенями. Следовательно, придем, наконец, к полиному R.y степень которого по отношению хх (если только полином этот не тождественный нуль) будет меньше степени ср. Складывая отдельные результаты, получаем окончательно: V/ss (*0rlQi + Vя 02 + • • • + 0/) <Р + /?«. что и доказывает нашу теорему, а вместе с тем еще и такое следствие: Следствие. В качестве полинома Р теоремы 2 может быть выбрана некоторая степень br Очевидно, было бы неправильно обобщить теорему 2 утверждением, что существует только одна система полиномов Q, /?, Р, ибо тождество (5) не меняет своего вида, если обе части его умножить на любой полином от (л:2, ..., хп) (ср., однако, упражнение в конце §73). б-i. Преобразование кодинота. Предположим, что f(xv *й, лг8> *4) будет однородным полиномом &-й степени в однородных координатах (хг: л:2: л;3: х4), так что уравнение /==^0 представляет некоторую поверхность &-го порядка. Если член с х4* имеет коэфициентом нуль, то поверхность проходит через начало координат. Если коэфициент при xtk (или при лга*, или при лг3*)« нуль, то поверхность проходит через бесконечно удаленную точку оси хх (оси х2, оси х3). Рассмотрения этих особенностей в положении поверхности, очевидно, можно избежать и притом бесконечным числом способов помощью неособенной коллинеации, которая любые четыре точки, не лежащие в одной плоскости, преобразует в начало координат и в бесконечно удаленные точки координатных осей при условии только, чтобы каждая из четырех выбранных точек не лежала на поверхности. — Высказав таким образом основную мысль, приступим теперь к доказательству теоремы для случая п переменных. Лемма* Если f(xv ..., хп) будет однородным полиномом k-u сте- пени, в котором не имеется члена с хтк, то помощью неособенного линейного преобразования переменных (xv ..., хп) можно f привести к виду fv в котором коэфициент при хт'к отличен от нуля, а коэфи- циенты k-x степеней остальных переменных не изменились. Не нарушая общности, можем при доказательстве предположить, что переменная xmf о которой идет речь, будет последней переменной хп. Неособенное линейное преобразование xL = х{ + а&п' (/=1, • • -, п — \) хп = хп преобразует / в причем коэфициенты членов с дг/, ..., лгм-Д очевидно, не изменились.
ПРЕОБРАЗОВАНИЕ ПОЛИНОМА 173 Так как каждый член в fl9 за исключением члена с хп'к> содержит по крайней мере одну из переменных дг/, ..., хп^9 то коэфициент члена с дгм'* будет равен: Л(0,0, ..., О, 1) = /(*,, а2, .... an_t, 1). Остается, следовательно, еще доказать возможность выбора постоянных аи ..., ап_± так, чтобы эта величина была отлична от нуля. Для этой цели возьмем какую-либо точку (bv ..., bn)9 для которой #Л + 0. Тогда можно выбрать столь малую окрестность этой точки, чтобы хп не равнялось нулю ни в одной из ее точек; и так как / не равен тождественно нулю, то можно затем найти такую точку этой окрестности [cv...9 сп), где сдфО, что f(cv ••-> О + О. Подставляя теперь вместо av ... an_t значения —, . .., -^=^, по- лучим, ввиду однородности /: /(^1,---, ^n-V 1)Ф°- Теорема 1. Если f(xv . .., хп) будет однородным полиномом k-u степени, то существует неособенное линейное преобразование, приводящее / к новому виду fl9 в котором коэфициенты членов с х^ку х>2'к. ..., хп'к все отличны от нуля. Доказательство получается непосредственно из предыдущей леммы. Достаточно только применить последовательно преобразования, которые равные нулю коэфициенты членов с^*, ..., хк приводят к значениям, отличным от нуля. Лемма доказывает, что все эти преобразования существуют и будут неособенными. Коэфициент при х±к не меняется более после первого преобразования при применении дальнейших преобразова ний. Последовательность всех этих преобразований снова дает неособенное линейное преобразование, именно то, которое упомянуто в теореме 1. Теорема 2. Существует такое неособенное однородное линейное преобразование переменных (xv ..., хп)у которое полином k-й степени f(xv ..., хп) преобразует в новый полином степени+k по отношению к каждой отдельной переменной хх\ ..., лгм'. Для случая однородного полинома/теорема эта эквивалентна теореме 1. Если f—неоднородный полином, то его можно представить в виде: где каждое <р будет однородным полиномом степени, указываемой его индексом, или же тождественным нулем. Достаточно теперь только применить теорему 1 к полиному <р/с, который, очевидно, не равен тождественно нулю. Теорема 2, а также ее частный случай — теорема 1, приводит к такому обобщению для случая системы функций: Теорема 3. Существует такое неособенное однородное линейное преобразование, которое систему полиномов U (*i, • • -> *»). h С*1. • • •, *\\ • • •, /т (*1> ' ' •> *«)
174 НЕКОТОРЫЕ ОБЩИЕ СВОЙСТВА ПОЛИНОМОВ соответственно степеней ku k.v ..., km преобразует в новую систему полиномов, обладающих степенями k19 &2, ..., km по отношению к каждой из переменных xt\ ..., хп*. Доказательство аналогично доказательству теорем 1 и 2; можно также для доказательства применить теорему 2 к произведению ДД-••/„,- В заключение заметим, что теоремы этого параграфа остаются справедливыми, если все полиномы будут вещественны, и дело идет только о вещественных линейных преобразованиях. Упражнение Если вещественный полином f{xb ..., хп) будет нечетной степени, то он обращается в нуль в бесконечном числе вещественных точек. (Ср. упражнение 3, § 6).
Глава пятнадцатая Общий делитель полиномов от одной переклейной и бинарных Форм 65. Разложение на линейные множители. Теорему 2, § 6 можно теперь высказать в следующей форме: Теорема 1. Полином п-й степени от одной переменной всегда приводим, если я>1. Он может быть разложен тогда на произведение п линейных множителей одним и притом одним способом. Пользуясь результатами § 62, хможно теперь высказать соответствующую теорему для бинарной формы ачххп + вй"-1^ + ... + апх2п. (1) Прежде всего, если а0 ф 0, то этой форме соответствует неоднородный полином (определение § о2): ДЛЯ + адм + \-ап.' (2) Полином этот может быть разложен на множители: а0 (хх — at) (xt— a2)... (xt — <хЛ). Вводя п постоянных аД а.2", ..., aw", произведение которых равно а0, представим его в виде: «*i - */) («a"*i - «Л- • • K"*i - ««'), (3> где для краткости полагаем Из теоремы 1, § 62 можем теперь заключить, что бинарная форма (1) тождественно равна выражению: ,(<*l"*l — ai'*2) Ы'Ч — «2'*2) • • • К"*1 ~ <*»'*2). (4) Никаким другим существенно отличным способом форма не может быть разложена на линейные множители, ибо тогда то же имело бы место для полинома (2). Для а Ф 0 теорема, таким образом, доказана. Предполагая теперь д0 = ... = aK.t = 0, ак ф 0 (k < п), видим, что форма (1) принимает вид: <W~**2* + • • • + Я**2*. (5)
176 ОБЩИЙ ДЕЛИТЕЛЬ ПОЛИНОМОВ Она разлагается, очевидно, на k множителей лг2 и бинарную форму *ЛП~* + V апх2п-*у обладающую степенью п — k. Так как первый коэфициент здесь отличен от нуля, то по вышедоказанному форма эта может быть разложена на п — k линейных множителей. Здесь также бинарная форма может быть написана в виде (4), где k из постоянных а" будут равны нулю. Оставляем читателю убедиться, что разложение по существу возможно только одним единственным способом. Теорема может быть тогда формулирована следующим образом: Теорема 2. Бинарная форма п-й степени всегда приводима, если л>1; она может быть разложена на произведение п линейных множителей одним и по существу только одним способом. Упражнения 1. Всякий вещественный полином от одной переменной, степень которого выше 2 приводим в вещественной области и может быть разложен на неприводимые мд*/-' ;жители одним и по существу только одним способом. 2. Доказать соответствующую теорему для вещественных бинарных форм. 66. Оощий наибольший делитель целых положительных чисел 1. Задача нахождения общего наибольшего делителя двух целых положительных чисел а и b находится в тесной связи с алгебраической задачей следующего параграфа. Надлежит поэтому изложить подробно решение, данное Евклидом (алгорифм Евклида). Если при делении а на b 2 получаем частное qQ и остаток rv то можно написать: а = ЧъЬ + ги где r1<^b) если деление в достаточной мерз продолжено. Деля теперь b на rv получаем частное qt и остаток г2, который будет меньше rv если деление достаточно продолжено. Таким образом получаем окончательно следующую систему уравнений: (1) При этом остатки rv г,, ... будут целые положительные числа, постоянно уменьшающиеся, так что, наконец, деление должно прекратиться. Из первого уравнения заключаем, что всякий общий множитель а и b <* =Я*Ъ +rt Ъ =ЯуГу + г2 г± = Чг '2 + Ъ Гр~2~(7р~1/р-1 + гр '2 Он >*з < г2, 'pOp-i, 1 В этом параграфе мы пользуемся словом делитель в арифметическом смысле, но не в алгебраическом, как это имело место в § 60. Целое число Ь называется делителем целого числа д, если существует такое целое число с, что а=be. 2 Если а < #, то частное равно нулю, а остаток равен д.
ОБЩИЙ НАИБОЛЬШИЙ ДЕЛИТЕЛЬ ЦЕЛЫХ ПОЛОЖИТЕЛЬНЫХ ЧИСЕЛ 177 должен быть также делителем rt; из второго следует, что всякий общий делитель Ь и гх будет делителем га и т. д. Наконец, всякий общий делитель гр_(1 и г^х является также делителем гр. Следовательно, всякий общий делитель а и b будет делителем гр. С другой стороны, из последнего уравнения (1) видим, что всякий делитель г будет делителем rp_t; из предпоследнего уравнения следует, что всякий общий делитель гр и rp_t является также делителем г^_, и т. д. Окончательно имеем, что всякий общий делитель г2 и rt будет также делителем Ь, и что всякий общий делитель rt и b является делителем а. Следовательно, всякий множитель гр будет общим делителем а и Ь. Наибольшим множителем г будет, очевидно, само г. Отсюда следует: Теорема 1. В алгорифме Евклида (1) гр будет общим наибольшим делителем а и Ь. В частности а и b тогда и только тогда будут взаимно простыми, если г— 1. Из уравнений (1) может быть получена важная формула, выражающая г через a, b и д. Первое из уравнений (1) дает: rx = a — q0b. Подставляя эту величину во второе из уравнений (1), получим: r2= — qa + (q9qt+l)b. / Из третьего уравнения имеем: 'з = (qtf2 + 1)* — (ЯъЧхЯг + ^ + Яо)Ь- Таким образом все г и, наконец, гр можно выразить через а и Ь. Чтобы общую формулу представить в обычных обозначениях, введем следующие символы: П = 1. ) ' К, 021 = ^02+1. | [аь а2> а3] = ¢^¾¾ + а3 + а,, ; (2) К • • •» oj = К- • •> an-l] <*п + К,-. ., а„-2]. ) Отсюда ясно, что вышенайденные выражения для rv г2, г3 заключаются в следующей формуле: П: = (— I)*"1 [qv q* - • - qit-A a + (— 1)* \Я* ¢1. <Ь • • -. ft-il*. (3) Уравнение это будет установлено для всех значений &<р, если, предполагая его справедливым для k<*kv сможем заключить, что оно имеет место также и для k = ki-j-l. Но это тотчас следует, если вместо rfc и гйг-| подставим их значение из (3) в уравнение: 12 Б о х е р. Введение в высшую алгебру.
178 ОБЩИЙ ДЕЛИТЕЛЬ ПОЛИНОМОВ и преобразуем полученное таким образом выражение помощью символов (2). Итак, получаем формулу: r? = Aa + Bbt (4 где Л = (-1)Р-»[^ 9» ..- ?P-il 5=(-1)Р[^ qb ..., ^J. Так как q — целые числа, то А и В будут также целые числа. Важнейшее применение уравнения (4) относится к случаю, когда а и b будут взаимно простыми. Тогдаг =1,и уравнение (4) принимает вид: Аа + ВЬ = 1. (5> Обратно, если существуют два целые числа А и В, удовлетворяющие уравнению (5), то а и b будут взаимно простыми, ибо в противном случае левая часть уравнения (5) обладала бы делителем, большим L Теорема 2. Два целые числа а и b будут тогда и только тогда взаимно простыми^ если существуют два целые числа А и В^удобле- творяющие уравнению Aa-j-Bb = l. Упражнения 1. Доказать (методом индукции) справедливость формулы: («1. а2 аJ = !<**> ал-1» •••. <Ч]. 2. Доказать, что afc-олютные ониченял А и В буду г соогветственно меньше ,}Ь и —а. и что эта дробь не может быть более упрощена. 3. Существует только одна единственная пара целых чисел А и В, по абсолют- ной величине соответственно меньших ~ Ь и •- а и удовлетворяющих уравнению аА + ЬВ= 1. 67. Общий наибольший делитель двух полиномов от одно Г? нерешенной. Вместо целых чисел a a b последнего параграфа рассмотрим теперь два полинома: /Wse^ + etjf- +... +аЛ, 1 f(x)~ Ых- + М™-11-... +fcw. J (*Ч/ Под их общим наибольшим делителем будем понимать тот их общий* делитель, который обладает наивысшей степенью. Будет доказано,, что этот общий наибольший делитель вполне определяется с точностью до некоторого произвольного постоянного множителя, который может быть по желанию в него введен. Исключение составляет только случай, когда Оба полинома тождественно равны нулю. Прежде всего надлежит доказать, что а __ fa* - -j b-[qx;:r:
ОБЩИЙ НАИБОЛЬШИЙ ДЕЛИТЕЛЬ ДВУХ ПОЛИНОМОВ ОТ ОДНОЙ ПЕРЕМЕННОЙ 179 Предположим, что ни /, ни ср не состоят из одной только постоянной и что степень / по меньшей мере равна <р, так что имеют место нера* венства: а0Ф0, Ь0 Ф 0. п > т > 0. Применяя теперь алгорифм Евклида так же, как и в § 66, получим следующую систему тождеств: /(х)~00(.г)>(.г) +/?,(*), * <9(x)~Qx(x)Rl(x)-i-R2(x\ I #1 (х) s Q2 (х) R2 (х) + Я3 (*), Г (2) /?p-i М = £р (*) /?р (х) +Яр+1 (дг), > • причем для однообразия положим: ?(*)==#е(*). Тогда R0, /?1} /?к2, ... будут полиномы, степени которых постоянно уменьшаются, тщ что один из них должен, Наконец, состоять из одной только постоянной. Полином этот обозначен в (2) через /?р+1. Рассуждаем теперь снова, как в § 66. Каждый общий делитель / и ср будет также делителем всех R, и, обратно, всякий общий делитель двух друг за другом следующих R является делителем всех предшествующих /?, а потому также / и <р. Если / и ср имеют общий делитель, не приводящийся к постоянной, то этот общий делитель должен быть также делителем постоянной R у Поэтому необходимо /?р+1 = 0. Обратно, если /?р+1 = 0, то полином R9(x) сам является общим делителем R и /?р+1> а потому также / и ср. Имеют место, следовательно, такие две теоремы: Теорема 1. Два полинома f и <f от одной переменной, из которых ни один не приводится к постоянной, будут тогда и только тогда взаимно простыми, если в алгорифме Евклида (2) имеет место неравенство R t ф 0. Теорема 2. Если в алгорифме Евклида (2) полином /?р+1 = 0, то /?р является общим наибольшим делителем f и ср. Теперь мы в состоянии вычислить общий наибольший делитель не только двух, но и вообще конечного числа полиномов от одной переменной. Например, если ищется общий наибольший делитель полиномов fix), ср(дг), ф(л;), то вычисляем сперва общий наибольший делитель R полиномов / и ср и затем тем же методом общий наибольший делитель полиномов R?ix) и ф(л:). Помощью тождеств (2) можно представить значения отдельных остатков R через /, ср и частные Q. Получаемые формулы вполне соответствуют данным в § 66; в частности имеем: Яр*еэ(-!»[&(*> &(*)> —. Рр М1/М+ ^ + (-l)p+4Qt<*), QiW. ..., OpWlfW. 12*
180 ОБЩИЙ ДЕЛИТЕЛЬ ПОЛИНОМОВ Если / и <р — взаимно простые, то межно делить (теорема 1) на /?phl; мы получим W/W + *W?Msi, (4) <5) p+1 Символы, примененные в уравнениях (3) и (5), уже были определены уравнениями (2), § 66; таким образом F и Ф являются полиномами от х Для того, чтобы два полинома / и <р были взаимно простыми, должны, следовательно, существовать два такие полинома F и Ф, которые удовлетворяют тождеству (4). Но существование этих полиномов F и Ф будет также достаточным условием, ибо из (4) следует, что всякий общий множитель f и Ф должен быть множителем 1^ т. е. должен быть постоянной. Итак, имеет место теорема *: Теорема 3. Полиномы f(x) и <$(х) будут тогда и только тЪгдл взаимно простыми, если существуют такие два полинома F(x) и Ф (х), которые удовлетворяют тождеству: /Ч*)/С*) + Ф (*)*(■*) = !. Теорема эта может быть формулирована еще точнее добавочным замечанием относительно степеней F и Ф. Для этого заметим прежде всего, что, если av ..., ап будут полиномы соответственно степеней kv ..., kn, то введенное в § 66, выражение [аи ..., ап] будет степени не выше kx -f- ... -f-AH. Если теперь mt означает степень Rf (х), а п и т, как и раньше, будут степени соответственно / и <р, то [уравнения (2)] степени Qo> Qv Qa> • • • будут, очевидно, п — т9 т — mv тх—/тг2, ...; поэтому в силу (5) степени F и Ф будут соответственно не больше чем (/я— тг) + {mi — т2) Н \-{щ-\ — Щ) = т — т?. (п — т) + (т — т{) + (т^ — т2) Н \-{т9-г — т9)=п — mpi Так' как т? ^> 0, то степень F меньше т и степень Ф меньше п. Докажем теперь обратное, что если Ft и Фх будут полиномами, степени которых соответственно меньше т и п> и если между этими полиномами имебт место тождество • *\ (*)/(*)+ ^i(*)*(*)=l. (в) то тогда Fx(x)=F(x). Ф1(х)^вФ{х). Вычитая, получаем из (4) и (б) тождество: 1 Доказательство не имеет силы для случая, когда / или <р будут постоянными. Но тогда справедливость теоремы 3 не нуждается з дальнейших пояснениях.
РЕЗУЛЬТАНТ ДВУХ ПОЛИНОМОВ ОТ ОДНОЙ ПЕРЕМЕННОЙ 181 Если выражения в обеих частях этого тождества разложить на линейные множители, то так как / и '& взаимно простые, видим, что / должен быть делителем Ф{— Ф и равным образом <р —делителем F—Fv Ло это возможно только тогда, если Ф1 — Ф и F— Ft тождественно главны нулю, ибо иначе степени этих полиномов были бы соответственно меньше пит. Теорема 4* Если полиномы f(x) и <р(х), из которых ни один не состоит из одной только постоянной, будут взаимно простыми, то всегда существует одна единственная пара полиномов F(x) и Ф(х)> степени которых соответственно ниже степеней f и <р, и которые удовлетворяют тождеству (4). Прежде чем перейти к общим приложениям вышеизложенных рассуждений, предлагаем читателю ближе освоиться с излагаемым, рассмотрев, например, частный случай двух полиномов второй степени: • f(x) === д0*2 + Ч* + а2 До 4= 0, Если требуется найти непосредственным применением Евклидова алгорифма условие того, чтобы этл два полинома были взаимно простыми, то необходимо придется рассмотреть отдельно два случая: a0bt — at&0 ф ^ и афх — atbQ = 0. Сравнивая полученные результаты, убеждаемся, что искомое условие в обоих случаях может быть представлено неравенством: {а2Ь9 — а0Ь2)* + (a{b0 — a9b{) (ахЬ2 — аф^ Ф °- Условие это может быть получено более кратким и изящным приемом, если поставить вопрос об отыскании таких двух полиномов F(x)=p9v+plt Ф (х) = qQt + Яь которые удовлетворяют тождеству (4). Этот последний метод будет применен в следующем параграфе самым общим образом. 68. Результант двух полиномов от одной переменной. Условие того, чтобы два полинома /(*) see а0х» + агхп-* + ... + я„-1* + ап д0 ф 0, п > 0, i(x) = b0xm + bixm-t + ...+am_tx + bm £0ф0. ет>0, были взаимно простыми, состоит по теореме 4, § 67 в том, что должны существовать постоянные рь, pv ..., pn_v q9, qv ..., qn„v удовлетворяющие тождеству: {Ро*т-* + Pixm~* + • • • + Рт-\) (а*хп + ахх*-* + -.. + ап) +
182 ОБЩИЙ ДЕЛИТЕЛЬ ПОЛИНОМОВ Сравнением коэфициентов при членах с одинаковыми степенями х получаем следующую систему соотношений, равносильную вышенаписан- ному тождеству: воРо -btq0-i-b0 q{ anPd "Г Д»-1/>1 +• • •+ an-m+lPm-l -wH-i Pm-i = 0 '^0 «n Ar + *mfl n-1- :1 (1) Для определенности мы предполагали при этом, что #>//*, хотя предположение это само по себе не существенно. Имеем здесь систему т-\-п линейных уравнений с т -f- п неизвестными /?0, —, pm_v q^ ..., Яп-v определитель которой после замены горизонталей вертикалями и некоторой перестановки горизонталей принимает следующий вид: da . . оп 0 1 о . . . . 0 . . . 0 0 . . 0 . . 0 . . . . 0 UQ . . ...0¾ . . . о ьл. . . . й- . . .ьт . . Ь„, 0 ъ„ 0 . . . . . 0 Этот определитель имеет т -f- п горизонталей и столько же вертикалей. Если R ф 0, то система уравнений (1) имеет всегда одно единственное решение, и / и <р будут взаимно простыми. Если /? = 0, то представляются с первого взгляда возможными два случая (ср. § 16), а именно: вовсе не существует никаких решений или же их имеется бесчисленное множество. Однако последнее предположение не может иметь места, ибо по теореме 4, § 67 существует не более одной пары подино- мов, которые удовлетворяют уравнению (4), § 67 и степени которых будут соответственно не больше чисел т—1 и п — 1. Таким образом, если /? — 0, то система уравнений не имеет никакого решения; отсюда следует, что / и 'f обладают общим множителем.
ОБЩИЙ НАИБОЛЬШИЙ ДЕЛИТЕЛЬ В ФОРМЕ ОПРЕДЕЛИТЕЛЯ 183 R называется результантом /и <?1. Понятие о результанте было определено таким образом в предположении, что / и <f являются полиномами по крайней мере первой степени. Желательно, однако, определение распространить и на тот случай, когда <один или два полинома приводятся к постоянным. Опуская случай, когда Ч1 = п==0, определим тогда результант также помощью определителя R. Таким образом для т = 0, п >> 0 имеем: *gj ^)=(-1)-^ V- Если £§ф 0, то R ф 0; / и <р — взаимно простые, так как постоянная ? ^ожет содержать только постоянные множители. Если, однако, &0 = 0, по /?=0, и каждый множитель / является множителем <р, так как f в рассматриваемом случае тождественно равен нулю. Равным образом для я = 0, /я>0 результант равен К \ и и 1 — Н » 4*0. •••; *т' / и <р тогда и только тогда будут взаимно простыми, если R ф 0. Если, наконец, л = /я = 0, то символ R (JM, который должен быть «азван результантом, определим одним из следующих уравнений: р/а0\ _ /1, если а0 и &0 не равны одновременно нулю, \bJ-\0, если а0 = ^0 = 0. Теперь можем высказать такую вполне общую теорему: Теорема. Два полинома от одной переменной тогда и только тогда будут взаимно простыми, если их результант отличен от нуля. К понятию о результанте можно притти другим путем (ср. упражнение 4, § 76). 69. Общий наибольший делитель в форме определителя. Определение* i-ым субрезультантом Ri двух полиномов от одной переменной называется определитель, получаемый вычеркиванием из результанта этих полиномов первых i и последних i горизонталей, а также первых i и последних i вертикалей. Если два полинома будут соответственно пятой и третьей степеней, то результантом R будет определитель зосьмого порядка; Rx будет тогда шестого порядка, #2 — четвертого, Rs — второго, в чем убеждаемся из следующей схемы: 1 Необходимо отметить, что результант ср и / может быть противоположен п:> знаку результанту / и <р; эта перемена знака в дальнейшем во многих случаях /не имеет никакого значения
184 ОБЩИЙ ДЕЛИТЕЛЬ ПОЛИНОМОВ R = о «1 «2 aZ а* О /?| = «0 0 0 ** = ■ 0 0 1 *0 <*i 1 ло 0 R,= 0 *0 *t «2 *1 0 *0 *1 *2 «3 «2 *0 *1 *2 Ьз ал а. 0 а* h 0 0 о о ч *>\ Ч Ь% О Формулируем теперь некоторые теоремы, доказательство которых предоставляем читателю. Лемма. Результант двух полиномов /х(х) и У^х) и их последовательные субрезультанты равны соответственно последовательным субрезультантам двух полиномов /C*)ss(*-«)/i(*). ¥(*)ss(*--a)fc(x). Теорема L Степень общего наибольшего делителя f{x) и <f(x) равняется указателю первого отличного от нуля субрезультанта в последовательности: Rо:r=: R9 RJ ? R2» • • • Теорема 2. Если степень общего наибольшего делителя двух полиномов f(x) и <р (х) равна i, то общий наибольший делитель может быть получен из 1-го субрезультанта f и <р путем следующего приема: последний элемент последней горизонтали, образованной из коэфициентов /, заменяют через /(*), непосредственно стоящий над ним элемент — через xf{x)y стоящий над этим последним—через x*f(x) и т. д. Равным образом последний элемент в первой горизонтали, обра' зованной из коэфициентов <?, заменяют через <р (л:), под ним стоящий элемент„—через ху{х) и т. д. Например, если / и <р будут соответственно пятой, и третьей степени,, причем /==1, то общий наибольший делитель может быть написан так; яв ах а2 ад ak xf {х) 0 аь ах а2 аъ / (х) 0 0 0 b0 ЬА v(x) о и b0 b\ Ь2 .г© (х) 0 Ь0 Ъх b2 Ь*. хЦ(х) Ь0 b\ b9 Ь.х и tfyix)
ОбщИЕ КОРНИ УРАВНЕНИЙ. ИСКЛЮЧЕНИЕ 185' 70. Общие корни уравнений. Исключение. Рассмотрим уравнения: f(x)^a0KH+aixn^ + ...^an^0 а0 ф 0, ?(*) = Vw + Mw-l+ ---+^ = ° ^о Ф 0,' корни которых пусть будут соответственно av а,, .. ., ап и j5t, ^,..., £тГ и предположим, что/(л:) и<р(лг) разложены на их линейные множители: /ДОггд^* —в1)(Г —0¾) ... (Г —ан), ?Ms*i(jr-U(jf-f2) ••• (*-U- Так как разложение это по теореме 1, § 65 возможно только одним< единственным способом, то оба уравнения f(x) = Q и <р (х) = 0 обладают тогда и только тогда общими корнями, если полиномы f(x) и <р (дг) имеют общего отличного от постоянной делителя, т. е. тогда и только тогд v когда равен нулю результант R полиномов / и <р. Задача исключения переменной х из двух уравнений f(x) = 0и ср (*)—(> часто ставится в элементарной алгебре так: найти такое соотношение между коэфициентами /и tf, которое имеет место, если удовлетворяются оба уравнения. Другими словами, требуется найти необходимое условие того, чтобы оба уравнения обладали общим корнем. Для многих: целей, однако, мы нуждаемся в большем, а именно в условии, не только* необходимом, но также и достаточном. Таким условием будет равенство нулю результанта. Надлежит, однако, взглянуть на этот вопрос также еще с несколько другой точки зрения. Мы можем в уравнениях д*г5Ф #1** + д2\г3-Ь лз*2 + акх + й5 = 0 сщ Ф 0, {1? М3 + М2 + Ь2х ф &з = 0 £« ф 0 (2>> рассматривать различные степени х как различные неизвестные, так что* имеем тогда два неоднородных линейных уравнения с пятью неизвестными х, л:2, л:3, а4, лг\ Умножая, следовательно, первое уравнение сперва на х, а гатем на а2, а равным образом второе последователь! io< на л:, х%9 х3, а:4, получаем следующую систему из восьми неоднородных: линейных уравнений с семью неизвестными: до*7 ф ахх* ф а2х* ф %** ф д4 v3 + %*2 = 0 a0vc ф atx* + а2х* ф д3*3 Ф а\Хг + аъх = 0 До** ф <*!** ф 02*3 + дз*2 + л4-* = —дх &0*3 Ф #1*2 + ^2* — —- *з М4ФМ3+^2*2 + ^ ~0 М5 + Ьхх* ф б**3 + b*& = 0 М* + М5 + *2** + Vs = о М7 + М6 + h& ф М4 = 0, Каждое значение х, которое удовлетворяет одновременно двум первым уравнениям, удовлетворяет также всем* вышеприведенным восьми,.
186 ОБЩИЙ ДЕЛИТЕЛЬ полиномов Уравнения эти будут, таким образом, друг с другом совместны; а потому по теореме 1, § 16 имеем: I а0 ах а2 а3 <Ч % ° ° I | 0 fl0 fli а2 я3 я4 аъ О I I 0 0 а% ах а2 аг #4 #5 I \ 0 О О 0 £0 Ьх Ь2 63 I о и 0 £0 ^ &2 ъ\ о 1 =а О О Ь0 Ьх Ъг Ъъ о о О b0 bt ь2 ь% о о о I ь0 ьх ь2 ьъ о о о о I Равенство нулю этого определителя является, следовательно, необходимым условием для того, чтобы уравнения (1) и (2) обладали общим корнем. Вышеприведенный прием известен под именем диалитического метод q исключения Сильъестра 1. Только что полученный определитель в точнЪсти равняется результанту R полиномов (1) и (2); метод Сильвестра приводит, следовательно, для двух уравнений, обладающих общим корнем, к тому же условию, -что было найдено выше, а именно /? = 0, причем не доказывается достаточность условия, но только его необходимость. Число общих корней уравнений /(дг)-== 0 и <р (а:) = 0, равно как и урар- «ение для вычисления общих корней, получается непосредственно из § 69. 71. Случай ав = 0 и #в = 0. Согласно определению, определитель R\b. ът) является результантом двух полиномов: /(*) == OqX* -ЬЯ!**-1 + ... + <!„ <р (х)es b<>xm +blx>"-< + ... + *т только тогда, если / и <р будут соответственно точно я-й и т-й степе* ней, т. е. если только а0 ф 0, Ьь ф 0. Таким образом, например, результант полиномов /(х) ~щх»-1 + а2хп~* +шлт + ан. ?(дг)=Мт + ^^ + ... + ^ •будет не определитель (п-\-т)-го порядка «о, если ах ф 0, Ьй ф 0, — определитель (п -\- т — 1)-го порядка R\b0 Ьт)> или, если at или £в равны нулю, определитель еще более низкого порядка 2. 1 Ради простоты мы рассмотрели только частный случай я = 5, /ю = 3;но прием является, очевидно, справедливым вообще. 2 Образуем, например, результант двух полиномов /(.r)==s(a-f- р)лг2 -\-х — р и (f (v) == ах + 1. Для афрфО и а ф 0 результант равен (а2 — 1) 0; но если а = = — ?Ф0, то результант равняется 1—а2.
случай aQ=0 и £0 = 0 187 Обозначим через R определитель (/г-}-/я)-го порядка Ri0^ ""* а*) \о91 .... ьш) и через г—результант / и <р. Для случая а0 = 0, ах ф 0, 60 ф 0 имеем: # = (-1)^-^, так как в первой вертикали R обращаются в нуль все элементы, кроме последнего. Таким же образом доказывается, что если Ь0 ф 0 и степень / равняется п — *, то имеет место уравнение: Если аь ф 0 и т — i будет степенью <р, то R = д0*г. Исключая случай ав = &0 = 0, видим, что R отличается от г только на некоторый отличный от нуля множитель. Теорема. Хотя определитель р(а0, ..., апЛ является результантом f и <р, только если д0фО и Ьь ф 0 («ли ££ла //г = 0 или /г = 0), /яел* я# менее равенство его нулю все-таки дает необходимое и достаточное условие того, чтобы f и ® обладали общим отличным от постоянной делителем' также и в том случае, когда аь — 0 или Ьп = 0 при условии, однако, чтобы а0 и Ь0 не были равны одновременно нулю. Это последнее ограничение, очевидно, не может быть снято, ибо, если #0 = 0, £0 = 0, то каждый элемент первой вертикали сравняется нулю; следовательно, тогда R — 0 независимо от того, обладают ли / и <р общим множителем или нот '. Если мы не желаем делать никаких огра- 1 Рассматривая вопрос с точки зрения теории общих корней, двух уравнений (§70), можно избежать последнего ограничения, вводя понятие о бесконечно большом корне. Уравнение aor* + 0i*n-' + ... + tfn=--=O обладает п различными или совпадающими корнями при условии д0 Ф 0. Но если а0 приближается к нулю, то один или несколько из этих корней по своему абсолютному значению становятся все больше и больше, в чем можно убедиться помощью преобразования #=—. Уместно поэтому в случае а = 0 говорить о бесконечно больших корнях. Тогда можно два уравнения, из которых каждое обладает бесконечно большим корнем, рассматривать как уравнения, обладающие общим к»фнем, и высказать такую теорему: необходимым и достаточным условием для того, чтобы уравнения а0хп + aix™ + ... + ап =о п >0, ^ + ^1^ + ... + ^.==0 т>0 обллдали общим корнем, во всех случаях является равенство нулю определителя R\b, bj'
188 ОБЩИЙ ДЕЛИТЕЛЬ ПОЛИНОМОВ ничений, то останется только сказать, что равенство нулю /? во всех случаях представляет необходимое условие для того, чтобы / и <р обладали общим делителем. 72. Результант двух бинарных форм. Одновременно с двумя бинарными формами J (*х> х2) 5= a0xtn + а1ххп~\х2 +... + апх2* (п > 1) 4 (хи х2) =з bbvtm + Ь^хГ^Хъ +... + £wк2п (/я > J) рассмотрим такие неоднородные полиномы: F(x) = а0хп + avxn~K +...+ ап> Определитель *У* •••• ^J является результантом F и Ф, только если ни aQ ни bQ не рсвны нулкх Во всех случаях, однако, мы будем называть его результантом двух бинарных форм / и <р. Теорема. Необходимое и достаточное условие для того, чтобы две бинарные формы обладали общим делителем, отличным от постоянной, состоит в том, что их результант равен нулю. Если ав и Ь^ оба отличны от нуля, то формам / и <р соответствуют (§ 62) полиномы F и Ф. По теореме 2, § 62 /и <р будут, следовательно,, тогда и только тогда обладать общим делителем, не приводящимся к постоянной, если их результант равен нулю. При аь — £в — 0 результант равен нулю; формы имеют общего множителя дг2. Аналогичное замечание имеет место для случая, когда или все а, или все b равны нулю. Остается рассмотреть только еще два случая: я/фО; ^ = ^=...=^ = 0. *мф0 {к<т\ (1) *0Ф0; ^ = ^==...=^==0, %i + 0 (*<л). (2> В случае (1) F соответствует /; и если мы положим g(xt, x2)^x2Mf1(xi, х2), то Ф соответствует <pt. Согласно § 71, в этом случае R ф 0 является необходимым и достаточным условием того, чтобы F и Ф были взаимно простыми. Следовательно, по теореме 2, § 62 R ф 0 будет также необходимым и достаточным условием того, чтобы / и 'ft были взаимно простыми. Но л\2 не является множителем /; поэтому / и <р будут тогда и только тогда взаимно простыми, если это имеет место Для / и <Pi. Таким образом теорема доказана длд случая (1); для случая (2) рассуждения аналогичны.
Глава шестнадцатая Делители полиномов от двух и более переменных 73. Делители, содержащие только одну иерешшную. В последней главе мы видели, что полиномы от одной переменной всегда приводимы, если степень их выше единицы. Полиномы от двух и большего числа переменных будут, напротив, как это мы уже видели для квадратичных форм, вообще говоря, неприводимы. Пусть полином f{xr у) расположен по убывающим степеням переменной х: f (л:, у) =з а0(у) х« + ах (у)*""1 + ... + ап.г(у)х + ап (у), где а означают полиномы от одного у. Тогда имеет место теорема: Теорема 1. Необходимое и достаточное условие того, чтобы f (х> У) обладал множителем ф (jy), зависящим только от одной переменной у, состоит в том, что ф (у) должен быть делителем всех а. Достаточность условия очевидна. Для того "чтобы доказать еще необходимость этого условия, предположим, что ф(у) будет множителем /О, у). Тогда а, (У)х« + ... + ап (у) ~ ф (у)[Ь0 (у)х« + ... + Ьп (у)]), (1) где Ь означают полиномы от одного у. Если дадим у какое-либо частное значение, то (1) будет тождеством относительно х, а потому имеют место следующее уравнения: $о (У) = Ф СУ) h (у), \ ::::::::-. ( *»(y) = i(y)b*<y). ) 1 Так как уравнения эти справедливы для каждого значения у, то они являются тождествами, и ф (у) будет делителем всех а. Теорема 2. Неприводимый полином ф (у)1 от одного у, который является делителем произведения /<? двух полиномов f(x,y) и <? (х, у) от х и у, будет либо делителем f(x, у), либо делителем <${х, у). Произведение двух полиномов /(*, у) =е а0 (у) х* + aL (у) хп~* + ... + ап (у) ср(х, y)=s h(У)*т + h{у)хт~* + . .. + *ж(у). 1 То-есть линейный полином.
190 ДЕЛИТЕЛИ ПОЛИНОМОВ ОТ ДВУХ И БОЛЕЕ ПЕРЕМЕННЫХ равно /(*> У) 9 U\ У) — *o*o*n+w + (^1 + я^о) г'14""-1 + + (*А, + арг + a2b») х**»-* + ... + anbm. Для того чтобы доказать, что ф является множителем или /, или <р„ покажем, что он будет делителем всех а или всех Ь. В самом деле, если бы это не имело места, мы могли бы среди коэфициентов а найти такие, пусть ai будет первым из них, которые не обладали бы множи- телем ф (у); пусть Ъ. будет также первым из Ь, который не содержит ф множителем. Докажем теперь, что предположение о делимости а0, ... , Д*_1» Ьь> ..., bj_t на ф при условии, что at и Ъ. не делятся на ф, при» водит к противоречию. Для этой цели рассмотрим в произведении ff коэфициент у х{п^)+(т-Я: aobi+j -| 1- ^i-ibj+i + <2*fy + fl/+ify-i + • —h Д*+^о. где а и b z указателями соответственно большими пит тождественно- равны нулю. Так как /<р по предположению делимо на ф, то по теореме 1 вышенаписанное выражение делится на ф; и так как все члены, предшествующие afij, равно как и все следующие за ним, содержат множитель ф, то среди линейных множителей полинома ар. должен находиться ф. Но по теореме 1, § 65 ар, может быть разложен на линейные множители по существу только одним способом, и единственный способ такого разложения заключается в разложении а{ и bj на их линейные множители. Так как ф не является ни одним из таких множителей, то мы приходим к противоречию, и наша теорема доказана. Следствие. Если полином ф (у) от одного у, будучи взаимно простым с <р, является делителем произведения полиномов /(а:, у) а <р (х, у} то он будет делителем /. Если полином ф (у) неприводим, то следствие это тождественно с теоремой 2. В остальных случаях разложим ф на его линейные множители: Рассмотрим тождество, выражающее условие того, что ф является множителем /<р: /(*. У) ¥ (х, У) = +1 (У) к (У) • • • h (У) О (х, у). (2> Отсюда следует, что ф1 (д;) является делителем /<р, и потому по теореме 2 будет делителем либо/, либо <р. Но так как фи? взаимно простые, то ф1 не может быть множителем ср и потому должен быть делителем /: f(x,y)*sh<y)Mx>y)- Подставляя это в (2) и сокращая обе части на множитель ф1? не равный тождественно нулю, получим: Л (*■ У) ф (х, у) зз ф2 (у) ... <[>* (у) G(х, у). (*> Так как ф2 будет множителем /х<р, то он должен быть множителем Д;
АЛГОРИФМ ЕВКЛИДА ДЛЯ ПОЛИНОМОВ ОТ ДВУХ ПЕРЕМЕННЫХ 191? Подставим это в (3) й сократим на ф2. Рассуждая аналогично далее, получим окончательно: f{x.y)^My)b(y) ••• h(y)fk(xty)^^(y)fi(xfy)f что и требовалось доказать. Упражнение 1. Две системы полиномов Р\(У\ Qi(*.y), Вх(х.У\ Р>(У)> Qii*, v), R2(x. у) будут друг другу пропорциональны при условиях: a) если они удовлетворяют тождествам: Pi (У) fix. У) =s Qi (х, У) <Р (*, У) + /?i(r, У\ Рг(У) f (х, у)^02(х,у)<?{х,у) + /?2(х , Л где / (х, у) и <р (х, у) означают полиномы; b) если Рх и Qu а также Р2 и Q2 могут иметь общими множителями только постоянные: c) если JRt и /?2 оба по отношению к х будут низшей степени, чем о (ср. теорему 2, § 63). 74. Алгорифм Евклида для полиномов от двух переменных. Рассмотрим два полинома от х и у: f(x, у) = я0Су)х* + а, (У)ж»-1 +...+ ап(у), 4(x,y) = b0(y)xm + bi(y)xm-* + ...+ Ът(у) и предположим, что а0=£0, Ь0^09 л>яг>0. Помощью теоремы 1 последнего параграфа и результата § 67 можем получить все общие множители / и <р, содержащие только одну переменную у, ибо такие множители должны быть общими множителями всех а и всех Ь. Остается, следовательно, рассмотреть задачу нахождения таких общих множителей, которые сами не содержат множителя от одного у. Покажем, что это может быть достигнуто помощью алгорифма, подобного алгорифму Евклида. Деля / на <р (ср. теорему 2, § 63), получаем тождество: Яо О0/(*. у) S5 Q0 (х, у) f (*, у) + /¾ (ж, Л где /?t ess 0 или будет низшей чем <р степени по отношению к х. Если /?t5^0, то делим ? на /?t: ^i tv) <р (х,» s Qt (дг, .у) /?t (дг, з/) + /?2 (дг, л где /?2 или тождественно равно нулю, или по отношению к х будет низшей степени, чем Rv Если /?5^0, то снова делим Rt на /?2 и т. д. Таким образом получаем следующую систему тождеств:
192 ДЕЛИТЕЛИ ПОЛИНОМОВ ОТ ДВУХ И БОЛЕЕ ПЕРЕМЕННЫХ Р% (У) f (*. у) ss Q0 (х, у) ? (д:, .у) + R{ (х, у), Л (У) <? С*. J') = Qi С*, у) JRt (х, у) + /?2 (ДГ, Jf), Р2 (У) Pi (х, у\ == <?2 (дг, .у) #2 (х, у) + R, (х, у). Рр-1 (У) Р9-2 (х, у) s Qp^ (г, jj) tfp_i (*. Л + /?р (*, у). I ^ Су) /?р_1 С*. Л = Ор (х, jO Дв (л:, j/) + /?р4_, (у). ) При этом степени /?,, /?4. ... по отношению к х идут последовательно убывая, так что, наконец, некоторый /?, например. /?р+1, не зависит от х. Теорема 1. Полиномы f и у тогда и только тогда обладают юбщим делителем, содержащим х, если /?р+1(у)==0. Для доказательства заметим прежде всего, что в силу первого тождества в (1) каждый общий множитель / и <р будет множителем /?t; второе тождество покажет тогда, что этот множитель является также делителем /?2 и т. д. В конечном результате получается, что всякий общий множитель f и <р будет множителем всех R. Но /?р+1 не содержит более х, а потому, если /и ? имеют общий множитель, содержащий х, то /?р+1(у) должен тождественно обращаться в нуль. Предположим теперь обратно: Rni (у) = 0 и положим R?(x,y)~S(y)G(x,y\ (2) гдеО не обладает более никаким множителем, зависящим от одного^1. Из последнего тождества в (1) вытекает тогда, что Р?(у) будет делителем Q9(x,y)S(y)G(x9yy, но так как по предположению G не содержит ни одного множителя, зависящего от одного у, то (следствие к теореме 2, § 73) PSy) должен «быть множителем Q S, т. е. 0Р (х,у) S (у) щ Яр (у) Н(х,у). (3) Подставляя в последнее тождество в (1) сперва (2) и затем (3) и сокращая на общий множитель Рр(у)9 не равный тождественно нулю, «получаем: Rp-tlx, у) = Н(х, y)G(x9 у). Таким образом G является делителем не только R , но также и #р_1# Поэтому предпоследнее тождество в (1) может быть написано в следующей форме: Р9-ЛУ)Р9-ъ (х, у) ~I(xf у) G (х, у). - В силу следствия к теореме 2, § 73;\Рро^(у) будет делителем /, ч1 Если R9 ке обладает никаким множителем, зависящим от одного у, го S булет постоянной. а)
ДЕЛИТЕЛИ ПОЛИНОМОВ ОТ ДВУХ ПЕРЕМЕННЫХ 193 следовательно, можно сократить на /^(у), причем ясно, что G является множителем /?р_9. Итак, мы видим, что G будет множителем цсех /?, а потому также и делителем / и <р. Далее, в силу (2) G будет по меньшей мере первой степени по отношению к х> ибо иначе /?р не содер-' жал бы х, между тем /?р+1 должен быть первым из /?, не содержащим ху что и доказывает окончательно нашу теорему. Так как каждый общий множитель / и <р будет также множителем всех R, то из (2) следует, что для некоторого общего множителя ф полиномов / и <р имеет место тождество: G(x,y)S(y) = Hx,y)K(xty). Если ф не содержит ни одного множителя, зависящего от одного у, то 5 должен быть множителем К (следствие к теореме 2, § 74). Поэтому последнее тождество можно сократить на S, откуда ясно, что ф должен быть множителем. G. Теорема 2. Если /?p+.t е== 0, то общий наибольший делитель f и <р, не содержащий ни одного множителя, зависящего от одного у, будет полиномом 0(х, у), получаемым сокращением Rp(x9 у) на все множители, содержащие только одно у. Если R?n будет некоторая постоянная, отличная от нуля, то / и <р будут взаимно простыми; обратное заключение, однако, места не имеет, как это показывает простой пример: /==2ЛГ2 + Зу2, fsgi. Возвратимся еще раз к тождествам (1). Первое из них дает выражение для Rt через /, <р, Р0, Q0. Подставляя это значение во второе уравнение, можно выразить /?2 помощью /, R и некоторых определенных полиномов Р и Q. Окончательно получаем таким образом: Яр+1 (V)^Г(х*У)/{х,У) + Ф(*, У) 9(*, у), (4) где F и Ф означают полиномы от х и у. 75. Делитель полиномов от двух переменных Теорема 1. Если f(x, у) и <р(дг, у) — какие-либо два полинома от х и у и ф(лс, у) означает неприводимый полином, являющийся дели* телем произведения /<р, то ф будет множителем либо /, либо ср. Если ф не содержит одновременно обе переменные д> и у> то теорема эта приводится к теореме 2, § 73. Остается рассмотреть, следовательно, только случай, когда ф содержит обе переменные. Тогда по крайней мере один из двух полиномов / и <р должен содержать также х по меньшей мере в первой степени. Для определенности положим, что это имеет место для /. Если ф является множителем /, то наша теорема справедлива. Если ф% не является множителем /, то / и ф — взаимно простые, ибо ф неприводим. Вычисляя общий наибольший делитель / и ф, убеждаемся 13 Б о х е р. Введение в высшую алгебру.
194 ДЕЛИТЕЛИ ПОЛИНОМОВ ОТ ДВУХ И БОЛЕР ПЕРЕМЕННЫХ тогда, что первый не содержащий х остаток /?р+1 (у) будет не равен тождественно нулю. Тождество (4) последнего параграфа дает нам тогда: /?р+10) = F(x, y)f(x, у) + Ф (х. у) ф (х, у). (1) Умножая на <р (л;, у)9 видим, что правая часть (1) приобретает множитель ф, ибо по предположение fy делится на ф, а потому #P+i Су) * (*. у) = ф (х, у) х (х9 у). (2) Замечая теперь, что ф может иметь с /? н только постоянного общего множителя, ибо ф неприводим, получаем в силу следствия теоремы 2, § 73, что /? +t будет делителем ч(х>у). Так как R п ф 0, можем на него сократить тождество (2) и получаем таким образом тождество l(x9 y)zs1f(x9 у).ц(х9 у). Отсюда ясно, что ф будет мнбжителем 'f, и следовательно, теорема доказана. Многократным применением этой теоремы получаем Следствие. Если произведение нескольких полиномов от х и у: Л С*. У)к (*> У) • • • h С*. У) делится на неприводимый полином ф(х, у)9 то по крайней мере один из / делится на ф. Перейдем теперь к важнейшей теореме всей теории о делимости полиномов от двух переменных. Теорема 2. Полином от двух переменных, не равный тождественно нулю, может быть разложен по существу только одним единственным способом на произведение неприводимых множителей, из которых ни один не состоит из одной только постоянной. Докажем прежде всего, что существует по крайней мере одно такое разложение. Полином f(x, у) либо сам уже неприводим, либо он приводим; в последнем случае имеет место тождество: /(*, y) = fi(x, У)/2(*> У)* где ни fv ни /д. не будут постоянными. Если ft и /2 оба неприводимы, то наше требование выполнено. В противном случае продолжим дальнейшее разложение на множители, из которых ни один не будет постоянной. Таким образом получаем f(x, у) в виде произведения трех или четырех множителей. Если они все неприводимы, то наше требование выполнено. В противном случае разложим каждый приводимый множитель снова на два множителя и т. д. Процесс этот должен закончиться после конечного числа операций, ибо каждый раз мы получаем множители, степени которых уменьшаются. Таким образом окончательно представляем / в виде произведения неприводимых множителей, из которых ни одни не будет постоянной.
ДЕЛИТЕЛИ ПОЛИНОМОВ ОТ ДВУХ ПЕРЕМЕННЫХ 195 Допустим теперь, что такое разложение возможно двумя способами; f(x, У)=А(х, У)Мх, у) ... Д(дг, у)^ = ?i О*. -V) ?2 (*» У) • • • ь (х> у)- Так как cpj является множителем /, то он должен быть (следствие теоремы 1) делителем какого-либо из полиномов/t,/2, ...,/fc. Положим, что указатели так расположены, что ft делится на <р1# Так как полином ft неприводим, то он может отличаться от <pt только постоянным множителем и, следовательно, можно сократить на <fv ибо <рх ф 0: Так же найдем, что ср2 отличается от одного из /, например /в, только постоянным множителем; получаем тогда: V2/3 •••/* = % ••• ?!• Если /<&, то таким путем исчерпаем <р раныж* чем /; при />&, наоборот, / будут исчерпаны раньше ср. Но в действительности ни один из этих случаев не может иметь места, ибо тогда существовало бы тождество между постоянной и полиномом, не приводящимся к постоянной. Возможно, следовательно, только одно предположение k = /, причем / могут быть так расположены, что каждый полином/пропорционален соответствующему ср. Но это является (определение 7, § 60) условием того, что оба разложения по существу не будут ётличны друг от Друга. Теорема 3. Если два полинома f(x, у) и <p(x, у\ взаимно про- стые, то существует только конечное число пар значений (х, у), для которых f и ср одновременно обращаются в нуль 1. Если бы / и ср одновременно обращались в нуль в бесконечном числе точек (*ь Л). С*2. .½). • • •. * (3) то среди этих точек существовало бы бесчисленное множество точек с различными х или бесчисленное множество точек с различными у. Надлежащим образом меняя обозначения, можем предположить, что существует бесчисленное, множество различных у; тогда / и ср должны быть по крайней мере первой степени относительно х, ибо полином от одного только у может тогда обращаться в нуль для бесчисленного множества значений у, когда он тождественно обращается в нуль. Вычисление общего наибольшего делителя / и ср дает тогда [ср. (4), § 74] тождество: **(х, у) fix, У) + Ф (х9 у) ср (г, у) == /?р+1 (у) 4= 0. (4) Левая часть обращается в нуль для всех точек (3); следовательно, ^P+iCvj также обращается в нуль для бесчисленного множества различных значений у, что приводит к противоречию. 1 Геометрическая интерпретация: две плоские алгебраические кривые /(*, j/) = 0 и ¥(■*» У) = 0 могут пересекаться в бесчисленном множестве точек только тогда, если они имеют общую целую алгебраическую кривую.
ш 196 ДЕЛИТЕЛИ ПОЛИНОМОВ ОТ ДВУХ И БОЛЕЕ ПЕРЕМЕННЫХ Одно из важных следствий доказанной теоремы может быть высказано так: если / и ср — два неприводимых полинома от х и у, то они | отличаются между собой только на постоянный множитель, если урав- | нения /= 0, у — 0 представляют одно и то же геометрическое место, i Для приводимых полиномов следствие это уже *не будет необходимым, j как показывает пример - | Обе кривые в рассматриваемом случае являются тождественными, ибо| каждая из кривых состоит из двух координатных осей, несмотря на то, | что / и <р не будут пропорциональны. Однако следующее условие де- i лает теорему справедливой для всех случаев: ' Пусть полином / разложен на свои неприводимые множители где Д, ...,/¾ означают неприводимые полиномы от д:, >>, из которых! никакие два полинома не будут пропорциональными. Тогда кривая/=== 01 состоит из k различных ветвей: , | Л = 0, /2 = о, Д=0. • ;1 ,1 Каждой такой ветви сопоставим целое положительное число av кото- jj рое назовем ее кратностью. Две кривые, определенные алгебраическими ] уравнениями, должны теперь считаться тождественными, если только они \ состоят из тех же самых неприводимых ветвей, из которых каждая А в обоих случаях обладает одной и той же кратностью. При этом утвер- \ ждении можем высказать такое следствие: Следствие. Две кривые /=0 гг ср ===== 0, в уравнениях которых левые части представ шют полиномы от х и у, не обращающиеся1] тождественное нуль, тогда и только тогда будут тождественными, | если f и <р отличаются только постоянным множителем. Упражнения 1. Пусть /(#), ^ (х), ф (лг) будут полиномы от х, коэфициенты которых принадлежат определенной области рациональности. Если ф, неприводим в этой области и является делителем произведения /<р, то ф будет множителем либо /, либо ср- 2. Пусть /(#) будет полиномом от ху не обращающимся тождественно в нуль, коэфициенты которого принадлежат определенной области рациональности. Тогда / одним и по существу только одним способом может быть разложен на произведение полиномов, коэфициенты которых принадлежат этой области, при^ чем полиномы в этой области будут неприводимы, и ни один из них не состоит из одной только постоянной. _ !, 3. Обобщить теоремы этого параграфа для полиномов от двух переменных,, коэфициенты которых принадлежат данной области рациональности. Я 1 76. Делитель полиножов от трех и более переменных. Выше*Я приведенные теоремы этой главы можно по существу обобщить на|1 случай полиномов от трех и более переменных, не меняя методов^ доказательств. Ограничимся поэтому только изложением текста теорем в той последовательности, в которой, они должны быть доказаныЦ само же доказательство предоставим читателю. Обобщение на случае
ДЕЛИТЕЛЬ . ПОЛИНОМОВ ОТ ТРЕХ И БОЛЕЕ ПЕРЕМЕННЫХ 197 п переменных не представит тогда никаких трудностей и может быть сделано самим читателем (упражнение 1). Расположим полином f(x, у, г) по степеням х: /(*, у, г)н=д0(У, z)xn + a1(y, г)хп~*-}- ...+an(y,z)f тде а означают полиномы от (у, z). Те оремам 1, 2, § 73 соответствуют в рассматриваемом случае такие теоремы: Теорема 1. Полином от (у, г) тогда и только тогда будет делителем fh если он является делителем всех а. Теорема 2* Если неприводимый полином ф (у, z) будет делителем произведения /ср двух полиномов /(х, уу z) и у(х, у, z), то он является делителем либо /, либо <р. Следствие. Если полином ф (хЛ у) является делителем произведения /tp двух полиномов f(x, у, z) и ср (лг, у, z), причем полиномы ф и со взаимно простые, то ф будет делителем полинома /. Для нахождения общего наибольшего делителя двух полиномов от трех переменных поступают так же, как и раньше. При этом получается система тождеств [ср. (1), § 74], где -Р и Rp+1 являются теперь функциями от (у, z)f/a Q и остальные R— функциями от (лг, у, г). Тогда теоремам_1, 2, § 74 соответствуют такие теоремы: Теорема 3. Полиномы f (xt у, z) и <р(л:, у, z) тогда и только тогда имеют общий множитель, зависящий от х, если R +1(у, ,г) ===0% Теорема 4. Если /?р+1 (у, z) ss 0, то для нахождения общего наибольшего делителя G (х, у, z) полиномов /(лг, у9 z) и <р (х, у, z), обладающего тем свойством, что он не содержит ни одного зависящего только от (у, z) множителя, надо в R?(x, у, z) вычеркнуть все множители, зависящие гполько от (у, z). Подобно тому, как в (4), § 74, можно и здесь также получить тождество: R9+i (у, z)~F(лг, у, z)f (лг, у, z) + Ф (х, у, z) ? (лг, у, z). (1) Теоремам 1, 2, § 75 соответствуют теоремы: Теорема 5. Если неприводимый полином ф(лг, у, z) является делителем произведения /<р двух полиномов f(xy у, z) и у(х, у, z)y то он будет делителем либо /, либо <f. Следствие. Если образованное из полиномов произведение fi(x, У, *)М*, у, z) ... Д(г, у, z) делится на неприводимый полином ф (лг, у, 2), то по крайней мере один из f делится на ф. Теорема 6. Полином от трех переменных, не равный тождественно нулю, по существу может быть разложен только одним спо-
1Й8 ДЕЛИТЕЛИ ПОЛИНОМОВ ОТ ДВУХ И БОЛЕЕ ПЕРЕМЕННЫХ Щ собом на неприводимые множители, из которых ни один не будетщ постоянной. Ц Теорема 3, § 75 для случая трех переменных не допускает непосред-'| огненного обобщения: вместо Rp+1 (у) здесь входит теперь /?р+1 (у, z), щ нельзя более утверждать, что 'этот полином обращается в нуль только! в конечном числе точек. Однако не только доказательство неприменимо, I но также и сама теорема более не имеет места, в чем убеждаемся, за-'| "мечая, что две поверхности, вообще говоря, пересекаются по некоторой 1 кривой. , | Теорема эта должна быть заменена следующей: i \ Теорема 7. Пусть f(x, у, г) и <р(лг, у, z) будут два полинома от \ трех переменных, из которых ср неприводим, a f обращается в нуль ; во всех точках, где ср= 0; тогда ср будет делителем /. Если ср не содержит ни одного из трех переменных х, у, zy то тео- '- рема справедлива, но тривиальна. Предположим теперь поэтому, что ср ; действительно содержит одну переменную, например х. Если бы ср не был делителем /, то, ввиду неприводимости ср, / и ср должны были бы быть взаимно простыми, а потому тогда в вышеупомянутом тождестве (1) /?р+1 (у, z) ф й. Не нарушая общности, можна в <р(лг, j/, *)=5*о(У, z)xm + B1(y, z)xrn-i+... + bm(y1z) (m>l) (2) предположить &0 (у, z) =j= 0. Тогда ЯР+1(У, *)h(yt *)Ф0. (8) Следовательно, существует такая точка (ух, zt), для которой ^Р+1 (Уь Ч) Ф 0, . г^о (Уь Ф *i) 0. (4) Полином ср (х, ух, z^) содержит тогда единственную переменную х по меньшей мере в первой степени и обращается в нуль поэтому (теорема 1, § 6) по крайней мере для одного значения х± переменной х: <p(*i, Уь zi) = °< По предположению имеем тогда также: /(¾ Уь *i) = 0f и, следовательно, из тождества (1) получим: ffp+iOi. 21) = ¾ что находится в противоречии с (4), а потому теорема доказана. Вводя для каждой части приводимой алгебраической ^поверхности понятие о кратности, "получаем совершенно так же, как и для плоских кривых Следствие. Если f и у будут полиномы от (х, у, z\ не равные тождественно нулю, то обе поверхности f— 0, ср ?= 0 тогда и только
ДЕЛИТЕЛЬ ПОЛИНОМОВ ОТ ТРЕХ И БОЛЕЕ ПЕРЕМЕННЫХ 199 тогда будут тождественными, если полиномы f и у отличаются друг от друга только постоянным множителем. Теорема 7 обобщается также следующим образом: Теорема 8. Если f(x, у, г) и ср(лг, у, z) будут два полинома, от трех переменных, обращающиеся в нуль в точке (х0, у0, zQ), причем полином <р неприводим, то <р будет множителем /, если f обращается в нуль во всех тех точках окрестности N точки (xQt у0, г0), в которых у = 0. Примем, как и ранее, что ср действительно содержит х и потому мажет быть представлен в форме (2). Рассмотрим прежде всего случай Ь0 (у9, гв) ф 0. Доказательство аналогично доказательству теоремы 7. Так же, как и выше, будет найдено соотношение (3), откуда мы заключим, что в любой сколь угодно малой окрестности М точки (yQy г0) может быть найдена такая точка (yi9 £t), для которой имеют место соотношения (4). Представив теперь левую часть уравнения ?(*. Л. *i) = 0 (5) ъ форме (2), можем окрестность М точки (уй9 г9) взять столь малрй, чтобы коэфивдёнты уравнения (5) сколь угодно мало отличались (теорема 3, § 5) от коэфициентов уравнения <Р (■*. УЬ >2Го)=0. (6) Но хщ по предположению является корнем уравнения (6). Возможно, следовательно, М взять столь малой, чтобы уравнение (5) обладало по крайней мере одним корнем хи сколь угодно близким к значению х^ (теорема 4, § 6). Итак, в данной окрестности 7V точки (хй, у0, zb) может быть найдена такая точка (xv yv zt)y что <p(*i, 3>ь *i) = 0. По предположению имеем тогда также: ^/(^1,^1.^) = 0. Из тождества (1) получаем поэтому: Яр+i (Уи *i) = 0, что находится в противоречии с (4), и теорема, следовательно, доказана для случая b0 (у9, zb) ф 0 1. 1 Данное выше доказательство применяется также, если не все Ь в (2) обращаются в нуль в точке (у0, z0); для этого надлежит воспользоваться обобщением теоремы 4, § б, упомянутым там в подстрочном примечании. Только случай обращения в нуль всех b в точке (у0, z0) (читателю предлагается составить себе ясное геометрическое представление) требует особого рассмотрения, к которому мы теперь и перейдем.
200 ДЕЛИТЕЛИ ПОЛИНОМОВ ОТ ДВУХ И БОЛЕЕ ПЕРЕМЕННЫХ- Если Ь9 (у0, 2в) == 0, то обозначая степень у(хуу, г) через ky преобразуем полином помощью неособенного линейного преобразования: y=a2x' + hy' + 42*', } (7) благодаря чему степень <р по' отношению к х сделается равной обшей степени k полинома <р теоремы 2, (§ 64). ^сли помощью этого преобразования мы переходим от точки (x0i у§, zj к точке (х0\ Уъ\ 20'), то ввиду того, что преобразование неособенное, можно указать столь малую окрестность N' точки (хь\ у0\ г0')> что все точки этой окрестности соответствуют точкам данной окрестности N для Ов, у<>, г9). Помощью (7) <р преобразуется в *' (*. У> *') = V *'* + V 0/', *')*'*+1 + ... + V (У,^). (8) где &0 будет некоторая отличная от нуля постоянная. Пусть / помощью (7) переходит в f'(x',y'.z'). Так как в окрестности N везде, где <р обращается в нуль, также и /=0, то в окрестности N* (которая соответствует только некоторой части N) f всегда обращается в нуль везде, где это имеет место для <р'. Мы можем поэтому доказанную выше часть нашей теоремы применить для полиномов f и <р\ ибо Ь0\ будучи отличной от нуля постоянной, не обращается в нуль в точке (увг, г9'). Отсюда заключаем, таким образом, что <р' является множителем /: Заменяя теперь x\ y\ z' помощью (7) через x, у, z, убеждаемся, что- <p является множителем /, что и доказывает нашу теорему. Упражнения 1. Формулировать и доказать восемь теорем этого параграфа для случая полиномов от п переменных. 2. Обобщить результат упражнения в конце §73 для случая п переменных. 3. Обобщить результаты двух предшествующих упражнений для полиномов, коэфициенты которых принадлежат данной области рациональности. 4. Результант двух полиномов от одной переменной /(*) == д0дгп + агхп~1 + ... + aw <?(x)^b0xm + Ъхх™+ ... + ЬШ иногда определяют как полином R наинизшей степени относительно а и Ъ, который удовлетворяет тождеству вида: /у+Ф<р==#, где F и Ф означают полиномы от да, ..., ап; Ь0, • * •»Ьт> х> причем тождество должно иметь место по отношению ко всем этим аргументам. Доказать, что определенный таким образом результант отличается только постоянным, не равным нулю множителем от результанта, определенного в § 68.
Глава семнадцатая Целые рациональные инварианты. Общие теоремы 77. Инвариантность множителей инварианта. Обозначим через общую форму k-ft. степени от п переменных, где х будут переменные и а — коэфициенты. Всякая такая форма при соответствующем выборе а может быть представлена указанным образом. Поэтому мы можем также новую форму, получаемую из / помощью линейного преобразования, обозначить через • ибо степень остается без изменения, равно как и число переменных. Эта новая форма и вместе с тем также каждое а! будут однородны и линейны относительно а\ с другой стороны, очевидно, каждое а1 является однородным полиномом k-й ^степени от коэфициентов преобразования. Из определения инвариантов следует, что произведение некоторого числа щелых рациональных относительных инвариантов форм или систем форм снова является целым рациональным относительным инвариантом. Докажем теперь обратное, начав с простейшего случая одной единственной формы. Теорема 1* Если целый рациональный инвариант I(ava«,...) формы /C*i» • • •» *п*> аЬ а2> • • •) будет приводим, то все его множители будут также инвариантны. Для этого достаточно только доказать, что неприводимые множители Л> Л» • • -i/i инварианта / будут инвариантами. Подвергая / линейному преобразованию с определителем с: и обозначая через я/, а2',... коэфициенты преобразованной формы, можем тождество ' (*i'i а2', ... ) ss сЧ {аь аь...) (1) представить также в виде:
^02 ЦЕЛЫЕ РАЦИОНАЛЬНЫЕ ИНВАРИАНТЫ. ОБЩИЕ ТЕОРЕМЫ Здесь мы имеем полином от с и от а, который в правой части pa3rj ложен на свои неприводимые множители,, ибо по теореме 1, § 61 определитель с будет также неприводим. Каждый множитель левой части | равняется, следовательно, произведению некоторых множителей, стоящих в правой части! так что имеют место тождества такого вида: •$ ft («i\ а2'„..) = *х*р* («1 «2- • •) (* =* 1, 2,.... /), (2) | где <р означают полиномы. Полагая теперь CU = ^22 = • • • = спп = 1 и все остальные с равными нулю, видим, что наше преобразование будет| тождественным, и потому каждое а1 равно соответствующему а. Тождество (2) приводится тогда к виду: fi («1, **• • •) е= ?, (flL> %• • •) tf = U 2,..., /). Подставляя полученные таким образом значения yt в (2), видим, что 1 f. будег инвариантом, что и доказывает нашу теорему. Более общей является следующая теорема: Теорема 2. Если целый рациональный инвариант 1{аьаъ,...\ЬьЬ2>...\ ...) системы форм Л С^ь • • •» хп> аь а2> • • •)* A (*v ••-..Яп'ЛЛ. •••). ;* будет приводим, то все его множители также являются инвариантами* Для доказательства достаточно текстуально повторить предыдущее доказательство. Упражнение Если целый рациональный ковариант Halta2t...; bbb2, ...; *..;уи ...,yn\zv ..., zn; ...) системы форм I и системы точек(уь .. .,jyn), fo, ..., zn),... приводим, то все его множители будут! ковариантами или инвариантами. ^ 78. Относительные инварианты, рассматриваемые с болев;» общей точки зрения. Мы называли полином / от коэфициентовЯ n-нарной формы (т. е. формы от п переменных) / относительным инва41 риантом этой формы, если при преобразовании формы помощью ли*|| ill
ОТНОСИТЕЛЬНЫЕ ИНВАРИАНТЫ 203 нейного преобразования полином этот умножается только на некоторую степень определителя преобразования. Естественно поставить вопрос, какого рода функции / мы бы получили, если бы было поставлено более общее требование, а именно, что / умножается на некоторый полином от коэфициентов преобразования. В действительности тогда получают не более общий класс функций, но только вышерассмотренные инварианты. t Теорема, Пусть / (ava^...) т— не обращающийся тождественно в нуль полином от коэфициентов (ах, а2,..) п-нарной формы /, которые переходят в {at\ а2',...) при преобразовании f помощью линейного преобразования *i = cnxi! + ... + сХпхп\ \ -Cn\Xi + ... + сппхп пусть, кроме того, полином этот удовлетворяет тождеству: I{а%\ajt...) — Ф(^11,.•.,с^Цаь д2,...), где ф будет полиномом от с, тогда ф является степенью определителя преобразования, если вышенаписанное тождество имеет место для всех а, и для всех с. Прежде всего надлежит доказать, что для с ф 0 будет также ф ф 0. Допустим, если это возможно, что ^ц,...,"^яп будет частной системой значений ¢.., для которой ф обращается в нуль, но для которой определитель преобразования отличен от нуля, т. е. ♦ fat.-.. lnl- dftn) = 0, Ф0. Тогда для преобразования хх = dnxx' + ... + dmx*> xn=dniXi + — + dnnxn существует преобразование, ему обратное: ***= 8nl*1 + • • • + 8пн*н- Для частной системы значений а% для которой 1(аъ д2, ...)4=¾ имеем тогда: Ца^а2\ ...) = Ф(<*ш >..,dnn)I{ax, я2,...) = 0.
204 ЦЕЛЫЕ РАЦИОНАЛЬНЫЕ ИНВАРИАНТЫ. ОБЩИЕ ТЕОРЕМЫ Но помощью обратного преобразования мы бы получили: / (ах\ оа', ...) = Ф (Зц, . •., Ьпп) I (ах>, а2', ...) = 0, что приводит к противоречию. Таким образом ф могут обращаться в нуль только для с = 0. Разлагая ф на его неприводимые множители: Ф (£ц, . - .,Спп) =ss <l>i (ctb ..., Спп).. .фх(^Ш- • •> спп)> видим, что множитель фг может тогда, очевидно, обращаться в нуль только для ¢ = 0. Распространяя теперь теорему 7, § 76 на случай п переменных, убеждаемся, * что фг должен быть множителем с, но так как с неприводимо, то tyt может отличаться от с только на постоянный множитель, и, следовательно, Ф = /С^. Для доказательства того, что /С = 1» рассмотрим тождество: I W> #2'>- • •) = КсЧ (аь Ч> • • •) и выберем с^ так, чтобы они давали тождественное преобразо#$ние. Тогда с=1, и а! равны соответствующим а. Последнее тождество принимает вид: 1(аь а2,...) = К1(аь аъ ...), откуда и следует, что К = 1. Упражнения 1. Если полином / от коэфициентов аь аъ... л-нарной формы и от координат (jVt,..., уп) некоторой точки обладает тем свойством, что он умножается только на некоторую рациональную функцию ф от коэфициентов линейного преобразования, помощью которого преобразуются и форма, и точка, то ф является положительной или отрицательной степенью определителя преобразования, а / будет ковариантом. 2. Обобщить теорему текста для инвариантов системы форм. 8. Обобщить т,еорему упражнения 1 для системы форм и системы точек. 4. Всякий рациональный инвариант формы или системы форм может быть представлен в виде частного двух целых рациональных инвариантов. 5. Распространить теорему упражнения 4 на коварианты. 79. Изобарный характер инвариантов и козариантов. Не только в учении об инвариантах и ковариантах, но также и во многих других областях бывает полезно сопоставить каждой переменной некоторый определенный вес. Произведению двух или большего числа таких переменных сопоставляется тогда вес, равный сумме весов сомножителей; постоянный множитель обладает весом, равным нулю/ Если zvzvzs имеют соответственно веса wvwii9w99 то вес члена bzxz^z£ будет равен w1-\-w^-\-2wz. Если сопоставить каждой переменной некоторый определенный вес, то, рассматривая полиномы, убеждаемся, что каждому члену полинома соответствует также определенный вес. Назовем тогда ' весом полинома наибольший из весов тех членов, коэфи- циенты которых отличны от нуля. Если все члены полинома обладают одним и тем же весом, то полином называется изобарным.
ИЗОБАРНЫЙ ХАРАКТЕР ИНВАРИАНТОВ И КОВАРИАНТОВ 205 N Согласно этому определению полином, тождественно обращающийся в нуль, не обладает никаким весом; если полином приводится к отличной от нуля постоянной, то его вес равен нулю. Если wt - и w^ будут веса двух полиномов, то произведение этих полиномов обладает весом Я^ + ^Л Применим теперь понятие о весе к тому случаю, когда переменные, о которых идет речь, являются коэфициентами av #2>"* /г-нарной формы / (*i» • • -»хп; аъ аъ • - • )> при этом оказывается удобным допущение п различных определений для весов этих а0 причем определения эти сопоставляются п переменным х1У..., хп. Определение 1* Коэфициенту а% члена ^aixx^iXJ,^..xnPn п-нарной формы сопоставим по отношению к переменным xv x3, , хп соответственно веса pti pv..., рп. Для бинарной формы %*ift + а1х1к"-'х2'+ . -. + акх2к указатели коэфициентов дают их веса по отношению к лг2; по отношению к xt веса их получаются путем вычитания указателя из степени формы. Для квадратичной формы aij Xf Xj вес какого-либо коэфициента по отношению к Xj будет равен 0,1 или 2, смотря по тому, будет ли отсутствовать указатель у в коэфициенте или же входит один или два раза а. Помощью частного линейного преобразования ¥ %2kxx/}v=l>2> •■•■ '-1- /+ь—.«) а) коэфициент а% веса \ по отношению к xjy принадлежащий, таким образом, члену xf, преобразуется в а{ = &xa$. Итак, имеем теорему: 1 Понятие о степени полинома является частным случаем понятия о весе, когда всем переменным сопоставлен один и тот же вес, равный единице. Понятие об изобарных полиномах приводится тогда к понятию об однородных полиномах. 2 Для форм высших степеней также может быть применено обозначение коэфициентов помощью нескольких указателей, так что вес каждого коэфициента непосредственно может быть прочитан по указателю. 2
206 ЦЕЛЫЕ РАЦИОНАЛЬНЫЕ ИНВАРИАНТЫ. ОБЩИЕ ТЕОРЕМЫ, Теорема 1. Вес некоторого коэфициента п-нарной формы по отношению к Хл равняется показателю степени ky на которую умножается этот коэфициент при частном преобразовании вида (1). Изобарный- полином веса X по отношению к х. от коэфициентов (avaif9...) некоторой /г-нарной формы умножается поэтому при частном преобразовании вида (1) на kx. .Справедливо также и обратное утверждение. В самом деле, пусть at', а^у... будут коэфициенты некоторой n-нарной формы, преобразованной помощью (1), и пусть <р (ava2,...) — некоторый не обращающийся тождественно в нуль полином, обладающий свойством: ?(%', <%\ ...)^k\(aha2, ...) (тождество это имеет место для всех к и всех а); тогда <р будет изобарным полиномом веса X. Для доказательства расположим члены <р по их весу: <Р (вц «2,- • •) = ?1 («1» «2, ••-) + % (а1> Я* •••) + •• •- где <fv <р2> ...—изобарные полиномы с весами, соответственно равными Имеем тогда: <р (at'9 а{%...)— k\ п (аиа2,...) + Л х* <р2 (аь а2, ...)+•- • Но, с другой стороны, «Р (Дь ^2',- -•) = &N> (яь д2,...) == kx^x (аь аъ.. .)+&\>2 (йь я2.- ••)"+-•• • А потому, сравнивая правые части двух этих тождеств, получаем: Отсюда имеем такую теорему: Теорема 2. Не обращающийся тождественно в нуль полином у от коэфициентов некоторой п-нарной формы при частном преобразовании вида (1) умножается тогда и только тогда на kx, если полином этот будет изобарным веса X по отношению к х^ Теорема эта показывает, что понятие о весе, введенное в § 31, находится в согласии с данным здесь определением, ибо целый рациональный инвариант я-нарной формы, обладающий по § 31 весом X, умножается при частном преобразовании вида (1) только на kx и потому должен быть по теореме 2 изобарным полиномом веса X по отношению к х.. Другими словами: Теорема 3. Целый рациональный инвариант формы /,, обладающий по § 31 весом X, будет, согласно определениям этого параграфа^ также веса I по отношению к каждой из переменных х\ формы f и является по отношению к каждой переменной изобарным полиномом. Таким образом дискриминант До я2 — at2
ИЗОБАРНЫЙ ХАРАКТЕР ИНВАРИАНТОВ И КОВАРИАНТОВ 207 бинарной квадратичной формы ад2 + 2ахххх2 + #2*22 будет изобарным веса 2 как по отношению к xv так и по отношению к xv Предоставляем читателю исследовать тем же приемом дискриминант общей квадратичной формы. Все рассуждения этого параграфа могут быть непосредственно распространены на тот случай, когда приходится иметь дело не с одной единственной формой, но с системой форм. Укажем в частности только на теорему, аналогичную теореме 3. Теорема 4. Целый рациональный инвариант системы форм, обладающий, по § 31 весом X, имеет также по отношению к каждой переменной х4 системы вес^,\ и является по отношению к каждой из этих переменных изобарным, В качестве примера читатель мог бы рассмотреть результант системы линейных форм и инварианты, приведенные в главах XII и XIII. Вес целого рационального инварианта в силу теоремы 5, § 31 не может быть отрицательным. Это обстоятельство становится теперь еще яснее, ибо ни один коэфициент не обладает отрицательным весом. Возможно, однако, высказать теперь более полную теорему. Теорема 5. Целый рациональный инвариант некоторой формы или некоторой системы форм никогда не ножет обладать весом, равным нулю. В самом деле, всякий член инварианта, коэфициент которого отличен от нуля, содержит произведение некоторого числ& коэфициентов системы, форм. Так как ни один из этих коэфициентов не может обладать отрицательным весом, то вес члена по меньшей мере равняется весу однога из этих коэфициентов. Но каждый из них наверное будет по меньшей мере веса 1 по отношению к одной из переменных. Следовательно, инвариант будет по меньшей мере веса 1 по отношению к одной из переменных и потому по отношению к каждой переменной. Чтобы распространить рассуждения этого параграфа на коварианты, необходимо следующее дополнительное определение: Определение 2* Если системы переменных (yv... 9уп), (zu..., zn)>... когредиентны переменным (xv..., хп) некоторой системы форм, то мы придаем, уi9 ziy... по отношению к xt вес, равный—1, а всем остальным у и z по отношению к xt — вес, равный нулю. При частном преобразовании вида (1) каждая переменная умножается также на некоторую степень k, показатель которой равен весу переменной. Таким путем вышеприведенные рассуждения могут быть легко распространены и на этот случай *; получаем следующую теорему: 1 Необходимо при этом обратить внимание на возможность присутствия» членов с отрицательным весом.
208 ЦЕЛЫЕ РАЦИОНАЛЬНЫЕ ИНВАРИАНТЫ, ОБЩИЕ ТЕОРЕМЫ f Теорема 6. Целый рациональный ковариант системы форм а системы точек веса \ (по определению § 31) обладает весом л nd отношению к каждой переменной стстемы и является изобарным пд$ отношению к каждой из этих переменных. В качестве примера заметим, что полярная форма аоУ1*1 + Ч (У'i*2 + Уъг\) + вгУ&ъ 11 бинарной квадратичной формы будет изобарной веса нуль. То же имеет Vj место, в чем читатель легко может убедиться сам, и для полярной \ формы общей квадратичной формы. i 80« Геометрические свойства. Принцип однородности. Мы | знаем уже из элементарной аналитической геометрии, что многие J геометрические свойства плоских кривых и поверхностей могут быть ,^ выражены равенством нулю целых рациональных функций от коэфи- | циентов их уравнений. Рассмотрим, например, поверхность 1 f(x,y,z\aua2, ...)==0, (1) ? 'l где / означает некоторый полином &-й степени неоднородных коорди- у нат х,у,г с коэфициентами avя2,... Пусть, далее, в уравнении | (^,^,...)=0 (2),| <р означает полином по меньшей мере первой степени от коэфициентов | ava^... По теореме 3, § 6 существует бесчисленное множество поли-;;| номов k-Vi степени от (х> у, г), коэфициенты которых удовлетворяют | уравнению (2), и Также бесчисленное множество таких полиномов, для ^ которых обстоятельство это места не имеет. Другими словами, полиномы | k-Pi степени от (л:, у, г) могут быть подразделены на два: класса А и В, \ причем полиномы класса А все удовлетворяют уравнению (2); для по- \', линомов же класса В уравнение (2) места не имеет. Таким образом V4 уравнение (2) представляет необходимое и достаточное условие для | того, чтобы / обладал некоторым определенным свойством, а именно | свойством принадлежать классу А. \\ Но уже на совсем простых примерах можно• убедиться, что этому ; свойству полинома f не соответствует необходимо некоторое геометри- j ческое свойство поверхности (1). Положим, например, & = 1, т. е. >< \ f==atx + a2y + a3z + aii \ и рассмотрим полином от а: л <р = а4. Л Равенство нулю а4 представляет необходимое и достаточное условие | того, чтобы f принадлежал классу однородных полиномов первой <| степени от (л;, у, г), выражая таким образом некоторое свойство поли- | нома /. Но уравнение at=0 выражает также геометрическое свойство J плоскости /== 0 проходить через начало координат. Выберем теперь вместо <р полином
ГЕОМЕТРИЧЕСКИЕ СВОЙСТВА. ПРИНЦИП ОДНОРОДНОСТИ 209 Равенство нулю cpt снова представляет необходимое и достаточное условие для того, чтобы полином f обладал некоторым определенным свойством, а именно, его постоянный член равняется единице. Плоскости, однако, не разделяются в рассматриваемом случае на два класса, ибо уравнение всякой плоскости (не проходящей через начало координат), путем умножения на некоторый отличный от нуля постоянный множитель, может быть преобразовано так, что его постоянный член равен единице. Из предыдущего видим, таким образом, что выражение: поверхность обладает некоторым определенным «свойством», равносильно утверждению о принадлежности ее к некоторому определенному классу поверхностей 1. Теорема 1. Уравнение (2) тогда и только тогда дает необходимое и достаточное условие существования некоторого геометрического свойства поверхности $L), если полином <р будет однородным. В самом деле, если <р — неоднородный полином, то мы можем представить его в виде: <р = <р« + ?»-i + • • • + ?i + <Ро» где<рл — однородный полином я-й степени, а остальные <р либо тождественно обращаются в нуль, либо будут однородными полиномами, степени которых равняются их указателям. Пусть теперь а/, а2',... — система значений а, для которой <рп и по крайней мере один из остальных <р отличны от нуля. Тогда для поверхности /(х9у9г9еаг\еа2'9...) = 0 ' (3) уравнение (2) принимает следующий вид: *nuW> а{у...) + сп"^н^ fa', а2',...) + (-сч№,а2',...) + To(*i',а2\.. .)=0 Так как это уравнение гс-й степени* относительно с имеет по крайней мере один коэфициент после первого, отличный от нуля, то оно обладает по крайней мере одним корнем £t ф 0. С другой стороны, можно указать такое значение га Ф 0, которое не будет корнем уравнения. Поверхность (3) удовлетворяет, таким образом, уравнению (2) для с = ct; для с = с% уравнение это не удовлетворяется. Но при изменении с поверхность (3) не меняется, ибо ее уравнение умножается только на постоянный множитель. Одна и та же поверхность, таким образом, одновременно удовлетворяет и не удовлетворяет условию (2). Отсюда следует, что если <р неоднородный полином, то условие (2) не выражает никакого свойства поверхности. Пусть теперь <р — однородный полином n-Pt степени. Обозначим снова через А класс, состоящий из таких полиномов /, которые удовлетворяют условию (2), а через В — класс из остальных /. Остается, таким образом, доказать, что тогда поверхности (1) могут быть также разделены на два класса, т. е. если #t',a2',... будут коэфициенты полинома 1 Это краткое объяснение не должно быть рассмотрено как попытка определения понятия «свойства»; в действительности ии один класс нельзя определить, не пользуясь каким-либо из свойств. 14 Б о х е р. Введение в высшую Алгебру.
210 ЦЕЛЫЕ РАЦИОНАЛЬНЫЕ ИНВАРИАНТЫ. ОБЩИЕ ТЕОРЕМЫ Л класса Л, и а^\а^\...—коэфициенты полинома класса Въ то надлежит! доказать, что две поверхности i f(x,y,г,ах\ ^,...) = 0, J Г(х9у,г;а^9 я2»,...) = 0 ,$ - :¾ не могут совпадать. В самом деле, если ры они совпадали, то коэфи» j циенты я/, а2',.»- были бы пропорциональны коэфициентам аД а2",.. * | (следствие к теореме 7, § 76): af — cai', a^' — cajf*, а потому было бы: vW,^'',...) = ^^^,...), что, однако, невозможно, ибо, согласно предположению: 1(в^аЛ--.) = 0,¥(вЛ а2",...)ф0, Таким образом теорема доказана. Теорема эта может быть обобщена в различных .направлениях. Прежде всего вместо одной единственной поверхности (1) можно было бы рассматривать систему алгебраических поверхностей, причем <р тогда будет полиномом от коэфициентов всех этих поверхностей. Совершенно те же рассуждения, как и выше, покажут нам тогда, дто уравнение <р = 0 является тогда и только тогда необходимым и достаточным условием для существования некоторого геометрического свойства системы поверхностей, если <р будет однородным полиномом от коэфициентов каждой отдельной поверхности. Пользуясь однородными координатами,, приходим к совершенно такому же результату: Теорема 2* Пусть задана система однородных полиномов от (x:y:z:t): Л (* *У> 2, t\ аь а2,...), /2 (х,у, г, t\ bt, Ь2,...),... с коэфициентами av а%, .. .\ЬиЬ^.. .\ ..., о также некоторый полином <р(Д1»я2, •••^ь ьъ ••• *>•••) i от a,b,... Тогда уравнение <р — 0 лишь тогда и только тогда выражает необходимое и достаточное условие того, чтобы система поверхностей v /i = 0,/2 = 0,... обладала геометрическим свойством^ если полином <р будет однородным от а, однородным от b и т. д. В заключение заметим, что все результаты этого параграфа имеют силу без изменения для алгебраических кривых на плоскости и равным образом также и в пространстве любого числа измерений. Упражнение Пусть в теореме 2 кроме поверхностей /i = 0, /2==0,... дана еще система; точек: (XiiyiiZi'.tOf (x%;y2:z2:t2\.*., и пусть полином <р кроме я, b,... содержит также еще координаты этих точек-
ОДНОРОДНЫЕ ИНВАРИАНТЫ 211 Уравнение <р = 0 дает лишь тогда и только тогда необходимое и достаточнее условие существования некоторого геометрического свойства систем поверхностей и точек, если ? будет однородным отдельно по отношению к а, по отношению к Ь и т. д. и, наконец, однородным отдельно по отношению к (xifyt, zit trf, no отношению к (x2, У2, z2t t2) и т. д. 81. Однородные инварианты. Из предыдущего параграфа вытекает, что целые рациональные инварианты, входящие в рассмотрение при геометрических приложениях, будут однородными от коэфициентов каждой отдельной основной формы1. Такого рода инварианты называются од- нородными инвариантами. Все до сих пор рассмотренные инварианты были именно этого рода. Следующая теорема дает важное соотношение между весом и различными степенями, входящими в однородный инвариант* Теорема 1. Вес \ однородного инварианта 1{аьа2,..>\ bltb2,...; ...) системы форм от п переменных f2(xt',..., хл'\Ь^Ь^%...)9 :::::::::::: j определяется из уравнений тха-\-т$-\-.. .= /гХ, (2) где т% означает степень fv а—степень 1 относительно а, $—степень I относительно b и т. д. Подвергая формы (1) линейному преобразованию ■*i = *li*l'+---+^1.1 хп' \ !!!!!!!!!!!! \ (S) *«=*«1*t' +-.- + cnnxnf } 1 Это утверждение не должно быть понимаемо буквально. Оно является пра» в ильным, если при геометрических приложениях переменные рассматривают ьак однородные координаты и изучают геометрические места, получаемые при-1 равниванием нулю основных форм. Возможно, однако, еще другое геометрическое толкование. Например, если в бинарных квадратичных формах Д =3 ах& + 2а^ху + а^\ f2~~ Ъх%* + 2Ь%ху + &аУ2 U, у) означают неоднородные координаты на плоскости и рассматривается пересечение конических сечений /i = l, /2 = 1» то обращение в нуль инварианта ata9— А2а+^Л— ьг* имеет геометрический смысл, хотя инвариант этот не будет однородным отдельно по отношению к а или отдельнр по отношению к Ъ. 14*
212 ЦЕЛЫЕ РАЦИОНАЛЬНЫЕ ИНВАРИАНТЫ. CriLfcE liCllbbl с определителем с, получим новые формы: Мхх\...9х%'\ bt\ b2\...\ I И так как по предположению / должен быть инвариантом веса )., то 1(а^,а2',...; V» Ь2', ...; ...)==& I{ava7, ...\ЬЬЪЬ ...;...). (4) Каждое а' является однородным полиномом от с.> степени mv каждое Ь* будет степени т^ и т. д.; так как инвариант / сам является однородным и притом степени а относительно а, степени $ относительно b и т. д., то левая часть (4) представляет однородный полином от с^ степени, равной тх a+ /¾ (3 + • • •• С другой стороны, из рассмотрения полинома в правой части следует, что степень его по отношению к си равна п\ что и доказывает нашу теорему. Важное значение, которое имеют однородные инварианты, зависит также и от того, что помощью их могут быть построены и неоднородные целые рациональными инвариантами. Теорема 2. Если целый рациональный инвариант I системы (1) представлен в виде: /=/1 + 4+---+4. где каждое I (но, однако, не сумма двух 1) означает полином, одно» родный отдельно по отношении) к я, по отношению к b и т. д., то каждая из функций A» А» •••»/* является однородным инвариантом системы (1). Теорема эта непосредственно следует из определения инвариантов. Действительно, из тождества A W* *г'» • • •; h\ h> • • •; • ..)+...+ 4 (<V, л2'.- • •; V» V* •••;•• 0 s3 === г* [А (аи02,...; fcj, ь2, ...;...)+•••+А(«1, «2» • • •; ^i» ^2» •••;•• •)] вытекают, очевидно, следующие: A W» <*2> h'> V» • • •; - • •) =сХ !\ (аь а* • • •; К h • • •; • • •)» А(а\\а%> • • •» ^i'» ^2'f • • •» • ••) — £*/*(^1*а2» • • -J^i»^2» •••;•• •)• Для случая одной единственной формы от л переменных и только для этого случая имеет место теорема: Теорема 3. Целый рациональный инвариант одной единственной формы от п переменных всегда будет однородном. Пусть / будет инвариантом и /С*1» • • •» хп> аЪ д2» • • • )
ОДНОРОДНЫЕ ИНВАРИАНТЫ 213 основной формой. По теореме 2 можем положить где стоящие в правой части / будут однородными инвариантами; пусть степени их по отношению к а будут соответственно av ,.., ак. Обозначим через X их общий вес, который будет также и весом /. Пусть, наконец, степень / будет т\ тогда по теореме 1 имеем: /яоц —/гХ; ma2~-nl, ..., так = пк; и так как т^>0, то отсюда следует: at = a2 = ... = ак9 'Ч т. е. все / правой части обладают одной н той же степенью; другими словами, / будет однородным. Теорема 4. Уравнение <р — 0, где <р означает полином от ко эфи- циентов некоторой системы форм Д, Д, от п переменных, дает тогда и только тогда необходимое и достаточное условие существования проективного свойства системы геометрических мест /1 = 0, Д=0,... в пространстве п — 1 измерений, если <р будет однородным инвариантом системы форм /. Если <р— однородный инвариант, то обращение его в нуль, согласно § 80, представляет необходимое и достаточное условие существования некоторого геометрического свойства; свойство это должно быть проективным, ибо при преобразовании геометрических мест помощью неособенной колли- неацни <р умножается только на постоянный множитель, отличный от нуля. Пусть теперь ср = 0 представляет необходимое и достаточное условие существования проективного свойства; тогда надлежит доказать, что <р будет инвариантом (однородность <р следует из § 80). Обозначим через av а%> ... коэфициенты Д, через bv £а, ,.. коэфициенты Д и т. д., и пусть линейное преобразование х1=спх1'+...+ сихп' \ !!!!!!!!!!'.'.[ (5) / ^=^1^+---+^^ ) преобразует, далее, Д в Д' с коэфициентами аг'9 я2', ..., Д в Д с коэфициентами &/, &2', ... и т. д. Образуя полином <р для преобразо ванных форм: ? (а\, <*ъ • • -I bi> ь2> • • •; • • •)» замечаем, что ср может быть рассматриваем как полином от a, Ь, ... и с%р так как а( и Ь' будут полиномами от а, Ъ, ... и ctj. Разложим ср на его неприводимые множители: s 9 (fli> «2> • • •; НН -.-;•••; ^и» • • ->спп) • • • <р* (*i> «2.- • ->h> h>- • •;• • -u,ctb - • •>£«„). (в) По крайней мере один из множителей правой части должен на самом деле содержать ciV Пусть <pt один из таких множителей; представим его в виде
214 ЦЕЛЫЕ РАЦИОНАЛЬНЫЕ ИНВАРИАНТЫ. ОБЩИЕ ТЕОРЕМЫ полинома от ¢., коэфициенты которого будут таким образом полиномами от a, by ... Пусть <|>(flt,a2, ...;&i, Ь2у.*.\...) один из этих коэфициентов; предположим, что ^ф не обращается тождественно в нуль и что член, в который ф входит коэфициентом, содержит по крайней мере одно из ctj по меньшей мере в перзой степени. Тогда можно #, Ь, ... придать такие значения А, В, ..., что ни ср, ни ф не обращается в нуль, и, следовательно, можно указать такую окрестность N точки (Аи Аъ ...; Вь Elt ...; ...), для которой везде <Р (<*1, а* • • •; К К -.-;-••) 4= 0, (7) Ф (<*!,% ...; ЪЬЪЪ...\ ...)=(=0. {*) Ограничимся теперь значениями а, Ь9 ... в окрестности Л/" и поставим вопрос, когда cpt может обращаться в нуль. Из (6) следует, что тогда ш для преобразованных геометрических мест должен обращаться в нуль, причем для исходных геометрических мест, как это следует из (7), <р должен быть отличным от нуля. Но так как по предположению обращение в нуль ср представляет необходимое и достаточное условие для существования проективного свойства, то преобразование (5), обращающее в нуль отличный от нуля ср, должно быть особенным. Это значит, что как только а, Ь% ... взяты в окрестности N, то определитель с преобразования (5) равняется нулю, если ух обращается в нуль. Для любых значений а> Ь, ... в окрестности N <pt будет полиномом от с., по меньшей мере первой степени в силу (8), и потому при соответствующем выборе значений ctj обращается в нуль. Теорема, аналогичная теореме 8, § 76, но для случая числа переменных, большего трех, позволяет утверждать, что срх является множителем определителя с. Но по теореме 1, § 61 определитель неприводим, и потому <рх является только простым постоянным, кратным с. К остальным множителям правой части (6), которые будут по меньшей мере первой степени относительно с.*, могут быть применимы те же рассуждения, а потому тождество (6), переходит в <р (а^, а2\ ...; Ьх\ Ь2\ ...;...) ss ^/ (аи аъ ...; Ьь &2,. ..;...), '*» где ^ не содержит более ни одного с{у Для определения i дадим t п значения 0, 1 так, чтобы (5) приводилось к тождественному преобразо- панию. Тогда а\ Ь\ ... будут соответственно равны а, Ьу ... ис=1; из (9) следует поэтому: 9(^1,аъ ...; bx,b2, ...; ...)== i(aita2, **>;bltb2f...;...). Подставляя это значение у в (9), убеждаемся, что <р действительно является инвариантом. Чтобы избежать всякого недоразумения, заметим, что в случае нескольких уравнений <pt = <р2 = ... = О, где <р являются полиномами от коэфициентов форм f0 уравнения эти могут представлять необходимое и достаточное условие для существования проективного свойства геометрических
РЕЗУЛЬТАНТЫ И ДИСКРИМИНАНТЫ БИНАРНЫХ ФОРМ 215 мест ji = 0, хотя <р не будут инвариантами. Так, например, необходимое и достаточное условие совпадения двух прямых «Л + 44 + Дз*8=0. bixi + b2x2 + b^=z0 заключается в равенстве нулю трех определителей второго порядка матрицы ах а2 д3 J *i *2 *3 Г из которых ни один, однако, не является инвариантом. Необходимое и достаточное условие того, чтобы поверхность второго порядка состояла из двух различных или совпадающих плоскостей, заключается в равенстве нулю всех определителей третьего порядка ее матрицы, из которых ни один также не является инвариантом. В этом случае можно, однако, представить условие, о котором идет речь, в виде тождественного обращения в нуль некоторого контра- варианта, именно присоединенной квадратичной формы. Если одного единственного условия <р = 0 недостаточно для выражения проективного соотношения, то, вообще говоря, выражают искомое условие помощью тождественного обращения в нуль некоторого коварианта или контра- варианта; но может также случиться, что условие будет дано обращением в нуль двух или большего числа инвариантов (ср. упражнение б, § 90). Упражнения 1« Если система в теореме 1 состоит не только из основных форм (1), но также и из точек f- (УЬ •••» J'n)» (*1> •••» zn)> •••» и мы имеем не инвариант, но ковариант веса X степени а по отношению к а, степени р по отношению к Ъ и т. д., степени -ц по отношению к у, степени I по отношению xzht. д., то пц& 4-/71-2? ■+■••• =лХ + иЧ- С +••• 2. Обобщить теорему 2 на случай ковариантов. Может ли быть также этим путем обобщена теорема 3? 3» Обобщить теорему 4 для ковариантов. 4. Степень целого рационального инварианта одной единственной бинарной формы нечетной степени будет четным числом. 5. Бес целого рационального инварианта одной единственной бинарной формы не может быть меньше степени формы. в. Представить в виде тождественного обращения в нуль некоторого коварианта или контраварианта условие совпадения двух прямых (двух плоскостей). 7. Полином от коэфициентов некоторой системы форм от п переменных, однородный при этом относительно коэфициентов каждой из этих форм и не меняющийся при линейном преобразовании с определителем +1> будет инвариантом рассматриваемой системы форм. 8. Обобщить упражнение 7 для ковариантов. ч> 82. Результанты и дискриминанты бинарных форм. Если ixx\x%) означают однородные координаты в пространстве одного измерения, то уравнения, получаемые приравниванием нулю двух бинарных форм / (*ъ *») *■ <W + *i*i"~l*2 + ■ • • + ***<?> 1(ХЬ ^)91^ + ^^2 + -+^,
216 ЦЕЛЫЕ РАЦИОНАЛЬНЫЕ ИНВАРИАНТЫ. ОБЩИЕ ТЕОРЕМЫ представляют системы точек на некоторой прямой. Точки, получаемые рассмотрением уравнения /=0, являются нулевыми точками линейных множителей /; то же имеет место и для ср. Две бинарные линейные формы тогда и только тогда обращаются в нуль в одной и той же точке, если они пропорциональны; следовательно, геометрические места, представляемые уравнениями /—0, ср = 0, имеют тогда и только тогда общую точку, если / и ср обладают общим множителем, не приводящимся к постоянной. Поэтому в силу § 72 необходимое и достаточное условие тогоу чтобы два геометричеЬкие места /= О, ср = 0 обладали общей точкой, заключается в равенстве нулю результанта R бинарных форм f и ср. Но это свойство является проективным, а потому из теоремы 4, § 81 следует: Теорема 1. Результант двух бинарных форм является однородным инвариантом пары форм. Данное в § 68 выражение для R в форме определителя показывает, что R будет степени т по отношению к а и степени п по отношению к Ь. Из уравнения (2), § 81 следует теперь: Теорема 2. Вес результанта двух бинарных форм равняется произведению их степеней. Следующая геометрическая задача приводит нас к важному инварианту одной единственной бинарной формы. Пусть не обращающаяся тождественно в нуль форма #-й степени / разложена на ее линейные множители [формула (4), '§ 65]: f(xb х2) s= (afxx — <V-*:2) (a2"*l — «2**2) • • - (an"*l — an'*2)- Если никакие два из этих линейных множителей не являются пропорциональными друг другу, то уравнение /== 0 представляет п различных точек. Если же некоторые линейные множители друг другу пропорциональны, то говорят, что / обладает кратным линейным множителем; тогда совпадают две или более из п точек, определяемых уравнением /= G. Исследуем, когда это может иметь место. Для этой цели образуем частные производные: д£- == ai"(a2"^l — «2'**) • • • (ап*2 — <х2) + (1) + <*2"(ai"*t — *i'*2) («3**1 — Ч'-Ч) • • • < <Х\ — а«'*2) + • • ■ ... + ап"(а1"дг1 — ах'х2)... (aw_t^, — ал_,'х2), д— = — «1 W*i — «2^2) • • • K"*t — «*'*2> — ~ «2'« <*i"*i — а^х2) Wxt — Оз'лгз).. .(«Л — <^х2) — ... • • •— <(«l"*i — <*i'*2)- • -K-Vl — <n-t'*a)- Отсюда ясно, что всякий кратный линейный множитель / являете» множителем обоих частных производных.
РЕЗУЛЬТАНТЫ И ДИСКРИМИНАНТЫ БИНАРНЫХ ФОРМ 217 Обратно, если эти частные производные имеют общий линейный множитель, то он должен быть множителем / в силу формулы: известной под именем теоремы Эйлера для однородных функций и по» лучаемой непосредственно из двух тождеств: М- == л«в Xi*~l + (я - 1) <н хГ 2х2 +...+ ап^х2п~\ ) S , _, - t (2> ^- s atxt«-1 + 2а2х1^ х2+.. .+ /1^-1. J Но в силу (1) линейный множитель / может тогда и только тогда войти в -^-, если он является кратным множителем /. Отсюда теорема: Теорема 3. Форма f тогда и только тогда имеет кратные ли~ д/ д/ неиные множители если равен нулю результант -<- и ■/—. Определепие. Результант $ и -J- называется дискриминантом формы /. Согласно формулам (2) дискриминант / может быть представлен как определитель (2л — 2)-го порядка, элементы которого в том случае,. когда они отличны от нуля, являются целочисленными кратными коэфициентов я0, av ...", ап формы /. Другими словами, дискриминант будет полиномом от а. Равенство его нулю представляет, кроме того, необходимое и достаточное условие для существования проективного свойства геометрического места /=0 (по крайней мере две из его точек совпадают). По теореме 4, § 81 дискриминант представляет поэтому однородный инвариант, вес и степень которого легко определяются. Таким образом получаем теорему: Теорема 4. Дискриминант бинарной формы п-й степени будет однородным инвариантом этой формы степени 2(п—1) и веса п(п — 1). Иногда бывает удобно определять дискриминант несколько иначе. Напишем бинарную форму / не в обычной форме с коэфициентами av av ..., ап, но введем еще биномиальные коэфициенты, так что: f(xb x2)^a^1n+nalx1n'lx2^^^^ ачхгп-2х2*+... • • • + ляп-1 *\x2~l + апх2п- Тогда имеют место уравнения: 1 i£ - Vl-' + (n-l) «i*i*-2*2 + ("-1)^-^п-з x* +>. m +an_lXrK 1 J|« ад"'1 +(»-!) VA + ("~!)2("~2) ^in-s*?+ ■■■+ а**?'1,
218 ЦЕЛЫЕ РАЦИОНАЛЬНЫЕ ИНВАРИАНТЫ. ОБЩИЕ ТЕОРЕМЫ и дискриминант / определяют как результант этих двух бинарным форм. В рассматриваемом случае он является полиномом от а, отличающимся от определенного выше дискриминанта только постоянным множителем, причем теоремы 3 и 4 продолжают иметь место. Это новое определение в применении к бинарным квадратичным формам и даст нам дискриминант этих квадратичных форм, определенный в предыдущих главах этой книги. Упражнения 1. Результант R двух. бинарных форм соответственно степеней пит буде1 неприводим. [Для #6 = 0 результант R равняется умноженному на ais результанту двух бинарных форм соответственно степеней п и т — 1. Остается только показать, что R неприводим, если неприводимым является только что названный результант. Метоа доказательства — переход от л — 1 к /г. Прежде всего исследовать случай /z=H т = 1.] 2. Пользуясь методами последней главы, доказать, что окаймленные определители главы XII являются инвариантами веса 2. 3. Метод исключения Безу определяют иногда следующим образом: выражение /(*)*(У)-¥(*)/(У), в котором / и «р — полиномы от х степени л, обращается в нуль, независимо от у, для таких значений х> для которых / и <р одновременно равны нулю. Так как выражение это обращается в нуль для х = .у, то оно делится на х—у, и потому ' Р(х v)=nx)«{y)~4(x)f(y) х — у будет полиномом (п — 1)-й степени х, который обращается в нуль для всех значений .у, если х будет общим корнем уравнений /=0 и <р=0. Располагая по степеням у% получаем: Р= <to + 4)1* + *02*2 + • • • + сьпгЛ xn~v + 4- У (сю + спх + сих* +...+ с1ттЛ xn~i) + + УЧЫ + CtL* + *Я** + + + У*"1 (£„-1,0 + *»-i,i* + Cn_{tffl + . ■ + Так как функция эта обращается в нуль независимо от у, то должен обращаться в нуль коэфициент при каждой степени у. Получаем п уравнений, из к торых могут быть исключены п величин 1, лг, д:2, ..., *"""*. Результант представится, таким образом, в форме определителя: Я= ^00 <Чо **=. 1,0 % сх% *п- W • • . • • • • cotn-i • Cl,n-l • СЛ—1,я = 0. Вспомогательная функция F дает, следовательно, в рассматриваемом случае результант в форме определителя л-го порядка, между тем как по методу Сильвестра результант представляется определителем 2д-го порядка. Предлагается критически исследовать это разложение и выразить его в строгой форме. Применить для случая однородных переменных. 4. Если полиномы / и ^ соответственно степеней п и т от (х, у) взаимно простые, то кривые /==0 и ? = 0 не могут иметь больше пт точек пересечения.
РЕЗУЛЬТАНТЫ И ДИСКРИМИНАНТЫ БИНАРНЫХ ФОРМ 219 [Прежде всего можно показать, что координатные оси могут быть так выбраны, что никакие две точки пересечения не обладают одной и той же абсциссой и что уравнения обоих кривых после этого преобразования будут соответственно степеней ли/пот одного у. Из этих уравнений исключают .у по методу Сильвестра.] б. Всякий целый рациональный инвариант бинарной кубичной формы будет постоянным кратным степени дискриминанта. [Надлежит прежде всего показать, что всякая бинарная кубичная форма с необращающимся в нуль дискриминантом может быть приведена к нормальной форме ATt3 — #23 помощью неособенного линейного преобразования. Затем сравнить § 48.]
Глава восемнадцатая Симметрические полиномы 83. Основные понятия. Функции 2 и S Определение 1. Полином F(xlt —, хп), не меняющийся при всех перестановках переменных xlt ..., xnf называется симметрическим. Для доказательства симметричности полинома нет необходимости, однако, рассматривать все возможные перемещения переменных; достаточно доказать, что полином остается неизменным при перестановке всякой пары переменных, ибо всякое перемещение (л;а, хъ, ..., хь) может быть получено из (хг, л:2, ..., хп) помощью последовательных только попарных перестановок элементов х. Например, если аф1, то перемещают ха с xt, затем перемещают второй элемент полученного таким образом перемещения с л:2 и т. д. Отсюда имеем теорему: Теорема 1. Полином будет тогда и только тогда симметрическим, если он остается без изменения при перемещении двух любых переменных. Специальный класс симметрических полиномов особой важности представляют функции 2, определяемые следующим образом: Определение 2, Знак 2 перед некоторым выражением означает сумму всех выражений, получаемых из данного путем всевозможных перемещений указателей. Таким образом имеем, например: Ъх* = х*±х*+...+ Х*, IxfxtflkxfxS +*iV +...+*i"**p + + x£x\ + xfx\ +... + xfxf + (a ф » + • • • + + *«V + *n"*2*+ - ••+ V**-iP. £ xx*x2* = xtax2a + xfxf +... + xfxn« + + лг2адг^+... + x2ax«n + + + + хп-1хп*- Порядок, в котором следуют друг за другом показатели а, р, ... > при этом является несущественным, ибо, очевидно, 1 xfxfxtf ss £ xfxtfxf. Если задан какой-либо член симметрического полинома, то полином Должен также содержать все члены, получаемые из этого первого путем всевозможных перемещений х. Сумма всех этих членов, очевидно,
ОСНОВНЫЕ ПОНЯТИЯ. ФУНКЦИИ 2 и S 221 представляет собой постоянную, кратную одной из определенных выше 2. Также и все остальные члены симметрического полинома располагаются в группы, причем сумма членов каждой группы представляет собой постоянную кратную одной из 2. Отсюда следует: Теорема 2. Всякий симметрический полином будет линейной комбинацией функций 2 с постоянными коэфициентами. Простейшими из этих функций 1 являются суммы одинаковых степеней х. Обозначим для краткости: Иногда бывает, кроме того, удобно положить S0 — п. Теорема 3. Всякий симметрический полином от х может быть представлен в виде полинома от некоторого определенного числа раз- яичных S. Так как всякий симметрический полином является линейной комбинацией от 2, то остается только еще доказать, что всякая 2 может быть представлена в виде полинома от S. Замечая, что имеем при а ф (5: S»S, s t^ + х2а+° +... + *„•+? + xfx? + хх«х£+.. .э Отсюда получаем соотношение: 2V*2P = Sa^~Sa+3 («=£». (1) Для a = {J имеем: Sa2~ xf* + х22а +... + *п" + bcfxf + 2n%« +.. .s — ^2а+2 2 Х\ Х% • Следовательно, Умножая Злг/лг,3 на SY, получаем следующие тождества, где три целые числа а, {$, у предполагаются различными: S^x2^3r-^^ST^5a+i,sT-^+r^-Sp4.YSa + 2Sa+fi+r (3) S xf х2а 4ftTs I (5;^т - ^.5T - 2Sa+TSa + 2S2a+T), (4) S *W*% ■■ "g- (5e»-3^,5«+ 2¾). (5) После рассмотрения этих частных случаев перейдем теперь к доказательству общей теоремы.
222 СИММЕТРИЧЕСКИЕ П01ИН0МЫ Перемножим два симметрические полинома: Sxt*xf...xk\ Sx=sZxtK (k<n). (в) При этом получаются различного рода члены, которые все, однако, входят в тот или другой из следующих полиномов: Ъх^х£...хк% Ъххах2*+Х...хк\ ... S^/...^Ч Ъхх*х£...хк*хм\ (7) причем каждый из этих полиномов действительно входит в рассмотрение. Так как произведение двух полиномов (6) является симметричным, то оно должно иметь следующий вид: сг 2 jqe+\*2P.. .xk% + с2 S х{х2**х.. .***+• ..+^2 xfxfi...хк%+х где с означают целые положительные числа. Отсюда имеем: lxi°x2K..xx+l^^[lxi"x2K..xk*. 2 *,*-<* S*r+V...*AX - -c2ZXi*xf+x...xkx-...-ск ЪХ1ах<?...хкх+х ]. Следовательно, если теорема справедлива для 2^".. .л;Лх, то она имеет место также и для ^xta*. .х^. Но для А=1, в силу определения суммы Sy теорема справедлива; следовательно, она имеет место для k ==2, /5==3 и т. д. 84. Элементарные симметрические функции. Помощью символа Ъ Х\ х2?... хп может быть представлена каждая 2 от п переменных; для р==у=... ,.. = v = 0 имеем 2 xta$ т. е. Sa; для у =... = v = 0 получаем симметрический полином %xtax2 и т. д. Пусть теперь в IxfxJ.. .хп* показатели a, f$, .. .,v все будут равны нулю или единице; тогда могут иметь место п случаев: а=1, P = T=---=v = 0, Ъхъ а =(1=:1, Т(а.м=зУ = 0, 2*1*» а= (1=...= ji=l, v==0, 2*i «2-•-•*»-* a = p = ...= ti = v=lf *1*2----^-1 ■*« Случай a = p = ... = v==0 не представляет интереса. Остальные я перечисленных симметрических полиномов называются элементарными симметрическими функциями и обозначаются через рь ръ ... , рп. Теорема 1. Всякий симметрический полином от х может быть представлен в виде полинома от р.
ЭЛЕМЕНТАРНЫЕ СИММЕТРИЧЕСКИЕ ФУНКЦИИ 223 Всякий симметрический полином от х может быть выражен в виде полинома от 5; остается поэтому еще только доказать, что всякая сум* ма 5 может быть представлена в виде полинома от р. Введем новую переменную х и рассмотрим полином: /(*, хъ хъ ..., *»)==(* — хх)(х — r2)...U — *rt)=s S3 *—рх *-1 +р2Хп-* — ... + (— 1)¾. Из первого представления полинома / имеем: dr * — ЛГ1 л: — х2 *■—.*„" Для л; = л;, полином / тождественно обращается в нуль; поэтому, полагая имеем: ^ ~= /г*""1 + (5t - nPi) хп~2 + (S, -ftSjH- л?2) >-3 +... С другой стороны, ^-^пхп-1-{п-\)р,хп-* + {п--2)р2хп-*-~... Следовательно, путем сравнения коэфициентов при одинаковых степенях х получаем соотношения: 5! — ^==- — (я — \)рь -¼ — Pi Sx -+- пр2 ~(/2 — 2) /?2, или 5,-/^0, ) (1> 5«-i — />i Srt-2 + р2 Sn^-~...+ (— I)"*"1 (л — \)рл^ == 0. Умножал теперь тождества ^-A*i""1 + Ai^-...+ (-])V,sO (/==1, 2, ..., /z) соответственно на х^""*, ..., хпк~п и складывая, получаем следующие тождества: ^-^5,-1 + ^^2--+(-1)^,5^ = 0 (Л = я. я + 1, ...)• (2> Формулы (1) и (2) известны под именем формул Ньютона. Они позволяют последовательно определить Sv *S2, ... в виде полиномоа Oj = Р\) S2 = f>t2 _ 2/72, чго и доказывает нашу теорему.
224 СИММЕТРИЧЕСКИЕ ПОЛИНОМЫ Надлежит отметить, что формула Ньютона (1) не может быть получена «з (2) при значениях k меньших п. Вводя символ />»+1=А1+1= .-. = 0, можно избежать необходимости рассмотрения двух различных систем формул; тогда все формулы Ньютона приводятся к одному виду: 5»—a5m+...+ (-1)*"Wi5i + (-1)^4s0 (Л=1. 2, ...). (4) Пользуясь таким обозначением, видим, что формулы (3), помощью которых S выражаются через ру не зависят от числа п переменных х\ но это имеет место также для тех выражений последнего параграфа, помощью которых 2 представляется посредством S. Теорема 2. Если введем обозначения s формулу Ньютона (4), то тождество, выражающее 2 в виде полинома от /?, не зависит от числа переменных х. Если имеем k полиномов от п переменных: /i(*ii •••* хп)> h{xb •••» хп)> •••» /*(*ь •••» хп)* то говорят, что между ними тогда и только тогда существует рацио- нальная зависимость, если имеется такой полином от k переменных, «е обращающийся тождественно вv нуль: F{zb .... гк\ который, будучи рассматриваем как полином от ху тождественно обращается в нуль после замены каждого из z на соответствующий fi F(fb ...,Л) = 0. Теорема 3. Между элементарными симметрическими функциями от п переменных р1У..., рп не существует никакой рациональной зависимости. В самом деле, пусть F(zl9 . . .,гп) будет полиномдм от п переменных, не обращающимся тожлественно в нуль и в точке (ах,.. .,#«) отличным от нуля. Если теперь определим (хи*.*9хп) как корни уравнения х* — аххп'1 4- а2хп'2 —... + (— 1)Х = 0, то для этих значений х р равны ait..., ап; поэтому функция F(pl9 .. .,рп) для этих значений х не обращается в нуль и является, следовательно, полиномом от jc, не равным тождественно нулю, что и доказывает нашу теорему. Следствие. Симметрический полином от (xv ... , хп) может быть представлен только одним единственным образом в виде полинома от элементарных симметрических функций pv ... , рп.
СТЕПЕНЬ И ВЕС СИММЕТРИЧЕСКИХ полиномов» 225 I Действительно, если бы мы имели для симметрического полинома / два такие выражения: /(*!, ...,^)5¾ (рь .. .,/>„), /0*1, ...,*») S3 <р2 (ft. • ••./*«)> то. помощью вычитания получили бы из этих тождеств такое тождество относительно х: ?l(ft» ---,Pn) — <t2(Pb --;Рп)^0. Но это указывало бы на существование рациональной зависимости 1между /?, за исключением того случая, когда Таким образом оба выражения для / действительно являются тождественными. Упражнения 1. Выразить следующие симметрические^ полиномы: Ъх£хь Ъх$х#, 2*13*22*з, помощью элементарных симметрических функций. 2. Всякий симметрический полином от xtt ..., хп можег быть представлен только одним единственным образом в виде полинома от S^ ..., Sn. 85. Степень и вес симметрических полиномов. Всякой элементарной симметрической функции р сопоставим вес, равный ее указателю (ср. § 79). Теорема 1. Если через р выразить однородный симметрический полином т-й степени от х, то он будет изобарным полиномом веса т. Пусть /(*i,^,..-,*«)=?(/>i,/>2> •••>/>«) (1) 'будет таким полиномом. Так как рх является однородным полиномо первой степени относительно лг, /?2—таким же полиномом второй степени и т. д., то каждый член ср будет однородным полиномом, степень которого равна весу этого члена. Например, член 6р^р%р98 веса 13 будет однородным полиномом от х 13-й степени. Так как изобарная группа членов, выраженная через х, не может тождественно обращаться в нуль по теореме 3 § 84, то jOHa должна быть однородным Полиномом, степень которого совпадает с первоначальным весом. Если <р не будет изобарным полиномом, то полином / неоднороден. Следствие. Если f—неоднородный полином т-й степени, то 0 не будет изобарным полиномом и имеет вес т. Теорема 2. Если выразить помощью элементарных симметрических функций pv .. -,/?л симметрический полином от xv ..., хп, то юн будет той же степени по отношению к /?, которую ранее он имел по отношению к любому из х. 15 Б о х е р. Введение в высшую алгебру
226 СИММЕТРИЧЕСКИЕ ПОЛИНОМЫ 1 Пусть снова / означает симметрический полином / (лгь ..., хп) == <р (а, Ръ ..., /?п) (2) и пусть по отношению к хх степень его равна т (в силу симметрии т будет также степенью/ по отношению к любому из лг): пусть степень <р относительно р равна \х. Надлежит доказать, что т = jx. Так как р будут первой степени относительно х19 то m<jx. Если <р— неоднородный полином, то его можно разложить на сумму однородных полиномов. Каждый из этих однородных полиномов от р может быть представлен в виде симметрического полинома от х, если вместо р введем х. Таким образом, если теорема будет доказана для случая Однородного полинома от /?, то из сказанного следует справедливость теоремы также и в общем случае. Итак, предложим, что ср будет однородным полиномом. Для п = 1 теорема справедлива, ибо тогда /?t =— xt. Докажем справедливость теоремы заключением от п—1 к п. Предположим прежде всего, что рп не является общим множителем всех членов ср. Тогда <р (/^,..., ''/?пм, 0) не обращается тождественно в нуль, но является однородным полиномом д-й степени от (/^,...,/^). Для хп = 0 будет также /?и = 0, и ьйл получим тождество: f (*i, • • •, *«-ь 0) ш ? (^^, ..., д^', 0), (2) где /?/, . . .9pn-i будут элементарные симметрические функции от (хх, . . . ,хп_х), a /(л^, . . . , хп_х, 0) является симметрическим полиномом степени #zt относительно хх (mx^m). Предполагая таким образом справедливость нашей теоремы для случая'я —1 переменных х, можем из (2) заключить, что ja = пгх < т. Но как выше было сказано, ja не может быть меньше т\ отсюда следует, что р. — т. Остается теперь доказать теорему еще для случая, когда рп будет общим множителем всех членов ср. Пусть высшая степень pnt которая* является множителем ср, будет рпк. Тогда имеем: 9(Рь ^^Рп)^РпкЬ(Ръ --->Рп\ где ух будет степени jjt — k. Подставляя вместо р их значения, получаем: / (ХЬ . . ., Хп) S3 ХхкХ2к .. - хп% (лгь .. -, хп), (3> где А(хи •..,*«) 5= ?1 (Р\, ■ • •. PJ- W Из (3) следует, что по отношению к хх /t будет степени /тг—k\ иа (4) имеем, что т — k = }i-~- k, так как <pt не обладает более множителем рп\ отсюда также следует, что /?г —jx; следовательно, наша теорема окончательно доказана. Обе теоремы этого параграфа имеют не только теоретическое значение, но и облегчают практическое выполнение задачи представления симметрических полиномов через р, ,
РЕЗУЛЬТАНТ И ДИСКРИМИНАНТ полиномов от одной ПЕРЕМЕННОЙ 227 Рассмотрим, например, симметрическую функцию /С*!, ..., Хп)==Ъх^К2Хъ. Здесь /—однородный полином четвертой степени от хл и потому, по теореме 1, он будет изобарным веса 4 относительно /?. По отношению к хх f будет второй степени, и по теореме 2 он будет также и по отношению к р второй степени. Поэтому £*i2*2*« ss APlP3 + Bpg + Срх, {b\ где А, В и С, по теореме 2 § 84, не зависят от числа п переменных х и могут быть получены применением метода неопределенных коэфи- циентов. Полагая п = 3, имеем /?4 = 0. При xt = 0, дг2 *= л3 == 1 получается pt = 2, /?а == 1, /?3 = 0. Подставляя эти значения в (5), имеем Б=0. Предположение jct = — 1, х2 = дг3 = 1 дает /^=1, р2 = — 1> Рз^ -""1» откуда следует, что Л*=1. Наконец, полагая «==4, ^ = ^2=^3 = ^4=1, получаем: /4 = 4, А = б, //8 = 4, ^4 = i; следовательно: С=*=-4. *■* В результате имеем окончательно: Упражнения 1. Симметрическая функция f(xh ..;, хп) === 5¾¾¾¾¾ + 2^¾2 + S*i*2*3*4 будет однородной и притом четвертой степени от л:; по отношению к л^ она является второй степени. Если представить ее помощью/?, то она имеет также вид Ар\Рг + &Р22 + £>4- Вычислить значения А, В, С. 2. Доказать, что (Х2 _ Хз)2 (Л;3 _ ^)2 (Г1 _ ^)2 == __ 21 pi — 4/>23 + 18^ Р2 рЪ — W /73 + Pi2 />22- 86. Результант и дискриминант полиномов от одной переменной. Рассмотрим два полинома 0¾ х: /(х)^хлЦ-а1хп-1^а2хп-%+ ... Н-в^э ^(х — <*!)(* — а2) ...(* — ан), f (Ж) з д- + *lJK*-« + b2xm~2 +...+Ьт~ в!(*-Ы(др-Ь)...(*-и и произведение /гся множителей: (*t Т PtHai - fe) • • .(«1 — U> (¾ — Pl> («2 — ?2) - • -(«2—U. 15*
228 СИММЕТРИЧЕСКИЕ ПОЛИНОМЫ Произведение это тогда и только тогда равно нулю, если по крайней мере один из а равен одному из [$. Следовательно, равенство его нулю дает* необходимое и достаточное условие того, чтобы (и <р обладали общим множителем. Но так как произведение (1) является симметрическим полиномом. как от а, так равным образом и от [J, то его можно представить помощью элементарных симметрических функций от а и от ^ и, следовательно, также в виде полинома от а и Ъ. Яснее это станет еще тогда, если мы произведение (1) напишем в виде: <Р (Ч) ? (¾) • • • <Р (а„), откуда ясно, что оно является симметрическим полиномом or а, коэфи- циенты которого будут полиномы от &; теперь достаточно будет только еще выразить а через я. Итак, вройвведение (1) может быть представлено в виде полинома F(av .. .9an]bl9 .. .»#w) от а и от &, причем обращение его в нуль представляет необходимое и достаточное условие для того, чтобы / и <р обладали общим множителем. В § 68 также был найден полином, обладающий этим свойством, а именно результант R от / и ср. Докажем теперь, что оба полинома F и R по существу являются тождественными. Теорема 1* Произведение (1) отличается от результанта R полиномов f и <р только постоянным можителем. Результант является неприводимым полиномом от а и Ь. Докажем сперва, что произведение (1), которое мы снова обозначим через F(ai9 ..., ап; bt, . ..,^м)> будет неприводимыми. В самом деле, если бы F был приводим, т. е. если бы, например: F(alt ...,дп; blt ...,^)==/^(^, .. .,дп; Ьъ ...,^)-/^(^1. -..,^ &i> •••^m)» где Fx и F2 — полиномы, из которых ни один не приводится к постоянной, то, так как а и b являются симметрическими полиномами от а и р, можно было бы представить Ft и /^ также в виде симметрических полиномов <pt и сра от а и р: <Pl (<Ч,- ••»«„; Pi,- • -I Pm) ?2 (аЬ- • •' ап\ Pi.- • •» Pin) = / («1— МОЧ-ЬЬ . .(«l-Pm) ! («2~Pl)(«2~p2). • .(«2-PJ I K-Pl)K~P2)- - -K-Pm). Отдельные множители, стоящие в правой части, более неприводимы, а потому cpt должен состоять из некоторого определенного числа этих множителей, причем <р.2 равняется тогда произведению остальных. Это, однако, невозможно, ибо тогда ни <pj, ни ср2 не были бы симметричны. Следовательно, F неприводим. Так как уравнение /^=0, равно как и /? = 0, представляет необходимое и достаточное условие того, чтобы f(x) и ср(лг) обладали общим множителем, то всякая" система значений (а, Ь\ для которой F обращается в нуль, делает также и R равным нулю. Поэтому, в силу теоремы, которая легко может быть получена из теоремы 7 § 76 для
РЕЗУЛЬТАНТ И ДИСКРИМИНАНТ ПОЛИНОМОВ ОТ ОДНОЙ ПЕРЕМЕННОЙ 229 случая п-\-т переменных, имеем, что F является множителем R. Далее, на основании теоремы 2 § 85, F должен быть степени т по отно-у шению к каждому из а и степени п по отношению к каждому из Ьу ибо F является симметрическим полиномом от а и р, обладающим по отношению к каждому а степенью т и по отношению к каждому [$ степенью п. Рассмотрение определителя § 68 показывает, что степени R по отношению к а и Ъ не превосходят соответственно тип. Так как F является, таким образом, множителем /?, и степень его не меньше степени R, то F и R могут отличаться только постоянным множителем, Что и доказывает нашу теорему. Поставим теперь вопрос: когда полином f(x) обладает кратными корнями? Нербходимое и достаточное условие для этого представляет, очевидно, обращение в нуль произведения («1— «2)0*1 — %). . .(«1 — 0«) (02— «з) • • • (а2—ап) К-1— ап) где а имеют те же значения, Что и ранее. Р не будет симметричен относительно а, ибо перемена двух указателей меняет Р на — Р. Но уже Р2 является симметрическим полиномом и может быть поэтому представлен в виде полинома от а: [P(4i ..., ajp = F(alt ..., ап\ Уравнение F= 0 дает, таким образом, необходимое и достаточное условие того, чтобы f(x) обладал кратным линейным множителем. С другой стороны, легко убедиться в том, что f(x) тогда и только тогда обладает кратным линейным множителем, если f(x) и f(x) имеют общий линейный множитель. Необходимое и достаточное условие для существования кратного линейного множителя у f(x) состоит, таким образом, в равенстве нулю результанта f(x) и f(x). Результант этот, называемый дискриминантом А полинома f(x), очевидно, представляет собою полином от коэфициентов f(x). Теорема 2. Полиномы F и А отличаются только постоянным множителем и являются неприводимыми. ч*; Доказательство этой теоремы, которое может быть проведено аналогично доказательству теоремы 1, предоставляется читателю. Упражнения 1. Вычислить произведение (1) помощью симметрических функций для двух яслиномов х2 + ахх + аъ x2-\-6tx+b2 > л сравнить его с результантом, представленным в форме определителя. 2* Установить теорему 2, сравнив результат упражнения 2 § 85 с дискриминантом полинома *3 + (ЦХ2 + 02* + я3, > = Р(ах, ...,0» представленным в форме определителя
Глава девятнадцатая Полиномы, симметрические от пар переменных 87. Основные понятия. Функции 2 и S. Переменные xv ...,*„, примененные в предыдущей главе, могут быть рассматриваемы не только как координаты точки в пространстве п измерений, но так же и как координаты п точек .некоторой прямой. Обычные приложения теории симметрических функций (ср. § 86) делают естественной такого рода интерпретацию. Тогда получаем естественное обобщение понятия о симметрических функциях, рассматривая п точек плоскости. Определение. Полином F(xit yt; хъ у* ...; *и, уп) от координат точек (*i> Ух), (*2> 3¾). • • •» С*н» Уп) (1) называется симметрическим полиномом от этих пар переменных\ если при любой перестановке этих пар переменных он не меняется. Так же, как в случае точек на прямой, мы убеждаемся в отсутствии необходимости рассматривать всевозможные перемещения указателей; для доказательства симметричности F достаточно будет показать, что F остается без изменения при перемещении двух любых точек (1). Символ 2 имеет то же значение, что и ранее. Таким образом S^V1 в х&£* + х2"*у2Ь +...+ xu+yn\ Vxpy^xftrf^xPy^xftf* + xpyt*xf*yf* +..., и т. д. Так же, как и в случае точек на прямой, порядок, в котором следуют друг за другом пары показателей av \\ а2, [Ja; ..., является несущественным. Далее, кроме того, непосредственно .ясно, что каждый симметрический по отношению к парам переменных (1) полином будет линейной комбинацией некоторого определенного числа сумм 2. Вводя символ skl а &ctw=x,w+хы +. - •+*»кУп* (/=J!;:::) • можем высказать такую теорему: Теорема* Всякий симметрический полином F(xb yt; ...; хЛ, уп) может быть представлен в виде полинома от сумм S» •i
ЭЛЕМЕНТАРНЫЕ СИММЕТРИЧЕСКИЕ ФУНКЦИИ 231 Доказательство этой теоремы, аналогичное доказательству теоремы 3 § 83, предоставляем читателю. 88. Элементарные симметрические функция. Всякая функция 2 от п пар переменных при соответствующем выборе значений а и |i может быть представлена в виде: ЪхрухЬх£*у$*.. .лг«"«у>- • (1) Определение. Функция (1) тогда и только тогда называется эмментарной симметрической функцией от пар переменных (xv j/t), ..., (хп9 уп), если а< + Pj = 0 или 1 (/ = 1,2, ..., /г), причем, однако, не все а и $ одновременно равны нулю. Для этих элементарных симметрических функций введем следующие обозначения: #20 гэ £«1*2, Ри гз 2*i Уъ Р02 = %У1У2* Х,0 = *iГ2. • .Хп, • • •»Pun-i = ^1* • -**.У»+1- • '.У*» • • • iР0,пг=У1У2 • • • JV Ясно, что существует безграничное число Stj, но число всех pt. является конечным, а именно равфм |- п (п -f- 3). Присвоим каждому /? по отношению к х вес, равный первому указа- телю, и по отношению к у вес, равный второму указателю. Гоэоря просто о весе /?г., подразумеваем полный вес, т. е. сумму указателей. Теорема. Всякий симметрический полином F(xlf ух\ ...; хп, уп) может быть представлен в виде полинома от pi.. Так как, в силу теоремы § 87, всякий такой полином может быть представлен в виде полинома от Stj, то надлежит только показать, что Sy могут быть выражены в виде полиномов от р^. Образуем из величин h = bft + iiyt, hsU2 + ъУъ •••»&• = **» + W» элементарные симметрические функции: ' 4 = s?i S3 Х2дг! + |iSyt = lpi0 + wn, = *2/>20 + Х^ц + H2/>02, rc3 г 2¼¾¾ ss X-V30 + Х2ц^21 + >|i2 ^?12 + ^ю, к„ s 1¾¾ ... $. я X>h0 + Х»->Л_Ы + X-V^M ,2+.-+ H'/W Пусть, далее, 8^¾4 (*=*i, 2, ...)-
232 ПОЛИНОМЫ, СИММЕТРИЧЕСКИЕ ОТ ПАР ПЕРЕМЕННЫХ Тогда, если а и [3 означает целые положительные числа или нули, го В силу теоремы 1, § 84, имеем: 8а+р == F(ku 1¾. • • -t *n)» где F будет полиномом. Поэтому где 4s также является полиномом. В этом тождестве относительно ()., \х) сравниваем коэфициенты членов, обладающих множителем XajxP, и получаем таким образом тождество относительно х и у: Sa^®(Pio, ...» Р0п)> где Ф снова является полиномом от р, что и доказывает нашу теорему. Теорема 3 § 84 не имеет более места для пар переменных, так как между \- п (п -\- 3) величинами pt, существует некоторое соотношение. Например, для п = 2 полином 4/?20 />02 — />20 ^012 — Рк?РП,^\- PlO РпР<И~* Pll2 обращается тождественно в нуль, если р выразим через х и у. Для п<=Ъ полином не обращается тождественно в нуль. В силу этого замечания ясно, что представление наших симметрических полиномов помощью р^ не определяется однозначно. Для дальнейшего ознакомления с вопросами, разбираемыми в этом параграфе, отсылаем читателя к Netto, Algebra, т. II, стр. 63. Упражнения 1. Доказать, что по пином, симметрический относительно пар переменных (xit yt) и притом однородный по отношению к х (степени т), а также однородный по отношению к у (степени п\ может быть представлен в виде полинома от рц> который будет изобарным веса т по отношению к х и веса п по отношению к у 2. Представить симметрический полином ЗДУгУз помощью метода неопределенных коэфициентов через рцу пользуясь упражнением 1. 3. Полином от (хъуъ zt; х2, Уъ Чу •••>' хп> Уп> zn)> не изменяющийся при всех перемещениях указателей, называется симметрическим полиномом п точек (xtlyit zj). Обобщить для таких полиномов результаты двух последних параграфов. 89. Бинарные симметрические функции. Пары переменных (xi> Уг)> •••> (хп> Уп) могут быть рассматриваемы не только как неоднородные координаты п точек плоскости, но также и как однородные координаты п точек прямой линии. Тогда, естественно, войдут в рассмотрение только такие симметрические полиномы, которые являются однородными по отношению к каждой отдельной паре переменных. Назовем такие полиномы бинарными симметрическими функциями. Многие из piJf последнего параграфа исключаются тогда из рассмотрения-
БИНАРНЫЕ СИММЕТРИЧЕСКИЕ ФУНКЦИИ 233 Последние п-\-\ из них (рп0, рп_1Л, ,..., pQn) являются однородными и притом первой степени по отношению к каждой отдельной паре переменных и называются элементарными бинарными симметрическими функциями. Теорема 1% Всякая бинарная симметрическая функция от переменных хьУи • •• \хтУп может быть представлена в виде полинома от PnQ>Pn-l,b •••>/?0л- Если мы разложим нашу бинарную симметрическую функцию на функции 2, то ясно, что каждая из этих 2 будет снова бинарной симметрической функцией; для краткости назовем ее просто бинарной функцией 2. Теорему нашу надлежит тогда только доказать для бинарных 2» Напишем общую бинарную функцию 2 в виде: Sr^ у^ xpyf* ... хп«»у,?» К > а2 > ... >ам) и обозначим через т степень этой 2 по отношению к любой naipe переменных, так что т = «1 + Pi = а2 + р2 = • • • = а« + Р»- Допустим, что ни одно из у не равно нулю, и положим: Y Х1 у Х2 Y . Х* Л1—Г7"> Л2— Г»"чЛп—ТГ • У\ У г Уп Образуем теперь элементарные симметрические функции этих X: Pi,»-i Р^ЪХХ Р2= ^Х\Х^ Роп р2,п—2 Роп у у у РпО (1) 12 " п Pbn Тогда S*i-!>ibx,*^..*.-y> _зд|-,^...^„ф(р|>..., яя), Рыт где Ф будет полиномом степени at от Р (теорема 2 § 85), ибо согласно предположению Ч^ «2 > • • • > ап- Следовательно, также Ф(РЬ .... pJ = *(Wi,«г" •-•'**>) (2> где <р будет однородным полиномом степени av Из (1) и (2) получаем: Е*ЛУ1Р»« • -Xn*«yrfn = PoJ<4(v«~, Рх,п-ь ••• /'no)» («*>
1234 ПОЛИНОМЫ, СИММЕТРИЧЕСКИЕ ОТ ПАР ПЕРЕМЕННЫХ причем это уравнение всегда имеет место, если ни одно из у не равно «улкх Так как каждая часть (3) может быть рассматриваема как полином от х и у, то по теореме 5 § 2 заключаем, что (3) представляет тождество, и теорема наша является доказанной. В силу теоремы 1 § 85, Ф является изобарным полиномом веса ai Н~ а2 Ч" • • • + ап от Р' Поэтому lxiaxy^.. -х„пуп*п> представленная помощью п -j- 1 величин pij9 обладает также весом at + а2+ ... + а„ и является изобарным полиномом при условии, что веса р., мы берем по отношению к х. Переходя к совокупности таких функций 2, получаем отсюда такую теорему: Теорема 2. Бинарная симметрическая функция, однородная, степени k, от п переменных х (или у), будучи выражена через /?л0у А-ы> • • •» Рот является изобарным полиномо и веса kno отношению к х {или у). При доказательстве теоремы 1 полином <р в (3) был однородным полиномом степени а от р; поэтому Ъхха}у^.. .хп«пуп?п будет однородным полиномом от р степени at -j- Pi = #*• Теорема 3. Всякая бинарная симметрическая функция степени т по отношению к каждой паре переменных может быть представлена в виде однородного поликома от рп0, /?n_lfl ..., р0п, обладающего степенью т1 по отношению к этим р. Упражнения 1. Доказать, что не существует никакой рациональной зависимости межд\ Роп, ♦••» Роп и что поэтому бинарная симметрическая функция может быть представлена в виде полинома от этих величин только одним единственным образом. \ 2. Тернарной (троичной) симметрической функцией называется такой симметрический полином от п точек (xif yit ^), который будет однородным по отношению к координатам каждой из этих точек. Обобщить результаты этого параграфа на тернарные симметрические функции. Ср. упражнение 3 § 88. 90. Результанты и дискриминанты бинарных форм. Рассмотрим теперь теорию результантов и дискриминантов бинарных форм с точки зрения теории симметрических функций. Пусть две данные бинарные формы будут: . / (*ь *2) зз До*1п + а1ххп^х2 + • • • + апх2п=з == (ах"хх — ах'х2) (р.2"Хх — а2'х2) ... (an"*t — ап'лг2), <р (хъ х2) г Ь^ххт + Ъхх^Х2 + ... -\~Ьтх2п' гз «(fc"*i - Ь'г2) (fc" Xi - Ь'х2) • • • (fU"*i - L'*2). Каждый из этих полиномов представлен здесь двумя способами, причем один раз разложенной на линейные множители. Сравнивая оба эти вида, убеждаемся, что элементарными бинарными симметрическими функциями от К, «Л, (a8'f a2") (an', an") будут: «о» —«ь ^2> •••♦ (--1 )%r
РЕЗУЛЬТАНТЫ И ДИСКРИМИНАНТЫ БИНАРНЫХ ФОРМ 235 Равным образом теми же функциями от точек (Pi'. fc").(W. РА -ЛР;. Pm") являются *0. — *1. *2. •••» (—l)W^m- Необходимое и достаточное условие пропорциональности линейных множителей **"*1--«|'*2. P/'*i—Р/*2 заключается в равенстве нулю определителя *"Р/-*'РЛ Произведение всех этих определителей / (ец* Ь' - Oi' РЛ (а/ fc' - ^ ^')... (а/ (У - а/ ^) W Ь' - «i' W) W h' - «2' РЛ • • • (С к - < ?/) Ps . I («1* Р,»' - «l' Р.") («2" Р*' - *i Р,Л • . •« Рт' - ««' РЛ будучи приравнено нулю, дает необходимое и достаточное условие пропорциональности по крайней мере одного из линейных множителей / одному из линейных множителей ср, т. е. чтобы / и <р обладали общим множителем, отличным от постоянной. Представив произведение Р в виде: ^/(Pi',Pi")/(fc', Р2")..-/(Р«Л РЛ убеждаемся, что Р будет однородным полиномом /и-й степени от а и симметрическим полиномом от т точек (J3/, [}/'). Так как, кроме того, Р, очевидно, является бинарной симметрической функцией и притом #-й степени по отношению к координатам каждой отдельной точки, то, по теореме 3 § 89, можно представить Р в виде однородного полинома #-й степени от элементарных бинарных симметрических функций точек ([$/, [$/'), т. е. от Ъ. Итак, произведение Р может быть пред* ставлено в виде полинома от айв, который будет однородным полиномом от а дтепени т и однородным полиномом от b степени п. Уже в § 72 был найден полином от а и Ь> а именно результант f и ф, равенство нулю которого было небходимым и достаточным условием для того, чтобы / и ср обладали общим множителем. Оба эти полинома находятся в определенном отношении друг к другу, устанавливаемом следующей теоремой: Теорема 1. Произведение Р отличается от результанта R полиномов f и у только постоянным множителем; результант будет неприводимым полиномом от а и Ь. Совершенно так же, как в теореме 1 § 86, можно доказать, что Р является неприводимым полиномом от а и Ь. Так как оба уравнения Р = 0 и /? = 0 представляют необходимое и достаточное условие того, чтобы / и <р обладали общим множителем, то каждая система зна-
236 ПОЛИНОМЫ, СИММЕТРИЧЕСКИЕ ОТ ПАР ПЕРЕМЕННЫХ чений а и Ь, для которой Р = О, должна также (Обращать в нуль /?, а потому, по теореме 7 § 76, Р является множителем R. Замечаем, что Р будет степени т относительно а и степени п относительно Ь> причём то же имеет место также и для /?, в чем убеждаемся из представления его в форме определителя § 68. Таким образом Р, будучи множителем R, обладает той же степенью, как и /?, и потому может отличаться от R только постоянным множителем, что и доказывает нашу теорему. Обратимся теперь к рассмотрению вопроса, когда бинарная форма /(•*\> х%) обладает кратным линейным множителем. Необходимое и достаточное условие этого состоит, очевидно, в равенстве нулю произведения: / (atv - 'i'V) («hV - «iV). • - К V - «iV) > == Ht (ai, at ; ..., an , an ), a3-j ... iar<V —at'Vj \ V).-.WV-a2V) ISJ K-iX'-««-i4") ' где a', a" имеют то же значение, что и ранее, причем Рх не является симметрическим по отношению к парам переменных а, ибо перемещение двух указателей изменяет знак у Pv Напротив, Р* будет бинарной симметрической функцией, которая может быть представлена в виде полинома от а: [Pi(«iW; ..-; о.доР — 'Ч** ••> **>■ Замечаем, что F тогда и только тогда обращается в нуль, если это имеет место для Pv Поэтому уравнение F*= О представляет необходимое и достаточное условие того, чтобы f(xt, дг2) обладал кратным линейным множителем. Но то же условие выражается равенством нулю дискриминанта Д (ср. § 82) формы f(xu дг2), причем имеет место такая теорема: Теорема 2. Полиномы F и Д отличаются только постоянным множителем и будут неприводимыми полиномами от а. Доказательство этой теоремы, тесно связанное с доказательством теоремы 1, предоставляем читателю. Предполагая обе бинарные формы / и ср разложенными на линейные множители, подвергнем эти формы линейному преобразованию: xi^cuxi' + cuxj; \ (1) *2 = ^21^/ + ^22-¾¾ / получаем две новые бинарные формы: [AfxJ - At'x2') Wxt' - AJxJ). .. (Л/ nf - An'x2f), WW ~ AJxJ) (S2'V - BJxJ) ... (Am» */ - Вт'хЛ где так что Af= <*/'% — <*/%> B/' = tfcu-l/сы M = — а/'с12 + V^2» B/ = - P/'*12 + Vе» А? В/ - А/В/> ее- с (a/'P/ - ot/p/'). причем с означает определитель преобразования.
РЕЗУЛЬТАНТЫ И ДИСКРИМИНАНТЫ БИНАРНЫХ ФОРМ 237 Так как линейное преобразование (1) некоторым образом может быть рассматриваемо как преобразующее а и [J в А и В, то выражение как показывает последнее тождество, в известном смысле является инвариантом веса 1. Но так как оно не выражается рационально через а и Ь, то мы имеем здесь пример некоторого иррационального инварианта. Результант форм / и срэ как произведение тп таких иррациональных инвариантов веса 1, очевидно, является инвариантом веса тп. Таким образом это утверждение является вновь доказанным независимо от § 82. Аналогичное доказательство относится к дискриминанту бинарной формы. Упражнения Теория инвариантов бинарной биквадратичной формы f(xh х2) == аьк£ + 4ахх^х2 + 6д2*12*22 + 4я3*1*23 + аи*Ф « может быть развита в следующем направлении: 1. Рассмотрим прежде всего иррациональные инварианты веса 2: A = (ar"a2' - ai'a/') (a3'V - «зЧ"), Д - («i'V ~ (¾ V) («i V - «*VX , C= (at V - «i'O (W - «2 VX сумма которых равна нулю. Их отношения, взятые с обратными знаками, являются двойными отношениями четырех точек К:О, («a':V). (*iW), K'W). 2. Образуя затем иррациональные инварианты веса 2 £!==# — С, £2==С —А, Еъ==А — В, покажем, что каждый однородный симметрический полином от Еъ Е2, Es будет бинарной симметрической функцией четырех точек (а/: а/') и потому целым рациональным инвариантом формы /. 3. В частности выражения 02 ss Е2ЕЪ +- ЕЪЕХ -f- Etfg, (¾ s Е^Е2ЕЪ будут однородными целыми рациональными инвариантами соответственно веса 4,6 и степени 2, 3. Доказать, что G2=e*-36£2, G3 = 432^8, где g2 == д0а4 — 4^:^3 + 3a22, g3 = ^o«2a4 + 2^1^2^8 — a0fl32 — al2ai — «28> Эти выражения g2 и g"s представляют собою простейшие инварианты формы /К 4. Дискриминант А формы / равняется 1 Они являются издавна известными примерами инвариантов (были найдены Кели и Булем в 1845 г.).
238 ПОЛИНОМЫ, СИММЕТРИЧЕСКИЕ ОТ ПАР ПЕРЕМЕННЫХ 5. Если>Д Ф0, то уравнение g^==0 представляет необходимое и достаточное условие того, чтобы четыре нулевые точки / были расположены по отношению друг к другу гармонически. Точки эти тогда и только тогда располагаются эквиангармонически (упражнение 3 § 33), если g2=Q. 6. Доказать, что при g2 = gB = 0t и только в этом случае, / обладает по крайней мере одним трехкратным линейным множителем 1. 7. Если X означает абсолютный иррациональный инвариант Я' т. е. одно из двойных отношений четырех нулевых точек /, то абсолютный рацио* нальный инвариант д может быть представлен в виде: "~~27* (X—1)П2 • . 8. Две бинарные биквадратичные формы с отличным от нуля дискриминантом тогда и только тогда будут эквивалентны, если инвариант / для обеих форм'имеет одну и ту же величину. 9. Две бинарные биквадратичные формы, для которых инварианты g2 и gs отличны от нуля, тогда и только тогда будут эквивалентны по отношению к линейным преобразованиям с определителем + I, если как g2, так и gs Для обеих форм имеют одну и ту же величину. 10. Бинарная биквадратичная форма с отличным от нуля дискриминантом помощью линейных преобразований с определителем +1 может быть приведена к нормальной форме: 4xt*x9 — £2*1*25 —£з-*24- 11. Всякий целый рациональный инвариант бинарной биквадратичной формы будет полиномом от g2 и £з* 12. Развить теорию инвариантов для пары бинарных квадратичных форм так же» как это только что было сделано для одной единственной би квадратичной формы. 18. Всякий целый рациональный инвариант пары квадратичных форм от п переменных является целой рациональной функцией инвариантов ®0> ••-, ®п (§ °?)- Надлежит прежде всего доказать, что если некоторая определенная целая рп циональная функция от коэфихшентов обеих квадратичных форм не обращается в нуль, то существует линейное преобразование с определителем +1, которое преобразует обе формы в <Ч*12+<*2*22+--- +Ч*п2> Pl*l2+fe*22+."+Pn*«2. Затем следует доказать, что всякий целый рациональный инвариант пары форм может быть представлен как бинарная симметрическая функция от (аь $t), (а<5, fig), .... (ап, рл) и что 6 действительно являются элементарными бинарными симметрическими функциями. 1 Здесь равенством нулю двух целых рациональных инвариантов представлено некоторое проективное свойство геометрического места /=0; ср. последние строки текста в $ 81.
Глава двенадцатая Элементарные делители. Эквивалентность /-матриц 91. Х-матрицы и их элементарные преобразования. Теория элементарных делителей, основанная Сильвестром, Смитом и в особенности Вейерштрассом, во многих важных ее частях была развита далее Кронекером, Фробениусом| и др. Теория эта в том виде,, в каком она здесь будет представлена 1, имеет своей целью исследование таких матриц, элементы которых являются полиномами от» одной переменной X. Такого рода матрицы (не нарушая общности, их можно предполагать квадратными) называются Х-^атрицами а. Определитель, такой Х-матрицы будет полиномом от X; если полином этот тождественно обращается в нуль, то матрица называется особенной Х-матрицей. Рангом Х-матрицы называется порядок ее наивысшего не обращающегося1 тождественно в нуль определителя. Так же, как и в § 19, нам придется иметь дело с некоторыми элемент тарщыми преобразованиями, которые мы определим следующим образом: Определение 1. Элементарными преобразованиями Х-матрицы называются следующие операции; a) перестановка двух горизонталей или двух вертикалей', b) умножение всех элементов какой-либо горизонтали (вертикали) на один и тот же отличный от нуля постоянный множитель; c) сложение элементов некоторой горизонтали (вертикали), умноженных на один и тот же полином от X, с соответствующими элементами другой горизонтали (вертикали). Если от одной матрицы можно перейти к другой помощью элементарного преобразования, то, очевидно, также возможно получить из второй матрицы снова первую тоже помощью элементарного преобразования. Отсюда ясна необходимость следующего определения: Определение 2. Две Х-матрицы называются эквивалентными, если от одной можно перейти к другой помощью конечного числа элементарных преобразований. 1 Теория моЖет еще быть обобщена в различных направлениях; так, например, можно рассматривать матрицы, элементы которых являются полиномами от любого числа переменных, или же ограничиться полиномами, коэфициенты которых принадлежат некоторой определенной области рациональности. Наконец, можно стать на точку зрения теории чисел и предполагать коэфициенты полиномов целыми числами. Простейший случай здесь был бы тот, когда элементы матрицы сами являются целыми числами. Ср. упражнения 2 § 91, упражнение 3 § 92,, упражнение 2 § 94. 2 Важным примером Х-матрицы является матрица системы квадратичных форм. к которой будет применена общая теория в главе XXII.
240 ЭЛЕМЕНТАРНЫЕ ДЕЛИТЕЛИ. ЭКВИВАЛЕНТНОСТЬ Х-МАТРИЦ Все Х-матрицы, эквивалентные некоторой данной матрице, эквивалентны между собою. Так же, как и в § 19, можно доказать, что две эквивалентные Х-матрицы всегда имеют один и тот же ранг. ^ Кроме ранга, существуют еще и другие величины, остающиеся неизменными при элементарных преобразованиях. Чтобы это показать, устаног вим лемму: : Лемма 1. Если все определители i-го порядка Х-матрицы а имеют множителем полином <р (X), то этим множителем обладают также все определители 1-го порядка каждой из матриц f получаемой'из а помощью элементарного преобразования. Если элементарные преобразования будут типа (а) или (Ь) (определение 1), то лемма непосредственно очевидна, ибо эти преобразования умножают определители /-го порядка только н& постоянные множители, отличные от нуля. Рассматривая преобразование (t), предположим, что оно заключается в присоединении к элементам /?-й вертикали матрицы а соответствующих элементов q-ft вертикали, умноженных на полином ф {X). Всйг кий определитель /-го порядка матрицы а, в который не входит /?-я вертикаль, равно как и всякий определитель /-го порядка, заключающий кроме /7-й также и q-ю вертикаль, остается без изменения. Определители /-го порядка, которые заключают рчо, но не q-ю вертикаль, после преобразования принимают вид: . где Л и В являются определителями /-го порядка матрицы а. Отсюда непосредственно следует, что и в рассматриваемом случае наша лемма справедлива. Теорема 1. Обозначим через г общий ранг эквивалентных \-мат- риц а и Ь, и пусть /<п то$Зр общий наибольший делитель Д(Х) определителей i-го порядка матрицы h будет также общи'м наибольшим делителем определителей i-го ПорЯока матрицы Ь. Согласно лемме Df^ будет множителем всех определителей i-го порядка матрицы б. Если бы эти последние имели еще множитель более высокой степени, то он, согласно лемме, должен был $ы быть также ещ%* множителем всех определителей /-гр порядка матрицы а, что противоречит предположение. Только что доказанная теорема показывает, что общ^е наибольшие делители Dt (X), .. • , Dr (X) будут инварианты по отношению к элементарным преобразованиям или вообще, что они являются инвариантами, пр отношению ко всем преобразованиям, образованным из элементарных преобразований. Сверх того они образуют вместе с рангом г полную систему инвариантов. Чтобы Это доказать, покажем, , каким образом Х-матрйца помощью элементарных преобразований может *бытгь представлена в очень простой нормальной фррме. Лемма £. Если первый элемент 1 /(X) некоторой l-матрицы не обращается %тождественно в нуль и не является множителем всех ~*- # ' * Первым элементом матрицы «изымается элемент^ стоящий слева .вверху.
X-WATPWUlif И ИХ ЭДЯМеНТАРЙЙ*!:.>pPEQBPA30BMte| I остальных элементов, тд можно"получить такую эквиэалертну1& Ша* трицу, первый элемент которой не рЫен тождественно нулю 'ii'-My*, дет меньшей степени, кем f* Предположим прежде всего, что элемент Д(Х) первое гориэ<Щ1тй#щ* не делящийся на/(X), находится в у-й вертикали. Пусть частное''ш'-^, ления ft на / будет q и Остаток г, т. е. ч \. **• /i(X)s*a)/a)+r<x). \ - -;*: . Присоединяя, следовательно, к элементам у-й йер^икали соответствующее элементы первой, умноженные на —#(Х), получаем эквивалентною Mi рицу,% в которой первый элемент у-й вертикали г(Х) будет стегни •меньшей, чем /(X). Достаточно теперь только переставить первую #$р? тикаль с у-й, и тогда для рассматриваемого случая лемма наша является доказанной, ' . • # > Доказательство прилагается совершенно тан же, очевидно, ^ к тому «случаю, когда в первой вертикали находится член, не делящийся на /. Пусть теперь каждый элемент первой^ горизонтали и первой вертикали делится на /, и член, не делящийся на /, находится в *-ft горизон-* тали- и в у-й вертикали. Пусть элемент на пересечении первой горизонтали и у-й , вертикали будет ф(Х)/(Х). Образуем тогда эквивалентную штрийу, присоединив к элементам /<-й вертикали соргветлс!гвующие элементу первой вертикали, умноженные на — ф (X). - В этой матрице / стоит, rfo« прежнему слева вверху, но первый элемент у-й вертикали равен нулю. Первый элемент 1-й горизонтали: остается без изменения и потрму де>- лится на /(X). Наконец, элемент на пересечении 1-й горизонтали и у-й^ вертикали также и теперь не-делится на /(),), ', " :- Из этой матрицы, образуем новую эквивалентную матрицу,г.^исо&ДЙ'* няя к элемента^ первой вертик^и\ соответствующие элементы |*Й вертикали. Попрежнему элемент, стояифй слева вверху, буд$т. j^X); однако первый элемент 1-й горизонтали уж| не делится на /(Х)$$ро такого рода матрица^ в которой имеется элёмен1г первой вер^к&лй, не делящийся на /(X), ^выше была уже рассмотрена;' это ^доказывает окончательно, лемму? ■ • ', < ^ \ . ¢: .• Лемма 3. \»матрща, не все*элементы которой равны нул,ю, мо~ жет быть всегда преобразовала в\э\щшлентную матрицу% обладающую следующими свойствами:. ц^ • ' а) первцй* элемент /.(X) не равен щдэюдественно нулю; Ь)' все Остальные элементы первой/ф&ризонтали и первой вертикали тождествецно равны нулю\ Ч/ с) все элементы, кроме выщеперечиЩнных, делятся, на /(X). Прежде всего,, Ъчёв^дно, соответствук^ей перестановкой горизонталей, и вертикалей- можно поместить на первУе место элемент, не равный тождественно йулю. Если этот элемент Ш£#вляется общим множителем всех остальных элементов, то на основам^ леммы 2 можно образовать такую эквивалентную матрицу, первый элемент которой бзэдет НиЫщЙ степени и притом не обращающими товдественно в нуль. Есщ ffOT элемент не является общим шожителф, 12^^^щ, ТР jiOBTO|me^;> crtgi* 16 Б о х е р. Введение п рысщую алгебру.
242 ЭЛЕМЕНТАРНЫЕ ДЕЛИТЕЛИ. ЭКВИВАЛЕНТНОСТЬ МАТРИЦ указанный прием, причем каждый раз понижается степень первого элемента, так что после конечного числа операций возможность приме- нэния. указанного приема должна прекратиться (а именно, когда первый элемент станет общим множителем всех остальных). Соответствующими преобразованиями типа (с) (определение 1) все элементы первой горизонтали и первой вертикали могут быть тогда приведены к нулю, за исключением первого элемента матрицы. Но тогда все остальные элементы делятся на первый, и лемма является таким образом доказанной. Так как /(X) будет делителем всех остальных элементов таким образом упрощенной матрицы, то по теореме 1 /(к) должен быть общим наибольшим делителем всех элементов первоначальной матрицы. ,. Только что доказанная лемма может быть, следовательно, высказана так: Х-матрица я-го порядка и ранга г^>0 ап . . . аи в«1 • • • апп элементарными преобразованиями может быть приведена к виду: 0> Д(Х) о о ьп . о ь«. п-1Л un-Un-l (2> где /t(X) 2jj£ 0 является делителем всех Ь. Так как матрица (2) должна быть ранга г, то ранг матрицы (я — 1)-го порядка "и п-1 ^п-1.1 (8) равняется г—1. Если, следовательно, rj>l, то помощью элементарных преобразований матрица (3) может быть приведена к виду: О сЬп-2 Сп-Щ сп-2 п-2 (4> где /2 (X) ~£ 0 будет делителем всех с. По теореме 1, /2(Х) как общий наибольший делитель всех элементов матрицы (4) будет также общим наибольшим делителем' всех Ь и потому делится на ft(k). Надлежит заметить, что элементарные преобразования, приводящие матрицы (3) и (4) одну к другой, могут быть рассматриваемы так же^
Х-МАТРИЦЫ И ИХ ЭЛЕМЕНТАРНЫЕ ПРЕОБРАЗОВАНИЯ 243 как элементарные преобразования матрицы (2), а именно как такие, ко^5 торые оставляют неизменными первую горизонталь и первую вертикаль этой матрицы. Итак, матрица (1) помощью ряда друг ва другом следующих элементарных преобразований может б-JTb приведена к виду: (5) 0 0 0 0 0 0 0 0 Си сп- 2.1 • • .0 .0 -Сп 1-2 -2,п-2 где ни fv ни Д не обращаются тождественно в нуль и где, кроме того yj является делителем /2, а Д — делителем всех с. Если г>2, то матрица (п — 2)-го порядка, состоящая из с, которая, очевидно, обладает рангом г—2, может быть преобразована подобным же образом. Таким путем матрица (1) может быть окончательно приведена к следующему виду: (в) /i (X) 0 ... 0 0 . 0 /2(Х). . .0 0 о о . . ла) о 0 0 ... 0 0 0 0 . . .0 0 - 0 0 0 0 0 где ни один из / не обращается тождественно в нуль и каждый / является делителем следующего. До сих пор мы пользовались только элементарными преобразованиями типов (а) и (с) (определение 1\ Преобразования типа (Ь) дадут дальнейшее упрощение матрицы (6); а именно, можно еще коэфициент высшей степени I в каждом полиноме f.(k) сделать равным 1, что и доказывает, такую теорему: Теорема 2. Всякая ^матрица п-го порядка ранга г помощью элементарных преобразований может быть приведена к нормальной форме: Ev(\) 0 ... 0 0 ... 0 0 Е2(1) ... 0 и ... 0 0 . . .£Г(Х) (>) о о \ . о о... о где^в каждом полиноме Eft) коэфициент выдшей степени X равен 1, и ^iQ) является мнооюителем ЕИ1(1), причем i принимает значения *§ 2, ... г--»- 1
244 ЭЛЕМЕНТАРНЫЕ ДЕЛИТЕЛИ. ЭКВИВАЛЕНТНОСТЬ МАТРИЦ В силу теоремы 1, общий наибольший делитель определителей /-го порядка (/<г) первоначальной матрицы совпадает с общим наибольшим делителем определителей /-го порядка матрицы в нормальной форме (7). Но эти последние все тождественно равны нулю, исключая только тех, которые состоят из / множителей Е. Пусть один из этих делителей будет: Я* М Я* М •••£*«. (8) где целые числа ku &2, ..., kt расположены в порядке возрастания их величины, так что kt будет наименьшим. Тогда, очевидно, ^1>1, &ft>2, ..., &^>/. Поэтому Et будет множителем £^, Е%— множителем Ек и т. д. Отсюда ясно, что £i(X)£^)...^(X) будет множителем (8) и сверх того общим наибольшим делителем определителей /-го порядка, ибо произведение это само представляет определитель /-го порядка. Теорема 3. Общий наибольший делитель определителей Uzo порядка 1-матрицы ранга г (/<г) будет равен где Е означают элементы нормальной формы (7), к кокорой матрица может быть приведена элементарными преобразованиями. В этом k общем наибольшем делителе коэфициент при высшей степени \ равен единице. Перейдем теперь к следующей особо важной теореме: » Теорема 4. Две l-матрицы п-го порядка тогда и только тогда будут эквивалентны, если они обладают одним и тем же рангом и если для каждого значения / от 1 до г включительно определители i-го порядка одной матрицы обладают теми же общими наибольшими делителями, что и определители 1-го порядка другой матрицы. Необходимость условия следует из теоремы 1. Остается еще доказать его достаточность. Для этого допустим, что обе матрицы приведены к нормальной форме (7), причем элементы одной нормальной формы отличаются верхними значками от элементов другой. Если условия нашей теоремы выполнены, то по теореме 3 имеем: El'{\)E2f{\)^Ei(k)E2{l)t Е^ <№%' (Х)£3' (X) в bt (Х)£2 (Х)Я8 М, Так как ни один из этих Е не обращается тождественно в нуль, то fi/WsEfW (/ = 1,2, .... г). Итак, нормальные формы к которым могут быть приведены обе мат* рицы, будут тождественны и, следовательно, первоначальные матрицы
ИНВАРИАНТНЫЕ МНОЖИТЕЛИ И ЭЛЕМЕНТАРНЫЕ ДЕЛИТЕЛИ 245 сами эювивалентны, ибо две 1-матрицы, эквивалентные третьей, эквивалентны также между собою. Упражнения X. Помощью элементарных преобразований привести матрицу [1X10 0 0 R И 0 1 о о о | О О X о о О О О X — 1 о 1 О О о О X —1 I к нормальной форме (7). Проверить результат, найдя общий наибольший делитель Di(k) сперва непосредственно, а затем из нормальной формы. 2. Элементарными преобразованиями матрицы с целочисленными элементами (все элементы— целые числа) называется одна из следующих операций: а) перестановка двух горизонталей или вертикалей; б) перемена знака у всех элементов одной и той же горизонтали или вертикали; в) сложение элементов некоторой горизонтали (вертикали) с соответствующими элементами другой горизонтали (вертикали), умноженными на один и тот же множитель, равный целому числу. Основываясь на этом определении, установить в том же направлении, как и для Х-матриц, теорию матриц, элементами которых являются только целые числа, 92. Инвариантные множители и элементарные делители. Вместо инвариантов D{(1) последнего параграфа полезно для многих целей ввести в рассмотрение другие инварианты, которые мы назовем инвариантными множителями. Для определения их воспользуемся теоремой,, непосредственно вытекающей из теоремы 3, § 91. Теорема 1. Общий наибольший делитель определителей i-го по- рядка (i = 2, 3, ..., г) \-матрицы ранга г делится на общий наибольший делитель определителей (*' — 1)-го порядка. Определение 1. Если для \-матрицы а ранга г обозначим общий наибольший делитель определителей i-го порядка через А(Х) (/=1,2, ..., г% причем коэфициент высшей степени \ равен I и D%(k)me\, то полином Etft^J^ ,(/=1,2,..., г) (1> называется i-м инвариантным множителем матрицы а. Из этого определения следует, что Е действительно будут инвариантами, ибоцони вполне определяются помощью D, которые, как доказано в § 91, являются инвариантами. Перемножая первые / тождеств (1), получаем дальнейшие тождества: да)^^(Х)£а(Х)...^(Х) (/=1,2, ...,г). (2> Отсюда также и обратно, Е вполне определяют величины D, и, следовательно, Е дают также вместе с рангом г гюлную систему инвариантов.
246 ЭЛЕМЕНТАРНЫЕ ДЕЛИТЕЛИ. ЭКВИВАЛЕНТНОСТЬ МАТРИЦ Теорема 2. Две 1-матрицы одного и того же порядка будут тогда и только тогда эквивалентны, если они обладают одним и тем же рангом г \ и инвариантные множители одной из матриц совпадают с соответствующими инвариантными множителями другой. Для случая неособенной матрицы я-го порядка Dn(k) отличается от определителя матрицы только постоянным множителем; отсюда следует, что определитель может отличаться от произведения всех инвариантных множителей только на постоянный, отличный от нуля множитель. Среди всех остальных случай этот является важнейшим; из него вытекает самый смысл термина инвариантный «множитель», ибо здесь нам действительно приходится иметь дело с множителями определителя. Теорема 3, § 91 показывает, что инвариантные множители в точности будут полиномами tEi в нормальной форме (7), § 91. Так как в этой нормальной форме каждый полином Е является делителем следующего, то получаем такую важную теорему: Теорема 3. В ряду Ех(\), .... Er(k) следующих друг за другом инвариантных множителей некоторой l-матрицы ранга г каждый множитель является делителем всех следующих. Если, следовательно, даны инвариантные множители некоторой Х-мат- рицы, то для получения порядка их последовательности достаточно расположить их по степеням, начиная с инвариантного множителя низшей степени, причем два инвариантные множителя одной и той же степени должны быть тождественными. Инвариантные множители так же, как и величины Z), будут рациональными инвариантами Х-матрицы, ибо они образуются из элементов матрицы только помощью рациональных операций: элементарные преобразования, определенные в § 91, ограничиваются только сложением, вычитанием, умножением и делением. В отличие от них элементарные делители, введенные Ъейерштрас- сом, являются, вообще говоря, иррациональными инвариантами а. Прежде чем перейти к ним, дадим следующее подготовительное определение: Определение 2. Если Dr (X) означает общий наибольший делитель определителей r-го порядка X -матрицы а ранга г, то линейные множители Dr (X) X — а, X — а\ X — а", ... называются также линейными множителями матрицы а 3. 1 Условие это ве является необходимым в том отношении, что ранг уже определяется числом всех Е. 2 По примеру Фробениуса немецкие авторы применяют термин элементарные делители к инвариантам обоих родов. Во избежание недоразумений надлежит прибегнуть к наименованию простых элементарных делителей (Вейерштрасс) в отличие от составных элементарных делителей Е. 3 Если матрица неособенная, то ее линейные множители одновременно будут также линейными множителями определителя матрицы.
ИНВАРИАНТНЫЕ МНОЖИТЕЛИ И ЭЛЕМЕНТАРНЫЕ ДЕЛИТЕЛИ 247 По формуле (2) DrQ) является произведением всех инвариантных множителей матрицы а; следовательно, всякий инвариантный множитель равняется произведению некоторых степеней линейных множителей матрицы а, показателями которых будут либо нуль, либо целые положительные числа. Дадим поэтому следующее определение: Определение 3, Обозначим через £,(1) = (^^)4-^ (l-af... (/=1.¾ ...,г) инвариантные множители l-матрицы а ранга г, и пусть их отличные друг от друга линейные множители будут Х-~а> Л— а', X —а", ...; / тогда те из величин (X_a)'t , (Х_«)*, . . . ,(Ь —a)«r , (Х-a')'1'» (Х-«Г»'' • • • .01-a')*', (X _«")•»", (X —а")вЛ . . .,(^-a")'r"> которые не приводятся к постоянной, называются элементарными делителями матрицы а, причем говорят, что всякий элементарный делитель соответствует линейному множителю, степенью которого он является 1. Инвариантные множители вполне определяют элементарные делители, обратное утверждение также справедливо, если только ранг г известен. Следовательно, элементарные делители будут не только инвариантами, но и образуют также вместе с рангом полную систему инвариантов. Теорема 4. Две матрицы тогда и только тогда будут эквивалентны, если они обладают одним и тем же рангом^ и элементарные делители одной тождественно равны соответствующим элементарным делителям другой. 1 Эга определение можно, очевидно, заменить также следующим, в которое не входит понятие об инвариантных множителях: Определение. Обозначим линейный множитель \-матрицы а ранга г через 1 — а и через 1Ь показатель наивысшей степени \ — а, который является множителем всех определителей 1-го порядка (i^r) матрицы а; определим, далее, целые числа et (положительные или равные нулю) помощью уравнений *< = 4 —4-i tf=1. 2.---, г); тогда те из выражений которые не приводятся к постоянной, называются элементарными делите* лямц матрицы а, соответствующими линейному множителю Х-^-а.
548 ЭЛЕМЕНТАРНЫЕ ДЕЛИТЕЛИ. ЭКВИВАЛЕНТНОСТЬ МАТРИЦ Из теоремы 3 следует важный результат: Теорема б. Показатели степеней элементарных делителей, соответствующие одному определенному линейному множителю, удовлетворяют неравенству: ei>ei_i (/ = 2, 3, .... г). Теорема эта позволяет элементарные делители, соответствующие одному линейному множителю, расположить надлежащим образом, а именно по величине показателя степени этого линейного множителя. Упражнения 1. Пусть из двух конических сечений ^ = 0 и ф = 0 вто рое будет неособенное. Исследовать зависимость числа и рода особенных конических сечений системы <р — Хф = 0от вида элементарных делителей матрицы квадратичной формы <р — Ц. 2. Обобщить упражнение 1 на случай пространства трех измерений. 3. Рассуждения этого параграфа применить к матрицам, все элементы которых — целые числа (упражнение 2, § 91). 93. Вычисление инвариантных множителей и элементарных делителей* Простейший общий метод для определения инвариантных множителей данной Х-матрицы состоит в том, чтобы помощью элементарных преобразований привести матрицу постепенно, как в § 91, к нормальной форме. Из этой нормальной формы инвариантные множители itforyf быть непосредственно получены и уже по ним могут быть затем вычислены элементарные делители, причем, вообще говоря, для этого потребуется еще разрешение уравнений более или менее высоких степеней. Однако существуют многие важные случаи, при которых элементарные делители получаются другими, еще более простыми, методами. Часто можно применить определение элементарного делителя непосредственно к данной матрице. Рассмотрим, например, Х-матрицу я-го порядка, в которой каждый элемент главной диагонали будет а — X, все же остальные элементы равны нулю, за исключением только тех, которые непосредственно следуют справа за элементами главной диагонали, и пусть эти элементы будут некоторыми отличными от нуля постоянными: a — I Ci 0 . . . 0 0 0 а — I с2. . . 0 0 0 0 0... о—X с+л О 0 0. . . 0 а —X (¾¾ **-1*0). (1) Определитель этой матрицы равняется (а — Х)н, причем, вычеркивая первую вертикаль и последнюю горизонталь, получаем определитель, равный ^¾. ..£п_г Поэтому Следовательно, (X — а)" является единственным элементарным делителем этой матрицы, ибо кроме (X—- а)п все остальные инвариантные множители равны единице.
ВЫЧИСЛЕНИЕ ИНВАРИАНТНЫХ МНОЖИТЕЛЕЙ И ЭЛЕМЕНТАРНЫХ ДЕЛИТЕЛЕЙ 24^ Иногда бывает удобно этот прямой метод соединять с методом элементарных преобразований (ср. упражнение 1 в конце этого параграфа). Дальнейший прием для установления элементарных делителей часта дается следующими теоремами, доказательство которых не представляет трудностей и предоставляется читателю: * Теорема 1. Если в некоторой ).-матрице равны нулю все элементы,, стоящие вне главной диагонали, и если каждый элемент главной диагонали, отличный от постоянной, представлен в виде произведения степеней различных линейных множителей X — а, X — а', ... на не* которую постоянную, то степени эти в точности равны элементар~ ным делителям матрицы. Теорема 2. Если равны нулю все элементы некоторой \-матрицы, кроме тех, которые находятся в некотором определенном числе не перекрывающихся друг с другом главных миноров, то все элементарные делители матрицы могут быть найдены по элементарным делителям всех этих главных миноров. Доказательство этой теоремы состоит в том, чго приводят Х-матрицу к форме, упомянутой в теореме 1, помощью элементарных преобразований, которые одновременно могут быть рассматриваемы как элемен» тарные преобразования одного из тех главных миноров, о которых идет речь. Надлежит заметить, что эта теорема не была бы более справедлива, если бы слова элементарные делители были заменены словами инвариантные множители (ср. далее упражнение 3). Инвариантные множители могут быть однако легко найдены, если известны элементарные делители Упражнения 1. Доказать эквивалентность двух следующих матриц: я х-а 0 0 — 1 О О X —а 0 0 —1 0 | О О X—а 0 0 —1 | р 1 О X— а О 0 | О р 1 О X —а 0 | | 0 0 р О О X —а I и [1—10 0 о о 0—10 о о 0 0—1 о о 0 0 0 (X — а)2 + 02 1 0 0 0 0 (X _ а)2 + р I 0 0 0 0 0 Установить, что их элементарные делители будут: [*-(« + Ml», [Х-(a-POP- % Обобщить упражнение 1 на матрицы 2п*го порядка. 8. Найти элементарные делители и инвариантные множители матрицы © О 0 0 1
250 ЭЛЕМЕНТАРНЫЕ ДЕЛИТЕЛИ. ЭКВИВАЛЕНТНОСТЬ МАТРИЦ II Х2'(Х — 1)2 о о о | О Х(1 —1)3 О О О О X—1 о г И о о о х I 4. Найти инвариантные множители и элементарные делители матрицы || 2Х 3 О 1 X | . 4Х 3 (X + 2) О X + 2 2Х О 6Х X 2Х О . X— 1 О X—1 О О || 3(Х —1) 1-Х 2(Х~1) О X 1 Эквивалентна ли эта матрица матрице упражнения в конце § 91? 5. Найти подходящие рациональные процессы для вычисления инвариантных шножителей таких матриц, которые встречались в теоремах 1 и 2. * 94. Эквивалентность Х-матрнц; другое определение. Данное выше определение эквивалентности двух Х-матриц вытекало из определения элементарных преобразований. Однако в силу слишком частного характера этих преобразований это определение эквивалентности для многих целей неудобно; дадим поэтому новое определение, относительно которого придется доказать, что оно равносильно первому. Определение. Две \-матрицы п-го порядка а и b называются эквивалентными, если могут быть найдены две неособенные Х-ма/п- рицы п-го порядка с и d с определителями, не зависящими от X, для которых имеет место соотношение1: щ b==scad. (Ь Согласно предположению определители матриц с \\ d будут постоянными; поэтому обратные матрицы с1 и dr1 будут также Х-матрицами, т. е. их элементы не являются дробными рациональными функциями от Т., как это вообще имеет место для матриц, обратных ).-матрицам. Написав таким образом формулу (1) в виде: а-ьсЪйК (2) замечаем, что, выраженное нашим определением соотношение между матрицами а и Ь является взаимным, как оно и должно быть. Для того чтобы оправдать только что данное определение, установим прежде всего лемму:. Лемма. Если полином ф(Х) является множителем всех определителей i-го порядка \-матрицы п-го порядка а, , то он будет также множителем всех определителей i-г» порядка матриц ab и Ьа, где Ь означает также некоторую \-матрицу п-го порядка. 1 Здесь и в дальнейшем знак == между двумя Х-мчтрицами ^служит для обозни- чешя свойства, в силу которого каждый элемент одной матрицы тождественно равен соответствующему элементу другой.
эквивалентность Х-матриц; ДРУГОЕ ОПРЕДЕЛЕНИЕ 251 В самом деле, по теореме 5, § 25, всякий определитель /-го порядка матрицы ab, а также и Ьа является однородной линейной комбинацией некоторых определителей /-го порядка матрицы а. Теорема 1. Если 1-матрицы а и b эквивалентны на основании последнего определения, то они будут также эквивалентны, согласно ранее данному определению (§ 91). В самом деле, тогда существуют две неособенные Х-матрицы с и d с постоянными определителями, которые удовлетворяют соотношение (1), а потому, по теореме 7, § 25 *, матрицы а и б имеют один и тот же ранг г. Если теперь Dt (к) будет общим наибольшим делителем определителей i-ro порядка матрицы а (/<>)> то, согласно лемме, Di(k) бУдет также общим множителем всех определителей /-го порядка матрицы са и потому, опять-таки на основании леммы, общим множителем всех определителей /-го порядка матрицы cad, т. е. Ь. Далее, мы можем заключить, что Dt(k) будет также наибольшим общим делителем определителей ьго порядка матрицы 6, ибо по формуле (2) общий наибольший делитель определителей /-го порядка b будет делителем всех определителей /-го порядка а и, следовательно, не может быть более высокой степени, чем Dt (X). Но тогда а и b будут эквивалентными в силу определения § 91 (ср. теорему 4, § 91). Теорема 2. Если l-матрицы а и b эквивалентны в силу определения § 91, то они эквивалентны также согласно определению § 94. Прежде всего докажем, что между двумя Х-матрицами а и аи получаемыми одна из другой помощью элементарного преобразования, имеет место одно из двух соотношений: ахчЕБса или a^^ad, (3) где end означают неособенные матрицы с определителями, не зависящими от X. Чтобы это доказать, "рассмотрим последовательно элементарные преобразования, упомянутые в определении 1, § 91 под рубриками (а), (Ь) и (с). а) Переставим р-ю и #-ю горизонтали одну на место другой, что можно сделать, образуя, например, произведение са, где матрица с получается из единичной матрицы 0 1 о о... О Я 1 0 1 о... о 1 || 0 0 0 ... 1 II перестановкой /?-й и q-ft горизонталей (вертикалей). Равным образом перестановка /7-й и q-й вертикалей может быть достигнута умножением ^ 1*а с, где с имеет то же значение, что и ранее. v 1 Читатель должен уяснить себе, что эта теорема применима к Х-матрицам.
252 ЭЛЕМЕНТАРНЫЕ ДЕЛИТЕЛИ. ЭКВИВАЛЕНТНОСТЬ МАТРИЦ В общих случаях с может быть рассматриваема как неособенная А-матрица, определитель которой, равный—1, не зависит от \. b) Процесс умножения /?-й горизонтали матрицы а на постоянную к может быть также рассматриваем как образование произведения сау где с отличается от единичной матрицы только тем, что вместо единицы р-м элементом главной диагонали будет к. Умножение р-й вертикали матрицы а на постоянную k может быть в свою очередь трактовано как умножение а на с, где с имеет то же значение, что и выше. Если постоянная k отлична от нуля, то с может быть рассматриваема как неособенная Х-матрица с постоянным определителем. c) Пусть умноженная на ср (X) д-я горизонталь складывается с /?-й горизонталью. Того же результата, очевидно, можно достигнуть снова умножением с на а, где с получается из единичной матрицы заменой О на пересечении /?-й горизонтали и q-ft вертикали через <р(Х). Сложение элементов /?-й вертикали, умноженных на <р (а), с элемен» тами q-Pi вертикали опять-таки является равносильным с образованием произведения ас, где с имеет то же значение, что и выше. Определитель Х-матрицы с в обоих случаях равен единице; следовательно, матрица будет неособенной. Таким образом доказано, что между двумя Х-матрицами, получа*- емыми одна из другой путем одного элементарного преобразования, имеет место одно из двух соотношений (3). Следовательно, если две8 Х-матрицы эквивалентны в смысле § 91, то между ними имеет место» соотношение: Ъ ==з CpCp-f. .Ctaddidt. ,.dq7 где каждая матрица £, равно как и каждая d, соответствует одному и» элементарных преобразований, которые должны быть взяты, чтобы преобразовать а в Ь\ все с и d являются неособенными Х-матрицами с постоянными определителями; следовательно, Ь = cad, где с и d — также неособенные Х-матрицы с постоянными определителями. Итак, наша теорема доказана: оба определения эквивалентности двух Х-матриц являются равнозначащими. Упражнения 1. Обозначим через а матрицу й упражнении 1,§ 91 и через д —ее нормальную- форму (теорема 2, § 91). Образовать две Х-матрицы с и d так, чтобы было выполнено соотношение (1 > Проверить результат, доказав, что, определители матриц end будут постоянны. 2. Распространить рассуждения этого параграфа на матрицы, элементами которых являются целые числа. (Сравнить упражнение 2, § 91 и упражнение 3, § 92.) 95. Умножение и деление Х-иатрац. В* заключение этой главы, дадим некоторые указания относительно так называемой элементарной? алгебры ^матриц.
УМНОЖЕНИЕ И ДЕЛЕНИЕ Х-МАТРИЦ 253 Определение. Степенью Х-матрицы называется наивысший показатель степени ее элементов по отношению к X. В Х-матрице &-й степени элемент (/, j) может быть представлен следующим образом: aij\* + aij'lk-i+...+ai}M где по крайней мере одно из at. отлично от нуля. Обозначая через ар матрицу, у которой элемент (/, J) равен at}v\ имеем теорему: Теорема 1. Всякая Х-матрица k-й степени может быть представлена в форме: а^ + a^-i +...+¾ (ао Ф 0), (1) где а0, .ь., ак будут матрицы с постоянными элементами; обратно, всякое выражение (1) может быть представлено как Х-матрица k-u степени. Теорема 2. Произведение двух Х-матриц соответственно степеней k и I ^ + 0^1+...+ ^ (а0 4=0), W4^H+... + b, (&офО) . будет Х-матрицей степени k-\-l, если по крайней мере одна из двух матриц а0 и &0 неособенная. В самом деле, произведение это будет Х-матрицей с*м + с^ + ...+см. где с0 равно а0&0 или Ь0а0 в зависимости от порядка умножения. По теореме 7, § 25 ни а0б0, ни &0а0 не равны нулю, так как тогда aQ и #0 — обе были бы особенными. Деление Х-матриц может быть определено следующей теоремой: Теорема 3. Пусть а — произвольная Х-матрица и Ь — такая \-матрица % которая, будучи представлена в форме (1), имеет коэфи- циентом при высшей степени X неособенную матрицу, тогда существует одна и только одна такая пара Х-матриц qxu rlt что a^qtb-^r rv причем степень гъ если rt не равна тождественно нулю, будет ниже степени ft; кроме того, существует тогда всегда одна и только одна такая пара Х-матриц q2 и г2, что a=E=bq2 + r2, где степень гг меньше степени Ь или же матрица г2 тождественно равна нулю. Доказательство теоремы по существу тождественно с доказательством теоремы 1, § 63.
254 ЭЛЕМЕНТАРНЫЕ ДЕЛИТЕЛИ. ЭКВИВАЛЕНТНОСТЬ МАТРИЦ Упражнение Определение. Матрица называется вещественной, если все ее элементы вещественны; l-матрица называется вещественной, если все ее элементы будут вещественными полиномами от \; элементарное преобразование типа (а) называется всегда вещественным; элементарное преобразование типа (Ь) называется вещественным, если постоянная вещественна, и, наконец, элементарное преобразование типа (с) называется вещественным, если полином будет вещественным (определение 1 § 91). Все результаты этого параграфа имеют место, если выражения матрица^ l-матрица и элементарное преобразование заменяются следующими: веще- ственная матрица, вещественная \ матрица и вещественное элементарное преобразование.
Глава двадцать первая Эквивалентность и классификация пар билинейных «»орм и коллинеаций 96. Эквивалентность пар матриц. Приложения теории элементарных делителей, которыми мы займемся в ближайших двух главах, относятся к области, имеющей только косвенное отношение к Х-матрицам. Если матрицы а и б двух билинейных форм состоят из постоянных элементов, то мы получаем Х-матрицу, рассматривая, например, матрицу а — \Ь системы билинейных форм, определенной двумя данными формами. Матрица эта первой степени; и в дальнейшем мы будем всегда иметь дело той&ко с Х-матрицами первой степени. Такое упроШние задачи влечет за собою, однако, новую трудность. Подвергнем Ъ€ё системы переменных в билинейных формах двум неособенным линейным преобразованиям с постоянными, т. е. не зависящими от X, коэфициентами. При этих преобразованиях Х-матрица а — Х6 умножается на определенные неособенные матрицы, элементы которых будут постоянны (§ 36), т. е. Х-матрица в силу § 94 переходит в эквивалентную Х-матрицу, которая, очевидно, будет первой степени. Преобразования § 94 были, однако, более общими, так что из предыдущего не ясно, могут ли быть получены действительно все Х-матрицы, эквивалентные данной, помощью рассматриваемых частных преобразований. Рассуждения эти указывают на важность следующей теоремы: Теорема 1. Если матрицы ava%, blt Ьъ из которых две последние неособенные, состоят из постоянных элементов и если, кроме того, л - матрицы mi^ax — lbi, т25ззд2 —^2 эквивалентны, то существуют такие две неособенные матрицы р и q с элементами, не зависящими от X, что m<i == pmxq, (1} Тгк как тх и та эквивалентны, то существуют такие две неособенные матрицы /?0 и qb с постоянным определителем, что т2^Рът&ь (2) Матрица q0 имеет, следовательно, обратную матрицу #Q_1, которая также?* является Х-матрицей. Деля pQ на т4 и q^1 на т1 (теорема 3, § 95), получаем четыре следующие матрицы: ри р, su 5, удовлетворяющие соотношениям: /?0 ==? т*р1 + р, ^Сгг1 ~ Si*k< + 5* №У
1256 ПАРЫ БИЛИНЕЙНЫХ ФОРМ И КОЛЛИНЕАЦИЙ где элементы матриц р и s не зависят от X* Из (2) имеем: Подставляя сюда значения из (3), находим: ffl2plml "+" /"Hi — nti$xmi + tn^s, откуда mtiP\. — ^1)^1 =5 я*2$ — РЩ- (4) Из этого тождества заключаем, что матрица pt тождественно равна st м что, следовательно: rn2$^pmv (5) В самом деле, если бы pt— st не равнялось тождественно нулю, то ^-матрица т^р^ — St) была бы по меньшей мере первой степени (теорема 2, § 95), и левая часть (4) была бы Х-матрицей по меньшей мере второй степени. Но это приводит к противоречию, ибо Х-матрица правой части (4) не может быть выше первой степени. Если бы мы знали теперь, что ри5- обе неособенные матрицы, то справедливость нашей теоремы тотчас бы следовала из (5), ибо тогда .доожно было бы написать: m2^pm1s-^t (в) *тде матрицы р и sr1 были бы неособенными и состояли бы из постоянных элементов. у Из (5), однако, следует, что р и s должны быть или обе особенные или обе неособенные матрицы. Остается, следовательно, только еще доказать, что s — неособенная ^матрица. Для этой цели подставим в тождество вместо fl0_1 ее значение из (3): l^qtSxttix + qoS (7) 'И разделим qQ на т% (теорема 3, § 95): L q^qim2 + q, , (8) где матрица q состоит только из постоянных элементов. Подставляя это значение в (7), получим: /s= q&xmx + qtm2s + qs, ..откуда на основании (5) имеем: l—qs^ (qoSt + qip)mv (9) Но отсюда следует, что 00^ + ^/0 = 0 и что поэтому I=qs. (10)
ЭКВИВАЛЕНТНОСТЬ ПАР МАТРИЦ Jg'Jjy В самом деле, если бы q^st -f- qxp не было тождественно равно нулю, то матрица в правой части (9) была бы по меньшей мере первой степени, в то время как левая часть (9) совершенно не содержит X. Таким образом, в силу (10), 5 является неособенной матрицей, что и доказывает нашу теорему. Далее (10) показывает, что q будет также неособенной матрицей и что q = s~i, так что уравнение (6) переходит в Отсюда имеем следствие: Следствие. Матрицы р и q, существование которых было доказано в предыдущей теореме, получаются как остатки при делениях Po^&hPi + P, Qo^Q%nh + <l Ро и q0 в формуле (2) на тг Из теоремы о Х-матрицах первой степени можно получить важную теорему о парах матриц с постоянными элементами, на которых основываются все остальные излагаемые здесь приложения теории элементарных делителей. Две пары матриц av Ьх и а^ Ь% естественно назвать тогда эквивалентными, если существуют такие две неособенные матрицы р и qy для некоторых: <Ч=рО\Ч> bt=pbxq. :(11) Теорема 2. Если матрицы двух пар щ, bt и а2, Ь% не зависят от X, причем матрицы Ьх и Ь% — неособенные, то две данные пары матриц будут тогда и только тогда эквивалентными, если две Х-матрицы обладают одними и теми же инвариантными множителями (одними и теми же элементарными делителями), В самом деле, если обе пары матриц эквивалентны, то имеют место уравнения (11); умножая второе из них на X и вычитай из первого, получаем: m2=pm1q, (12) т. е, Х-матрицы iWj и т2 эквивалентны и обладают поэтому одними и теми же инвариантными множителями и одними и теми же элементарными делителями. Из предположения, что матрицы Ьх и Ь% неособенные, следует, что матрицы тх и тг будут также 4 неособенные и имеют поэтому также один и тот же ранг. Следовательно, если т± и ш.2 обладают одними и теми же инвариантными множителями или одними и теми же элементарными делителями, то матрицы эти будут эквивалентны; но так как они первой степени, то, по теореме 1, существуют две неособенные матрицы Р и Qy которые удовлетворяют тождеству (12) и элементы которых не зависят от X. Но из тождества (12) тотчас же следует (^11); обе и^ы 17 Box ер. Введение в высшую алгебру.
258 ПАРЫ БИЛИНЕЙНЫХ ФОРМ И КОЛЛИНЕАЦИЙ матриц являются, таким образом^ эквивалентными, что и доказывает окончательно нашу теорему. Особенно важен случай, когда обе матрицы bt и &2 приводятся к единичной матрице /. Тогда щ^ и mz называются характеристическими матрицами соответственно для ах и а^ причем имеет место следующее определение: Определение, Если а означает матрицу п-го порядка с постоянными элементами и I—единичную матрицу п-го порядка, то матрица А=*а — */ называется характеристической матрицей для а. Определитель матрицы А называется характеристической функцией для а, и, наконец, уравнение п-й степени от \*получаемое приравниванием нулю этого определителя, называется характеристическим уравнением для а. Из теоремы 2 получаем теперь следующий частный результат: Теорема «5. Если at и а2 означают две матрицы, не зависящие от \ то тогда и только тогда существует неособенная матрица р$ обладающая свойством az^patpi, (13) когда характеристические матрицы At и А% для аг и а% имеют одни и те же инвариантные множители (одни и те owe элементарные делители) 1. В самом деле, если At и А% имеют одни и те же инвариантные множители (элементарные делители), то на основании теоремы 2 существуют такие две неособенные матрицы р и qx что 02 = ра^ I=plq. Второе из. этих уравнений дает 0=р-1; подставляя эту величину в первое из уравнений, убеждаемся, что р будет матрицей, обладающей свойствами, указанными в теореме. С другой стороны, из (13) непосредственно следует, что At и А% должны иметь одни и те же инвариантные множители и одни и те же элементарные делители. 97* Эквивалентность нар билинейных форм. Рассмотрим две пары билинейных форм от 2п переменных: п и 1 1 п п T2«2fl</**-ty Ф2=2А/*'>* , 1 Две матрицы, связанные соотношением вида (13), иногда называются подобными. Понятие о подобии, очевидно, является частным случаем определенного * § 29 общего понятия об акв и валентности, причем преобразования, о которых идет речь, имеют частный вид (13).
ЭКВИВАЛЕНТНОСТЬ ПАР БИЛИНЕЙНЫХ ФО*>М 2Д0 причем формы <j>t и ф2 пусть будут неособенным». Исследуем, ттгщ »ти две пары форм эквивалентны, т. е. при каких условиях cyiiteci&yjof неособенные линейные преобразования с для х ш d для yt которые одновременно преобразуют <pt в <р2 и фх в фг Пусть эти преобразования будут: V *n— Cnlxl +":+ сппхп *< :::::::::::: i --^=^1^+---+^^ Обозначим через tf матрицу, сопряженную с матрицей с, и через а1У Ьи я2, &2 — матрицы, соответствующие формам Ч^Фит^» tV тогда, в силу теоремы 1, §36, преобразования end преобразуют формы <ft и $± в новые. билинейные формы соответственно с матрицами c'a^d и c'btd. Но если эти формы должны совпадать соответственно с 'f3 и ф2, то 02 = с'щй, b2 = tf'fyd. (1) Поэтому на основании теоремы 2, § 96 две 1-матрицы имеют одни и те же инвариантные множители и элементарные делители. Обратно, если эти две i-матрицы обладают одними и теми же йн* вариантными множителями (элементарными делителями), то в силу той же теоремы существуют две матрицы с' и d с постоянными элементами, которые, удовлетворяют обоим уравнениям (1); следовательно, существуют тогда линейное преобразование для х и одновременно такого же рода преобразование для у, которые одновременно преобразуют <х>|, в <р2 и фх в ф2, что и доказывает такую теорему: Теорема. Две пары билинейных форм от 2п переменных <plf ф1 и ¥*> ф2, из которых <!>! и ф2~ неособенные, будут тогда и только тогда эквивалентны, если матрицы обеих cticmeM обладают одними и теми же инвариантными множителями (одними и теми жг элементарными делителями) х 1 В дальнейшем для краткости мы будем говорить- об этих ийвариантш** множителях и элементарных делителях как обинвариантных. мнойситёлях и Ц§г Янтарных аелителяж пар ФррЖ^Щг,^:^/^;'^ 17*
260 ПАРЫ БИЛИНЕЙНЫХ ФОРМ И КОЛЛИНЕАЦИИ Упражнение Последняя теорема остается справедливой, если билинейные формы <pt, <fo н ?2, Фз все вещественны, и термин эквивалентность относится к вещественным неособенным линейным преобразованиям. 98. Эквивалентность коллинеации* Второе важное приложение теории элементарных делителей относится к учению о коллинеЗдиях. Ради краткости рассмотрим только случай двух измерений: (хг9 = аи хх + ап х2 + ап х3 х2' == а2\ xt + д22 х2 + а2з хг хг == asl х^ + ^32-^2 + азз -½ хотя наши рассуждения остаются справедливыми и для общего случая. До сих пор мы видели в коллинеации только средство для преобра* зования геометрических фигур. Возможно, однако, стать на другую точку зрения и рассматривать коллинеацию со специальной целью представления относительного положения двух фигур дои после преобра-* зования. Пусть, например, коллинеация а преобразует фигуру, состоящую из конечного или бесконечного числа fочек Av Aj, ..., в фигуру Аг\ А^,... Будем рассматривать теперь эти две совокупности точек как одну единственную фигуру; свойства такой фигуры мы и назовем свойствами коллинеашш. Свойства эти могут быть проективными или метртееюшиц Если козшшеация преобразует пару пересекающихся под прямым углом прямых в другую пару тоже перпендикулярных друг к другу прямых, то имеем метрическое свойство. С другой стороны, если, например, треугольник при коллинеации преобразуется сам в себя, то мы имеем дело с проективным свойством. Нашему дальнейшему исследованию подлежат только проективные свойства. Рассмотрим, например, фиксированную точку коллинеации, т. е. точку, которая остается без изменения при коллинеации. Для того чтобы (х±: лг2: х9) была фиксированной точкой, необходимо и достаточно выполнение условия: х±'=Хлгь х2г = Хдг2» #з'=**з> где 1Ф0. Подставляя эти значения в а, приходим таким образом к вопросу о нахождении отличной от нуля постоянной X, удовлетворяющей уравнениям: («И — *)*i + ^12*2 м %**з = °» *2t*i+(«22--ty*2+ Д23*3 = 0, . (I) %1*1+ Д32*2+ (033-^3 = 0- Матрица этой системы уравнений является характеристической матрицей А для матрицы а линейного преобразования. Характеристической функцией будет полином третьей степени от \, обладающий тремя нулевыми точками, которые частью или все вместе могут совпадать. Пусть одна из ни^ будет \± 4= 0. Подставляя эту величину, видим, что уравнения (1) дадут координаты одной или нескольких точек — фиксированных точек коллинеации а; легко убеждаемся, чтЪ проективные свойства коллинеации по существу различны, смотря по тому, имеем ли мы одну, две, три или бесчисленное множество фиксированных точекп
КЛАССИФИКАЦИЯ tIAt» БИЛИНЕЙНЫХ ФОН* 261 Подвергнем две совокупности точек Аи Л2,... и Л/, Л2', ... (из которых вторая получается из первой помощью особенной или неособенной коллинеации а) неособенной коллинеации с, которая преобразует точки АХ9 Л2, ... в Bv В%, ... и 4/, Л2', ... в Bt\ В%\ ... Тогда фигура, состоящая из точек В, В', обладает теми же проективными свойствами, что и фигура Л, А'. Если, Следовательно, существует коллинеация ft, которая преобразует В19 В%, ... в Bt'f В^ул..9 то она обладает теми же прбективными свойствами, что и коллинеация а. Но такая коллинеация получается, очевидно, помощью уравнения: ln=ca€rtt (2) ибо С1 преобразует точку Bt в А$; помощью а эти точки переходят в Л/, которые, наконец, помощью с преобразуются в В/. Две коллинеации а и &, которые находятся в соотношении, устанавливаемом уравнением (2), могут, однако, Обладать совершенно различными метрическими свойствами, но их проективные свойства остаются одними и теми же; так как в этом отношении коллинеации не отличаются друг от друга, то цх называют эквивалентными. Определение. Две коллинеации а и Ь называются эквивалентными, если существует такая третья неособенная коллинеация с, для которой имеет место уравнение Ъ = сасп. Из теоремы 3, § 96 следует такая важная теорема: Теорема. Две коллинеации будут тогда и только тогда эквивалентными, если их характеристические матрицы обладают одними и теми же инвариантными множителями (одними и теми оке эле- ментарными делителями). Упражнения » 1. Любые к фиксированных точек Рь Ръ ..., Ph неособенной коллинеации в пространстве п — 1 измерения, соответствующие к разлпчвъш корням характеристического уравнения, будут линейно независимы. 2. Исследовать распределение фиксированных точек для всевозможных ел /чаев неособенных коллинеации в пространстве двух и трех измерений* S. Исследовать (для всех неособенных коллинеации) распределение прямых (плоскостей), остающихся без изменения при коллинеациях в пространстве двух (трех) измерений. Каково положение их по отношению к^фикеированным точкам? 4. Две вещественные коллинеации а и Ь могут быть названы эквивалентными, если существует такая вещественная неособенная коллинеация с, что Ь = сас~К Применяя это новое понятие об эквивалентности, доказать высказанную в этом параграфе теорему также и для вещественных коллинеации. 99« Классификация пар билинейных форм. Рассмотрим снова веду билинейных форм я я 1 ■ • • т *з которых вторая неособенная, и образуем Х-матрицу а — №. т
262 itXfbi билинейных ф^рм и коллинеаций Слегка меняя обозначение, примененаое в § 92> обозначим элемент- тарные делители йатрицы (1) через : (Х-Х^, (l — h)% ..., (X--Xfc)^ (ех-{-е2+...+ек = п), причем линейные множители X— \i могут и не быть все отличным** друг от друга. Особо важным вопросом во многих случаях являете* вопрос о степенях еи е2, ...,¾ элементарных делителей. Для обозначения их, не пользуясь элементарными делителями, написакными в явной форме* введем символ [ete%...e^f который носит наименование характеристики Х-матрицы (1) или также пары форм <р> ф- Легко убедиться, что ха« рактеристика будет некоторого рода арифметическим инвариантом дли пары форм, ибо две пары эквивалентных билинейных форм необходимо имеют одну и ту же характеристику. Обратное. заключение, однако, не; имеет места, ибо для эквивалентности двух пар билинейных форм не достаточно равенства степеней элементарных делителей, но требуется еще тождественность самих элементарных делителей. Все пары билинейных форм с одной и той же характеристикой обра* зуют, как принято говорить, одну категорию. Имея дело, например, с парами билинейных форм от шести переменных, мы должны различать три категории соответственно характеристикам: [111], [21], [3], что исчерпывает, очевидно, все возможные случаи. Надлежит, однако, исследовать, действительно ли существуют все эти категории. На этот вопрос мы ответим в утвердительном смысле, написав нижеследующие пары билинейных форм от шести переменных, которые представляют эти три категории: L Г1111 / ^1^1+^2^2+^3^ II Xt— X 0 0 | О Xg-X О I;. , 0 0 Хз-Л II. {21] { *i *i У1 + *i х2У2 + *\ Уг -+ h ЧУг, *1Л + ХъУ% + ХА—X 1 0 | О X,—X о о о х2—X | *з.Уз- III. № { К Х\У\ + к Х2У2 + h ЧУ в + ЧУъ + ЧУ%» ЧУ1 + ЧУ2 + , ЧУъ I ' О 11 • .. xi-x 1 J. О Xt —X J , Xi — X о о Вышенаписанные пары билинейных форм дают, однако, больше, чем одно простое доказательство существования этих трех категорий. Именно, они показывают не только, что степени элементарных делителей явля-' ются произвольными (при условии, однакр, что их сумма равна трем К!;
КЛАССИФИКАЦИЯ ПАР БИЛИНЕЙНЫХ ФОРМ щ но также и то, что при условии упомянутого ограничения элементарные делители сами могут быть совершенно произвольно выбраны. Наконец^ они являются нормальными формами; каждая пара билинейных форм' от шести переменных, из которых вторая форма неособенная, помощью неособенных линейных преобразований может быть приведена к одной кз этих трех нормальных форм. Теорема. Если lv hit.,., 1к означают какие-либо постоянные, безразлично равные или неравное, и если ev е%, , ek будут какие-либо положительные целые числа с суммой, равной п, то существуют всегда пары билинейных форм от 2п переменных, обладающие элементарными делителями при этом вторая форма каждой пары будет неособенной. Для доказательства рассмотрим пару билинейных форм (2) «i+i «1-4-2 (*) •••+ (2^-^+2^-^)' Ф ^ х\УХ + *2У2 + --- + *пУт кз которых вторая неособенная. Обозначим Х-матрицу этих форм для краткости через Mt м* 2 (4) Мк где буквы М1У.. ., Мк означают не отдельные члены, но целые группы их; так, например, Mt означает матрицу ^-го порядка: М^ \ — \ 1 О, О ^—X 1 . о о О 0., л-* причем все остальное элементы матрицы (4), которые не принадлежат ви одному из квадратов Mi9 будут нуля. Элементарные делители (4) являются тогда, очевидно (формула (1) 1г теорема 2, $ 93], в точности выражениями ,(2), что и доказывает нашу теорему.
264 ПАРЫ БИЛИНЕЙНЫХ ФОРМ И КОЛЛИНЕАЦИЙ Из § 97 получаем^ что (3) представляет нормальную форму, к ко* торой может быть приведена всякая пара билинейных форм от 2я деч ременных, обладающая теми же элементарными делителями (2)1. Возвратимся теперь снова к классификации пар билинейных форм. Для данного числа 2п переменных имеем, очевидно, только конечное < число категорий, которые могут быть далее подразделены на классы^ отмечая, сколько элементарных делителей (если только они существуют) соответствует одному и тому' же линейному множителю. В характеристике мы можем это указать, заключая в круглые скобки те же целые числа, которые являются степенями элементарных делителей, соответствующих одному и тому же линейному множителю. Таким образом для случая п = 8 характеристика [(21)(111)2] означает, что 1-матрица действительно обладает тремя различными линейными множителями; одному из них соответствуют два элементарных делителя соответственно степеней 2 и Л; второму — три элементарных, i Вместо (3) могут быть получены еще многие другие нормальные формы. Так, например: ei-l *33 (2 \ С±Х4Уе^ + 1+ 2*! **-V-<) + (2^2^^+^+1 + '2> «1+1 0|+ва-~1 -2« «1+1 »—1 + 2¾ *i 34+*-«) + ^-+( Я—«fc+1 П—£jfc+l 4 f «i+e» . ф S 2 ^1 *< Л^Ч-l + 2 ^2 ЪУ*€+ес-Н.Х + 1 в1+1 *l+*2+^ П + 2^ cB xt ^4-2^^3-/-1-1+- "+2dC* ЧУгп-еъ-^П <>i+e*+l ' n—¢4+1 > (3') /; где постоянные ¢^...., cfc, db..*y dk совер&енно произвольны при условии, однако, что ни одна из них не равна нулю; в частное ги они могут быть все приняты разными единице. Х-матрица этой пары форм может быть представлена в форме (4), где, однако, Mi обозначает теперь матрицу *гго порядка: М,= О . . .dt £?,&— X) 0 *!&-«. . -О о о Матрицы ЛГ| и потому также билинейные ф#рмы (З') .будут симметричны^ Утверждение это придает особую важность нормальным формам (3') в частности при изучении квадратичных форм в ближайшем параграфе. ) В выражениях (3) можно было бы ввести такие же постоянные ci9 dit кад и в (3').
КЛАССИФИКАЦИЯ ПА? БИЛИНЕЙНЫХ ФОРМ 265 делителя первой степени, и, наконец, третьему — один единственный элементарный делитель второй степени. Две эквивалентные пары билинейных форм необходимо принадлежат одному и тому же классу; но две пары билинейных форм, которые принадлежат одному и тому же классу, не будут необходимо эквивалентными. Для иллюстрации того, что было сказано, рассмотрим снова случай п = 3. Из трех категорий получается б классов, которые могут быть соединены в следующую таблицу: I. II. III. а [Ш] [21] [3] Ъ [(11)1] [(21)] с [(111)1 Три класса 1а, Ift, 1с образуют, вместе категорию I и могут быть представлены нормальной формой, данной выше для этой категории, причем в классе \й все три величины lv \, Х3 различны; в классе Ift две иа них и только две равны между собою, и, наконец, в классе к все три \ совпадают по величине. Равным образом категория II распадается на два класса: Па и lib; в нормальной форме для категории Ц величины \ и \ различны для класса Па, для класса же lift они совпадают. Наконец, категория III состоит только из одного единственного класса. Для многих случаев, однако, желательно произвести еще дальнейшее подразделение. Вторая из наших билинейных форм ф предполагается всегда неособенной, тогда как первая - могла быть и особенной и неособенной; и легко усмотреть, что форма 9 является особенной тогда и только тогда, если по крайней мере одна из постоянных Xg в линейных множителях Х-матрицы равна нулю. В каждом отдельном классе имеются таким образом пары билинейных форм, из которых обе будут неособенные, а также и такие, у которых одна форма ' является особенной. Это различие можно было бы снова использовать, чтобы основать на нем подразделение классов на подклассы. , В этом направлении можно сделать еще шаг далее, поставив вопрос о зависимости ранга <р от величин постоянных \. Матрица <р равна матрице системы <р — Хф для Х = 0; если, следовательно, <р обладает рангом г, то каждый определитель (г+1)-го порядка матрицы <р — Хф Должен делиться на X, и" по крайней мере один определитель r-го порядка этой матрицы не делится ра X. Определение - элементарных делителей (подстрочное примечание к определению 3, § 92) показывает, что тогда необходимо должны равняться нулю п — г и только п — г из постоянных *» входящих в элементарнее делители. Обратное утверждение также справедливо, следовательно: форма <р обладает тогда и только тогда
266 ПАРЫ БИЛИНЕЙНЫХ ФОРМ И КОЛЛ^НЕАЦИЙ рангом г, если п — г и только п — г элементарных делителей будет бида \*г Над каждым из целых чисел ei9 которые образуют степень такого элементарного делителя, поместим в характеристике [ete%.. .ек] маленький нуль. Две пары билинейных форм доллшы быть тогда и только тогда отнесены к одному подклассу, если их характеристики совпадают как в распределении этих нулей, так и во всех других отношениях. Две эквивалентные пары форм принадлежат всегда- одному и тому же подклассу; обратное утверждение, однако, не имеет места. Для пояснения возьмем снова случай л=3. Имеем тогда 14 под- классоз вместо прежних шести классов: dill. [(11)11. [(HDL PU PDI, [3], (/- = 3), О 0 0 0 0 [111], [Ul)l], [21], [211, [3]. (г = 2), г 00 00 [(1011. [(21)1, (г=1). 000 [('11)1, (- = 0). Для каждого случая указан ранг г формы <р; в первых ше-ти -под-, классах форма ср неособенная и т. д: Упражнения 1. Доказать, что существуют пары вещественных билинейных форм от 2я переменных, из которых вторая будет неособенной и которые обладают элементарными делителями (к — л^'1, (X — \2)% ..., (к — lh)ek (et + е2 + ... И- ек = п\ три условии, что невещественные элементарные делители могут б.ать сгруппиро-. в»ны в сопряженные комплексные пары (упражнения 1> 2, § 93). "2. Классифицировать пары вещественных билинейных форм от б переменных. у которых вторая форма будет неособенной, различая при этом вещественные и мнимые элементарные делители. 100. Классификация коллинеациГь Классификация пар билинейные форм, которой мы занимались в последнем параграфе, по существу является классификацией пар матриц, у кщорых вторая матрица будет неособенной. Поэтому полученные результаты могут быть также применены для классификации, коллинеаций, ибо на основании § 98 всякой коллинеации соответствует пара матриц, у которой вторая матрица будет неособенной, а именно матрица линейного преобразования и единичная матрица. Для рассматриваемого случая нормальная форма (3), § 99 является в особенности удобной, ибо вторая туда входящая форма ф обладает действительно единичной ма>рицей X Мы можем, следователь-* но, тотчас формулировать такую важную теорему: Теорема 1. Если llt Х>, ..., \п означают какие-либо равные или неравные постоянные и e[f e^t ..., ek — какие-либо целые положи* тельные числа с суммой, равной nf то в пространстве п — 1 из* мерений существует коплинеация, характеристическая матрица ко» торой обладает элементарными делителями: ' (Х-Х0Ч (Х-Х2)**, ..., (Х-ХА)«*. ' К этой теореме можно добавить еще следующую:
КЛАССИФИКАЦИЯ КОЛЛИНЕАЦИИ 267 Теорема 2. Всякая крллинеация, о которой шла речь в теореме 19 эквивалентна коллинеации, обладающей матрицей: м, \ ! М2 Mh где Mi означает матрицу еь-го порядка: м< = X, 1 0. 0 lt 1 . . .0 . .0 0 0 0, Таким путем получаем классификацию коллинеации, в которой встречаются все те же категории и классы, как и в § 99. Для л = 3 (коллинеации в плоскости) получаем три категории, характеристики которых и нормальные формы здесь приведены: / xit = \txl-\-х2 II. [21] I xj= Х,дг2 hx& ( *l' = Xl*l + *2 III. [3] < дг2' = li*x2 + x9 I ltx9. 'Категории эти распадаются тогда снова на 6 классов и на 14 подклассов, как в § 99. Это последнее подразделение оказывается здесь особенно в.тжным; поэтому мы указываем эти 14 подклассов и даем для каждого из них характеристические свойства, существование которых тотчас вытекает из нормальной формы; так как эти сврйствй все проективны, то они имеют место естественно также для всех коллинеации подклассов. То обстоятельство, что эти свойства действительно являются характеристическими, может быть легко установлено a posteriori; ни Одно из этих свойств не будет одновременно выполнено коллинеациями двух подклассов. [111] Три различные фиксированные точки, не лежащие на прямой ЛИНИИ *. 1 То-есть здесь, равно как и в дальнейшем, это означает, что фиксированные точки, о которых идет речь, являются единственными фиксированными точками коллинеации.
268 ПАРЫ БИЛИНЕЙНЫХ ФОРМ и КОЛЛИНЕАЦИИ [(11)1] Любая точка некоторой определенной прямой и, кроме того, еще одна точка, на этой прямой не лежащая, являются фиксированными •точками. [(111)] Тождественная коллинеация. [21] Две различные фиксированные точки. [(21)] Каждая точка некоторой определенной прямой является фиксн- рованной точкой. [3]. Одна единственная фиксированная точка. Все эти коллинеации будут неособенные, и все неособенные коллинеации таким образом исчерпаны. В следующих трех подклассах существует одна точка Р плоскости, которая совершенно не преобразуется; все остальные точки при коллинеации перейдут в точки некоторой прямой /?, которая не проходит через точку Р, и, каждой точке этой прямой соответствует бесчисленное множество точек плоскости, о [111] Две различные фиксированные точки на прямой р. о [(11)1] Каждая точка прямой р является фиксированной точкой, о [21] Одна единственная фиксированная точка на прямой /?. В следующих двух случаях точка Р совершенно не преобразуется, между тем как все остальные точки плоскости помощью коллинеации будут отображены на прямую /?, которая теперь, однако, проходит через Р, Каждой точке этой прямой соответствует бесчисленное множество точек плоскости. о ' / [21] Одна фиксированная, точка, i о [3] Ни одной фиксированной точки. Остающиеся коллинеации столь просты, что они не только Характеризуются, но и полностью определяются приводимыми далее свойствами: 00 v [(11)1] Точки некоторой определенной прямой совершенно не преобразуются; все остальные точки помощью коллинеации переходят в одну единственную точку, не лежащую на этой прямой. 00 [(21)] Точка, упомянутая в предыдущем случае, лежит теперь на прямой. 00 0 [(111)] Ни одна точка на плоскости не преобразовывается. В этом последнем случае совершенно не имеется никакого преобразования. Упражнения 1. Классифицировать проективные преобразования в пространстве одного намерения. 2. Классифицировать коллинеации в пространстве трех измерений. 3. Классифицировать вещественные проективные преобразования для одного, двух, трех измерений. (Ср. уравнения 1, 2, § 99.)
Глава двадцать вторая Эквивалентность и классификация пар квадратичных Форм 101. Две теоремы из теории матриц. Прежде чем приступить к приложениям учения об элементарных делителях к теории квадратич* иых форм, возвратимся несколько назад к общей теории матриц. Определен/ив. Если <t(x) означает полином 9 (х) s а0кт + axxm~i +... + ат^х + ami то выражение а<рс™ + ахя?*-1 +... + атЛа&'+ ат1 называется полиномом от матрицы х и обозначается через у(х)г' Теорема 1. Если <р(Х) означает характеристическую функцию для матрицы а, то Уравнение это, ввиду исключительной важности вышеприведенной теоремы, получило особое ваименрвание; его называют уравнением Гамильтона- Кели. Обозначим через с характеристическую матрицу для а: с=а—> XJ. Она является Х-матрицей первой степени; ее присоединенная С будет Х-матрицей, степень которой не превосходит числа п—1, если п означает порядок а: Cs~ CV4X-I + <V2X-2 +..:+ Co. (1) Можно также написать: l(k)mk%V + k^xl**+...+ k. (2) Но из формулы (5), § 25 следует: аС— XCss^MJ. Подставляя сюда вместо Си <р(Х) их значения из (1) и (2), получаем сравнением одинаковых степеней X: а Сф =&0Х а Сх — Оа =ktI 1 Согласно этому определению, коэфициенты полинома от ос будут скаляры в противоположность Х-матрице, в которой коэфициентами будут матрицы, а беременной — скаляр. Оба эти случая заключаются в выражении: щхтЬ* + dtPcP-ibi +...+ а^%хЬ^х + aw.
270 ЭКВИВАЛЕНТНОСТЬ И КЛАССИФИКАЦИЯ TUP КВАДРАТИЧНЫХ форм Умножая эти уравнения соответственно на J, а, cfc2, ..., ап и складывая, получим: Но это представляет собою ура нение <р (а) = 0. и таким образом первая теорема является доказанной. Для доказательства второй необходима лемма, которая относится только к скалярным величинам Лемма* Если постоянный членкполинома*^ (х) п-й степени (я>0) отличен от нуля, то существует такой полиномах) степени меньше я, что выражение делится на ф(х). Пусть различные линейные множители ф(лг) будут х — а, х — Ц х — £, ..., так что ^{x)=*k{x-~aY(x~-bf(x--c)l... (a + p + Y+...^л). Так как постоянный член полинома ф не равен нулю, то ни одна из постоянных а, Ь, с, ... также не равна нулю. Обозначим теперь через фх полином, получаемый отбрасыванием в ф множителя (х — а)% равным образом пусть фа будет полиномом, полученные из ф опущением множителя (х — Ь)$ и т. д* Образуем затем полиномы с неопределенными коэфициентами: A{x)^Ai + A1{x — a) + A2(x~af+...+ Au_1(x — af-i B(x)E=sBo + Bi(x-i>) + B2(x-by+...-> В .(x-byt-i C(x)^C,-j~Ci(x-c)-]-C2(x~cf + ,..+ C^x(x-c)^ и помощью Эти* полиномов строим следующий полином: 1{*) — АХх)Ь[х) + В(х)Ь(х) + СМЬ(*)+---> степень которого не мбжет быть выше л—1. Покажем теперь, что постоянные Ai9 Bv ..4 могут быть выбраны так, что полином х'(лр) удовлетворяет условию нашей леммы. Так как фа, ф3, ... все делятся на (х — #)*, то (хОО)2—х тогда и только тогда будет делимо на (х—a)F, если это имЬет место для полинома: <9(x)-^{A(x))H^(xf-x, Но ? (а) = А$ Ш {а —• bf$ (a — eft ...-^ & потому ср(дг) тогда и только тогда делится да* —о* если ,4^^---- а— —# Щ ^ *2 (а — ЪУ*Ъ {а — с)*ч. .♦ f
ДВЕ ТЕОРЕМЫ ИЗ ТЕОРИИ МАТРИЦ 271 Так как ни числитель, ни знаменатель не могут быть равны нулю, то мы получаем для Лв два различные значения, из которых ни одно не равно нулю. Если, следовательно, дадим Лв одно из этих значений, то ср (дг) будет делим на х— а. Для того чтобы у(х) делился также на (х — а)*, необходимо и достаточно, чтобы ср'(а) = 0. Эго условие может быть, как мы немедленно в этом убедимсл, всегда выполнено одним, и притом только одним способом, путем соответствующего выбора Л,. Условие делимости <?(*) на (х—р)* выразится теперь так: <р"(а) —О, где верхние значки означают, как и ранее, порядок производных. Докажем теперь, что прием этот мож^т быть продолжен до тех пор, пока мы не получим окончательно условия делимости <р(лг) на (х — а)а. Для этой цели применим метод индукции и предположим, что Л0, ..., Ав__х определены под условием, что <р (а) = <р' (в) =. •. =г(р [*-i] (а) = 0. Тогда останется только показать возможность определения А8 так, чтобы <рМ (а) = 0. Для этого заметим, что #(*) s 2А&(х)Л (х) (h (х)? + *,(*). (*) где R8(x) будет целой рациональной функцией от ij>f, ф/, ..., фхМ Л, Л', ..., Л^1! с численными коэфициентами. Но так как Л(д) = Л, А'(а) = Аь * /1" (а) = 2!Л* .... Л**"4 («) = (*—1)М,-ь то #(я) является известной постоянной, т. е. не зависящей ни от одной еще не определенной постоянной Л?, As+V . ,г, Л ^, и тем менее от 3, от С и т. д. Из (4) получаем поэтому, что <рМ(а) == 0 тогда и только тогда, если -Я,,(я) ■ Л*~2*!Лв(91.(а))»' w Вычисляя, следовательно, по этой формуле один за другим коэфициенты Л,, Л2, ..., Л^, можем полином А(х) окончательно определить так, что у(х) делится на (л: — а)*. Но тогда, как выше уже было сказано, (Ц(ХУ)* — а: делится на (л; — л)а. Тем же путем определим теперь коэфициенты В{х) так, чтобы (i (х))%~х делилось на (х—Ь)$; затем коэфициенты С(х) так, чтобы (х(*))а —лг делилось на 1.x — с)* и т. д. Если все полиномы Л, 5, С, *.. определены таким путем, то (%(х)У—х делится на ф(лг), и следовательно, наша лемм*а доказана. TeopeMfa 2* Если а означает неособенную матрицу п-го порядка, то существуют такие неособенные матрицы Ь п-го порядка, что 1г является полиномом от а степени меньше п, причем имеет место соотношение: &='<*,.,. (в) Так как а— неособенная матрица, то характеристическая функция ?(Х) для нее будет адлиномом д-й степени, постоянный Член которого
272 ЭКВИВАЛЕНТНОСТЬ И КЛАССИФИКАЦИЯ ПАР КВАДРАТИЧНЫХ ФОРМ отличен от нуля. Поэтому, в силу только что доказанной леммы существует такой полином i(k) степени меньше п> что (х(Х))2-Х-<р(Х)/(Х), где /(X) также означает полином. Но из этого тождества следует? (x(*))* —* = *(«)•/(*). откуда в силу теоремы 1, так как ср(а) = 0, имеем: (Х(а))2 = а. Следовательно, b—i(a) является матрицей, удовлетворяющей высказан* ным в теореме условиям. 102. Симметрические матрицы. Приложение учения об элементарных делителях к квадратичным формам основывается на следующей теореме: Теорема 1. Если две матрицы а± и а2 будут симметрическими и если существуют тстие две неособенные матрицы р и q, что аъ~ра&, (1) то существует такоюе и неособенная матрица JP, для которой имеем место соотношение: где I ' означает матрицу, сопряженную с J? *. Взяв сопряженные с обеими частями (1) матрицы, находим, в силу теоремы 6, § 22: Ob^q* а&\ (g) при этом р' и q' означают матрицы, сопряженные с р я q; матрицы же щ и а% ввиду их симметричности являются самосопряженными. Из (1) и (3) непосредственно получается дальнейшее соотношение: Полагая для краткости U=(q')-ip, W^p'cr** (5) где также (упражнение 6, § 25) U означает матрицу, сопряженную с /7, получаем* из уравнения (4): (Лн^щУ, (в) 1 Более простое доказательство этой теоремы будет таково: из (1) непосредственно следует, что щ и «^ обладают одним и тем же рангом; поэтому по теореме 4, § 46 квадратичные формы с матрицами щ и л2 эквивалентны. Если обозначим через JP матрицу линейного преобразования, переводящего квадратичную форму at в квадратичную форму «2, то уравнение (2) имеет место в силу теоремы 1, §43. . Доказательство это не позволяет нам, однако* заключить, что JP может быть выражена только через одни ри q, что для нашей цели является существенным.
СИММЕТРИЧЕС1Ш МАТРИЦЫ Из этого уравнения непосредственно вытекают следующие: W Vkax = Va1U,^^=axUfh. ) Присоединяя к уравнениям (6) и (7) еще уравнение ах = av умножав все эти уравнения на произвольные скалярные величины и складывали Таким путем получаем для каждого полинома l(U) от U соотношение; Выберем теперь полином V=i(U) так, чтобы V была неособенной матрицей и чтобы V* = U, что возможно в силу теоремы 2, § 10L Если обозначим тогда чере» V матрицу, сопряженную с Vy то, очевидно: 1 j v=x(f>b так что уравнение (8) может быть представлено в следующем виде: Val = aiVrt Подставляя это значение в (1), получим: Но из перюго уравнения (5) следует: pV-i = q'V. Поэтому р V'1 будет матрицей, сопряженной с Vq> так что уравнение (9) может быть представлено в §иде: где что и доказывает кашу теорему. * Следствие. В качестве матрицы Р предыдущей теоремы может быть взята матрица V*q, где Y\ будет сопряженной с каким-либо из квадратных корней (определенных в теореме 2, § 101) из (qfTtp^ В частности отсюда виДим, что Р зависит от р и qt но не от at или а2. Если, следовательно, матрицы av щу bv Ь% симметричны и если существуют две неособенные матрицы р и #,для которых а% as pavq, Ьг = pbtqt то существует такая неособенная матрица JP, что
274 ЭКВИВАЛЕНТНОСТЬ И КЛАССИФИКАЦИЯ ПАР КВАДРАТИЧНЫХ ФОРМ | Отсюда и из теоремы 2, § 96 заключаем, ч^о имеет место следующая ^ теорема: * ' \1 Теорема 2. Если среди симметрических матриц aif aif bv Ь2 две *| последние — неособенные, то существует тогда и только тогда неосо- | бенная матрица Р, обладающая свойством ,| если матрицы • . j щ — lbb аг — \Ь2 ч )\ имеют одни и те же инвариантные множители (одни и те же эле~А ментарные делители). I Если, в частности, Ьх = at ==7, где / означает единичную матрицу, то $ из второго уравнения (10) получаем: | J = Z»P. ' и ' J У Такая матрица Р называется ортогональной матрицей на основании ij следующего определения, которое, очевидно, эквивалентно определению* \i данному в подстрочном примечании в конце § 52. l| 1 Определение. Матрица называется ортогональной, если она бу- у дет неособенной и если матрица ей обратная совпадает с сопряжен- J ной с ней матрицей. j Для этого частного случая теорема 2 может быть высказана следую* $ едим образом: ^| ЭРеорежа Зе Если две матрицы at и щ будут симметрическими*' J то существует тогда и только тогда ортогональная матрица Р„ J обладающая свойством | о, = 1^, j ~ I если характеристические матрицы для ах и щ имеют . одни и те щ же инвариантные множители (одни и те же элементарные дели^ \ тели). J Различие по отношению к теореме 3, § 96 состоит в том, что ах к^1 «а— симметрические матрицы, а Р—ортогональная матрица. -М 103. Эквивалентность кар квадратичных форм. Рассмотрим две | нары форм: | I 1 i 1 >1 If причем обе формы фх и фа будут неособенными. Исследуем, когда эти» Ц
ЭКВИВАЛЕНТНОСТЬ ПАР КВАДРАТИЧНЫХ ФО*1» ^¾¾¾ две пары форм эквивалентны, т. е. когда cymecTByet линейное др%* образование I Хп=**ШХ1'+...+ СщлХл>, преобразующее <pt в <ра и одновременно ф4 в ф2. Обозначим через Ь' матрицу, сопряженную с матрицей <*, у через а*, *i» «2» ^а — соответственно матрицы форм tpt, ф1э tp2f фа# т0Гда (тво* рема 1, § 43) преобразование е переводит формы <pt и ф4 в новые формы, обладающие матрицами: с'а4с, с^^с. Если, следовательно, эти формы должны быть % и ф^ iv Поэтому (теорема 2, § 102) две 1-мфгрицы ai — lbi и Да — Хдя ' -. * имеют одни и те же инвариантные множители (элементарные делители). Обратно, если эти обе Х*матрицы имеют одни и те же инвариантные множители (элементарные делители), то существует (в силу той же теоремы) такая не зависящая от X матрица с, которая удовлетворяет обоим уравнениям (1). Поэтому тогда обе пары квадратичных форм являются эквивалентными, что и доказывает такую теорему; Теорема 2. Две пары квадратичных форм %, фх, <?&, ф8 от п т- ременных, из которых ф4 и ф2 являются неособенными, будут тогда и только тогда эквивалентными, если матрицы обеих систем обладают одними и теми же элементарными делителями (одними и теми же инвариантными множителями) г. Особенно важцым является частный случай, когда обе формы ф| и ф2 приводятся к виду: -^ + ^+---+^- В этом случае мы имеем дело* с .ортогональным преобразованием 'ср. определение в упражнении 1, § 52), и наша теорема может быть тогда высказана следующим образом 2: ТеореМа Цщ Две квадратичные: фдрмы с матрицами at и а.г могут быть помощью ортогонального преобразования тогда и только 1 Для краткости обозначим эти инвариантные множители и элементарные делители просто как инвариантные множители и элементарные делители пар форм ?ь <[>i и <£2, ф2. ' •• .* . . 2 Теорема эта по существу снова. повторяет то же, что и теорема 3, § 102, непосредственным следствием которой она является. 18*
276 ЭКВИВАЛЕНТНОСТЬ И КЛАССИФИКАЦИЯ ПАР КВАДРАТИЧНЫХ ФОРМ тогда преобразованы одна в другую, если характеристические матрицы для ах и щ обладают одними и теми же инвариантными множителями (одними и теми же элементарными делителями). Для пояснения теорем этого параграфа рассмотрим задачи одновременного приведения двух квадратичных форм к суммам квадратов. В главе Х1Д были рассмотрены два случая, когда это приведение возможно (теорема 2, § 58; теорема 2, § 59). Но теперь мы в состоянии дать необходимое и достаточное условие для возможности такого приведения в предположении, что одна и& двух форм будет неособенной. Рассмотрим для этого две квадратичные формы: 9 ss kxX<* + *2*22+ - • + МЛ и предположим, для того чтобы ф была неособенной, что ни одно из с не равно нулю. Матрица системы форм у— Хф является тогда равной | kt — ql 0 0. . . 0 1 | 0 Аг2 — ^2Х 0, . . 0 I 0 0 0.. .К — сЛ\ J и элементарные делители этой матрицы ^ zk 1 ^ \ ?» ct' cz'mu" сп все будут первой степени. Всякая пара квадратичных форм, эквивалентная только что рассмотренной паре, должна обладать, следовательно, Х*-ма- трицей, элементарные делители „которой все будут первой степени. Обратно, если мы имеем пару квадратичных форм, из которых вторая неособенная, и если Х-матрица обладает элементарными дедитрл#м# только первой степени, то постоянные k и с могут быть, очевидно, так выбраны, что i-матрица вышерассмотренных форм <р и ф имеет те же элементарные делители; поэтому данные формы эквивалентны <р и ф, что и доказывает теорему: Теорема 3, Необходимое и достаточное условие для тощ чтобы две квадратичные формы у и ф, из которых ф — неособенная форма, могли быть помощью неособенного линейного преобразования одно$р&~* менно преобразованы в формыу содержащие только квадраты перемек- ных} состоит в том, что элементарные делители парцт форм должны быть все первой степени* В этой теореме как частный случае заключается теорема 2, § 58, ибо, если Х-урав&ение не обиада^т кратйыми корнями, тек элементарные делян тели необходимо должны быть первой стейени* Но в теореме 2, § 5© цол>кно быть тафке выполнено полученное $адше^ условие, и потому имеем теорему;
классификация nAp^iffiA^p^tiiqittrfX'^jm* mm Теорема 4. Если ф будет неособенная определенная квадратичная форма и <р — произвольная вещественная квадратичная форма у то ^сё элементарные делители этой пары форм будут первой степени. / 104. Классификация нар квадратичных форм. Рассмотрим две формы: , Я Л из которых форма ф неособенная. Элементарные делители этих форы обозначим, так &е, как и в § 99: Символ [et, ^, ..., ek] называется снова характеристикой пары форм; все пары квадратичных форм с одной и той же характеристике находятся, как принято говорить, в одной и той же категории *. Так же как и для билинейных форм, здесь имеет место такая теорема: Теорема* Если \v \, ..., \+-какие-либо равные или друг, от друга отличные постоянные и если ev е%> ..., ек—целые положительные числа с суммой9 равной п> то существуют пары квадратичных форм от п переменных^ которые обладают элементарными делителями при этом вторая форма каждой пары будет неособенной. Для доказательства этой теоремы рассмотрим следующую пару квадратичных форм, образованную аналогично нормальней форме (Зг) § 99 (2 Х1 С1Х* Х«Н+1 + 2 di ** X4-*J^ + (^^^2^2^4^ + ^-^1 + 1+ Jtd ^2^^+^/ + n n—1 +... + ( 2 x* **** ■***-•*-<+| "+* 2 ^x2*»-«*-<) > + ^2-^4^,^+1+2 ^^l+f + l + 2 " Г4*%+1*+*-1 + 1+ '; ■ ' n - + .**+ 2 ^4^-^-4+1^ » 1 Таким о^азом, например, все пары форм, ид которых втррая неособениа* и которые допекают однорремениые прйве^ейия к суммам квадратов, образуют одну ^л^брШ t характеристик К§ %Щ)>
278 ЭКВИВАЛЕНТНОСТИ И КЛАССИФИКАЦИИ ПАР КВАДРАТИЧНЫХ ФОРМ Щ где постоянные clf с2,..., сЬУ dv d%,..., dk являются произвольцьш^щ при условии, однако, что ни одна из них не должна равняться нулщЯ Х-матрица этой пары Уформ совпадает е Х-матрицей пар билинейн^^ш форм (3#) § 99 и имеет поэтому также и требуемые элементарные дблител^Я Теорема 1, § 103 показывает, что формула (3) является нормаль#<Йет| формой, к которой может быть приведена всякая пара квадратич!&$Я форм (вторая из этих форм неособенная) при условии, что элементарны^Я делители имеют значения, указанные в (2). Vfi Категорий, о которых мы до сих пор говорили, могут быть разделены нвдя классы так же, как в § 99 в случае билинейных форм. Для этого снова'Я надлежит исследовать, сколько имеется \, равных друг другу, и, если toulm хотим далее продолжить классификацию, сколько имеется \, равных нулю J1 Теперь мы в состоянии убедиться, Что элементарные делители дают ;1 нам значительно больше, чем инварианты 8„ рассмотренные в § 57. Ин-\| варианты эти, будучи коэфициентами Х-уравнения нашей пары форм, *$J определяют постоянные Х<э которые будут корнями этого уравнений, Щ а также еще и кратности этих корней. Однако они не определяют сте^ Щ пень е% элементарного делителя, и пользование одними 6, не позволит 1 нам поэтому определить, будут ли две пары форм эквивалентны. 1| Например, две пары форм могут обладать одними и теми же инвари^ <л, антами ft, но соответственно с характеристиками: . | [(11)11...1] и [211..ЛЦ. i -I Таким образом bt образуют полную инвариантную систему только в очень | частном смысле этого слова. , ^ Упражнения \\ 1» Для случая п = 3 дать численный призер, иллюстрирующий заключительное \ замечание этого параграфа. ."£ 2. Если две эквивалентные пары квадратичных форм имеют два элементарных , делителя первой степени, соответствующих одному и тому же линейному мно- 1\ жителю, то существует бесчисленное множество линейных преобразований, одну ' { из этих пар форм преобразующих в другую. (- *ь 3. Доказать общую теорему, частным случаем которой является упражнение 2: v если две эквивалентные пары квадратичных форм имеют характеристику, заклю- \ чающую одну или несколько скобок, Т0 существует бесчисленное множество ,^ линейных преобразований, которые одну из форм преобразуют в другую. * j 4. Если характеристика двух эквивалентных пар квадратичных форм вовсе не < заключает скобрк, то существует только конечное число линейных преобразований, ') которые одну пару форм преобразуют в другую 2. '<* В каком отношении друг к другу находятся эти преобразования? | 10¾. Пары квадратных уравнений. Системы форм и уравне- | ний 8. Задайи об, эквивалентности и классификации квадратичных форм ij _ &Г4 ' - 4 $ 1 Для случая я я1$* мы можем тоже установить геометрически, замечая, что, Л пользуясь только Одними инвариантами Ъ& нельзя провести различия, будут ли ч| два конические сечения, друг друга касающиеся, иметь простое дли двойное '"^ касание; наоборот, рассмотрение элементарных делителей тотчас доставляет необ- Н ходимый критерий. jM 2 Упражнение § 58 Может быть рассматриваемо как частный улучай этого Ч1 упражнения. - 1 8 Для билинейных форм также могут быть поставлены вопросы, аналогичные <j| далее рассматриваемым. х " **
ПАРЫ КВАДРАТНЫХ УРАВНЕНИЙ. СИСТЕМЫ ФОРМ И УРАВНЕНИЙ 27¾ У*е всегда представляются нам точно в той форме, в которой мы их рассматривали в последних двух параграфах. Часто, например, приходится иметь дело не с квадратичными формами, но с уравнениями, получаемыми приравниванием этих форм нулю. Две пары квадратных уравнений должны быть рассматриваемы как эквивалентное не только тогда, если формы сами были эквивалентны, но также если одна пара форм может быть получена из другой путем умножения на отличные от нуля постоянные. Рассмотрим снова две квадратичные формы ср, ф, из которых вторая неособенная, и исследуем, каким образом изменятся элементарные делители а—ч)% a-w. ...,(х-**)#* ш этих форм, если обе формы умножить на отличные от нуля постоян* ные р и <j. Полагая имеем: Ъ-ЩшрЬ-Л*), (2) где Р Обозначим через X— а линейный множитель матрицы от <р — Хф, так что а является одной из постоянных \, \9.. ♦, Xfc. Пусть, далее, как в подстрочном примечании^ к определению 3, § 92, lt будет показателен наивысшей степени X — а, которая является множителем всех определителей i-ro порядка этой матрицы. Вследствие (2) li будет также показателем наивысшей степени X' — а, которая является множителем всех определителей /-го порядка матрицы от <ft — X<J>t; другими словами, будет высшей степенью линейных множителей X — ^, которая будет множителем всех определителей i-ro порядка матрицы от <pt — Хфг Определение элементарных делителей, данное в подстрочном примечании к определению 3, § 92, показывает также, что элементарные делители матрицы от <ft — Хф4 отличаются от элементарных делителей матрицы от ср — Хф. только тем, что постоянные Х^ заменены на £-*. Таким образом имеем: Теорема 1. Если пара квадратичных форм <р, ф, из которых вторая —■ неособенная^ обладает элементарными делителями то пара форм qyy <?ф, где р и q — отличные от нуля постоянные^ имеет элементарные делители: (X^VA^-VP (*~V)4
а& й#я краткости принято обозначение: * Обе пары форм имеют одну и ту же характеристику также и тагдйД если в характеристику вводят скобки и нули. ' <Щ Вышедока^анйая теорема показывает, что пары однородных квадратах;ffi уравнений могут быть классифицированы помощью своих характерист^Ж так же, как и пары квадратичных форм в последнем параграфе, в пр&Щ положении, что второе уравнение пары будет, неособенное. Дадим кла^гЙ сификацию для случая /г =s 3, причем придется иметь дело с конн^Я скими сечениями на плоскости, из которых одно будет неособенным. Мы имеем здесь три категории,, представленные следующими нормаль*/^ ными формамиг 9 35 *1*12 + W — VA е(ш ^2 + ^^, ' М l пи] {; 1L l2l] А*т2*Хш + хА Ш. [3] ( ? ~ 2*i*i% + W + 2дг1дг2, . Л Эти категории разделим снова на классы, причем при йомощи рае» смотрения нормальных форм мы можем указать для каждого классу такое проективное свойство, которое не принадлежит никакому дру* тому классу2. Так как коническое сечение ф во всех случаях будет неособенно то нет необходимости каждый раз это особо отмечать. [111] <р и ф пересекаются в четырех различных точках. {(11)1] Двойное касание. [(111)] Оба конические сечения совпадают. [21] Три различные общие точки; в одной из них касание. [(21)] Рцперсоприкасание. [3], Соприкасание. Во всех шести случаях <р — неособенная форма; но для следующих пяти случаев <р состоит из двух различных прямых линий. о * [111] Четыре различные точки пересечения, о [(11)1] Две прямые, на которые распадаются <р, касаются ф, о [21] Три различные точки пересечения; в одной из них касание. о , [21} Двойная точки <р лежит на ф; никакого касания. [3] Двойная точка <р лежит на ф; касание. 1 * В формуле (3) последнего параграфа мы придаем постоянным fy и kt такие ЛЙ значения, что геометрические места ф = 0,Ф = 0 обладают вещественными точками/ если постоянные X! вещественны. Однако это не является, существ^нньш, ибо miAua здесь не занимаемся вопросами» связанными с вещественностью входящих ®ew^| лшчни. ; i , - ч щ * Для проверки сделанных здесь утверждений чижат^л^1 должеи ознакомиться ,г" с вопросом о касании конических сучений. См„ например, Salmon, Аналитическая геометрия конических сечений, Щ XIV.
В следующих двух случаях ф является двойной прямой; % :'f;; [(11)1] Две различные точки пересечения. / V^4.'V [(21)1 Касание. у Наконец, мы имеем еще: ' [(Ill)] Здесь <f:ss0, и имеется только коническое сечение ф. "V Предположим, наконец, что должны быть классифицированы не rikp^ квадратичных форм или уравнений, но системы таковых. Рассмотрим^ например, систему квадратичных форм *-м», ',' ';;■,-. где фот>ма ф неособенная, и положим, что соответствующие элемент тарное делители представлены помощью формулы (1). Тогда является допрос, будут ли обладать каждые две формы системы в которых <j>i должна быть неособенней!, теми же элементарными делителями, что <р и ф. Если бы это им^ло место, то моякно было бы говорить о (1) как об элементарных делителях системы. Д&лее, однако,, увидим, что это не имеет места и что нельзя, следовательно, говорить об элементарных делителях системы квадратичных форм К Существует, однако, очен|> простое соотношение между элементарными делителями двух пар форм, принадлежащих системе. Чтобы это* показать, определим элементарные делители пары уи фг Для этой це#и рассмотрим выражение <ft — Хф1э которое при X ф 1 может быть цр$а~ ставлено в виде: *-Hi «О-41*-*'♦!, \ (•> где 7—Г Предположим теперь снова, что X—■ а будет линейным множителе*^ матрицы формы <р—Хф и yiro (X— а)н означает наивысшую степень X—-а, которая будет общим множителем определителей /*го порядка этой матрицы; каждйй определитель /-го порядка матрицы формы *р —Хф мойсет быть для X ф 1 представлен в виде: ■, где / означает под ином от X', степень которого не выше, чем 7— 1Г. Поэтому Щ основании (3) соответствующий определитель 1-го порядка матрицу форры <ft — tyt может быть представлен так: / #~*~а(1^Х>]^1<*>/ «г * 1 Мы рассматриваем здесь систему просто как бесчисленное множество квадратичных ф&рк; именно рсе^тех, которые получаются из формулы <р— Ц, если давать частные значения параметру X. В этом смысле мы не можем говорить об элементарных делителях системы. Но если мы рассматриваем, как это делают иногда в математике* систему квадратичных форм как полийом ? —Хфотл + 1 переменных(*i,...f •-&, X), то- мы имеем право говорить об efe элементарных делителях*, подразумевая ггод этим, Очевидно, элементарные делители, ее матрицы, т. е. именнЬ>о, что yiAce было иазшш адемейтяряымй делителями трн форм ^ £
282 эквивалентность И КЛАССИФИКАЦИЯ ПАР КВАДРАТИЧНЫХ ФОРМ аде fx означает полином от h Следовательно, полином «будет множителем всех определителей г-го порядка матрицы формы чрх — Хфг Проводя эти рассуждения в обратном порядке, убеждаемся, что не существует никакой бол%е высокой степени выражения a-w-v ^которая была бы множителем всех этих определителей /-го порядка. Теорема 2. Если пара квадратичных форм <р и ф, из которых «вторая — неособенная, обладает элементарными делителями (^—^)eS (X—Х2)% ..., (X — и если р. и v — какие-либо две отличные друг от друга постоянные, из которых v отлична также от всех величин \v Х2> ..., Xt, то две формы <fts=<p—цф, Фи33* — *Ф» мз которых вторая будет тогда неособенной, имеют элементарные делители: a-vA <*-v>%..., a-V)**, где для краткости положено У^т— (/=1, 2, ...,*). В частности легко видеть, что обе пары форм <р, ф и ^, фх имеют одну и ту же характеристику [*t, е2, ..., ек] также и тогда еще, если ^помощью скобок обозначим, какие показатели степени е соответствуют равным Хг Но так как Xf и \' одновременно не равны нулю, то характеристики не будут те же, если мы введем маленькие нули. Если, еле* довательно, мы желаем классифицировать системы квадратичных форм, то для этого можно воспользоваться характеристикой любой пары форм системы, если вторая форма будет неособенной, но мы не должны вводить маленьких нулей в эти характеристики. Классификация эта естественно не распространяется на «особенные» системы, т. е. на такие, •формы которых будут все особенные. Все вышесказанное без существенных изменений применяется также для систем квадратных уравнений. Поэтому мы можем тотчас же перечислить различные классы неособенных систем конических сечений1. Существует, очевидно, только еще шесть классов: [111] Все коцические сечейия проходят ч^ерез четыре различвъгЦ точки. ; N 1 Для подобной классификации систем поверхностей второго порядка ртсы* лаем к книге: В*dmwich, Quadratic Forms aftd their ClassificatKm by Meaiis of Invariant Factors, Cambridge, p. 46.
ЗАКЛЮЧЕНИЕ 2Щ [(11)1] Конические сечения имеют общими две различные точки и каждое коническое сечение системы имеет с каждым другиц двойное касание, [(111)] Все конические сечения совпадают1. {21] Три различные точки пересечения; в одной из них все кони^е^ с'кие сечения касаются друг друга. [(21)] Все конические сечения находятся в одной точке в Wtfeg- соприкасании. [3] Две точки пересечения; в одной из них имеется соприкасание всех конических сечений. Упразднения , . 1, Определить помощью элементарных делителей свойства двух следующих пар конических сечений: .'' * i • ■ 3*i2 + 7х22 + 8xtx2 — Юх^хв + 4xtxs = о \ Л 2xt* + 3x2* — V + 4*t*a — ^8*1 + 6*1*1 = 0 Р ' 3*!*— д:22 — Злг32 — &*i#2 + Зх2х9+ xtx3^0 ) ' ' % Классифицировать все пары бинарных квадратных уравнений, из которых второе уравнение будет неособенным. Дать геометрическое истолкование. 106. Заключение. В этом заключительном параграфе коснемся некоторых важных вопросов, связанных с теорией элементарных делителей, которые, одна!ко, кы должны были оставить без рассмотрения ввиду естественной необходимости при изложении не выходить из определенных пределов. Рассматривая две пары yv ф4 и <р2, фа билинейных или квадратичных форм, из которых tyt и фа будут неособенные, мы можем определить, будут ли они эквивалентными или нет/ Если вместо элементарны! делителей мы пользуемся инвариантными множителями, то метод требует применения только рациональных процессов (сложения, вычитания, умножения, деления) и может быть, следовательно, приложен в каждом коркретном случае. Сверх того в § 93 были даны некоторые совершенно практические методы для определения инвариантны* множителей Х-матрйцы, так что з&Дачу об эквивалентности для двух пар билинейных или квадратичных форЬ* можно считать решенной не только теоретически, но.и практик чёски. Существуют, однако, другие вопросы, выше нами не' рассмотренные; например* есЛи, две пары билинейных или квадратичных форм буду? эквивалентны, то как найти линейное преобразование, переводящее одну Пару форм ;в другую? С теоретической точки зрения задача эта может считаться решенной, Р самом деле, вышеприведенное доказательство того, что Две пары форм, обладающие одними и теми же элементарными* делителями, могут быть преобразованы одна в другую помощью линрй- * Согласие* обычной терминологии тогда не имеете» вообще никакой сйс- *емы.
284 ЭКВИВАЛЕНТНОСТЬ И КЛАССИФИКАЦИЯ. ПА** КВАДРАТИЧНЫХ ФОРМ тгб преобразования, состояло просто в указании пути, при следовании которому такое линейное преобразование всегда могло быть найдено. Ес#и дело идет о билинейных .формах, то здесь также пользуемся только рациональными операциями. Таким образом для двух данных эквивалентных пар билинейных форм, из которых вторая форма в обоих случаям неособенная, мы можем в каждом случае действительно указать линейное преобразование для х и такого же рода преобразование ддяу> которые обе пары преобразуют , одну в другую. Однако эти методы требуют еще дальнейших развитии, которые сделали бы их удобными для действительного вычисления. Для случая квадратичных форм задача усложняется тем, что операции не будут все рациональными (ср. лемму в § 101). Это зависит, однако, не от выбранного метода, но от самой сущности вопроса, в чем можно убедиться на весьма простых численных примерах. Пусть, например: п ess 2х? + ЗМ ?2= 2*!* — Zx#, ; Обе пары форм <pt> ф4 и <р2, ф2 имеют элементарные делители X— 2, ).--3 и будут поэтому эквивалентны. Лцнейнре преобразование, переводящее одну из этих пар в другую, не может быть, однако, веществен* ным, ибо форйы <pt и ф4 — определенные, а <ра, ф$ — неопределенные; коэфициенты искомого преобразования не могут быть, следовательно^ представлены рационально помощью коэфициентов данных форм. Является, таким образом, задача; дать практический метод для нахождения такого линейного преобразования, которое первую пару кв^дра* тичных форм преобразует во вторую, ей эквивалентную. Такого рода метод, предполагающий известными элементарные делители, находится ш цитированной вьппе книге Brotowlch (см. подстрочное примечание к койцу § 105). Наше изложение предмета является неполным еще и с другой точки зрения. Мы всегда предполагали, что у пары форм % ф вторая форма ф должна быть неособенной. В большинстве случаев, когда дело идёт о применении элементарных делителей, это действительно имеет место; однако является желательным освободиться от этого ограничения. Этого можно отчасти достигнуть, рассматривая не систему у— Хф, как этбяиф дедами выше, но более общую систему jxcp — Хф, где jx и X означйютг переменные параметры. Вся теория элементарных делителей может быть легко обобщена для* этого случая. Определители матрицы этой системы будут теперь бинарными формами от (ц, X), а элементарные делители ~~ степенями линейных бинарных форм с целыми показателями. Единственный случай, который останется неисследованным, будет тот,- когда не только <р и >ф> но каждая форма системы будет особенной. Этот особенный случай^ исключенный из рассмотрения ВейерШ'грассом в его йёмуаре, ?ребует особенного исследования, которое и было дано Кройекероц. Для квадрат тичных форм см. цитированную выше книгу Brojiiwich. Наконец, может быть поставлен вопрос Й прЦенении террии элеме^й тарных делителей к тому случаю, когда ofe^P^H ¥ и Ф вещес^кйь^
ЗАКЛЮЧЕНИЕ и дрпу&сают только вещественные линейные преобразования* Для билинейных форм вопрос не представляет серьезных трудностей (ср, упражнение к § 97, 99), но для квадратичных форм' придется ввести мнимые величины, как на это указывает доказательство леммы в §, 101. Трудность эта не является здесь также недостатком метода, но заключается э самом существе вопроса. В самом деле, уже рами теоремы7ие остаются необходимо справедливыми, как это видно из численного примера, указанного ранее в этом параграфе для другой цели, где мы имели две пары вещественных квадратичных форм, которые хотя ц обладают одними и теми же/элементарными делителями, но не являются эквивалентными по отношению к вещественным линейным преобразо* ваниям. Ограничимся этими краткими указаниями на эти важные вопросу отсылая читателя для доказательства одной из самых основных теорем к книг& Bromwich. Дальнейшие указания, касающиеся, теории и различных приложений элементарных делителей, можно найти в книге Mutti «Theorie und AnwetK 4ung der Elementarteiler», Leipzig, Teubner, 1899,
Алфавитный указатель (именной и предметный; числа? означают номера страниц) Абелевы группы 82 Абсолютные инварианты 87 Абсолютные коварианты 88 Алгебра, основная теорема 24 Алгебраические инварианты 86 Алгебраическое дополнение 30, 31 Алгорифм Евклида, для целых чисел 17о—178, для полиномов от одной переменной 179, для полиномов от многих переменных Ш-г-193 Ангармоническое отношение 98—102 Арифметический инвариант 88 Аффинная группа 84 Аффинное преобразование 72 Besy, метод исключения Б. 218 Бесконечно большие корни 187 Бесконечно удаленная прямая 21, плоскость 22, точка 20—21 Б и квадратичные бинарные формы 237— 238 Билинейные формы 108—111, матрица^ б. ф. 108, нормальные б. ф. ПО, определитель б. ф. 108, особенные б. ф. 108, пары б. ф. 258—259, 261—266, ранг б. ф. 108, симметрические б. ф. 109, эквивалентность б* ф. 109 Бинарные симметрические функции 232—234 Бинарные формы 14, биквадратичные б. ф. 237—238, дискриминант б. ф. 217—218, 237, инвариант б. ф. 216, 217, кубичные б. ф. 219, приводимость б. ф. 175—176, результант б. ф. 188, 216, 217, 218, 237 Буль 237 Вейерштрасс 157, 239, 246, 247, 284 Вектор, линейная зависимость в. 4¾ Величина 63, общие комплексные в. 63,. обыкновенные комплексные в. 64, скалярные в. 64 Вершина, поверхности 2-го порядка 114, квадратичной формы 122 Вес, относительного инварианта 93, относительного коварианта 94, контравари* анта 104, полинома 204—208, симме-; >рического полинома 825-^-226 Вещественная область 164 Вещественная матрица 254 Вещественная Х-матрица ^54 Вещественная окрестность вещественной точки 18 < Вещественна» точка 18 Вещественное ортогональное преобразование 163 Вещественное элементарное преобраз% вание 254 Вещественные квадратичные формы 136—146 i Вещественный прлином 27 Взаимная квадратичная форма 152 Взаимно простые полиномы 165 Гамильтон, уравнение Г.-Кели 269 Гармоническое деление 99 Гауссова, плоскость 18 Геометрические места, их линейная зависимость 47 Главные миноры 31 Голоэдрически ивоморфные группы 82 Групповое свойство 81 * Группы, абелевы (коммутативные) 82, аффинные 84, голоэдрически изоморфные 82, единичный элемент г. 81, ме- / роэдрически изоморфные 83-^84, порядок г. 85, циклические г. 85, четвертые г. 85 Двойная точка, квадратичной формы 122—123, поверхности второго порядка 114 Двойное отношение Четырех плоскостей 102, четырех точек прямой 98 Деление, гармоническое 99, X-watpnu 253, матриц 76, полиномов 169-472 Делитель, нуля 67, ОбщиЙ^ Д* 175—200» общий наибольший д. 176—181, 183— 184, 193, д. полинома 164, элементарный д. 246—248 Деформация линейная (однородная) 72 Диадик 79 * Диадический полином 79 Аналитический медод исключения Сильвестра 185—Д86
АЛФАВИТНЫЙ Дискриминант, бинарной биквадратичной формы 237, бинарной кубичной формы 219, бинарной формы 217—218, 237, квадратичной формы 123, полинома от одной переменной 229, поверхности 2*го порядка 112 Дополнение, алгебраическое 30,31, д. минора 30 Дополнительные миноры 30 * Дробные матрицы 84 Евклидов алгорифм, для целых чисел 176—178, для полиномов от одной переменной 179, для полиномов от многих переменных 191—193 Единичная матрица 74—75 Единичный элемент группы 81 Зависимость, линейная 40—47, рациональная 224 Закон инерции 136—138, a. «of Nullity» 78 Изобарные полиномы 204 Изобарные симметрические функции 226 Изоморфные группы 82, 83—84 Ййвариантность множителей инварианта 201—202 Инвариантные множители, коллинеации 267, матрицы 245—248, пары билинейных форм 259, пары квадратичных форм 275 Инварианты 86—107, 201—219, абсолютные и. 87, алгебраические 86, арифметические 88, вес относительного и. 93, и. бинарной формы 216, 217, бинарной биквадратичной формы 237—238, геометрические и. 87', иррациональные и. 156, 237, 246, и. квадратичной формы 13»0—131, однородные и, 211—-215, относительные и: 93, 202—204, и. пары квадратичных форм 156, полная система и. 90, 131, рациональные инварианты 95, 201—219 Инерции закон 136—138 % Иррациональные инварианты 156, 237,246 Исключения метод, Сильвестра 186, Безу * 21# Истинные касательные и истинные касательные плоскости 113, 114 Канонические уравнения поверхностей 2-го порядка 163 Картан 146 У Касательная ИЗ , - ■ Касательная плоскость Щ Категории, коллинеации 267—268, пар билинейных фо|м 262, пар квадратичных форм 277 квадратичные формы 14, 121—122, 163, вершина к. ф. 122, вещественные к. ф. 136—146, 163, взаимные $. фч 152, двойная точка к* ф. 122—123, Д|йгкри* УКАЗАТЕЛЬ минант к. ф. 122, инварианты >н**ые рациональные %. ф. 130—131, iwmL фикация к. ф. 139—141, матрица* ф. 121, нормальная форма к* ф. 127^128* 139, неопределенные к. ф. 141, обратные к. ф. 152, определенные к. A, MJl особенные к. ф. 122, пара к. ф, 15§г4бЗ* полуопределенные к. ф. 141, ^ояярные к. ф. 120, правильно расположенные к. ф. 138, приведение к. ф. 124т4427^ 131—135, приводимые к. ф. 12&~-Щ9 присоединенные к. ф, 150—151, 1ДЗ^* k 154, ранг к. ф. 122, сигнатура к. *ф. 138, характеристика квадра гичных форм 141, эквивалентность квадратичных форм 127—128 Квадратная матрица 28 Кватернарные формы 14 Кели 14?, 237, уравнения Гзмильтона-1С 269 Классы квадратичных форм 140 Коварианты, абсолютные 88, относитель- , ные 93, тождественно обращающиеся в нуль 215, целые рациональные 95 Когредиентные переменные 88 КоллинеаЦик 70—74, классификация к. 266г-268, фиксированные точки к. 260, характеристика к. 267, эквивалентность, к. 261 Комбинанты 109 Комбинаций матриц 63—68 Коммутативные группы 82 * Компоненты комплексной величины 63 Конические сечения 155—156, особенные* к. с. 155 Конкомитанты 104 Контравар ианты 104 Контрагредиентные переменные 103 Конус 114 Координаты, линейные (осевые, лучевые) 104—107, однородные 20, плоскостные 102, к. точки. 20 Корни, уравнения 25, бесконечно большие корни 187, кратные корни 25V Корни ^-уравнения как абсолютные иррациональные инварианты 158, общие корни 185—186 Корреляция 111 . Косая матрица 62 Косое билинейное уравнение 111 Косой определитель 62 Коэфициенты полиномов 11, 13 Крамер, правило К. 48 Кратные корни уравнения 25 Кратность ветвей кривой 196, к. корней; i-уравнения как арифметический инвариант 158, кратность части поверхности 198 Кронекер 131, 157, 239 < Кр^г, линейная зависимость к, 49 Кубидаые бинарные формы 219 Кубичные формы 14
^288 АЛФ АВИ ТНЫЙ УКАЗАТЕЛЬ Лагранж, приведение Л. 124—126 Лаплас, разложение Л. 31—33 Линейная зависимость 40—47, л. з. плоскостей 47, векторов 46, геометрических мест 47, окружностей 47, полиномов 41, 43, систем постоянных 41, 42—43 л. а, точек 44—46 Линейные деформации 72 Линейные преобразования 68—70 Линейные уравнения 48—56 Линейные координаты 104—107, уравйе- ния в л. к. 150 Линейные множители, бинарных форм 175—176, Х-матрцц 246, полиномов от одной переменной 75 Липшиц 146 Лучевые координаты 107 i-матрица, вещественная 254, инвариантные множители Х-м. 245—248, нормальная форма Х-м. 243, особенная Х-м. 239, ранг Х-м. 240, степень Х-м. 253, умножение и деление Х-м. 253, характеристика Х-м. 262, эквивалентность Х-м. 239, 250, элементарные преобразования Х-м. 239 Х-уравнение, пары квадратичных форм 158, пары конических сечений 156 Математическая система 80 Матрицы 28, м. билинейной формы 108, вещественные м. 254, деление t м. 76, дробные м. 84, единичные м. 74—75, м. квадратичной формы 121, квадратные м. 2¾ комбинация м. 63—68, косые м. 62, м. как комплексные величины 6Й—65, м. линейного преобразования 68, определитель м. 29, ортогональные м. 145, 274, особенные м. 67, обратные м. 75, м. поверхности 2-го порядка 113, произведение м. 65, присоединенные м. 77, подобные м. 258, разность двух м. 64, расширенные м. 49, ранг м. 29, 57—62, 77—79, симметрические м. 59—61, 272—274, м. Системы линейных уравнений 49, скалярные м. 76, сопряженные м. 29, степени м. 75—76, сумма м. 64, транспонированные м. 29, умножение м. 65—67, унимодулярные м. 82, характеристические м. 258, эквивалентные м. 58, элементарное преобразование м. 57. Мероэдрически изоморфные группы 83-84 Метрическая классификация поверхностей 2-го порядка 163 Миноры, определителя 29—30, главные м. определителя 31, м. присоединенного определителя 37-^-39 Мнимая точка 18 М«ои&ство 8() Множители, инварианта 201—202, поли- вюш 164 Мнфкщ-ель, инвариантный м. Х-матрицы 245—248, линейный м. Х-матрицы линейные м. полиномов от одной пе менной 75 Мур 84 Неоднородные линейные уравнения 4Й-* Неоднородные полиномы, соответетву . щие однородному полиному 167-4С, Неопределенные квадратичные формы Ш Непрерывность полинома 22—24 Неприводимость определителя 166—1<5 Несовместные линейные уравнения 48,' Нормальная форма, билинейных форм liflSj бинарных биквадратичных форм Щ'ф бинарных кубичных форм 219, вещех^ венных квадратичных фор** 139, квадрад тйчных форм 127—128, 139, Х-мафиМ? 243; пары билинейных форм 263*~&6ОД пары квадратичных форм 59, 156V-4C уравнений поверхностей 2-го поря 118—119, полинома от одной пере* но.Й 11 ' Д? Нулевая система 111 [Ж Нуль, делитель н, 67 ш Ньютон, формула Н. 223—224 Область, вещественная 164, рационам 1б4, 165 Образующая 115 Обратная квадратичная форма 152 Обращая матрица 72 .Обратное йрербразование 69 Общая степень полинома 13 Общие делители полиномов от одной переменной 175—188 Общие корни уравнений 185—186 Общий наибольший делитель, определи телей /-го порядка Хтматрицы 240, линомов от одной переменной 178-18¾ 183—184, полиномов от двух перемер ных 193, целых чисел 176—178 Однородные деформации 72 Однородные инварианты 211—215 Однородные координаты 20 Однородные линейные уравнения 51—3 Однородные полиномы 14 Однородность, принцип о* 208-'-210 Окаймленные определители 35—36 , yj Окрестность точки 17, 18 Определенные квадратичные формы t#tj Определитель 28—39, о. билинейных форш 108. главный минор о. Щ косой о* $Щ о. матрицы 29, миноры О* 29—30, ока! млённый о. 35—36, ортогональный Ж 145, о.< преобразовай*# 68, прясоещщ ненный о. 37, произведение о. 33—3 "* разложение Лапласа ;о^ 31—33, рай о. 29, симметрический о. 59 Ортогобильные матрицы 145, 274 Ортогональны© определители' 145 Ортдгоя^льцые п^обрйзо^ания 145—щй Л68 lL*
АЛФАВИТНЫЙ УКАЗАТЕЛЬ 289 Осевые координаты 107 Основная система решений однородных линейных уравнений 54 Основная теорема алгебры 24. Основные формы 93 Особенная система 284 Особенные билинейные формы 108 Особенные квадратичные формы 122 Особенные конические сечения 155 Особенные линейные преобразования 63 Особенные матрицы 67 Особенные >-матрицы 239 Особенные поверхности 2-го порядка 112 Ось 1о7 Относительные инварианты 93, 202—204 Относительные коварианты 93 Переменные, когредиентные 88, контра- гредиентные 103 Период элемента группы 85 Плоскостные координаты 102, уравнение в п. к. 148 Плоскость, бесконечно удаленная 22, гауссова 18, линейная зависимость плоскостей 47, полярные п. 116, сопряженная п. 150. П люк-ер 107 Поверхности 2-го порядка 112—119, вершина п. 114, двойная точка 114, дискриминант 112, касательная ПЗ, касатель- . ная плоскость 114, классификация п. 116—117, 140—141, 163 матрица и. 113, образующая 115, особенные п. 112, ранг п. 112, секущая п. 113, сопряженные плоскости п. 150, сопряженные точки п. 115 Подгруппа 82 Подобные матрицы 258 Полиномы 11—27, алгорифм Евклида для полиномов 179, 191—193, вес п. 204—208, вещественные п. 27, взаимно простые п. 165, деление п. 169—172, делители п. 164, диадические п. 79, дискриминант п. 229, изобарные п. 204, коэ- фициенты п. 11, 13, линейная зависимость п. 41,43, множители п. 164, непрерывность п. 22—24, п.,не имеющие стегни 14, нормальная форма п. 11, шяеЩ$ точки п. 25, общая степень п. 13, Ф$йак родные п. 14, п. от матрицы 269, тШ$& димые п. 164, произведение п. IS—1В, производные и. 346, результант двух п. Ш—183, 227—229, симметрические п. 222—227, 230-2¾ соответствующие п. 167—169, степень п. 11, 13 п., тождественно обращающиеся в нуль 13, 15, тождественно равные п. 11, 14, члены п. 11, 13 Полная система инвариантов 90, 131 Полуопределенные квадратичные формы 141 Полюс 117 Полярность 111 Полярная плоскость 116 Полярная форма 120 Полярный тетраэдр 119 Полярный треугольник 155 Порядок группы 85 , Правильно расположенная симметрическая матрица 61 Правильно расположенные квадратичные формы 138 Преобразование, аффинное 72, вещественное 254, матрицы 239, линейное 68—70, матрица п. 68, п. матрицы 57, обратное п. 69, п. определителя 68, ортогональное п. 145—146, 163, особенное 69, проективное 71, результирующее 69, тождественное 69, элементарное п. матрицы 239 Приведение квадратичной формы, Кроне- кера 131, Лагранжа 124—126, одновременное п. двух квадратичных форм - 15^-163 Приводимость, бинарных форм 175—1769 п. в области 164, 165, п. квадратичных форм 128—130, п. определителей 166—167, п. полиномов 164—165 Присоединенные квадратичные формы 15Э—151, 153—154 Присоединенные матрицы 77 Присоединенные определители 37 Проективное преобразование 71, п. п. прямой 71 Произведение, степень п. двух полиномов 15, п. двух определителей 33—35, п. двух матриц 65, п. матрицы на скалярную величину 65 Пропорциональные системы постоянных 40 Промежуточные формы 104 Простые элементарные делители 247 Псевдокасательные 114 Псевдоплоскости 114 Прямая, проективное преобразование п. 71, бесконечно удаленная п. плоскости 21 Пучок конических сечений 155 Разложение Лапласа 31—33 Разность двух матриц 64 Ранг, билинейной формы 108, квадратичной формы 122, ^-матрицы 240, матрицы 29, 57 — 62, 77—7<9, определителя 29, поверхности,2-го порядка 112, присоединенной квадратичной формы 153— 154, произведения двух матриц 77—79, системы лиивйяых однородных уравнений 54—56, системы точек (линейных форм) 90—92 Распределительный закон для матриц 66 Расширенная матрица 49 Рациональная зависимость 224 Рациональная область 164, 165 Рациональные инварианты и коварианты 95
290 АЛФАВИТНЫЙ УКАЗАТЕЛЬ Национальные инварианты Х-матрицьь 246 эезуяьтант, бинарных форм 188, 216, 217, 218, 237, двух полиномов от одной переменной 181—183, 227—229, системы линейных форм 92 Результирующее линейное преобразование 69 Свойства проективные 86 Текущая 1ДЗ Sgn 138 Сигнатура вещественной квадратичной формы 138 Сильвестр 78, 136, 239, диалитический метод исключения С. 185—186 Символическое произведение двух били* нейных форм 108 Симметрические билинейные формы 109 Симметрические бинарные функции 232— 234 Симметрические матрицы 59—61, 272— 274 Симметрические определители 59 Симметрические полиномы 222—227, 230—238 Симметрические тернарные функции 234 Симметрические элементарные функции 222-225, 231—232 Система, квадратичных форм 157, 281, квадратных уравнений 282, линейных форм 96—98, математическая с. 80, особенные с 284, полная с. инвариантов 90, 131 Система постоянных, линейная зависимость с. п. 41, 42—43, пропорциональные с. п. 4Э Система решений, основная с. р. однородных уравнений 53—56 Скалярные величины 64 Скалярные матрицы 76 Смешанные конкомитанты 104 Смит 239 Собственно унимодулярные матрицы 82 Соответствующие полиномы 167—169 Сопряженная с произведением матрица 67 Сопряженные матрицы 29 Сонряженные плоскости 105 Сопряженные точки 115—116 Составление линейных преобразований 69 — 70 Составные элементарные делители 247 Сочетательный закон для матриц 66 Степень, ^-матрицы 253, матрицы 75— 76, общая с. полинома 13, с. полинома 11, 13, произведения двух полиномов 15—16 Субопределители 30 Субрезультанты 183 Сумма двух матриц 64 Тернарные симметрические функции 234 Тернарные формй 14 Тетраэдр Молярный 119 Тождественное преобразование 69 Тождественное обращение в нуль, полиномов 13, 15, коварианта 215 Тождество полиномов 11, 14 Точка 3? бесконечно удаленная т. 20—21, вещественная т. 18, т. в пространстве п измерений 18, 22, координаты т. 20, линейная зависимость т. 44—46, мнимая т. 18, окрестность т. 17, 18, сопряженные т. 115—116, уравнение т. 102 Транспонированная Матрица 29 Треугольник полярный 155 Умножение, Х-матриц 253, матриц 65—67 определителей 33—35 Унимодулярные матрицы 82 Уравнение, корни у. 25, бесконечно большие корни у. 187, общие корни у. 185—186, кратные корни у. 25, линейные у. 48—56, канонические у. поверхностей, 2-го порядка 163, несовместные у. 48, однородные линейные у. 51—56, характеристическое у. 258, у. в линейных координатах 150, в плоскостных координатах 148 Фиксированные точки коллинеаций 260 Формы 14, би квадратичные 237—238, билинейные ,108—111, бинарные 14, вещественные квадратичные 136—146, квадратичные 120—163, кватернарные 14, кубичные 14, 219, линейные 14, полярная ф. 120, приводимые ф. 128— 130, системы квадратичных ф. 157,181, тернарные ф. 14 Фробениус 138, 239, 247 Функция, бинарная симметрическая 232— 234, тернарная симметрическая 234, характеристическая 258, элементарная симметрическая 222—225, 231—232 Функция 5 221, 230 Функция 2 220, 230 Характеристика, квадратичной формы 141, коллинеаций 267, Х-матрицы 262, пары билинейных форм 262, пары квадратичных форм 277 Характеристическая матрица 258 Характеристическая функция 258 Характеристическое уравнение 258 Целые рациональные инварианты 95, 201—219, ц. р. и. квадратичной формы 130—131 ч Целые рациональные коварианты 95 Циклические группы 85 Ч1м>веряая группа 85 Члены полинома 11, 13
АЛФАВИТНЫЙ УКАЗАТЕЛЬ ОД Эйлер 146, теорема Э. об однородных функциях 21/ Эквиангармоническое положение 102 Эквивалентность, алгебраических выражений 89, билинейных форм 109, геометрических образов 89, двух систем линейных форм 96, квадратичных форм 127—128, коллинеаций 261,Х-матриц 239, 250, матриц 58, пар билинейных фо м 258—259, пар квадратичных форм 274, 276, пар матриц 255—258 Элемент, единичный э. группы 81, э. множества 80, период э. группы 85 Элементарные делители, простые и сложные 245—248, вычисление э. д. 248— 250, э. д.{пар билинейных форм 259, $. Д. пар квадратичных форм 275 Элементарные преобразования, вещественные 254, э. п. ^матрицы 239« матрицы 57 Элементарные симметрические функции 222—225, 231—232 Якоби 136
29 ; Редакционную работу по этой книге провел Д. А. Райков. Издание оформила В. Зазульская. Корректуру держала Л. Свешникова. Наблюдала за выпуском О. Морозова. Рукопись сдана в производство 10/1 1932 г., листы подписаны к печати в сентябре 1933 г., книга вышла в свет в октябре 1933 г. в количестве 5000 экз. на бумаге формата 62)*(947ie> печатных знаков в книге 1.384 тыс., листов 18»Д- Заказ № 461. Уполномоченный Главлита № В—45032. 1-я Журн. тип. ОНТИ НКТП СССР. Москва, Денисовский 30.
ft