Text
                    Л оп1|лярные лекции
ПО МАТЕМАТИКЕ
siors
И.Р. ШАФАРЕВИЧ
О РЕШЕНИИ
УРАВНЕНИЙ
ВЫСШИХ
СТЕПЕНЕЙ
(МЕТОД ШТУРМА)
ГОСУДАРСТВЕННОЕ ИЗДАТЕЛЬСТВО
ТЕХНИКО-ТЕОРЕТИЧЕСКОЙ ЛИТЕРАТУРЫ
МОСКВА•1954

11-3-1 ОГЛАВЛЕНИЕ Введение .......................... 3 § 1. Границы корней.................4 § 2. Общие корни многочленов н равные корни...............................7 § 3. Характеристика пары многочленов .... 9 § 4. Число корней .многочлена, лежащих между а и b ............. 17 И. Р. Шафаревич. О решении уравнений высших степеней. Редактор Ь. Б. Орлов. Теки, редактор С. С. / авралов. Корректор Ц. С. Варшавская Сдано в набор 25/V 1954 г. Подписано к печати 22/VII 1954 г. Бумага 84Х108уа.. Физ. печ. л. 0,75. Условн. печ. л. 1,23. Уч.-изд. л. 1,24. Тираж ЗООООэкз. Т-О1В80. Цена книги 40 к. Заказ № 1405. Государственное издательство технико-теоретической литературы. Москва, Б. Калужская, 16. 4 я типография им. Евг. Соколовой Союзполиграфпрома Главнздата Министерства культуры СССР. Ленинград, Измайловский пр., 29.
ВВЕДЕНИЕ В курсе алгебры средней школы выводится формула для решения квадратного уравнения, а из курса физики видно, насколько необходима эта формула для решения многих физических вопросов (например, в задачах, связанных с равно- ускоренным движением, и т. д.). Не меньшую роль, чем квадратные уравнения, играют в математике и ее приложениях уравнения третьей и более вы- соких степеней. Люди почти так же давно начали заниматься уравнениями высших степеней, как и квадратными уравнения- ми. Известны вавилонские клинописные таблички, в которых решаются некоторые кубические уравнения. Несмотря на то, что этим вопросом занимались так давно, основные факты об уравнениях высших степеней были открыты только в XIX веке. Эта лекция посвящена обзору некоторых основных свойств уравнений высших степеней. Способ, которым мы будем выводить свойства уравнений высших степеней, резко отличается от того способа, при помощи которого в курсе алгебры средней школы выводят свойства квадратных уравнений. Почти все свойства квадратных уравнений выводятся из формулы для их решения, мы же не будем выводить формулу для решения уравнений высших степеней, а получим их свойства из некоторых общих алге- браических и геометрических соображений. Дело в том, что для большинства уравнений высших степеней не существует такой формулы, как для уравнений второй степени. В тех же случаях, где такая формула есть, она настолько сложна, что из нее невозможно вывести никаких свойств уравнения. Но и независимо от этого, наш путь имеет еще одно преимущество: он делает более ясной истинную причину тех фактов, которые доказываются. 1* 3
Все рассуждения, которые здесь будут приведены, годятся для уравнений любой степени. Часто они будут изложены в общем виде. В некоторых же случаях, когда рассуждение в общем случае принципиально то же, но удлиняет выкладку, мы будем приводить его лишь для уравнений третьей степени и только формулировать то, что получится в общем случае. Очень рекомендуется провести все рассуждения самостоятельно в общем случае. Наконец, совсем выпущены доказательства фактов, подоб- ных следующему: если график многочлена имеет точки по разные стороны оси х, то он эту ось пересекает. Вероятно, некоторые читатели не почувствуют потребности в доказа- тельстве подобных предложений. Тот же, кто пожелает про- вести эти доказательства, легко сделает это при помощи простейших свойств непрерывных функций, которые можно узнать из первых глав любого курса анализа. В этой книжке мы будем заниматься только свойствами действительных корней уравнений, так что от читателя не потребуется знания свойств комплексных чисел. Заметим, что свойства комплексных корней уравнений могут быть выведены с помощью таких же методов, но несколько усложненных. § 1. ГРАНИЦЫ КОРНЕЙ Первая задача, которую мы себе поставим, заключается в следующем: для каждого уравнения указать гра- ницы, между которыми расположены его корни. Предположим, что наше уравнение — третьей степени и имеет вид ах'л Ьх$ -|- сх d = 0. (1) Мы покажем сейчас, кйк найти такое положительное число N, что если абсолютная величина х превосходит N, толевая часть уравнения отлична от нуля. Тогда корни будут наверняка расположены между — /V и N. Для этого постараемся выбрать М таким, что если абсолютная величина х больше N, то абсолютная величина первого члена превосходит абсолют- ную величину суммы трех остальных. Тогда первый член не сможет сократиться с суммой остальных и все выражение будет отлично от нуля. Мы заведомо достигнем своей цели, если треть абсолют- ной величины первого члена будет больше абсолютной вели- 4
чины каждого из трех остальных, т. е. l|0||x|8>|ft||xp. ||fl||x|8>|c||x|, l|a||x|«>|d|. Решая эти неравенства, получим: Таким образом, мы получим число с нужным нам свойством, взяв за 7V большее из трех чисел 1/ З-J-^r, 1/ зД-^-г. н I л | Г |в| ’ Г |в| В самом деле, при | х |, большем /V, все три неравенства будут выполняться, а следовательно, левая часть уравне- ния (1) не будет обращаться в нуль. Для уравнения степени п, ох”-}-Ах’,~1-|-схп_г-4- . •. -}-Ах-}-/ = О, (2) надо было бы принять за W наибольшее из ряда чисел: Заметим, что мы доказали несколько больше, чем утвер- ждали. Так как абсолютная величина первого члена в левой части уравнения (1) больше, чем абсолютная величина суммы остальных членов, то знак всего выражения определяется знаком первого члена. Таким образом, мы не только знаем, что левая часть уравнения (1) есть число, отличное от нуля, когда абсолютная ^величина х превосходит N, но мо- жем указать и знак этого числа — он совпадает со знаком первого члена. Уже из этих простых соображений мы можем вывести важные следствия о корнях уравнений. Для этого надо вос- пользоваться графиком функции у — ох”-}-Ах”-1-}- • • • Ах-}-/. (3) Пусть (черт. 1) на плоскости взяты оси координат и вычерчен график функции (3). Согласно общему правилу черчения гра- 5
фиков ордината и точки М графика равна тому числу, которое получится, если подставить ее абсциссу v в выражение (3) вместо х. В частности, ордината обратится в нуль, когда абсцисса будет корнем уравнения (2). Это значит, что корни уравнения геометрически изображаются точками пере- сечения графика с осью х. Пусть наше уравнение — третьей степени. Мы разделим обе части его на коэффициент а при первом члене и запишем в виде х*px2-\-qx-\-r = 0. (4) Посмотрим, чтд геометрически обозначает найденное чис- ло N с указанными выше свойствами. Все корни уравне- ния (4) расположены между —/V и /V. Это значит, что график функции у = х3 + рх2 4- qx -|- г (5) может пересекать ось х только в точках, абсциссы которых лежат между — N и N. Но обязан ли график пересекать ось х? Вспомним, что если х по абсолютной величине больше /V, то знак функции (5) совпадает со знаком первого члена. Но знак первого члена нам известен — он совпадает со знаком х. Таким образом, если х больше /V, то много- член положителен, а это значит, что график в этой части лежит выше оси х. Если же х меньше —N, то многочлен отрицателен, т. е. график в этой части лежит ниже оси х. То, что мы таким образом узнаем о графике, нарисовано на черт. 2. 11з этого чертежа ясно, что график должен пере- 6
сечь хоть один раз ось х, а это значит, что уравнение третьей степени имеет хотя бы один корень. Аналогичный факт имеет место и для уравнений высших степеней: уравне- ние нечетной степени имеет хотя бы один корень. Ясно, что для уравнений четной степени эта теорема не имеет места, как показывают уже квадратные уравнения, которые могут вовсе не иметь корней •). $ 2. ОБЩИЕ КОРНИ МНОГОЧЛЕНОВ И РАВНЫЕ КОРНИ Основным алгебраическим приемом, которым мы будем дальше пользоваться, является деление многочлена на много- член с остатком. Если имеется два многочлена f и g, то мы можем разделить (обычным способом, яуголком») тот из них, который имеет большую степень, на другой, и получим не- полное частное q и остаток Л, который имеет уже меньшую степень, чем делитель. Это можно записать в виде формулы f = (b) Деление с остатком — это общий прием, который сводит изучение пары многой.ленов / и g к научению пары много- членов g и h. имеющих меньшие степени. Именно благодаря этому обстоятельству часто оказывается, что свойства пары многочленов могут быть легче изучены, чем свойства одного многочлена. В качестве примера рассмотрим, к4к находятся общие корни двух многочленов / и g. Если а есть корень как много- члена /, так и многочлена g, то, полагая в соотношении (6) х = а, мы получим, что и Л должно обратиться в нуль, т. е. иметь корнем а. Таким образом, общий корень много- членов / и g является общим корнем многочленов g и Л. Наоборот, из того же соотношения (6) мы видим, что если а есть общий корень многочленов g и Л, то он является также корнем /, т. е. общим корнем многочленов / и g. Взятые вместе, эти два утверждения показывают, что общие корни многочленов f и g. с одной стороны, и многочленов g и Л, с другой, совпадают. Достижение здесь заключается в том, что многочлены g и Л имеют меньшие степени, чем fug. *) Напомним, что мы под корнем всегда подра «умеваем веще- ственный корень, так что, например, уравнение х’ 1 = о. с нашей точки зрения, не имеет корней. 7
C g и h мы можем повторить те же рассуждения, разделив g с остатком на Л. Таким образом, мы будем получать пары многочленов все меньших степеней, причем общие корни у всех этих пар многочленов будут одни и те же. Мы при нуждены будем остановиться, когда придем к паре много- членов и и V, один из которых, например V, есть нуль. Но в этом случае все корни многочлена и являются общими корнями и и V, так как V, будучи равно нулю, имеет все числа своими корнями. Таким образом, нахождение общих корней многочленов / и g свелось к нахождению корней многочлена и, имеющего, как правило, гораздо меньшую степень. Рассмотрим пример. Найти общие корни многочленов х* ха -f- 3X -f- 1 и х8 4-х 4- 2. Делим первый с остатком на второй: *4 4-^4-3x4-1 |ха4-х4-2 х4 -|~ Ч- 2х х х4-1 Остаток есть х -|- 1. Следовательно, общие корни у перво- начальной пары многочленов те же, "что и у многочленов x84-JC-|-2 и х4-1. Делим опять первый с остатком на второй: Xs 4- х 4- 2 | х -|- 1 х'“-}-х2 х2 — х-|-2 _х24-х-|-2 — х----X 2x4-2 2x4-2 О Остаток есть 0. Следовательно, общие корни те же, что и у многочленов х -|-1 и 0, то-есть только один общий корень —1. Мы можем применить то, что сейчас узнали, к другой задаче: узнать, имеет ли заданный многочлен среди своих корней равные, и найти эти равные корни. Мы опять будем предполагать, что имеем дело с многочленом третьей сте- 8
пени (5). Если этот многочлен имеет своим корнем а, то он делится без остатка на х—а. Это вытекает из теоремы Безу, но мы проверим сейчас этот факт простым делением: № -|- рх2 4 qx -|- г х — а__________________________ Xй—ах2 х2 4(Р + «)х 4 а2-|-ра-|- q (р-]-а)х24 qx-\-r (Р 4 «) х2 — а (рЦ- а) х (а24-ра-|-д)х-|-г (я2 4 ря 4 ?) х — « (я2 4- pa 4 g) а3-}- ра2-|-<?я Остаток «3-|-ра2 4^а4’г равен нулю, так как нам дано, что а является корнем уравнения (4). Мы получим заодно, что частное от деления есть х2 + О4 «)х + (а2 + ра + <7)- (7) Если бы уравнение (4) имело еще один корень, равный а, то он должен был бы быть корнем многочлена (7). Подставляя а вместо х, получаем За2 4- 2ря 4 q — 0. Итак, мы доказали, что равные корни многочлена (5) являются общими корнями этого многочлена и многочле- на Зх24-2рх4- q. Этот последний называется производ- ным многочленом от многочлена (5). Таким образом, задача привелась к разысканию общих корней многочлена и его производного многочлена, а эту задачу мы уже умеем решать. Для многочленов n-й степени (2) имеет место вполне ана- логичная теорема. Роль многочлена Зх2-\-2рх-\- q здесь играет многочлен пахп~} -|-(п— 1)£хп~24(я — 2)сх”-в4 •• ... 4" Этот многочлен также называется производным от многочлена (2). § 3. ХАРАКТЕРИСТИКА ПАРЫ МНОГОЧЛЕНОВ Мы переходим теперь к нашей главной задаче. Она фор- мулируется так: задан многочлен / и два числа а и Ь, причем а < Ь', надо узнать, сколько у мно- гочлена / есть корней, лежащих между а и Ь, 9
т. е. меньших Ь, но ббльшиха. Мы увидим дальше, что из решения этой задачи будут следовать ответы на боль- шинство вопросов, которые можно задать о корнях много- членов: об их числе, расположении и даже способе их вы- числения. В решении этой задачи мы будем поступать так же, как и в предшествующем параграфе, т. е. сначала исследуем свойства пары многочленов. При этом мы будем пользоваться двумя методами, которые нам уже встречались: алгебраи- ческим— делением с остатком, и геометрическим — построе- нием графика. Пусть даны два многочлена, причем нам важен и порядок, в котором они заданы. Первый многочлен обозначим через Д, Черт. 3. а второй -— через Д. Мы будем предполагать, что Д и Д не имеют общих корней, так как общие их корни мы можем найти по способу предыдущего параграфа. Начертим графики многочленов Д и Д. (График Д мы будем чертить жирной линией, а Д— пунктиром; черт. 3.) Они будут делить всю плоскость на три части — первую, которая лежит ниже обоих графиков, вторую, которая лежит выше обоих, и третью, которая лежит между двумя графиками. Третья часть и будет нас дальше, интересовать. Мы будем ее заштриховывать на чертеже и называть заштрихованной областью. Нанесем на оси х точки с абсциссами а и b и обозначим их через А и В. Будем двигаться от точки А к точке В по оси х. При этом мы будем пересекать графики многочленов Д и Д в точках, изображающих их корни. В некоторых из этих 10
точек пересечения мы будем выходить из заштрихованной области, в других — входить в нее. Первые мы будем называть точками выхода, вторые — точками входа. Заметим, что точка не может быть одновременно точкой входа и точкой выхода (как это имеет место на черт. 4 для точки С), так как тогда оно изображала бы общий корень многочленов fx и Д, а мы предположили, что таких нет. Теперь мы введем одно новое понятие. Характеристикой многочленов Д и Д называется раз- ность между числом точек выхода и принадлежащих графику многочлена Д и расположенных между точками Ли В. Например, на чертеже 3 точки D и Е являются точками выхода, принад- лежащими графику Д, а С, F и G—точ- ками входа на этом же графике. Харак- теристика в этом случае равна 2 — 3 = = — 1. Характеристика является целым числом иобозначается(Д.Д). Она, конеч- но, зависит, кроме многочленов Д и Д.еще и от точек А нВ, между которыми мы числом точек входа, Черт. 4. рассматриваем графики многочленов. Совершенно очевидно, что характеристика многочленов Д и Д зависит от того, какой из них мы считаем первым, так как при ее подсчете мы обращаем внимание только на точ- ки входа и выхода на графике этого многочлена. Поэто- му интересно выяснить, кйк именно изм нится характе- ристика, если мы будем считать первым многочленом не Д, а Д, или, иначе, как связаны между собой числа (Д, Д) и (Д, Д). Удобно представить себе положение вещей на следующей мод ли. Имеется комната, в которую человек может входить и из которой может выходить. Обозначим число, показы- вающее, сколько раз он вышел из комнаты за заданный промежуток времени, через Р, а сколько раз вошел — через Q. Ясно, что так как за каждым входом, кроме последнего, следует выход, а за выходом — вход, то число входов может отличаться от числа выходов не боле: чем на 1 в ту или другую сторону. Мы можем это запи- сать так: е = 0, 1 или —1. (8) 11
Более точно значение е определяется следующей таблицей: 1 — если в начальный момент человек был внутри, а в конечный — снаружи; — 1 — если в начальный момент он был снаружи, а в ко- нечный — внутри; О— если в начальный и конечный момент времени он был по одну и ту же сторону стен комнаты (черт. 5). Представим теперь себе, что задача усложнена tAi, что в комнате есть две двери — / и //, и число выходов и вхо- дов через каждую дверь подсчитывается отдельно. Число выходов и входов через 1 дверь мы обозначим через Pi и через II—Р2 и Q,. Ясно, что общее число входов и вы- ходов через обе двери подчиняется соотношению (8), т. е. Отсюда мы получаем: Л — <21 = -(^2 — С2)-Ь- Это показывает, что разности между числом выходов и чис- лом входов в случае I и II двери просто связаны между собой. Ясно, какое это имеет отношение к нашим многочленам. Комната — это заштрихованная область, I дверь — это график VUW I-W-1 Мш ПЯЛ> 1.е=0 И.в=О Ш.е=-1 П.е=1 Черт. 5. многочлена II дверь — это график /2. Выходы и входы — это точки входа и точки выхода, Рх — — не что иное, как характеристика (Д, Д), Р2—Q2— характеристика (Д, Д). Мы получаем соотношение (А. /.) = -(/». А)+*. и остается только выяснить, каков смысл е в нашем случае. Внутри заштрихованной области (комнаты) мы начали или вне ее, зависит от того, принимают ли многочлены Д и Д при х = а значения одинакового знака или разных знаков. Точно так же, внутри или вне заштрихованной области мы кончили, зависит от того, одинакового или разного знака 12
значения Д и Д при х = Ь. У славимся говорить, чта в паре чисел есть одна перемена анака, если ани разных знакав, и нет ни одной — если аднага, и обозначим значения Д и Д при х = л через и «2, а при х = Ь через и >2. Как легка праверить, е будет савпадать с разностью между числам перемен знака в паре в( и в, и числам перемен знака в паре и >2. Если первае числа обозначить через mv а втарае — через nv та е = т1 — п1. Да сих пар мы не имели спасаба найти характеристику двух мнагачленав, так как, для тага чтебы воспользоваться опре- делением характеристики, нада была знать их карни. Сейчас мы мажем такай спасаб вывести. Именна здесь вступает в дей- ствие деление с астаткам. Мы разделим f1 с астаткам на Д: fi = fa +/з (/в — •статок), (9) 4 Черт. 6. и паставим вапрас, как связаны характеристики (Д, Д) и (Д, Д). Такая пастанавка вопроса подсказывается нам ре- зультатам предыдущего параграфа, где мы видели, чта общие карни у пары мнагачленав Д, Д уп те же, чта и у пары многочленов Д, /в- Прежде всего мы имеем: (А-/2) = -(/2-А)+'- О») Нам остается сравнить (Д, Д) и (Д, А)- Мы лекажем, чта эти два чис- ла равны. Для этага заметим, чта ес- ли « является карнем мнагачлена Д, та при х = « значения мнагачленав Д и Д севпадают (черт. б). Эта пелу- чится, если в (9) заменить х на « и заметить, чта член, садержащий Д, прападает. Из этага следует, чта акала тачки с абсциссай х — « гра- фики мнагачленав Д и Д расположены сторону от графика уже просто следует совпадение характеристик (Д, Д) и (Д, Д). В самом деле, при подсчете обеих характеристик нам надо перебирать корни мнагачлена Д, лежащие между А и В, и смотреть, какие из них являются точками входа, а какие — точками выхода. Но из того, что было только что доказано относительно расположения графиков многочле- нов Д, Д и Д, следует, что если корень « является точкой па адну мнагачлена Д (черт. б). и ту же • тс мда 13
входа в заштрихованной области, образованной графиками многочленов Д и fv то он будет изображаться также точкой входа и в области, образованной графиками f2 и Д. То же самое имеет место и для точек выхода. Таким образом, совпадение характеристик (/,, Д) и (Д, Д) доказано. Вместе с (10) это дает нам соотношение (Д. Д) = -(Д. Д) + «- (И) Так как многочлены Д и Д имеют меньшие степени, чем многочлены Д и Д, то это дает нам общий способ вычисле- ния характеристики пары многочленов. Принципиально наша задача — научиться вычислять ха- рактеристику пары многочленов — решена, но можно придать результату более законченный вид. Для этого постараемся избавиться от знака минус в формуле (11). Проше всего взять для этого за Д не остаток от деления Д на Д, а этот остаток с обратным знаком. Остаток будет тогда—Д и (9) будет иметь вид: /1=А?—/в- а формула (41) приобретает более простой вид (/1. А) = (Д. /«) + *. (12) Для того чтобы это проверить, нам надо только дока- зать, что характеристика пары многочленов меняет знак, если второй многочлен меняет знак. Но это совершенно ясно из чертежа, поскольку график второго многочлена заменится тогда симметричной ему относительно оси х кривой, так что все корни первого многочлена, которые были точками вы- хода, сделаются точками входа и наоборот. Ясно, что ха- рактеристика изменит знак. После того как мы разделим на Д и остаток, взятый с обратным знаком, обозначим через Д, проделаем то же самое с Д и Д и будем продолжать, пока у нас не полу- чится остаток, равный нулю. Полученный таким образом ряд многочленов Д, Д, Д, .... fk (не считая нуля) назы- вается рядом Штурма пары многочленов Д и f.2. Послед- ний многочлен Д ряда Штурма не может иметь корней, так как многочлены Д, Д, .... Д только знаками отличаются от тех, которые мы строили в предыдущем параграфе для определения общих корней Д и Д, и если бы Д имел корень, то он был бы общим корнем Д и Д, а мы предположили, что таких нет. Выписывая формулу (12) для каждой после- 14
довательной пари многочленов ряда Штурма, мы получим целый ряд формул: (/1. А) = (А- А)4-'г (А- А) — (/а- /4) 4* <’о. (Jk-ч' fk-i) — (.fk-v A) + efc-a' (А-p A)=(A. 0) Здесь числа et....ek_l имеют прежний смысл, то-есть каждое из них (например, et) есть разность между числом пере- мен знака в паре чисел, являющихся значениями двух рядом стоящих многочленов f, и /1+1 при х — а и при х = Ь. Заметим теперь, что раз fk не имеет корней, то характе- ристика его с любым многочленом равна нулю, в частности (Д, 0) = 0, и мы можем последнюю формулу переписать так: (Д_г fit) = ^k-v Из предпоследней формулы определим (.fk-ч' 01,0 окажется равным ек_„ Ц- Поступая гак и дальше, мы получим, наконец, что (А» A)==<’i4_f->4- ••• +рк-р (13) Эту формулу можно еще упростить. Обозначим через «г а2.....ак значения многочленов Д, Д. ..., Д при х = а, а при х = Ь— через Ьх, Ь.,, .... Ьк. Если число перемен знаков в паре чисел и а,+1 есть т(, а в паре чисел bt и bi+1— есть л,, то е. = Л14 —л,. Формулу (13) можно поэтому переписать так: (/р А) = ('л1 —wi) + (m2 —••• +("»ik-i —Як-1). или (А. А) = (»»i 4- 4- • • • 4- ^*-1) — («14- «24- • • • 4- Число ЛЧ4- 4_/n*-i показывает, сколько раз в ряду чисел a.t, ..., ак стоят рядом числа противоположных знаков. Число пх- ... -}-л|(_1 показывает то же самое для ряда чисел Л(, Ь.л, .... Ьк. Эти числа называются числами перемен знаков в ряду at, .... ак и ряду bt, .... Ьк. Теперь мы можем сформулировать окончательно полу- ченный нами результат так: характеристика пары много- 15
членов равна разности между числом перемен знаков в значениях многочленов ряда Штурма при х = а и х — Ь. Закончим этот длинный параграф примером. Определим характеристику многочленов f1 = xi — 8х2 —|— 19-v — 12 и /„ = х3—9х2-[~27х— 26, причем положим а = О, Ь = 5. Найдем ряд Штурма. Делим с остатком на /2: х3 — 8№ 19х — 12 |х3 — 9х2 27х — 26 х3—9х2 + 27х —26 Г~ х2—8х+ 14 Остаток есть х2—8х-]-14 и, следовательно, f:i = — х2-}- 8х—14. Делим f> с остатком на /а: х" — 9х2 Ц- 27х — 26 | —-х2 + 8х—-14 х3 — 8х2 —|— 14х — х -f— 1 — х2 -|- 1 Зх — 26 — х2+ 8х—14 5х — 12 Остаток есть 5х—12 и, следовательно, fi — — 5х-|-12. Делим с остатком на /4: — х2Ц-8х—14 | — 5хЦ-12 И 28 ' 5Х 5 12 ’ 5 Х ?х-14 О 28 28 Т*-12-25 __14 4- 12 • — =_— 25 25 _ 14 . 14 Остаток есть —и, следовательно, /Б = ^=. 2.J ZO Ясно, что следующий остаток уже будет нулем. Ряд Штурма состоит, таким образом, из многочленов х3 — 8х2-|- 4-19Х—12, х3 — 9х2 + 27х — 26, — х28х — 14, 14 -5х+12, ". 16
Значения многочленов ряда Штурма выпишем в виде таблицы г = 0 х- 5 — 12 8 л -26 49 /з — 14 1 л 12 — 13 Л 14 25 1 1 25 Таким образом, первый столбец содержит как раз числа av .... ак, а второй — числа bt.....Ьк. В первом столбце есть одна перемена знака, так как рядом стоят —14 и 12, во 14 втором — две, так как рядом стоят 1 и — 13 и — 13 и Характеристика равна 1—2=-—1. § 4. ЧИСЛО КОРНЕЙ МНОГОЧЛЕНА. ЛЕЖАЩИХ МЕЖДУ а и b Сейчас мы покажем, кйк от характеристики пары мно- гочленов перейти к нахождению корней одного многочлена. Характеристика пары многочленов и /2 равна разности между числом тех корней многочлена fx между а и Ь, которые являются точками выхода, и iex, которые являют- ся точками входа. Если бы мы сумели подобрать мно- гочлен /2 так, чтобы все корпи многочлена стали точками выхода и, значит, пи одни не был бы точкой вхо- да, то характеристика пары многочленов и f., в точ- ности совпала бы с числом корней многочлена лежащих между а л Ь. Посмотрим, как подбирать такой многочлен При этом нам нужно будет предполагать, что многочлен ft не имеет равных корней. Пусть а есть корень многочлена Как должен быть расположен график многочлена /.,, чтобы точка, изображающая корень а, была точкой выхода? Тут воз- можны два случая в зависимости от того, поднимается ли график многочлена f\ при х = я снизу вверх или спускается 2 И, Р. Шафаревич 17
сверху вниз. Как показывают черт. 7 и 8, в первом слу- чае график многочлена /2 должен лежать при х — а выше, а во втором — ниже оси х. Иными словами, в первом случае значение многочлена Д при х = а должно быть положитель- ным, а во втором — отрицательным. Посмотрим теперь, как научиться узнавать, какой из двух случаев имеет место. Пер- вый случай заключается в том, что при х, меньшем а, мно- гочлен Д отрицателен, а при х, большем а,-—положителен. Во втором же случае — наоборот. Предположим опять, что мы имеем дело с многочленом третьей степени Д = х8-|-рх2-|- qx г, имеющим корень а, и вспомним, что еще в § 2 мы показали, что такой много- член делится па х—а и частное равно х2 -ф- (р -ф- а) х -ф- "Г (“2 + Р“ +?)'• х» Ц- рх2 Ц- qx + г — (х — а) [х2 + (ра)х + (a2 -f- pa -j- <?)|. Воспользуемся этим разложением, чтобы определить, каковы знаки тех значений, которые принимает многочлен когда х немного меньше или немного больше а. Относи- тельно первого множителя все ясно: если х меньше а, то он отрицателен, а если больше-—то положителен. Обратимся ко второму множителю. При х = а он не обращается в нуль. В самом деле, мы видели в § 2, что это свидетельствовало бы о наличии у многочлена Д двух равных корней, а мы предположили, что их нет. Значение второго множителя при х = а равно как раз значению производного многочлена Д при х = а. Если эю—положительное число, то и при х, не слишком сильно отличающемся от а (именно, если х ближе 18
к а, чем какой-либо из корней этого квадратного трехчлена), второй множитель положителен, а это значит, что все произ- ведение ведет себя в смысле знаков принимаемых значений как первый множитель; иными словами, мы имеем здесь пер- вый случай. Наоборот, если значение производного много- члена отрицательно, то все знаки меняются на обратные, и мы имеем второй случай. Мы установили, что здесь решающую роль играет уже знакомый нам производный многочлен, а именно, первый случай имеет место, если значение производного многочлена при х = а положительно, и второй — если отрица гельно. То же самое имеет место и для многочленов любой степени. Но из этого мы витим сразу, что производный многочлен как раз и является таким многочленом Д, какой нам надо най- ти. Иными словами, если за Д взять производный многочлен многочлена Д, то характеристика (Д, Д) будет равна числу корней многочлена Д, расположенных между а и Ь. Так как мы вывели в предыдущем параграфе способ вычисления ха- рактеристики, то мы имеем способ нахождения числа корней любого многочлена, расположенных между а и Ь. Сформулируем полученное правило для отыскания числа корней многочлена. Для того чтобы найти число корней многочлена, рас- положенных между а и Ь, надо найти ряд Штурма для многочлена и его производного многочлена и вычислить значения многочленов этого ряда сначала при х = а, потом при х*= Ь. Разность между числом перемен зна- ков в первом и втором рядах чисел и будет искомым числом корней. Это правило является знаменитой теоремой французского математика Штурма. Она доказана им в 1829 г. Интересно, что рассуждения, при помощи которых мы решили нашу задачу — найти число корней многочлена, ле- жащих между а и Ь, — имеет много общего с теми рассуж- дениями, при помощи которых мы в § 2 решили другую задачу — найти равные корни многочлена. В обоих случаях оказалось, что проще сначала исследовать некоторое свой- ство пары многочленов — в первом случае это был вопрос об общих корнях, во втором—о нахождении характери- стики. Причина того, что в свойствах пары многочленов легче разобраться, чем в свойствах одного многочлена, в обоих случаях была одна и та же — к двум многочленам можно 2* 19
применять деление с остатком, благодаря чему решение интересующего нас вопроса о двух данных многочленах сво- дится к решению того же вопроса о двух многочленах меньшей степени. Затем мы в обоих случаях подбирали к заданному нам многочлену такой вспомогательный мно- гочлен f.2 (в обоих случаях за такой многочлен можно при- нять производный многочлен к /,), что решенный нами во- прос о паре многочленов в применении к паре fv дает решение интересующего пас вопроса о многочлене /г Покажем теперь, как при помощи теоремы Штурма можно решить ряд задач о корнях многочленов любой степени. Прежде всего мы обратимся к задаче об определении числа всех, а не только лежащих между а и Ь, корней за- данного многочлена /. Решение этой задачи получается сразу же, если соединить теорему Штурма с результатами, полу- ченными нами в § 1. Там мы показали, как найти такое число N, что все корни многочлена лежат между — Л' и Л'. Из этого следует, что если мы при помощи теоремы Штурма определим число корней многочлена, расположенных между — /V и /V (взяв л = — /V, b = N), то получим число всех его корней. Таким образом, задача решена. Это решение можно, однако, представить в более изящ- ной форме. Пусть ряд Штурма для многочлена fx и его про- изводного многочлена f.2 состоит из многочленов /р .....fk. Для каждого многочлена из этого ряда существует согласно § 1 такое свое число /V,, чго корпи лежат между — (V, и Л\. Выберем теперь за/V любое число, большее всех чисел /Vj. Тогда корни всех многочленов расположены между -.V и /V. Если мы теперь применим теорему Штурма, взяв а =— N и b — N, то мы получим, конечно, число всех корней нашего многочлена. Но оказывается, что теперь при вычислении числа перемен знаков в значениях многочленов рядов Штурма при х = « и при х = Ь нам нет надобности вычислять сами эти значения. В самом деле, нас ведь интересуют только знаки, а мы показали в § 1, чго знак того значения, которое принимает любой многочлен при х, меньшем —.V или большем /V, со- впадает со знаком его первого члена. Мы же гак выбрали N, чго оно больше всех ,V,, а значит,—/V меньше всех N(. Таким образом, знаки значений многочленов ряда Штурма при х = N и при х = — N определяются знаками их пер- вых членов. Отметим гот любопытный факт, чго, хотя мы 20
пользовались в рассуждениях существованием числа N, нам нет необходимости вычислять его в каждом конкретном слу- чае, так как первый член каждого многочлена ряда Штурма имеет вид ахк и его знак при х = — N или х — N вовсе не зависит от величины N. Пример. Найти число всех корней многочлена fL = — х* 4~ Зх — 1. Производный многочлен есть Зх*4_3=/2. Находим ряд Штурма. Делим с остатком на f2: х’4-3х—1 |3х24-3 х* + х 1/яХ 2х — 1 Остаток есть 2х—1, следовательно, /3 = — 2х-|-1. Делим f2 с остатком на /3: Зх‘2 4-3 | — 2х 4~ 1 3-к2 */ ях —3/2х——8/4 а/2х + 3 3/.,х — »/4 З’Л Остаток есть 3*/4, следовательно, /4 = — 3*/4. Ясно, что следующий многочлен уже равен нулю. Ряд Штурма состоит, таким образом, из многочленов х*4“3х—1, Зх24~3, — 2х 4- 1 и — 3*/4. Если мы теперь выберем число N (конечно, положитель- ное) так, как было указано, то анаки значений этих много- членов при х = — N и х —N будут со, падать со знаками их первых членов. Эти знаки даны в таблице х= — N x--N В первом столбце имеются две перемены знака, во вто- ром— одна. Многочлен х*4-3х—1 имеет, таким образом, 2—1 = 1 корень. 21
Теперь мы можем перейти к задаче о вычислении кор- ней многочлена. Мы поставим себе целью вычислить все корни с какой угодно степенью точности. Собственно, ничего лучшего мы не имеем и в случае квадратных уравнений, хотя и кажется, что там формула дает точное, а не прибли- женное значение корня. Действительно, если мы говорим, что корень многочлена х~— а равен а, то этим мы только указываем, что если применить правило приближенного вычи- сления квадратных корней, то получится приближенное зна- чение корня многочлена с любой степенью точности. Для приближенного вычисления корней многочленов нам надо прежде всего (в отличие от того, что имело место при определении числа корней) действительно вычислить по пра- вилу § 1 такое число N, что между —N и N лежат все корни нашего многочлена. После этого мы делим отрезок между —N и N на части, например пополам, и находим по теореме Штурма число корней в каждой из половин, то-есть между —N и 0 и между 0 и N. С каждым из этих отрез- ков, если оказалось, что в нем содержатся корни, поступаем так же. Так мы делаем до тех пор, пока не раздробим наш отр зок от —N до N на отрезки сколь угодно малой длины, причем нам известно, в каких из этих маленьких от- резков лежат корни, а в каких — пет. Но это и значит, что мы смогли вычислить корни с какой угодно степенью точ- ности, так как если мы, например, узнали, что корень лежит между числами аир, разность между которыми меньше 0,001, то а и является приближенным значением корпя с не- достатком с точностью до 0,001, а р— значением с избыт- ком. Для удобства вычислений часто делят отрезок не по- полам, а на 10 частей. Когда мы дойдем до таких маленьких интервалов, что в каждом из них лежит или один корень многочлена, или ни одного, то при следующих вычислениях нам нет надобности пользоваться теоремой Штурма и вычи- слять значения многочленов ряда Штурма. В самом деле, пусть мы знаем, что между аир лежит ровно один корень многочлена. Пусть мы разделили числом 7 отрезок между а и р на две части и хотим узнать, в какой из этих частей, между а и у или между у и р, лежит корень. Тогда доста- точно вычислить значения многочлена при х = а и при х = f. Если они разных знаков, то, как видно из черт. 9, при х = а и при х = у график многочлена лежит по разные стороны оси х, а следовательно, должен где-то между а 22
и f эту ось пересечь. Но это и значит, что корень лежит между а и у. Наоборот, если значения многочлена при х = а и при х = у одного знака, то корень не может лежать между « и f. Действительно, тогда график многочлена где-то между а и 7 переходил бы с одной стороны оси х на другую, а значит, где-то в другом месте, тоже между « и 7, должен был бы вернуться назад, раз при х = а и при х = у он лежит по одну сторону оси х (черт. 10). Но это означало бы, что многочлен имеет между а и 7 по крайней мере два корня, а этого не может быть, так как мы предположили, что между аир есть всего один корень. Значит, корень не может лежать между а и 7, а лежит между у и р. Пример. Вычислим с точностью до 0,1 корень много- члена x's-j-3x—1. В прошлом примере мы видели, что этот многочлен имеет один единственный корень, значит, мы можем применить то упрощение в общем методе, о котором только что говорили. Вычислим прежде всего N. Согласно правилу § 1 нам надо за N взять наибольшее из чисел 0, У<Гз и ]‘"3. Наибольшее из них, конечно, |/3 • 3 = 3 и, значит, jV=3. Таким образом, искомый корень лежит между —3 и 3. Узнаем теперь знак корня. Для этого найдем значения многочлена при х = 0 и при х = 3. Получим —1 и 36. Так как это числа разных знаков, то корень лежит между 0 и 3, а следовательно, положителен. Найдем теперь значения многочлена при х = 1 и х = 2. Получим 3 и 13. Таким образом, значения при х=1, 2 и 3 — все одного знака, а значения при х = 0 и при х — 1 — 23
рааных. Это значит, что корень лежит между 0 и 1, т. е. х — 0, ... Чтобы найти первый знак после запятой, над® узнать, в каком из десяти промежутков (между 0 и 1/10, между ’/ю и */ю> •••» ыежДУ ®/ю и О лежит корень. Для этого положим сначала х = *>/10 — J/.2. Пелучим в качестве значения многочлена в/8. Так как —1 и ь/в разных знаков, т© корень лежит между 0 и ]/2. Положим теперь */10- По- 27 9 27 1 лучим значение, равное —1 = — Этоотри- цательное число, и, значит, корень лежит между */10 и *710, так как значения многочлена при х = */1в и х = ь/1в— разных знаков. Нам остается положить х = 4/10. Получим 64 . 12 . 64 , 2 „ значение fooo Н~ Jo—= Г(Х>е+16' Так как эт0 поло>ки’ тельное число, то корень лежит между */10 и 4/10. Наша задача решена. Мы нашли, что с точностью до 0,1 значение корня многочлена х’-^Зх—1 есть 0,3.