/
Text
ПОПУЛЯРНЫЕ ЛЕКЦИИ ПО МАТЕМАТИКЕ
В Ы П У С К 35
н. я. виленкин
МЕТОД
ПОСЛЕДОВАТЕЛЬНЫХ
ПРИБЛИЖЕНИЙ
ИЗДАНИЕ ВТОРОЕ,
ПЕРЕРАБОТАННОЕ И ДОПОЛНЕННОЕ
ИЗДАТЕЛЬСТВО «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
М О в К В А 1 9 S 3
518
В 44
УДК 512Г37
АННОТАЦИЯ
В этой книге в популярной форме рассказы-
рассказывается о методах приближенного решения алгеб-
алгебраических, тригонометрических, показательных и
других уравнений. Книга рассчитана на учеников
старших классов, учащихся техникумов, учителей
математики и лиц, сталкивающихся в практиче-
практической деятельности с решением уравнений. По ходу
изложения в книге вводятся некоторые элементар-
элементарные понятия высшей математики. К книге прило-
приложено 27 упражнений и их решения.
Наум Яковлевич Виленкин
Метод последовательных приближений
(Серия «Популярные лекции по математике»)
М., 1968 г., 108 стр. с илл.
Редактор В. М. Гринберг
Техн. редактор Л. А. Пыжова Корректор С. Д. Кайар
Сдано в набор 27/Х 1967 г. Подписано к печати 26/1 1968 г. Бумага
84х108'/82. Физ. печ. л. 3,375. Условн. печ. л. 5,67. Уч.-изд. л. 4,63.
Тираж 100 000 экз. Т-00023. Цена книги 15 коп. Заказ J* 3569
Издательство «Наука»
Главная редакция физико-математической литературы
Москва, В-71, Ленинский проспект, 15.
2-2-2
148-68 Москва, Г-88, ШубвнскжВ пе»., К
СОДЕРЖАНИЕ
Предисловие ко второму изданию 5
Предисловие к первому изданию 5
§ 1. Введение 7
§ 2. Последовательные приближения 10
§ 3. Ахиллес и черепаха 13
§ 4. Деление на электронных вычислительных машинах ... 16
§ 5. Извлечение квадратных корней методом последовательных
приближений 18
§ 6. Извлечение корней с натуральным показателем по методу
последовательных приближений. 25
§ 7. Метод итераций 28
§ 8. Геометрический смысл метода итераций 31
§ 9. Сжимающие отображения 33
§ 10. Сжимающие отображения и метод итераций 37
§ П. Способ хорд 43
§ 12. Усовершенствованный способ хор;; 48
§ 13. Производная от многочлена 49
§ 14. Метод Ньютона приближенного решения алгебраических
уравнений 51
§ 15. Геометрический смысл производной 55
§ 16. Геометрический смысл метода Ньютона 57
§ 17. Производные любых функций 59
§ 18. Вычисление производных 61
§ 19. Нахождение первых приближений 64
§ 20. Комбинированный метод решения уравнений 66
§ 21. Признак сходимости процесса итераций 68
§ 22. Быстрота сходимости процесса итераций 72
§ 23. Решение систем линейных уравнений методом последова-
последовательных приближений 74
§ 24. Решение систем нелинейных уравнений методом последо-
последовательных приближений 80
§ 25. Видоизмененное расстояние 82
§ 26. Признаки сходимости процесса последовательных прибли-
приближений для систем линейных уравнений 85
§ 27. Последовательные приближения в геометрии 91
§ 28. Заключение 94
Упражнения 96
Решения 98
ПРЕДИСЛОВИЕ КО ВТОРОМУ ИЗДАНИЮ
Во втором издании книга подверглась переработке.
Метод итераций изложен теперь на основе понятия сжима-
сжимающего отображения, что позволило рассказать о нем до
введения понятия производной. Значительно расширена
часть книги, касающаяся приближенного решения систем
уравнений. Наконец, все задачи снабжены решениями.
ПРЕДИСЛОВИЕ К ПЕРВОМУ ИЗДАНИЮ
Основной целью этой книги является изложение различ-
различных методов приближенного решения уравнений. Их прак-
практическая ценность неоспорима, однако им уделяют мало
внимания как в средней, так и в высшей школе. Поэтому
часто бывает так, что человек, прослушавший курс выс-
высшей математики во втузе, испытывает затруднения при не-
необходимости решить простейшее трансцендентное урав-
уравнение. С решением уравнений сталкиваются не только
инженеры, но и техники, рабочие-рационализаторы и пред-
представители многих других специальностей. Знакомство с
методами приближенного решения уравнений полезно и
для школьников старших классов.
Поскольку большинство методов приближенного реше-
решения уравнений связано с понятием производной, нам
пришлось ввести это понятие. При этом в основу были по-
положены наглядные геометрические соображения. Таким
образом, для чтения этой книги достаточно знаний по ма-
математике в объеме девяти классов средней школы,
5
При составлении книги была использована лекция,
прочитанная автором для школьников 9—10-х классов,
занимавшихся в школьном математическом кружке при
Московском государственном университете им. М. В. Ло-
Ломоносова.
Материал этой лекции был применен учителем средней
школы г. Москвы № 425 С. И. Шварцбурдом для внеклас-
внеклассной работы с учениками 9-х классов. Автор выражает бла-
благодарность С. И. Шварцбурду за предоставление разрабо-
разработанных им заданий на решение уравнений методом ите-
итераций, использованных при написании этой книги.
Автор выражает глубокую благодарность В. Г. Бол-
Болтянскому, замечания которого существенно способствова-
способствовали улучшению первоначального варианта рукописи.
§ 1. ВВЕДЕНИЕ
При изучении математики в школе очень много времени
затрачивается на решение уравнений и систем уравнений.
Сначала это уравнения первой степени и системы таких
уравнений. Потом появляются квадратные, биквадратные
и иррациональные уравнения. Наконец, школьник зна-
знакомится с показательными, логарифмическими и триго-
тригонометрическими уравнениями.
Такое внимание к уравнениям не случайно. Оно объяс-
объясняется важностью уравнений для приложений математи-
математики к практике. Какую бы область приложений ни взять,
чаще всего для получения окончательного ответа прихо-
приходится решать уравнения или системы уравнений.
При обучении в школе к уравнениям часто прибегают
для решения физических задач. Рассмотрим, например,
такую задачу:
В колодец брошен камень. Найти глубину колодца,
ест звук от падения камня услышан через Т секунд после па-
падения.
Если обозначить глубину колодца через х, то для опре-
определения х получаем уравнение
* + ¦? = Т
g ^ v
где v — скорость распространения звука в воздухе
_
A/ -~ —
время падения камня и -^ — время, за которое до нас дой-
дойдет звук падения). Это иррациональное уравнение. Полагая
Vх — У, сведем его к квадратному уравнению
которое решается по известной формуле.
Уравнения применяют и для решения геометрических
задач. Например, задача о делении отрезка АВ длины /
в среднем и крайнем отношении (то есть на такие отрезки
АС и СВ, что АВ: АС = АС : СВ) приводит к решению
квадратного уравнения
х2 + 1х — /2 = О,
где через х обозначена длина отрезка АС.
К более сложному уравнению сводится задача о деле-
делении угла а на три части. Это уравнение имеет вид
4х3 — Зх — cos a = О,
где х = cos -g-. Такие уравнения, называемые кубически-
кубическими, в школе не изучают, но в курсе высшей алгебры дока-
доказывают, что и для кубических уравнений есть формула ре-
решения (см. ниже формулу C)).
Часто, однако, в физике возникают задачи, приводя-
приводящие к более сложным уравнениям, для которых не только
в средней школе, но и в университете не дают формул ре-
решения. Возьмем, например, железный стержень (или, как
говорят техники, балку) и наглухо заделаем его концы.
Если ударить по такому стержню, он будет совершать по-
поперечные колебания. Как доказывают в математической фи-
физике, чтобы найти частоту этих колебаний, надо решить
уравнение
рх I р- J?
cos*
где е = 2,71828...
В школе никаких правил для решения такого уравне-
уравнения не дают. Не следует думать, что это объясняется крат-
краткостью школьной программы по математике. Формулы для
решения уравнения A) в том смысле, как это понимают в
школе, вообще не существует. Уточним это утверж-
утверждение.
Говорят, что для некоторого уравнения существует
формула решения, если его корни можно выразить через
входящие в уравнение величины при помощи арифметиче-
арифметических операций, извлечения корней, показательной, лога-
логарифмической, тригонометрических и обратных тригономет-
тригонометрических функций. В этом смысле у квадратного уравнения
х% + рх + q = О есть формула решения, имеющая вид
Т-Ч- B)
Есть формула и для решения кубического уравнения*)
х3 + рх + q = 0.
Она имеет вид
Однако практическое применение формулы C) наталки-
наталкивается на ряд трудностей и требует использования комплек-
комплексных чисел.
Существует формула и для решения уравнений четвер-
четвертой степени, но настолько сложная, что мы ее не будем при-
приводить.
Для уравнений пятой и высших степеней дело обстоит
хуже. В 1826 г. норвежский математик Абель доказал**),
что при п > 5 не существует формулы, выражающей ре-
решение алгебраического уравнения
аоХп+ аххп-1 + ... + ап = 0
при помощи арифметических операций и извлечений кор-
корней. Лишь для некоторых частных случаев алгебраиче-
алгебраических уравнений, степень которых больше четырех, могут
существовать формулы решения***).
Если бы математики ограничивались изучением урав-
уравнений, допускающих точное решение, то есть решение по
*) К такому виду сводится любое кубическое уравнение
аох3 + е^ж2 + а2х + а3 ¦= 0
подстановкой х + -,— = у.
**) Относительно/"? жизни и творчества Абеля см. книгу О. Оре
«Замечательный математик Нильс Хеирик Абель». Работы Абеля
были продолжены французским математиком Э. Галуа, о котором напи-
написана книга Л. Инфельда «Любимец богов».
***) Об алгебраических ^уравнениях можно читать книги этой
серии:
Курош А. Г., «Алгебраические уравнения произвольных сте-
степеней», Гостехиздат, 1951;
Ш а ф а р е в и ч И. Р., «О решении уравнений высших степеней»,
Гостехиздат, 1954.
какой-то формуле, то разговоры инженеров с математика-
математиками имели бы примерно такой вид:
Инженер: При расчете сооружения я пришел к такому урав-
уравнению (показывает уравнение). Мне его надо срочно решить — через ме-
месяц я должен закончить проект сооружения.
Математик: Был бы рад помочь Вам, но для уравнений такого
типа нет формулы решения.
Инженер: Не сможете ли Вы вывести эту формулу?
Математик: И пытаться не буду. Давно уже доказано, что для
таких уравнений формулы решения не существует.
Надо думать, что в результате подобного разговора мне-
мнение инженера о математике и ее возможностях значитель-
значительно ухудшилось бы. К счастью, такого разговора не про-
происходит. Дело в том, что инженеру обычно и не нужна фор-
формула для решения того или иного уравнения. Ему надо
получить ответ с определенной степенью точности, а будет
ли ответ получен по формуле или иным путем, его не столь
уже интересует. Ведь и формула нужна ему обычно лишь
для того, чтобы с ее помощью вычислить ответ с необходи-
необходимой степенью точности.
Представьте себе, например, что формула найдена, но
по ней получился ответ в виде х = 3 + У^З. Ясно, что этот
ответ нельзя непосредственно использовать (вряд ли мож-
можно заказать слесарю деталь длиной 3 + У* 13 см). Для прак-
практических целей надо выразить |/~ПЗ в десятичной системе
счисления, беря такое число десятичных знаков, какое тре-
требуется для данной практической задачи.
Таким образом, инженер будет вполне удовлетворен,
если математик укажет ему тот или иной способ вычисле-
вычисления корня уравнения с необходимой степенью точности.
В математике разработан целый ряд способов приближенно-
приближенного решения уравнений. Описанию некоторых из них и пос-
посвящена эта книга.
§ 2. ПОСЛЕДОВАТЕЛЬНЫЕ ПРИБЛИЖЕНИЯ
Большая часть способов приближенного решения ура-
уравнений основана на идее последовательных приближений.
Эта идея применяется не только при решении уравнений,
но и для решения ряда практических задач.
Пользуются методом последовательных приближений
артиллеристы. Если они хотят поразить какую-нибудь
ю
цель, то устанавливают соответствующим образом угломер
I! припал орудия и производят выстрел. В случае про-
промаха на основании наблюдения точки разрыва снаряда
вносятся поправки в установку угломера и прицела и
производится следующий выстрел. После нескольких при-
приближений угломер и прицел устанавливаются так, что
цель оказывается пораженной.
Иногда последовательные приближения нужны и для
определения точки прицела. Пусть, например, ведется
стрельба из зенитного орудия, находящегося в точке О, по
летящему самолету (рис. 1). Если направить орудие на точ-
точку Л о, где самолет находится в данный момент, то получит-
получится промах: за время движе-
движения снаряда самолет передви- , А а а *~
нется в другую точку Av Зная ^ Ло-
скорости снаряда и самолета, 3
эту точку сравнительно легко
найти. Однако, если напра-
направить снаряд в точку Л1; все
еще может получиться про-
промах. Ведь в результате изме-
изменения наклона ствола орудия g
меняется закон движения сна-
снаряда, поэтому время, которое Рис. 1.
снаряд затратит для преодоле-
преодоления пути ОАо, отличается от
времени, которое он тратит на преодоление пути ОАи и
в результате попадания снаряда в самолет не произойдет.
Но теперь промах будет меньше, чем при прицеливании
в точку Ло. Чтобы сделать его еще меньше, надо найти
время, затрачиваемое снарядом для движения по пути АОХ,
и найти, в какой точке окажется через это время самолет.
Эта точка Л2 и будет следующим приближением для иско-
искомой точки прицеливания. После этого надо найти время,
за которое снаряд окажется в точке Л2, и вычислить, в
какую точку Л3 попадет за это время самолет. После не-
нескольких приближений мы найдем с нужной степенью точ-
точности точку прицела.
Пользуются методом последовательных приближений
и для решения многих других задач.
Пусть, например, надо перевозить песок из нескольких
песчаных карьеров Л!,...,Л,; на несколько строек Blt...,Bm.
Пусть производительность карьера Л/ равна а,- тонн в
и
день, а потребность стройки Bk в песке равна bk тонн в день.
Наконец, пусть стоимость перевозки одной тонны песка
с карьера А,- на стройку Bk равна с# (эта величина зависит
от расстояния между А,- и Bk, состояния дорог и т. д.).
Для составления плана перевозок составим табл. 1.
Через Xik в этой таблице обозначено количество песка,
которое перевозится с карьера А; на стройку Bk-
Таблица 1
Аг
А,
К
хи
х-п
ХПХ
Bi
Хп
х,.
...
вт
у
*"\т
Х2т
Хпт
Ясно, что числа xik должны удовлетворять следующим
соотношениям:
(с карьера А, нельзя вывезти больше, чем а,- тонн песка
в день),
Xik + X2k + ••• + Xnk = bk
(на стройку Bk надо завезти bk тонн песка в день).
При плане, даваемом табл. 1, стоимость перевозок пес-
песка равна
С — СцХц -j- ^2^12"!" • • • ~Т С\пХ\п \
' ^21-^21 ~Г ^22X24 ~Г • • • ~Г С^пХ^п \ D)
~Г С1П]Хт\ г СпцХтъ ~Т •••{ СтпХтп.
План надо составить так, чтобы значение С было наимень-
наименьшим. Для этого сначала задаются каким-то ориентировоч-
ориентировочным планом. Например, поступают следующим образом:
К карьеру А1 прикрепляют стройку, расположенную
ближе всего к нему. Если этот карьер производит больше
песка, чем нужно данной стройке, прикрепляют к нему еще
12
одну стройку, которая наименее удалена от него среди всех
оставшихся строек. После нескольких шагов производи-
производительность карьера Аг окажется исчерпанной. После этого
прикрепляют к карьеру Л2 ту из оставшихся строек, которая
ближе всего расположена к нему, и т. д. В конце концов
каждая стройка окажется прикрепленной к некоторому
карьеру.
Однако составленный таким образом план не является
наилучшим, так как под конец останется совсем немного
строек и они могут быть очень удалены от оставшихся ка-
карьеров. Поэтому придется изменить составленный план.
Некоторые из строек, прикрепленных к карьерам с малы-
малыми номерами, придется от них открепить и прикрепить к
карьерам с большими номерами.
Методы изменения плана, приводящие к уменьшению
стоимости перевозок, рассматриваются в разделе матема-
математики, называемом линейным программированием *).
После нескольких приближений, выполненных по этим
методам, получится план, при котором сумма D) является
наименьшей или мало отличается от наименьшей.
Вообще, при составлении любого плана, расписания и
т. д. сначала берут некоторое грубое приближение, кото-
которое потом последовательно улучшают, получая в конце
концов требуемый результат.
Обработку детали в цехах завода также можно рассмат-
рассматривать как последовательное приближение к нужной фор-
форме. Сначала берут грубое приближение — отливку или
какую-нибудь другую заготовку. Эту заготовку обраба-
обрабатывают на станке, придавая ей форму, близкую к изготав-
изготавливаемой детали. После этого ее передают на станок, рабо-
работающий с большей точностью. После нескольких этапов об-
обработки, то есть нескольких приближений, и возникает
требуемая деталь.
§ 3. АХИЛЛЕС И ЧЕРЕПАХА
Впервые последовательные приближения встречаются
у греческого философа Зенона Элейского, жившего за 500
лет до нашей эры. Этот философ пытался доказать, что в
*) О линейном программировании см. А. С. Солодовни-
Солодовников, Введение в линейную алгебру и линейное программирование,
«Просвещение», М., 1966.
13
природе не существует движения (помните, у Пушкина есть
стихотворение «Движенья нет, сказал мудрец брадатый...»).
Доказывал отсутствие движения Зенон таким образом:
если самый быстроногий из греков — Ахиллес — попро-
попробует догнать черепаху, то он никогда этого не сможет сде-
сделать. В самом деле, пусть расстояние между Ахиллесом и
черепахой 1000 шагов и пусть Ахиллес пробегает за 1 сек
10 шагов, а черепаха проползает 1 шаг. Через 100 сек Ахил-
Ахиллес пробежит 1000 шагов, отделявших его от черепахи.
Но за это время черепаха отползет на 100 шагов. Еще че-
через 10 сек Ахиллес пробежит эти 100 шагов, но черепаха
уползет еще на 10 шагов вперед. Чтобы преодолеть эти 10
шагов, Ахиллес затратит еще 1 сек, за которую черепаха
продвинется вперед на 1 шаг. Итак, черепаха все время бу-
будет впереди Ахиллеса, и он никогда не догонит черепаху.
Значит, движения не существует.
Разумеется, это рассуждение Зенона — остроумный па-
парадокс, но не более того. Движение есть неотъемлемое свой-
свойство материи. Ведь и у Пушкина стихотворение про Зено-
Зенона продолжается так:
«Другой смолчал и стал пред ним ходить.
Сильнее бы не мог он возразить.
Хвалили все ответ замысловатый...»
Любой школьник без труда сосчитает, когда Ахиллес
догонит черепаху. Для этого достаточно составить уравне-
уравнение
\0х — х= 1000, E)
где через х обозначено искомое время. Из этого уравнения
получается
1000 ,,, 1
х — —q— сек = 111 -q- сек.
Рассуждения Зенона можно, однако, рассматривать как
своеобразный метод приближенного решения уравнения E).
Именно, перенесем в уравнении E) х в правую часть
и разделим обе части уравнения на 10. Мы получим урав-
уравнение
х = 100 + ^ . F)
Если пренебречь в правой части слагаемым тт, (оно мало по
сравнению с х), то получим для х приближенное значение
14
хх = 100. Теперь мы можем уточнить ответ, подставив в
правую часть вместо х найденное приближение хг = 100.
Мы получим более точное значение для х, а именно, х2 =
= 100 + 10 = ПО. Подставляя это значение в правую часть
уравнения, найдем следующее приближение х3 = 100 +
ип
= 111. 1аким путем мы получаем приближения
ПО
10
г = 100, х2 = ПО, х3 = 111, Xi = 111,1,
х
то есть те же самые числа, которые получались в рассуж-
рассуждении Зенона. Эти числа связаны друг с другом соотноше-
соотношением
х„+1=100 + -~, G)
которое позволяет вычислить их одно за другим. С уве-
увеличением п они приближаются к точному решению х =
= 111 у уравнения E).
Описанный сейчас метод решения уравнения привел
к успеху из-за того, что слагаемое ^ было мало по сравне-
сравнению с х. Иначе мы получили бы числа, не приближающие-
приближающиеся к искомому решению. Предположим, например, что
Ахиллес состязался не с медленной черепахой, а с легко-
легконогой антилопой, пробегающей за 1 сек 20 шагов. Чтобы
найти, через сколько времени Ахиллес догонит антилопу,
надо решить уравнение
10% —20% = 1000. (8)
Его решением является х = —100. Это означает, что Ахил-
Ахиллес и антилопа были рядом 100 сек тому назад, а теперь ан-
антилопа обогнала Ахиллеса и расстояние между ними в даль-
дальнейшем будет только увеличиваться.
Попробуем решить уравнение (8) так же, как мы реша-
решали уравнение E). Для этого перенесем слагаемое 20л: в пра-
правую часть уравнения и разделим обе части уравнения на
10. Мы получим уравнение
х = ЮО + 2х. (9)
Положим в правой части х0 = 0. Мы найдем, что хг = 100.
Подставляя это значение в правую часть уравнения (9),
получим следующее приближение х2 = 300. Продолжая
15
этот процесс, получим числа
Хо = О, хх = 100, х2 = 300, х3 = 700,...
Мы видим, что эти числа не стремятся к точному решению
х = — 100 уравнения (8).
§ 4. ДЕЛЕНИЕ НА ЭЛЕКТРОННЫХ
ВЫЧИСЛИТЕЛЬНЫХ МАШИНАХ
Возможно, что читатель этой книги удивится — зачем
было решать уравнение E) методом последовательных
приближений, когда его можно было совсем просто решить
точно. Но, конечно, нас интересовало не уравнение E),
а сам метод последовательных приближений, который мы
потом приложим к более сложным уравнениям.
Впрочем, надо сказать, что решение методом последо-
последовательных приближений уравнений, похожих на уравнение
E), понадобилось совсем недавно в связи с появлением быст-
быстродействующих электронных вычислительных машин. Есть
некоторые модели таких машин, которые могут выполнять
лишь три арифметических действия — сложение, вычи-
вычитание и умножение. Кроме того, они могут делить на числа
вида 2". Как же эти машины делят на любые числа?
Разделить число Ь на число а — это значит решить урав-
уравнение ах = Ъ. Так как машина может умножать и делить
на 2", то можно считать, что 1/2 ^ а < 1 (в противном слу-
случае мы умножим или разделим обе части уравнения ах = Ь
на соответствующую степень числа 2). Перепишем уравне-
уравнение ах = Ь в виде
х = (\ — а) х + Ь. A0)
Примем за первое приближение для числа х значение хх =
= Ь. Обозначим ошибку этого приближения через а1(
то есть предположим, что хх + аг = Ыа. Тогда из уравне-
уравнения A0) получим
хх + ах = A — а) (хг + ах) -f Ъ =
= A-а)х1 + Ь+A-а)а1. A1)
Поскольку 1/2<^а<1, то
0< 1 — а< 1/2.
Так как коэффициент 1 — а сравнительно мал, отбросим
в правой части уравнения A1) слагаемое A — а) аи кото-
которое по крайней мере вдвое меньше, чем ах. Мы получим
x-L+a-L ш(\ — а) хг + Ь.
Число
х — п а\ х i j
мы и примем за следующее приближение для х.
Обозначим через а2 погрешность приближения х2, то
есть положим х2 -{- а2 = Ыа. Тогда из уравнения A0)
получим
+ /1 \ i 1 i /1 \
/¦у I I /71 у , /¦) , / /у\ Л/
Отбрасывая в правой части этого равенства слагаемое
A — а) а2, получим приближенное равенство
х2 -\- <х2 j^ A — а) х2 -\- о.
Таким образом, в качестве следующего приближения мож-
можно взять
х3 = A — а) х2 + Ъ.
Рассуждая точно так же, найдем, что следующее прибли-
приближение имеет вид
хц = A — а)х3 + Ь
и т. д. Числах!, х2,...,хп,..., вычисляемые последовательно
по формуле
Хп+1 = (I - а) хп + Ь, A2)
приближаются к числу Ыа. Но в этой формуле использу-
используются лишь действия сложения, вычитания и умножения,
а значит, машина может по ней считать.
Описанный метод деления основан, по существу, на фор-
формуле для суммы бесконечной убывающей геометрической
прогрессии. Именно, мы записываем дробь Ыа в виде
6 _ ъ
~а ~ 1 — A — а)'
Но по упомянутой формуле имеем
Ь
— а) " > I а)Л К а) "I
A3)
17
Обозначим через хп сумму первых п членов этой прогрессии:
Хп = ь + b A - а) + ... + Ь A - ау~\
Очевидно, что
хп+1 = Ь + ЬA—а) + ... + ЬA—а)" =
= Ь + A— а) [Ь + ЬA—а) + ... + Ъ A — а)"] =
= Ь + A — а) х„.
Эта формула совпадает с формулой A2). Таким образом,
заменяя дробь Ыа приближенным значением хп, мы за-
заменяем бесконечную сумму в формуле A3) суммой первых
п членов. При возрастании числа слагаемых п эта сумма
приближается к сумме всей прогрессии (убывание прогрес-
прогрессии A3) вытекает из того, что 1/2 <^ а < 1, и потому
О < 1 — а < 1/2).
§ 5. ИЗВЛЕЧЕНИЕ КВАДРАТНЫХ КОРНЕЙ
МЕТОДОМ ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ
Покажем теперь, как применяют метод последователь-
последовательных приближений для извлечения квадратных корней.
В школе изучают способ извлечения квадратных корней, поз-
позволяющий определять один за другим знаки искомого кор-
корня. Его тоже можно рассматривать как один из способов
последовательного приближения к ответу. Однако этот спо-
способ довольно сложен и зачастую школьники механически
применяют его, не вполне понимая сущность дела. Мы
опишем другой способ извлечения квадратных корней,
употреблявшийся уже в древнем Вавилоне задолго до на-
нашей эры. Его применял и александрийский математик Ге-
рон. Потом этот способ был заброшен, но сейчас к нему
прибегают иногда для извлечения квадратных корней на
электронных вычислительных машинах.
Пусть, например, надо извлечь квадратный корень из
числа 28. Выберем сначала какое-то приближенное значе-
значение этого корня, например, положим х1 — 5. Погрешность
этого приближенного значения обозначим через аи то есть
положим 1^28 = 5 -\- av Чтобы найти значение аь воз-
возведем обе части этого равенства в квадрат. Получим
28 = 25 +
18
то есть
а\ + 10а! — 3 = 0. A4)
Таким образом, для ах получилось квадратное уравнение.
Если попробовать точно решить это уравнение, то получим
значение а1 = -— 5 + У 28. Таким образом, точное опреде-
определение аг требует вычисления У28. Казалось бы, мы нахо-
находимся в заколдованном круге: чтобы найти 1^28, надо со-
сосчитать а1; а чтобы найти ах, надо вычислить 1^28.
На помощь приходит следующее соображение. Погреш-
Погрешность a-L приближенного значения хг = 5 невелика, она за-
заведомо меньше единицы. Еще меньше число а\. Поэтому
попробуем найти приближенное значение аъ отбросив
в равенстве A4) малое слагаемое а\. При этом для аг полу-
получается приближенное уравнение \0ах— 3^0. Из него
вытекает, что 0^^0,3.
Итак, приближенное значение поправки аг найдено.
Так как 1^28 = 5 + «i, то второе приближение х2 для
Y28 имеет вид
х2 = 5 + 0,3 = 5,3.
Чтобы найти еще более точное приближение для ^28,
повторим описанный процесс. Именно, обозначим через
а2 погрешность значения .ц = 5,3, то есть положим 1^28 =
= х2 + а2. Возведем обе части этого равенства в квадрат и
отбросим малое слагаемое а\. Мы получим, что 28хх\-{-
+ 2лг2а2> и потому
28 ~*2
Это означает, что третье приближение для ]/8 выражает-
выражается формулой
28 - х\ 28 -f х\
Так как х2 = 5,3, то отсюда получаем, что х3 = 5,2915...
Точно так же, исходя из приближенного значения х3 =
=5,2915, находим следующее приближение лг4> выражаемое
формулой
28 4-4
19
Вообще, если уже найдено приближенное значение хп для
]/8, то следующее приближение выражается формулой
хп f I = TZ • ('")
п
При этом каждый следующий шаг процесса приводит ко все
более точным приближениям для 1^28. Процесс приближе-
приближений останавливают, когда разность между хп+1 и хп станет
меньше, чем заданная точность вычисления. Например, если
надо вычислить ]/8 с точностью до 0,0001, то достаточно
взять четыре приближения и положить Y28 = 5,2915 (в са-
самом деле, xs = 5,2915... и л;4 = 5,2915...).
Совершенно так же извлекают квадратный корень из
любого положительного числа. Именно, при вычислении
Y а мы выбираем некоторое начальное приближение хг,
а потом определяем следующие приближения по формуле
A6)
Формулу A6) можно вывести и из несколько иных рас-
рассуждений, чем рассуждения, примененные при извлечении
1^28. Пусть мы уже нашли п-е приближение хп для ]/"а.
Так как Ya = у %п' 1Г~ > то Vя является средним геомет-
а
рическим чисел хп и ~. В качестве приближенного значения
для этого среднего геометрического возьмем среднее арифме-
а
тическое чисел хп и ~^~ , то есть положим
"'п
X -~(Х I <*\_*п + а
^ \ л„ / ьхп
Это и есть формула A6).
Таким образом, описанный выше способ приближенного
извлечения квадратных корней заключается в том, что мы
на каждом шагу приближений заменяем среднее геометри-
а
ческое чисел хпи~их средним арифметическим..
20
Выясним теперь, всегда ли процесс последовательных
приближений при извлечении квадратных корней ведет к
цели, то есть будет ли всегда обстоять дело так, как при по-
погоне Ахиллеса за черепахой, или иногда дело обстоит так,
как при его погоне за антилопой (в первом случае математики
говорят, что процесс приближений сходится, а во втором —
что он расходится). Мы докажем, что при извлечении квад-
квадратных корней никогда не бывает осложнений — процесс
приближений всегда сходится, всегда ведет к цели.
Для этого сравним погрешности ап = У а — хп и ап+1 —
= У а— хп+1 двух следующих друг за другом приближений.
По формуле A6) погрешность ап+1 можно записать в сле-
следующем виде:
_ г- 4 +а xl-2xnVa + a
<Хя+1 =уа — хп+1 = у а 7Г— = т .
Но
х\ — 2хп yi+a= {хп — У аJ = а?п,
и потому
Мы рассматриваем лишь положительные приближения хп
для У а. Поэтому из равенства A7) можно сделать вывод,
что все погрешности а2, ос3,..., ап, .... отрицательны. Иными
словами, все приближения х„, начиная со второго, являются
приближениями с избытком*); первое приближение хх
может быть как приближением с избытком, так и прибли-
приближением с недостатком.
С помощью формулы A7) легко доказать, что абсолют-
абсолютная величина погрешности приближенного значения хп умень-
уменьшается с каждым шагом по крайней мере вдвое. В самом деле,
равенство A7) можно записать так:
--П ^Лп \ С ?.Ап1
Поэтому
1 у I
\*п\. A8)
*) Это объясняется тем, что среднее арифметическое всегда больше,
чем среднее геометрическое.
21
Но так как хп > 0, то
С другой стороны, как было показано выше, при п > 2
имеем хл ^> У а и потому
Отсюда вытекает неравенство
2
A9)
Рассматривая соотношения A8) и A9), убеждаемся, что
Это и доказывает справедливость нашего утверждения:
с каждым шагом приближений абсолютная величина погреш-
погрешности уменьшается по крайней мере вдвое. Отсюда следует,
что после второго шага приближений абсолютная величина
погрешности уменьшится по крайней мере вчетверо, после
третьего — по крайней мере в восемь раз и т. д. Ясно, что
с возрастанием п абсолютная величина погрешности ап =
= У а— хп уменьшается и стремится к нулю. Но это и озна-
означает, что числа хп при возрастании п стремятся к У а.
Разберем теперь, как влияет на ход процесса при-
приближений выбор начального приближения хх. В первую
очередь отметим, что этот выбор никак не влияет на
окончательный результат. Ведь мы уже доказали, что,
как бы ни было выбрано начальное приближение xlt
погрешности а2, ...,а„, ... дальнейших приближений при
п -* оо стремятся к нулю. Таким образом, если задана
необходимая точность вычислений, то при любом начальном
приближении хг получится одно и то же значение для Ya
с указанной точностью. Даже при очень неудачном выборе
начального приближения мы в конце концов придем к пра-
правильному результату. После десяти шагов приближения
абсолютная величина погрешности уменьшится более чем в
тысячу раз B10 = 1024 л; 1000), а после сорока шагов —
22
по крайней мере в биллион A0й) раз. Так, если при вычис-
вычислении У2 положить хх = 106, то ахта 106, а потому |а40|<С
<^ 10~6. Иными словами, в начале процесса погрешность
была около миллиона, а в конце ее абсолютная величина
стала меньше одной миллионной.
Тем не менее выбор начального приближения влияет
на длительность процесса приближений. Если выбрать на-
начальное приближение неудачно, то придется долго ждать,
пока разность между хп+1 и хп станет меньше, чем заданная
точность вычислений. Хороший выбор начального прибли-
приближения значительно ускоряет дело. Поэтому часто поступа-
поступают так: начальное приближение хх берут из таблиц квадрат-
квадратных корней, а формулой
B0)
пользуются лишь для уточнения полученного значения.
Такой путь особенно удобен потому, что скорость убы-
убывания погрешности значительно возрастает, когда хп
приближается к У а. Ведь при выводе неравенства
мы заменили в формуле A8) множитель
VJL
/— 1 уа
Но если хп близко к у а, то дробь -у — -^— очень
числом -гг.
мала,
а потому <Xn+i [ =
l
уъ
\ап\ значительно меньше, чем
Уточним сделанное утверждение. Для этого рассмотрим
наряду с абсолютной погрешностью \ап\ = | У а — хп
относительную погрешность р„ приближенного значения хп,
то есть отношение абсолютной погрешности |а„| к точно-
точному значению корня У а. Эта погрешность выражается фор-
формулой
У а
Уа
23
Из равенства A7) получается такая формула для величины
У а 2хп У~а '
Так как хп ^> У а, то отсюда вытекает, что
Итак, для относительных погрешностей $п приближен-
приближенных значений выполняется неравенство
?п+1<~-. B1)
Например, если относительная погрешность приближения
хп равна 0,01, то для приближения л;„+1 она не превосхо-
превосходит 0,00005, а для хп+2 она не превосходит 0,00000000013.
Мы видим, что точность приближений возрастает все бы-
быстрее и быстрее. Можно показать, что, когда мы уже доста-
достаточно приблизились к У а, каждое следующее приближе-
приближение примерно удваивает число верных знаков.
Пример. Вычислить У38 с точностью до 0,00001.
По таблицам И. Н. Бронштейна и К. А. Семендяева*)
находим 1^238 = 15,43. Примем число 15,43 за хх и най-
найдем х2 по формуле
_ 15,432 + 238
Оценим точность полученного ответа. Так как погрешность
значения 15,43 не превосходит 0,01, то ах = 0,01 и потому
3 ~ °'01
Но тогда
%<Q-^- = 0,0000005.
Это означает, что абсолютная погрешность приближения х.г
не превосходит значения 15,43-0,0000005 < 0,00001. Ины-
*) И. Н. Б р о ы ш т е й н и К. А. С е м е н д я е в, «Справочник
по математике», «Наука», 1965,
24
ми словами, в значении У~238 = 15,42725... верны все семь
знаков.
Если бы мы хотели получить четырнадцать верных зна-
знаков, то уже третье приближение дало бы нужный ответ.
Однако такая точность почти никогда не бывает нужна.
Остановимся в заключение на следующей особенности
метода последовательных приближений. При применении
обычного метода извлечения квадратных корней любая
ошибка, допущенная в каком-то месте, полностью обесце-
обесценивает дальнейшие вычисления. Иначе обстоит дело при
применении метода последовательных приближений. Пусть,
например, в результате сделанной ошибки мы вместо пра-
правильного значения п-го приближения хп получили непра-
неправильное значение уп. Тогда все дальнейшие расчеты можно
рассматривать как вычисление Ya пРи начальном прибли-
приближении уп. Но мы видели выше, что при любом выборе на-
начального приближения метод последовательных приближе-
приближений приводит в конце концов к значению Ya c нужной
степенью точности. Таким образом, сделанная ошибка в даль-
дальнейшем будет стремиться к нулю. Единственное влияние,
которое она окажет, состоит в том, что придется взять не-
несколько лишних приближений.
Благодаря отмеченной особенности процесса приближе-
приближений в начале расчета можно вычислять приближения с
меньшей точностью и лишь для последних приближений
брать заданную точность. Это сокращает время, затрачива-
затрачиваемое на расчет.
§ 6. ИЗВЛЕЧЕНИЕ КОРНЕЙ С НАТУРАЛЬНЫМ
ПОКАЗАТЕЛЕМ ПО МЕТОДУ ПОСЛЕДОВАТЕЛЬНЫХ
ПРИБЛИЖЕНИЙ
Описанный выше метод извлечения квадратных корней
можно применять и для извлечения корней с любым нату-
натуральным показателем. Для этого нам понадобится следую-
следующая формула*):
(* + <х)*=*к + ***~1«+...> B2)
*) Эта формула вытекает из бинома Ньютона, но мы не предполага-
предполагаем знакомства читателя с формулой бинома.
25
где точками обозначены члены, содержащие а2, а3
и т. д.
Докажем эту формулу. Из школьного курса известно,
что
(х + аJ = х2 + 2ш + а2,
(х + аK = х3 + Зх2а + Зха2 + а3.
Эти равенства можно переписать следующим образом:
(х + аJ = х2 + 2хсс + B3)
(х + аK = х3 + ЗЛс + . . . B4)
Таким образом, формула B2) доказана при k = 2 и & = 3.
Умножим теперь обе части формулы B4) на х + а. Мы
получим, что
(х + ееL = (х3 + Зх2сс + ...) (х + а).
Если раскрыть в этом выражении скобки, то получится одно
слагаемое х4, не содержащее а, и два слагаемых Зх3а и
х3а, содержащих а в первой степени; что же касается ос-
остальных слагаемых, то они содержат а во второй и высших
степенях. Поэтому можно написать, что
(х + аL = х4 + Зх3а + х3а + . . . = х4 + 4xsoc + . . . B5)
(как и выше, точками обозначены члены, содержащие а2,
а3 и т. д.)
Итак, формула B2) доказана и при k = 4. Точно так же
из формулы B5) выводится, что
(х + аM = хь + 5х4а+ ... B6)
Очевидно, что таким путем можно доказать формулу B2)
для любого целого положительного показателя k.
Вернемся теперь к извлечению корня любой натураль-
натуральной степени k. Предположим, что уже найдено какое-то
приближение хг для искомого корня У~а. Обозначим через
«x погрешность этого приближения, то есть предположим,
ь .
что хх + ах = у а. Тогда (хг + «J* = а. Но по формуле
B2) это равенство можно записать в следующем виде:
х\ + kxl'1^ + ... = а,
где точками обозначены члены, содержащие о^, а* и т. д.
26
Если выбранное приближение хх было достаточно
к/~ ,
близко к у а, то погрешность ах этого приближения мала,
и потому можно пренебречь членами, содержащими высшие
степени погрешности. Мы получаем, таким образом, приб-
приближенное равенство
х\ -}- kx\-1 ax ш а.
Из этого равенства вытекает, что
а — xf
и потому в качестве следующего приближения для }/~а
можно принять число
t a-x\ __ а + (к-1)%
Хч, — Х\Л : v~i , i,_i •
Точно так же, исходя из приближения хъ находим сле-
следующее приближение:
Хз —
Вообще, если найдено приближение хп для -\Га, то следую-
следующее приближение определяется формулой
йфD- S)x\
хм = ~^&-~- B7)
Как и при извлечении квадратных корней, можно пока-
показать, что указанный процесс сходится при любом выборе
начального приближения хх (лишь бы это приближение бы-
было положительным числом). Иными словами, числа xlt x2)...
• •¦, хп, ... при любом выборе хх приближаются к у/"а.
Процесс приближений ведется до тех пор, пока числа хп и
Xn-ii не совпадут в пределах заданной точности.
о _
Пример. Найти значение /970 с точностью до 0,001.
При k = 3 формула приближений B7) принимает вид
а4>2х*
Xn+1 = ~TxY~' B8)
27
В нашем случае а = 970. Положим х± = 10. Из формулы
B8) следует, что
„ 970^ 2.103 _ 2970 _
*2 - ~TW~ ~~ зоо ~
г = 970 Ф 2.9,9* _ ^910,60 _
3 3-9,93 ~~ 294,03 »>
Мы видим, что в пределах заданной точности значения
и х3 совпадают. Поэтому с точностью до 0,001 имеем
^970 = 9,899.
§ 7. МЕТОД ИТЕРАЦИЙ
Все разобранные выше примеры являются частными
случаями применения одного общего способа решения урав-
уравнений. Этот способ называют методом итераций или ме-
методом последовательных приближений. Сущность этого
способа состоит в следующем.
Уравнение f(x) = 0, которое хотят решить, переписы-
переписывают в виде
х = Ф(х). B9)
После, этого выбирают начальное приближение хг и под-
подставляют в правую часть уравнения B9). Полученное зна-
значение х2 = <r(#i) принимают за второе приближение для
корня. Вообще, если найдено приближение х„, то следую-
следующее приближение хп+1 определяют по формуле
Хп+1 = ф(*п)-
Пусть после нескольких приближений мы получим, что с
заданной степенью точности выполняется равенство хп «
xiXn+i- Так как хп+1 = ц>(хп), то это значит, что с заданной
точностью выполняется равенство хп ~ Ц>(хп), то есть что
хп — приближенное значение корня уравнения х — ф(лг).
Например, решая задачу об Ахиллесе и черепахе, мы
записали уравнение
10 х — х - 1000
в виде
100 + Т5-
28
и искали приближения по формуле
В задаче о делении на электронной вычислительной машине
мы записали уравнение
ах = Ь
в виде
х = A — а) х + Ь
и искали приближения по формуле
Xn+i = A — а)хп + Ь.
Наконец, при извлечении корня k-я степени мы преоб-
преобразовали уравнение
xk — a
к виду
после чего искали приближения по формуле
n~t~L L ft—1 °
Приведем пример более сложного уравнения, решаемого
методом итераций.
Пример. Решить уравнение
Юл: — 1 — cos x = 0 C0)
с точностью до 0,001.
Перепишем уравнение C0) в следующем виде:
Выберем некоторое начальное приближение, например
Xj — 0, и подставим его в правую часть равенства C1). По-
Полученное значение
1 4- cos 0 „ 9
29
примем за второе приближение искомого корня. Подстав-
Подставляя значение х2 в правую часть равенства C1), получим
третье приближение
\ -f cos 0,2 1^0,98 1QS
хя- jo ~ jo -0,198.
Далее, находим
_ 1 -f cos 0,198
Xi 10 ;
0,198.
Мы видим, что с точностью до 0,001 выполняется равен-
гр l-ё- COS Xi
ство х3 = х^ Так как х4 = —^— , то это означает, что
с точностью до 0,001 число х3 = 0,198 является корнем
1 ^ cos х
уравнения х = —^-jq— •
В связи с описанным способом итерации возникает ряд
вопросов:
1. Всегда ли последовательность хъ ...,хп, •¦•, получа-
получаемая по способу итераций, сходится к некоторому числу §?
2. Если имеет место равенство lim xn — \, то является
ли число \ решением уравнения х — ф(л:)?
3. Как быстро приближаются числа хъ..., хп, ... к кор-
корню | уравнения х = ф(л')?
Легче всего ответить на второй вопрос. Пусть числа
х1г ..., хп, ¦¦¦ приближаются к числу ?. Рассмотрим равен-
равенство хп+1 = ц>(хп), дающее выражение следующего прибли-
приближения через предыдущее. С увеличением п его левая часть
приближается к |, а правая часть — к ф(|) *). Поэтому в
пределе мы и получим ? = ф (I), то есть | является кор-
корнем уравнения х — ф(х).
На первый вопрос ответ отрицательный. В самом деле,
рассмотрим, например, уравнение
х = 10* — 2.
Если положить хг = 1, то мы получим
х2 = 8, х2 = 10е — 2, ...
С увеличением п числа хп увеличиваются и не стремятся ни
к какому пределу. В то же время, если переписать уравне-
*) Мы предполагаем, что ф (х) непрерывная функция.
30
ние в виде х = lg(* + 2), то процесс приближений будет
сходиться, и мы получим после трех приближений, что х =
= 2,38.
Таким образом, надо заменить первый вопрос таким:
Какой должна быть функция ф(х), чтобы последователь-
последовательность чисел хъ х2,..., хп,... сходилась?
Выяснению этого вопроса предпошлем геометрическое
истолкование способа итераций.
§ 8. ГЕОМЕТРИЧЕСКИЙ СМЫСЛ
МЕТОДА ИТЕРАЦИЙ
Очевидно, что разыскание корня \ уравнения х = у(х)
есть не что иное, как нахождение абсциссы точки М пере-
пересечения кривой у = (f(x) с прямой у = х. Предположим, что
задано некоторое начальное значение хх (рис. 2). Тогда
X, X
Рис. 2.
точка My с координатами М-^Ху, (pfo) ) лежит на кривой
у = ф(д;). Проведем через эту точку горизонтальную пря-
прямую. Она пересечет прямую у = х в точке Л^1(ф(д;1),
V(xi))- Обозначим ф^) через х2. Тогда координаты точки
Nt будут иметь вид кх(хг, хг). Далее, проведем через точку
Nt вертикальную прямую. Она пересечет кривую у — ц>(х)
в точке Мъ с координатами М2{хъ ф(д;2) ). Повторяя
этот процесс, мы получаем точку Nt на прямой у = х с
координатами ЛГ2(х3, *з). ГДО х3 = <р(х2), а потом точку
Mt на кривой у = ф(д;) с координатами Л13(л-3, ф(л;3) ) и т. д.
Если процесс приближений сходится, то точки Мъ
М2,..., Мп,... приближаются к искомой точке пересечения.
31
Таким образом, геометрический смысл способа последо-
последовательных приближений заключается в том, что мы двига-
двигаемся к искомой точке пересечения кривой и прямой по лома-
ломаной линии, вершины которой попеременно лежат на кривой
и на прямой, а стороны попеременно имеют горизонтальное
и вертикальное направления (рис. 2, а).
Если кривая и прямая расположены так, как на рис. 2, а,
то эта ломаная напоминает лестницу. Если же кривая и пря-
прямая расположены так, как на рис. 2, б, то ломаная напоми-
напоминает спираль.
Описанный процесс приближений может и расходиться,
не приводить ни к какому результату (как и было, когда
У
JL
/
t,XtX2X3
а)
Рис. 3.
мы решали задачу про Ахиллеса и антилопу). Графически
это означает, что ступени лестницы (или звенья спирали)
становятся все больше и больше, а потому точки Мъ...
..., Мп, ... не приближаются к точке М, а удаляются от нее
(рис. 3).
Различие между рис. 2 и 3 состоит в следующем. Прове-
Проведем через точку М пересечения прямой у = х и кривой
у = <р(х) прямую под углом 135° к оси абсцисс. Эта прямая
вместе с прямой у = х делит плоскость на четыре части.
Если кривая в некоторой окрестности точки М располо-
расположена в левой и правой четвертях плоскости и начальное
приближение берется в этой окрестности, то процесс итера-
итераций сходится. Если же кривая расположена в верхней и
нижней четвертях плоскости, то процесс приближений рас-
расходится.
32
Однако чтобы применить это правило, надо сначала сде-
сделать набросок графика функции у = q>(x), а это не всегда
целесообразно. Поэтому надо установить другой признак
сходимости процесса итераций, позволяющий решать во-
вопрос о сходимости или расходимости аналитически, при по-
помощи вычислений, а не геометрических построений. Это
условие будет дано в § 10. Сначала нам нужно будет позна-
познакомиться с понятием сжимающего отображения.
§ 9. СЖИМАЮЩИЕ ОТОБРАЖЕНИЯ
Возьмем функцию у -- ср(лг), заданную на отрезке [а, Ь].
Каждой точке х0 этого отрезка соответствует точка у0 на
оси ординат, а именно, точка у0 — ф(х0). Чтобы построить
Рис. 4.
эту точку, надо провести через точку х0 оси абсцисс верти-
вертикальную прямую до пересечения с графиком функции у =
= Ф(х), а потом через точку пересечения провести горизон-
горизонтальную прямую до пересечения с осью ординат (рис. 4).
Таким образом, функция у = ц>(х) задает отображение от-
отрезка [а, Ь] в ось ординат. Множество всех точек оси орди-
ординат, соответствующих точкам отрезка [а, Ь], называют образом
этого отрезка. Например, образом отрезка [2, 5] при ото-
отображении у — х2 является отрезок [4, 25], а образом от-
отрезка [—1, 6] при том же отображении — отрезок [0,36]
(нарисуйте график функции у = х2). Можно доказать, что
если функция у = <р (х) непрерывна на отрезке [а, Ь], то
образом этого отрезка является отрезок оси ординат.
В случае, когда функция у = <р(х), кроме того, монотонно
возрастает, образом отрезка [а, Ь] является отрезок
Н. Я. Виленкин
33
1ф(а),<рF)], а в случае, когда она монотонно убывает,—
отрезок [фF), ф(а)] (рис. 5).
Вместо отображения отрезка [а, Ы в ось ординат можно
рассматривать его отображение в ось абсцисс. Для этого
после отображения в ось ординат повернем ось ординат на
90° по часовой стрелке. В результате точки отрезка la, b]
сначала отобразятся в какие-то точки оси ординат, а по-
потом — в точки оси абсцисб. Таким образом, функция ц>(х)
b х
задает отображение отрезка [а, Ь\ в ось абсцисс. Это отоб-
отображение мы будем записывать так: х -* (р(х). Если функция
ф(х) непрерывна, то в результате получим какой-то отре-
отрезок оси абсцисс.
Может случиться, что образ [alt fej отрезка [а, Ъ] яв-
является частью [а, Ь]. Например, при отображении у =
= Yx + 1 отрезок [0, 4] переходит в свою часть [1, 3]. Мы
будем говорить в таком случае, что отображение ф(д;) перево-
переводит отрезок [а, Ь] в свою часть. Если ф(х) переводит отре-
отрезок [а, Ь] в свою часть [а1( ЬЦ, то любая часть отрезка
[а, Ы переходит в часть отрезка [аъ 6J. В частности, сам
отрезок [аъ Ь±] переходит при отображении ф(д;) в свою
часть [аг, Ь2]. Точно так же отрезок [а2, Ь2] переходит при
этом отображении в свою часть [а3, Ь3] и т. д. В результате
мы получим систему отрезков
[а, Ь], [аъ Ьъ], ..., \ап, &„],...,
каждый из которых является частью предыдущего и та-
таких, что [an+l, bn+1] является образом [ап, Ьп] при отображе-
отображении <р(х).
34
Например, отображение х ~> 1 т-=- переводит отре-
зок [0, 4] в его часть [Va, 6/eL Применяя это отображение
к отрезку [У2, 6/в], получим отрезок [3/5, 11/i?] и т. д.
Каждый следующий отрезок является частью предыдущего.
Возможны два случая: либо существует отрезок [с, d],
принадлежащий всем отрезкам [ап, Ьп], либо эти отрезки
имеют лишь одну общую точку ?. В последнем случае гово-
говорят, что система отрезков [ап, Ьп] стягивается к точке ?.
Ниже мы сформулируем условие стягивания системы
отрезков [а, Ь], [аъ Ьг], ..., [ап, &„],... Для этого введем важ-
важное понятие сжимающего отображения. Отображение ц>(х),
переводящее отрезок [а, Ь] в свою часть [а1г Ьг], называет-
называется сжимающим, если оно уменьшает расстояние между
любыми двумя точками этого отрезка по крайней мере в М
раз, где М ^> 1. Так как расстояние между точками хг и
х% равно | хг — х1 \, то условие сжимания можно сформули-
сформулировать так:
Существует число q такое, что 0 < q <^ 1 и для любых
двух точек хъ хг отрезка [а, Ь] выполняется неравенство
kW-4>W|<?]x2--%| C2)
(здесь q — ММ).
Длина произвольной части [с, d] отрезка [а, Ь] при сжи-
сжимающем отображении ц>(х) уменьшается по крайней мере
в М = Mq раз. В самом деле, пусть [cj, dj] — образ от-
отрезка [с, а]. Тогда сх и d1 — образы некоторых точек хг и
х2 отрезка [с, d],
q = ф(хх), dx = ф(х2).
Но тогда
\di — c1\'-=\ фW — <P(*i) I < Ц IЧ — хх \.
Так как точки хх и х2 лежат на отрезке [с, d], то их расстоя-
расстояние \х.2 — Xi | меньше длины \d — с\ отрезка [с, d]. Значит,
Wi — Сл. | ^ Ц I d — с\.
Наше утверждение доказано.
Теперь мы можем сформулировать условие того, что си-
система отрезков [аъ Ьг\, ..., [ап, Ьп], получающихся из отрезка
[а, Ь] последовательным применением отображения ц>(х),
етягиваетзя.
2» 35
Если отображение ср(л:), переводящее отрезок [а, Ь\ в
свою часть [ах, Ь^\, сжимает этот отрезок, то система от-
отрезков [аъ 6J [ап, Ьп],... стягивается к некоторой точ-
точке ? отрезка [а, Ь].
В самом деле, так как отображение <р (х) стягивающее,
то для любого п
Точно так же
Но тогда
I К — ап
bn-i — ап_!
|Ьп — ап|
q | bn-г —
q |bn-2 — ап.г
Повторяя это рассуждение, получаем
\Ьп — ап\ < <г\ Ь — а|.
Поскольку О <С q <С 1. то последовательность чисел q,
q2,..., qn,... стремится к нулю, а потому длины \Ьп — ап\
отрезков [ап, Ьп] стремятся к нулю, когда п стремится к
бесконечности. Но тогда не может быть отрезка [с, d], при-
принадлежащего всем отрезкам [ап, bj. Следовательно, система
отрезков
[a, b], [alt by], ..., [ап, Ь„], ...
стягивается.
В заключение рассмотрим отображения <р(л:), для кото-
которых неравенство C2)
|ф(*«) — 4>(*i)| < <7|*« — xi\>
где 0 < q < 1, выполняется для любой пары чисел х\
и х2- Эти отображения являются сжимающими на всей чис-
числовой оси. Покажем, что в таком случае есть отрезок, кото-
который сжимается отображением ф(х). Поскольку для любых
двух точек хх и х2 условие C2) выполнено, достаточно пока-
показать, что есть отрезок, который переводится в себя отобра-
отображением ц>(х). Возьмем любое число а и положим b = ц>(а).
Выберем число qL < 1 такое, что q < qx.
Положим
р\Ь-а\
и покажем, что отрезок [а — R, а + R] переходит при ото-
отображении ц>(х) в свою часть. В самом деле, пусть х — точ-
36
ка этого отрезка. Тогда \х — а\ < R. В силу неравенства
C2) выводим, что
\ф) — Ь\ = | ф) — ф(а)| < <7|л: — а]< <?#.
Но тогда
| ф (л-) — а| = |ф (л;) — Ь + Ь — а\ <
< |<р(*) - Ь\+ \Ь - а\ < </# + |Ь - а| = qR + A -?1)Я =
= A+?-?1) i? < i?.
Это и показывает, что любая точка отрезка [а — R,a-\- R]
переходит при отображении ц>(х) в точку того же отрезка,
а потому отображение ц>(х) сжимает отрезок [а — R, a + R\-
§ 10. СЖИМАЮЩИЕ ОТОБРАЖЕНИЯ И МЕТОД
ИТЕРАЦИЙ
Вернемся теперь к методу итераций. Этот метод приме-
применяется для решения уравнений вида х = ф(х). Если ? —
корень этого уравнения, g = ф(?), то при отображении
х —> ц>(х) точка ? остается на месте. Таким образом, зада-
задача о решении уравнения х =ц>(х) равно-
равносильна задаче об отыскании непод-
неподвижных точек отображения ц>(х).
Если отображение ц>(х) является сжимающим на от-
отрезке [а, Ь], то на этом отрезке всегда есть неподвижная
точка. Чтобы убедиться в этом, возьмем последовательность
отрезков
[alt fej, [й2, Ь2], ..., [ап, Ьп)
получающихся из [а, Ь] последовательным применением
отображения ф(х). Так как q>(x) — сжимающее отобра-
отображение отрезка [а, Ь], то существует единственная точка |,
общая всем отрезкам [ап, Ьп]. Она и является неподвиж-
неподвижной точкой отображения ф(л;).
В самом деле, отображение у(х) переводит каждый от-
отрезок [ап, Ьп] в свою часть [ап+1, Ь„+1]. Поэтому образ ц>(х)
любой точки с отрезка [ап, Ьп\ лежит на его части [an+lt bn+1],
а тем более на самом отрезке \ап, Ь„\. Поскольку точка \
принадлежит всем отрезкам [ап, Ьп], то и ее образ ф(|)
должен принадлежать всем этим отрезкам. Но единствен-
единственной точкой, принадлежащей всем отрезкам [ап, Ьп], является
точка ?. Значит, ф (|) = I, то есть I — неподвижная точка
отображения ц>(х).
Итак, для отображений, сжимающих отрезок [а, Ь],
всегда существует неподвижная точка, лежащая на том же
37
отрезке. Эта точка единственная. В самом деле, если бы на-
нашлась другая неподвижная точка т\, т] = <р(т]), то должно
было бы выполняться неравенство
Поскольку 0 < q < 1, это неравенство может выполняться
лишь, если | т] — g | = 0, то есть если т) = ?.
Теперь мы можем сформулировать достаточное условие
сходимости процесса итераций.
Пусть функция ф(х) задает сжимающее отображение
отрезка [а, Ь]. Тогда для любой точки х0 этого отрезка по-
последовательность чисел х0, хъ х2,..., хп где хп+1 = <р(хп),
сходится к корню ? уравнениях = ц>(х), лежащему на этом
отрезке.
В самом деле, пусть [ап, Ьп\, п = 1,2,..., — последова-
последовательность отрезков, получающихся из [а, Ь] последователь-
последовательным применением отображения ф(х). Так как точка х0
лежит на отрезке [а, Ь], то ее образ хх = ф(х0) лежит на от-
отрезке [alt &J, образ хг = Ф^) точки х1 лежит на отрезке
[а2, Ьг] и т. д. Таким образом, для любого п точка хп лежит
на отрезке [ап, Ъп]. Так как длины отрезков [ап, Ъп] стремят-
стремятся к нулю при возрастании п, то последовательность точек
хх, ..., хп, ... стремится к общей точке \ этих отрезков.
Проведенное рассуждение показывает, что за началь-
начальную точку х0 можно брать любую точку отрезка [а, Ь].
Выясним, с какой скоростью стремятся точки х0, хъ...
..., хп, ... к точке %. Так как % = ф(^), то для любой точки с
отрезка [а, Ь] имеем
I Ф {с) - 11 = | Ф (с) - Ф (?) | < q | с - 11. C3)
Применим неравенство C3) к точкам х0,..., хп, ••• Так как
хп = q>{xn-i), то
Но тогда для любого п имеем
\xn—l \<q\xn-1 — l \<q2\xn-2— I |< ... <qn \x0— l\.
Таким образом, погрешность \хп — %\убывает с ростом п
по крайней мере со скоростью геометрической прогрессии,
имеющей знаменатель q.
Приведем примеры на применение доказанного условия.
38
Пример 1. Можно ли применять метод итераций для
решения уравнения
* = 4Т?? C4)
В данном случае
Для любых хх и хг имеем
1
ф Ы — Ф (x
1 xi + х21 . _ .
||4 ь^Г1 " Х|*
Но по неравенству между средними арифметическим и гео-
геометрическим
Поэтому
\Xl + *2 I «С |*11 + |ла | -^ - -- ?-
„2
8
Мы доказали, что для любых ху и х2 выполняется неравен-
неравенство
а потому
Это означает, что отображение ф (х) является сжимающим
на всей оси.
Мы уже знаем, что в этом случае есть отрезок, перехо-
переходящий в себя при этом отображении. Чтобы найти его, по-
положим а — 0. При отображении <р(л:) точка а = 0 перехо-
переходит в точку Ь = 1/4. Далее, в нашем случае q = 1/a. По-
1/ * 16 —а I 1 _
ложим qx — U и обозначим число —. =-^ через R.
Отрезок — у , -И переходит при отображении ф(д;) в себя.
39
Значит, на этом отрезке есть одна неподвижная точка, то
есть корень уравнения C4). Чтобы найти эту точку, возь-
Г 1 11
мем любую точку отрезка ¦— -^ , -»¦ , например точку х0 =0.
Применяя метод итераций, получаем
Х\ = -г
у
2~
4-f (|,'-5'2 " 4,0625
¦! - 4 -I- 0,24612 4,0605 "" U'
v — — * —. n
4 "" 4 -{¦ U,24632 " 4,0605 "" U'
С точностью до 0,0001 имеем xs — xt. Значит, с точностью
Г1 11
до 0,0001 корень уравнения C4), лежащий на отрезке -о-, -к- »
равен 0,2463. Поскольку отображение щх) сжимающее на
всей оси, уравнение C4) не имеет других корней.
Пример 2. Можно ли применить метод последова-
последовательных приближений для решения уравнения
на отрезке [— 1, 8]?
8,—
Здесь ф (х) = 1 + у х. Так как ф (—1) = 0, ф(8) = 3,
то отображение ц>(х) переводит отрезок [—1,8] в себя. Од-
Однако оно не является на этом отрезке сжимающим, так как,
например, при хх — — 0,008, х2 = 0,008
При доказательстве того, что отображение в примере 1 было сжи-
сжимающим, мы использовали неравенство У аЬ <—2~~ ' Сейчас мы
выведем некоторые неравенства, которые часто приходится исполь-
использовать для доказательства того, что данное отображение сжимающее.
Докажем, что при х > 0 имеет место неравенство
sin х < х < tg x. C5)
Для этого заметим, что на рис. 6 площадь S0AB сектора ОАВ с централь-
центральным углом х заключена между площадями треугольников ОАВ и ОАТ:
S&OAB < "^сект. ОАВ < "
40
Но
R^sinx
'долг
RHgx
2 ¦ -Д"Л1 2
(R — радиус круга). Площадь же сектора ОАВ равна —tj— (угол мы
измеряем в радианной мере). Поэтому
?2 sin х R4 R* tg x
Я2
Сокращая на -я-, приходим к неравенству C5). Из неравенства C5)
вытекает, что при 0 < х < 1 имеем
л- < arcsin х,
а при л- > 0 имеем
х > arctg х.
Отметим еще неравенства
ех > 1 + х, х > О,
1п A + *) <*, 0<*< 1,
доказательство которых несколько сложнее.
П р и м е р 3. Выяснить, можно ли решить методом ите-
итераций уравнение
Рис. 6.
X = 1 + -х-
C6)
Так как при всех значениях х имеем 1 + yarctgAr^O, то
уравнение может иметь лишь положительные корни. Мы
имеем
Поэтому
Ф (дс) = 1 + - arctg x.
у arctg Х
C7)
T arctg Xl) I =
:т | arctg*2—arctg
Но при х1 > 0, х2 > О
arctg л;2 — arctg x\ = arctg ^3 ^
и потому
| Ф (x,) — ф (.vx) | = Y arctg;
¦ Xl
1 +
1*2—
41
Значит, отображение C7) является сжимающим на полуоси
[О, оо). Это отображение переводит отрезок [0, ]Аз] в свою
часть [1, 1 + я/6]. Поэтому существует единственный ко-
корень уравнения C6), лежащий на отрезке [1, 1 + я/6].
Чтобы найти этот корень, положим х± = 1. Тогда
*а= 1 + 4" arctg 1 = 1 + |~1,39,
х3= 1 + у arctg 1,39 = 1,474,
*4=1 +4 arctg 1,474= 1,487,
= 1 +
-|-arctg 1,487 = 1,489,
хв = 1 + у arctg 1,489 = 1,490,
1
arctg 1,490 = 1,490.
Мы видим, что с точностью до 0,001 выполняется равен-
равенство х6 — Xt — 1,490. Значит, с этой точностью корень на-
нашего уравнения равен 1,490. Так как отображение ср (х)
является сжимающим на всей полуоси, 0^л;< оо, то урав-
уравнение C6) не имеет других корней.
Часто бывает, что уравнение х = ц>(х), которое нельзя
решить методом итераций, можно преобразовать к виду, до-
допускающему применение этого метода. Возьмем, например,
уравнение
х = Xs — 2. C8)
Так как здесь
фA)=
ФB) = 6>2,
то это уравнение имеет корень на отрезке [1, 2]. Но отобра-
отображение х3 — 2 не является сжимающим на этом отрезке,
так как не отображает его в свою часть. Перепишем уравне-
уравнение C8) в виде
х = -/~х -f 2.
о
Здесь rj? (х) =
42
На отрезке [1,2] имеем х1 > 1, х2 > 1. Значит, на этом от-
отрезке
|ф(д;я) — i|>(*i)l< -тт=-1*2—-*i|.
3 у 9
Мы доказали, что отображение г|>(л;) — сжимающее на от-
отрезке [1, 2]. Положим хг — 1 и применим метод итераций.
Мы получим
дса = ^3=1,442,
= /3,442= 1,510,
3%Ш=~- 1,520,
-1,521,
1,521.
Итак, с точностью до 0,001 корнем уравнения C8), лежа-
лежащим на отрезке [1, 21, является 1,521. Других корней это
уравнение не имеет.
Мы видим, что удачное преобразование исходного урав-
уравнения привело его к виду, допускающему применение мето-
метода итераций.
Описанный здесь признак сходимости метода итераций
не очень удобен для использования, так как требует доказа-
доказательства довольно сложных неравенств. Ниже (в § 21)
мы познакомимся с одним следствием этого признака, кото-
которое значительно облегчает доказательство сходимости про-
процесса итераций.
§11. СПОСОБ ХОРД
Метод итераций является одним из самых общих мето-
методов приближенного решения уравнений. Многие другие
способы приближенного решения уравнений — это част-
частные случаи метода итераций. Сейчас мы опишем один из
таких способов, называемый способом хорд.
Пусть нам надо решить уравнение f(x) = 0. Эта задача
равносильна задаче об отыскании точек, в которых график
функции у = f(x) пересекает ось абсцисс. Предположим,
что функция f{x) непрерывна и имеет в точках аи b значения
43
различных знаков. Тогда по крайней мере в одной точке
отрезка [а, Ь\ эта функция обращается в пуль. Иными сло-
словами, хотя бы в одной точке | отрезка [а, Ь\ график функции
У — f(x) пересекается с осью
абсцисс. Вообще говоря,
таких точек может быть не-
несколько (рис. 7). Однако
если функция у = fix) м о-
нотонна на отрезке
[а, Ь\ и имеет на его кон-
концах значения различных
Рис. 7. знаков, то график функции
пересекается на этом отрез-
отрезке с осью абсцисс лишь в одной точке |. Чтобы найти
приближенно эту точку, заменим на отрезке [а, Ь] дугу
кривой у = fix) соответству-
соответствующей хордой MN и найдем
точку пересечения Т этой хор-
хорды с осью Ох (рис. 8).
Для этого рассмотрим по-
подобные треугольники ММХТ
и NNXT. Из подобия этих
треугольников вытекает, что
ЛЩ = Л^У- Но из рис. 8
видно, что МХТ = ах — а,
TN1=b — a1, MM1 = —f(a)
и N\N = fib), где через ах
обозначена абсцисса точки пересечения хорды MN с осью
Ох. Поэтому
fli — a b — fli
Рис. 8.
Решая это уравнение, находим, что
п _ af(b)-bf(a)
Это равенство можно записать также в виде
ИЛИ
ах = а — / (а) -
f(b)-f (a)
C9)
D0)
44
(проверьте, приведя правые части формул C9) и D0) к одно-
одному знаменателю).
Число аг и является приближенным значением корня
уравнения f(x) = 0, лежащего между точками а и Ь.
Так как знаки чисел f (а) и f(b) различны, то либо
знак f(a), либо знак f{b) отличаются от знака /(%). Если
в точках а и ах функция/(л) имеет различные знаки, то
применяют формулу C9) к отрезку [а, аг] и получают
следующее приближение:
для искомого корня. Если же функция f(x) принимает зна-
значения разных знаков в точках а1 и Ь, то применяют форму-
формулу D0) к отрезку [а^, Ь] и полагают
w^tW- D2)
Найдя значение а2, применяют формулу C9) к отрезку
[а, а2] (или соответственно формулу D0) к отрезку [а2, Ь])
и находят следующее приближение аа. Вообще, если уже
найдено приближение ап, то ищут следующее приближение
по формуле
или по формуле
ам =aa-f (an) f(b)__f'n{aj • D4)
Мы получили две формулы D3) и D4). Посмотрим теперь,
в каком случае надо применять ту или иную формулу.
Пусть кривая обращена вогнутостью вверх. В этом случае
надо соединять точки кривой с тем концом М или N, в ко-
котором функция положительна. Если же кривая обращена
вогнутостью вниз, то надо соединять точки кривой с тем
концом, в котором функция отрицательна. Различные
возникающие при этом случаи изображены на рис. 9. Эти
рисунки делают геометрически очевидным следующее утвер-
утверждение:
Пусть на отрезке [а, Ь\ функция f(x) непрерывна, моно-
монотонна, имеет постоянное направление вогнутости и прини-
принимает на концах отрезка значения различных знаков. Тогда
при правильном выборе формулы приближений метод хорд
45
дает последовательность точек, сходящуюся к корню урав-
уравнения f(x) — 0.
Если же выбрать формулу неправильно, то способ хорд
может привести к тому, что точка а3 попадет за пределы от-
отрезка [a, ft]. Это изображено на рис. 10.
Рис. 9.
Рис. 10.
Описанный сейчас способ хорд является частным случа-
случаем метода итераций. Пусть функция f(x) не обращается в
нуль при х — а. Тогда уравнение f(x) — 0 равносильно
уравнению
= x-f(x)
D5)
46
В самом деле, если /(!) = 0, то
6 = *-'<*> 7TSE7W- D6)
Обратно, если \ =j=a и выполняется равенство D6), то/ (|)=0.
Но уравнение D5) имеет вид х = ц(х), где
w(y\ y ft у) х'~а
w(y\ y ft у)
<?{Х)-Х-Г{Х) f{x)_Ha) - f{X)-f(a) •
Положим х0 — Ь и применим метод итераций. Мы получим
ту же последовательность чисел аъ й2> •••> Ял> •••> которая
получается при способе хорд:
ft л пп~~а
'[[an)~f(an)-~f(a)
Для примера решим способом хорд уравнение
Xs + дх — I - 0. D7)
Здесь f(x) = х-3 + 'ix — 1. Так как /@) = — 1, /A) = 3,
то уравнение D7) имеет хотя бы один корень на отрезке
[0, 1]. Если нарисовать график функции у =л:3 + За;—1,
то мы увидим, что на отрезке [0, 1] он обращен вогнутостью
вверх. Поэтому применяем формулу C9). По формуле C9)
первым приближением для этого корня является число
Второе приближение находим по формуле
Далее,
х3 = 1 — 3- з + о>'о4о = °'319-
, о 1—0,319
г 1 Ч
Х4_ 1 — с$- з + 0,010 ~
х8 = 1 — 3- з + о'ооив= 0>322-
Таким образом, е- точностью до 0,001 корень уравнения,
лежащий на отрезке [0, 1], равен 0,322.
47
§ 12. УСОВЕРШЕНСТВОВАННЫЙ СПОСОБ ХОРД
Если способ хорд сходится, то скорость сходимости бу-
будет такой же, как и у способа итераций,— погрешность
значения корня убывает, как геометрическая прогрессия.
Существует усовершенствование способа хорд, дающее
гораздо более быструю сходимость. В обычном способе
хорд мы на каждом шагу используем один из концов отрез-
отрезка [а, ft] и последнее получившееся приближение. Вместо
Рис. 11.
этого можно использовать два последних приближения —
ведь они обычно ближе к искомому корню, чем концы от-
отрезка [а, ft].
Формула, при которой мы используем два последних
приближения, имеет следующий вид (рис. 11, а):
D8)
При этом at вычисляется по формуле C9), а а2 — по форму-
формуле D1) или D2), в зависимости от знаков/(a), /(ft), / (ах):
если /(я)< 0, / (ft) > 0, то при / (а{) < 0 выбирается формула
D2), а при /(а2) > О — формула D1).
Если случайно окажется, что точка as, вычисленная по
формуле D8), лежит за пределами отрезка la, ft], то на сле-
следующем шаге надо вместо этой точки взять ближайший
к ней конец этого отрезка (рис. 11, б).
Оказывается, что сходимость усовершенствованного
метода хорд гораздо быстрее, чем у обычного. Именно, если
с; — корень уравнения /(%) = 0, то
<С\а„—1\
D9)
48
где
t — * "^ ^ 5 -—- 1 filЯ
Для примера решим этим методом то же уравнение
г1 + Зх — 1 = О,
которое мы ранее решили методом хорд. Первые приближе-
приближения ах = 0,25 и а2 = 0,31 те же, что и в обычном методе
хорд.
Следующее приближение вычисляем по формуле
Сз = 02 — / (аг)
/ (а2) — f (ai)
= 0,31 + 0,040 1Го'о4О~°(J234 = °'3223-
Мы имеем / @,3223) = 0,0004. Ясно, что х = 0,3223
дает искомый корень с точностью до 0,0001.
§ 13. ПРОИЗВОДНАЯ ОТ МНОГОЧЛЕНА
При решении уравнения f(x) = 0 методом итераций мно-
многое зависит от того, каким способом мы привели уравнение
к виду х = ц>(х). Одним из лучших способов является во
многих случаях способ, предложенный Ньютоном. Этот
способ основан на понятии производной. В этом параграфе
мы расскажем о том, что такое производная многочлена.
Это позволит нам применить метод Ньютона к решению ал-
алгебраических уравнений, то есть уравнений вида
аохк + ахх^ + .. . + ak = 0. E0)
Пусть
f{x) - aQxk + a]**-1 + ... + ak
— некоторый многочлен. Рассмотрим многочлен fix + a),
то есть выражение
aoix + а)" + (ф. + а)*-1 + ... + ak. E1)
Если раскрыть в выражении E1) скобки, то в некоторых
слагаемых а будет отсутствовать, в других — входить в
первой степени, в третьих — во второй и т. д. Сгруппи-
Сгруппируем члены, содержащие одну и ту же степень а. Тогда
49
многочлен f(x + а) примет такой вид:
f{x + а) - /„(*) +Ша + Ш** +... + /* (*)«* E2)
(так как степень многочлена / (х) равна k, то наивысшая
степень а в разложении E2) тоже равна Щ. При этом оче-
очевидно, что /o(.v),.,., Ik (x) также являются многочленами от х.
Пример. Пусть
f{x) = 2х3 — 3xs -h 6л: — 1.
Тогда
f(x + а) = 2(х + а)8 —3(х + аJ + 6 (х + а) — 1 =
= 2 (л;8 + Зл;2а + Зл;а2 + а8) — 3(х2 + 2т + а2) +
+ 6(* + а)—1 = {2х3 — Зх2 + 6х — 1) + Fл;2 — 6х +6)а+
+ Fл; — 3) а2 + 2а8
Значит, в этом случае
/0(х) - 2х3 —Зх2 + бк— 1,
/i(x) == 6х2 — 6л; + 6,
/2(л;) — 6л; — 3,
/3(х) = 2.
Мы видим, что слагаемое /о(*) совпадает с f(x). Это не
случайно. Если положить в равенстве E2) а = 0, то полу-
получится, что /(л;) = fo(x).
Остановимся теперь на следующем слагаемом fi(x)a.
Коэффициент при а, то есть многочлен fi(x), называется
производной многочлена f(x). Например, производная много-
многочлена 2л;3 — Зл;2 + 6% — 1 равна 6л;2 — 6л; + 6. Производ-
Производную многочлена f(x) принято обозначать f'(x).
Итак, производной f'(x) многочлена f(x) называют коэф-
коэффициент при а в разложении многочлена f(x + а) по сте-
степеням а.
Пользуясь введенными обозначениями, можно перепи-
переписать формулу E2) в следующем виде:
/(* + а) = /(*) + f'(x)a + ... E3)
Точками в этой формуле обозначены члены, содержащие а2,
а8, ..., а*. Например,
2{х + аK — 3(х + af + 6(х + а) — 1 = 2ха — За-8 + 6х —
— 1 + Fх2 — 6а-+ 6)а + ...
50
Мы ввели понятие производной многочлена f(x).
Покажем, как вычислять эту производную. Для этого рас-
рассмотрим многочлен
f(x + а) = а0 (х + а)" + а, (х + а)*-1 + ...
... +ak..1(x + a) + ak.
т
Заменяя каждое слагаемое по формуле (х + а)т = х +
+ тхт~х а + ... (см. § 6), мы получим
/ (х + а) = а0 (xh -f kxk-Ъ +...) +
+ fli I*-1 + (k- 1)^~V + ...] + ...
.. . -f flft-i (^ -f «) + ah =
— aoxh -j- aixh~^ -\- . . . + ak +
+ a Ifezo*'1-1 + (A— 1)fljx'-M- . • • + Ofc-i] + . . .
Сравним это равенство с равенством E3):
/(х+а) =/(хL-а/'(*) + -
Получаем следующее утверждение:
Производная многочлена
f (х) = аол:* + a^-i H- .. . + flft-i* + flh E4)
имеет вид
Г (х) - ?а0.*"-г + (« — 1) ai-vft-2 + • ¦ • + оа-т. E5)
Например, производная многочлена
/(л:) - 6л:7 + 8х3 — Зх2 — 1
есть
24х2 — 6х.
§ 14. МЕТОД НЬЮТОНА ПРИБЛИЖЕННОГО РЕШЕНИЯ
АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ
Вернемся к приближенному решению алгебраических
уравнений. Пусть дано уравнение
аох» + а,**-1 + ... + а* = 0. E6)
Предположим, что тем или иным путем найдено приближен-
приближенное значение хг корня этого уравнении, и покажем, как
51
найти более точное значение этого корня. Обозначим через
ах погрешность значения хъ то есть предположим, что
хх -f ai является корнем уравнения E6). Тогда имеет
место равенство
ao(*i + «!>* + ах(хх + а^-1 + ... + ak = 0. E7)
Иными словами,
/(*1 + «!) = 0,
где через f(x) обозначен многочлен
aoxk + axxk~x + ... + ak.
Но по формуле C1) имеем
где точками обозначены члены, содержащие а?, ..., ccj.
Таким образом, для определения а% мы имеем уравнение
Цх, + а,) = /(лч) + a]/'fe) + ... = 0. E8)
Если начальное приближение хх было достаточно хоро-
хорошим, то погрешность с^ этого приближения мала. Тогда
в равенстве E8) члены, обозначенные точками, будут малы
по сравнению с ах. Отбрасывая эти члены, получим для
определения а, приближенное равенство
fix,) + aJ'{Xl) « 0. E9)
Мз этого равенства вытекает, что
«. —j^. F0)
Поэтому улучшенное значение хг корня нашего уравнения
дается формулой
После этого можно снова улучшить найденное прибли-
приближение. Третье приближение для корня дается формулой
52
Вообще, если найдено н-е приближение хп искомого корпя,
то следующее приближение дается формулой
Хплт. ---хп — ~^ . F2)
В развернутом виде эта формула записывается так:
Если в пределах заданной точности приближенные зна-
значения хп и х„+1 совпадут, то наш процесс (в пределах задан-
заданной точности) закончен и искомое значение корня найдено.
Описанный метод решения уравнений принадлежит зна-
знаменитому английскому математику Ньютону.
Метод Ньютона тесно связан с методом итераций. Имен-
Именно, если функции у = /(*) и</ = f'(x) не имеют общих кор-
корней, то уравнение f(x) = 0 равносильно уравнению
х = х-т- F4)
Применяя к этому уравнению метод итераций, мы получим
последовательность чисел хъ хг, ..., хп, связанных с тем же
соотношением
^ Х
Г \хп>
(DO)
что и в методе Ньютона. Иными словами, метод Ньютона
заключается в том, что уравнение f (x) ~ 0 записывают в
виде F4) и применяют к нему метод итераций.
Пример. Решить по методу Ньютона уравнение
х3 _ Зх — 5 = О
с точностью до 0,001, приняв за первое приближение хг =3.
Так как производной многочлена
fix) = xs — Зх — 5
является многочлен
fix) - Зх* - 3,
53
то формула F2) примет в данном случае вид
х$ _ gx g
Поэтому
v о 27 9 5 „ 13 с) лр.
*г - J 27-3 ~ '3 ~ 24 ~ ^'40'
= 2,46 — 0,165 = 2,295,
%4 = 2,295-12'°^J016'^83~-J = 2,295 - 0,016 - 2,279,
15,582-3 —
Мы видим, что с точностью до 0,001 выполняется равенство
х4 = хъ.
Поэтому корень уравнения Л — Зх — 5 = 0 с точностью
до 0,001 равен 2,279.
Изложенный в § 6 метод приближенного вычисления
корней является частным случаем метода Ньютона. В самом
деле, нахождение У а является не чем иным, как решением
уравнения
xk — а = 0,
Но производная многочлена xk — а равна kxk~x и потому
для уравнения
xk — а - 0
формула F2) примет вид
_
Хп+1 -
Это и есть формула, по которой вычисляются приближения
для У а.
Отметим следующую существенную разницу между ре-
решением уравнения xk — а = 0 и решением общего алгеб-
алгебраического уравнения
aoxk + агхк^ + ... + ak -= 0.
Для уравнения xk — а = 0 выбор начального приближе-
приближения хг был несуществен. Как бы ни выбрать значение хъ
54
v-
после некоторого числа шагов мы получим значение у а с
заданной точностью. Иначе обстоит дело при решении урав-
уравнения E6). Здесь одни начальные значения приводят к
одним корням уравнения, другие начальные значения — к
другим корням, а некоторые начальные значения не приво-
приводят ни к какому определенному значению корня — после-
последовательность чисел хъ х%, ..., хп, ¦ ••, вычисляемая по фор-
формуле F2), не стремится ни к какому определенному пределу,
то есть расходится.
§ 15. ГЕОМЕТРИЧЕСКИЙ СМЫСЛ ПРОИЗВОДНОЙ
Метод Ньютона изложен нами пока только для алгебраи-
алгебраических уравнений. Чтобы обобщить его на уравнения про-
произвольного вида, надо обобщить понятие производной,
Рис. 12.
введя его для любых функций. Для этого выясним геомет-
геометрический смысл понятия производной.
Рассмотрим график многочлена
у =
ак
и возьмем на этом графике две точки М и N (рис. 12).
Пусть в точке М абсцисса равна х, а в точке N абсцисса
равна х + к. Тогда ординаты в точках М и N даются соот-
соответственно выражениями
f(x) = aoxk
ак
55
и
/(х + а) = fl0(x + а)» + а1(х + a)*-1 +- ... + ak.
Проведем через точки М и N секущую и вычислим угловой
коэффициент ксек*) этой секущей. Из чертежа видно, что
, . TN
Но отрезок МТ равен разности абсцисс точек М и N, и по-
потому
МТ = (х + а) — х =--¦ а.
Отрезок же TN равен разности ординат этих точек, и по-
потому
TN = f(x + а) - f(x).
Значит,
te.h_™ _ {(х -4- а) - f (х)
lg " ~ МТ ~ a •
Но по формуле E3)
/ (х + а) = / (х) + af(x) + ....
где точками обозначены члены, содержащие а2, а3,...
Поэтому
где на этот раз точками обозначены слагаемые, содержа-
содержа2
щие а, а2,...
Итак, угловой коэффициент секущей MN выражается
формулой
*сек = tg4> = /'(*) + •- F6)
Будем теперь уменьшать значение а. Секущая МЛ^ бу-
будет при этом поворачиваться вокруг точки М. В пределе,
при a = 0, секущая превратится в касательную к кривой
У " /(А") в точке М. На рис. 13 изображены положения
, 1 1
секущей при a = 1; -у ' Т '
Но при a = 0 все члены, обозначенные в формуле F6)
точками, обращаются в нуль. Поэтому угловой коэффици-
*) Угловым коэффициентом прямой называют тангенс угла наклона
этой прямой к положительному направлению оси Ох. Например, если
прямая наклонена к оси Ох под углом 60°, то ее угловой коэффициент
равен У" 3.
56
ент касательной к графику многочлена у = f(x) в точке
с абсциссой х выражается формулой
"кас / VV'
F7)
Итак, производная многочлена f (x) равна угловому коэф-
коэффициенту касательной к графику этого многочлена, прове-
проведенной в точке с абсциссой х.
У
Рис. 13.
Пример. Найти, под каким углом наклонена к оси
Ох касательная к графику многочлена
f(x) = x3 —
Ъх
проведенная в точке с абсциссой х = 2.
Так как
/' (х) = Зх2 - 8х + 5,
то /'B) = 1 • Значит, tg ф == 1, и потому угол наклона ср
равен 45°.
§ 16. ГЕОМЕТРИЧЕСКИЙ СМЫСЛ МЕТОДА НЬЮТОНА
Мы можем теперь выяснить геометрический смысл ме-
метода Ньютона для приближенного решения алгебраических
уравнений. Пусть надо решить уравнение f(x) = 0, где
/ {х) — некоторый многочлен. Геометрически эта задача яв-
является задачей о нахождении точек пересечения графика
функции у = f(x) с осью Ох, то есть точек, в которых
У = 0.
57
Предположим, что уже найдено приближенное значение
хг корня этого уравнения. Проведем в точке /V с абсциссой
хг касательную к кривой у = f(x). При удачном выборе зна-
значения хх точка Г пересечения касательной с осью Оде будет
ближе к точке пересечения кривой у = f(x) с осью Ох, чем
точка М (рис. 14).
Чтобы найти абсциссу ха точки Т, рассмотрим треуголь-
треугольник TMN. Катет MN этого треугольника есть не что
иное, как значение функции у = / {х) в точке хг, то есть
MN = / (ху). Катет же ТМ
равен хх — Хо. Отсюда сле-
следует, что тангенс угла cpj
наклона касательной к оси
Or выражается формулой
Ф1
Р&- . F8)
м
_^_ Из равенства F8) следует,
х что
Рис. 14.
tg<?i
F9)
Но tg фх есть угловой коэффициент касательной к кривой
У ~ f (x)< проведенной в точке с абсциссой хх. Поэтому,
в силу геометрического смысла производной, tg ф, = f'(xi).
Значит, формулу F9) можно переписать так:
= хх ¦
f(Xi)
Тем самым второе приближение для искомого корня
найдено. Проведем теперь касательную к кривой у = / (х)
в точке с абсциссой х2. Абсцисса точки пересечения этой
касательной с осью Ох дается формулой
= Х2 ¦
Вообще, если уже найдено приближение хп, то, чтобы
получить следующее приближение хп+1, надо провести ка-
касательную к кривой у = / (х) в точке с абсциссой хп. Абс-
Абсцисса точки пересечения этой касательной с осью Ох даст
нам хп+1.
58
Формула для вычисления хп+х такова:
или, что то же самое,
tg ф„ *
G0)
G0')
где ф„ — угол наклона касательной к кривой у = / (х)
в точке с абсциссой хп. Эта формула совпадает с формулой
F2) способа Ньютона. Мы выяснили, таким образом,
геометрический смысл способа Нью она. Он заключается в
ч
Рис. 15.
том, что дуга кривой у = / (х) заменяется касательной к
этой кривой. Поэтому способ Ньютона называют также
способом касательных.
На рис. 15 изображено, как точки хъ х2, ..., хп, ..., по-
получаемые по способу Ньютона, приближаются к точке I
пересечения кривой у = / (х) с осью Ох.
§ 17. ПРОИЗВОДНЫЕ ЛЮБЫХ ФУНКЦИЙ
Данное нами геометрическое истолкование способа
Ньютона позволяет без труда обобщить его на любые урав-
уравнения вида / (х) — 0, где / (х) может уже не быть много-
многочленом. Именно, чтобы найти решение этого уравнения,
возьмем некоторое приближенное значение корня хх.
В точке с абсциссой хх проведем касательную к кривой
У — f ix)и обозначим через х% точку ее пересечения с осью Ох.
59
В точке с абсциссой х% вновь проведем касательную к кри-
кривой у = /(х) и т. д. Так же как и в случае, когда / (х) яв-
является многочленом, легко установить, что
Хп+1 = Хп — г—- , G1)
где ig ф„ —¦ угловой коэффициент касательной к кривой
У = f (х) в точке с абсциссой хп.
Формула G1) пока непригодна для вычислений, так
как мы еще не умеем вычислять tg ф„. Итак, нам надо на-
научиться вычислять угловые коэффициенты касательных
к графикам любых функций у = / (х) (а не только к графи-
графикам многочленов). Найдем сначала угловой коэффициент
секущей. Пусть М — точка на графике функции у = f (x)
и MN — секущая, проходящая через эту точку. Рассуждая
точно так же, как и для многочленов, мы получим, что уг-
угловой коэффициент секущей выражается формулой
kceK=t^ = f-^±^=im. G2)
где х — абсцисса точки М, ах + а — абсцисса точки N.
Если уменьшать а, то секущая будет поворачиваться во-
вокруг точки М и стремиться занять положение касательной
к кривой у = / (х) в этой точке (см. рис. 12). Поэтому мож-
можно написать, что
;be=tgT:=Hm'(* + tta)-'Bi. G3)
Назовем предел, стоящий в правой части этого равенства,
производной функции / (а:) и обозначим его через /' {х),
то есть положим
Г(х) = Ит^+а)-Пх). G4)
Равенство G3) теперь можно записать в виде
Aw=tg<p = /'(*). G5)
Таким образом, и для любых функций (а не только много-
многочленов) производная функция f(x) в некоторой точке рав-
равна угловому коэффициенту касательной к кривой у = / (х)
в этой точке *).
*) Если в точке с абсциссой х к графику функции у-- f (x) нельзя
провести касательную (например, если б этой точке график имеет из-
излом), то в этой точке у функции f (дс) отсутствует производная.
60
Так как tg <р„ = /' (xl), то формулу G1) можно перепи-
переписать в виде
f (хп)
('6)
Эта формула совпадает с формулой F2). Таким образом,
способ Ньютона перенесен на все уравнения вида / (х) — 0.
§ 18. ВЫЧИСЛЕНИЕ ПРОИЗВОДНЫХ
Мы видели в предыдущем пункте, что для нахождения
углового коэффициента касательной к кривой у = / (х) на-
надо сосчитать предел
Это вычисление, вообще говоря, довольно затрудни-
затруднительно. Но во многих важных случаях этот предел вычис-
вычислен. Иными словами, для наиболее часто встречающихся
функций известны их производные. Приведем список наи-
наиболее употребительных производных:
l2[{^fJkxk-K 7- ^^'"з-ет-
3. («*)' = * In a. 8.(loge*)'= '
4. (sin ax)' = a cos ax. "и
5. (cosav)'=—asinax. 9. (arcsinax)' =
(Через In a в формулах 3 и 8 обозначен логарифм по осно-
основанию е = 2,71828...— так называемый натуральный ло-
логарифм.) Отметим, что в формуле 2 показатель k может
быть не только натуральным числом, но и любым веще-
вещественным числом. Например,
2Vx'
х" i
61
Формул 1—10 еще недостаточно для вычисления про-
производных любых функций. Однако, если функция / (х)
составляется с помощью арифметических действий из функ-
функций, для которых мы умеем считать производные, то легко
найти ее производную. Для этого применяются следующие
правила, доказываемые (как и формулы 1—10) в курсах
высшей математики.
1. Производная суммы двух функций равна сумме их
производных, то есть
if г (х) + h (x)Y = f[ (x) + f2 (x).
2. Постоянный множитель можно вынести за знак
производной
[of (x)Y = af (х).
3. Производная произведения двух функций вычисляет-
вычисляется по формуле
f/i (х) /2( x)Y = h W /2 (х) + fi (х) f, (х).
4. Производная дроби вычисляется по формуле
НЩ_ h(x)h(x)-fi(x)f2(x)
Данное в § 13 правило вычисления производной от мно-
многочлена является следствием правил 1 и 2 и формулы 2
из списка.
Пример 1. Найти производную дроби
~ г& + 5 '
Пользуясь правилом 4, находим
,, C* -х+ 1)' Bл? + 5) - C* - х + 1) B*з + 5)'
; ^ ' B*84-5)а
Далее, по правилу дифференцирования многочлена
(Зг5 — х + 1)' = ох — 1
{2х* + 5)' = 6х\
G2
а потому
., . Bл? ф 5) F* — 1) — (Ах2— х4-1)'
30* — 5
5)а
Пример 2. Найти производную функции
Решение. По формулам 2 и 9 и правилам 1 и 2 имеем
_ If =?\ _
Пример 3. Найти производную функции
/ (х) = 10*sin2;t.
По правилу 3 и формулам 3 и 4 имеем
/' (х) - A0*)' sin 2х + 10* (sin 2.?)' =
= 10* sin 2л: In 10+10*«2cos 2x=
=¦= 10* (sin 2a-In 10 + 2 cos2x).
Указанные правила позволяют находить производ-
производные во многих случаях. Есть еще одно очень важное пра-
правило — правило о вычислении производной сложной функ-
функции. Оно формулируется так:
Если функцию у = f (х) можно записать в виде у —
= F (г), где г = ц> (х), то ее производная дается формулой
f'(x) = F'{z)<t'(x), G7)
где г = <р(л:).
Пример. Найти производную функции у = sin (л:3).
Эту функцию можно записать в виде у = sin г, где г = хъ.
Производная функции F (z) = sin г равна F' (г) = cos z,
а производная функции ф (л:) = Xs равна ф' (х) = Зл:2.
Применяя формулу G7), получаем
[sin (a-3)]' = F' (г) ф' (а) = cos г. За2.
Подставляя вместо z значение г = Xs, получаем
[sin (а3I' = За2 cos (а3).
63
Более подробное изложение понятия производной чи-
читатель может найти, например, в книге: Я- Б. Зельдо-
в и ч, «Высшая математика для начинающих», Физматгиз,
1960.
§ 19. НАХОЖДЕНИЕ ПЕРВЫХ ПРИБЛИЖЕНИЙ
Остановимся теперь на выборе начальных приближе-
приближений. Разыскание первого приближения при решении урав-
уравнения /( х) — 0 можно сделать графически. Для этого на-
надо начертить график функции у — / (х) и найти точки пе-
пересечения этого графика с осью Ох (в этих точках у — 0,
и потому / (.г) — 0).
Если по каким-либо соображениям чертить график функ-
функции неудобно (скажем, если уравнение решается на элек-
электронной вычислительной машине), прибегают к другому
а) 6) в)
Рис. 16.
способу определения первого приближения. Для этого вы-
вычисляют значение функции для некоторых значений аргу-
аргумента (например, для целых значений аргумента, лежащих
в известных пределах). Если функция у = f (x) непрерыв-
непрерывна (то есть ее график не имеет разрывов), то между значе-
значениями а и Ь, в которых функция имеет различные знаки
(рис. 16, а), лежит корень уравнения / (х) = 0 (если у гра-
графика функции есть разрывы, то может случиться, что она
скачком переходит от отрицательных значений к положи-
положительным, не обращаясь по пути в нуль (рис. 16, б)). Зна-
Значения а или b можно принять за первые приближения для
корня уравнения / (х) = 0.
Отметим, что при этом можно пропустить некоторые
корни уравнения. Так, на рис. 16, б изображен случай,
когда функция у = / (х) имеет в двух точках значения од-
G4
ного и того же знака, но между этими значениями обраща-
обращается в нуль.
Мы получили, таким образом, две точки: а и Ь. Чтобы
выяснить, какую из них лучше выбрать за начальное при-
приближение* в методе Ньютона, рассмотрим рис. 17. Рис. 17, а
и 17, б показывают, что если кривая обращена вогнуто-
вогнутостью вверх, то за начальное приближение надо выбирать ту
Рис. 17.
из точек а и b, в которой функция f (x) положительна.
Другой выбор начального приближения может даже приве-
привести к тому, что точка х% окажется вне отрезка \а, Ь\. Точ-
Точно так же, если кривая обращена вогнутостью вниз, то за
начальное приближение надо брать точку, в которой функ-
функция f (х) отрицательна (рис. 17, в, г).
Это правило удобно применять, если известен график
функции у = / (х). Если же график этой функции не на-
нарисован, то определение направления вогнутости требует
дополнительных расчетов. Для этого надо найти вторую про-
производную функцию / (х). Второй производной функции
f {x) называется производная от ее первой производной.
Х/й 3 н. я, Виленкии rr
Например, если дана функция
/(*) = Xs — 4х2 + Эх— 1,
то ее первая производная равна
/' (х) = Зх2 — 8х + 3,
а вторая производная есть
Г (х) = 6х — 8.
В курсах высшей математики доказывают, что если на
отрезке [а, Ь\ вторая производная положительна, то кривая
обращена вогнутостью вверх на этом отрезке. Если же вто-
вторая производная на отрезке [а, Ь] отрицательна, то кривая
на нем обращена вогнутостью вниз. Пользуясь этим, полу-
получаем такое правило для применения способа Ньютона:
Пусть в точках а и b функция f (х) имеет различные зна-
знаки, причем на отрезке la, b] вторая производная функции
f (x) положительна. Тогда за начальное приближение хг
надо выбирать ту из точек а или Ь, в которой функция f (x)
принимает положительное значение. Если же на отрезке
[а, Ь\ вторая производная отрицательна, то за начальное
приближение хх надо выбирать ту точку, в которой функ-
функция f (x) принимает отрицательное значение.
§ 20. КОМБИНИРОВАННЫЙ МЕТОД РЕШЕНИЯ
УРАВНЕНИЙ
При решении уравнений часто комбинируют методы хорд
и Ньютона. Если график функции у = / (х) обращен вог-
вогнутостью вверх, то находят точки а1 и х1 по формулам
т^ш< <78>
Если же график функции у — f (х) обращен вогнутостью
вниз, то точку а1 находят по формуле G8), а точку х1 — по
формуле
66
Как видно из рис. 18, а и 18, б, корень I уравнения f(x) =
— О лежит обычно между полученными точками at и хг.
Применяя снова к этим точкам формулы способа хорд и
способа Ньютона, получают новую пару точек а2 и х,
и т. д.
Таким путем получают две последовательности точек
аъ а2,..., ап,... и xlt x2,..., хп,-.-, приближающиеся с разных
сторон к искомому корню |. Преимущество описанного
способа состоит в том, что при нем получаются приближен-
приближенные значения как с избытком, так и с недостатком.
а х,
Ь .
В)
Рис. 18.
Пример. Решить комбинированным способом урав-
уравнение
х — sin а; — 0,5 — 0
с точностью до 0,001.
Составим таблицу значений непрерывной функции
/ (х) = х — sin х — 0,5.
X
\
—0,659
0
—0,5
1
—0,341
2
0,591
Из этой таблицы видно, что корень уравнения лежит
между 1 и 2. По формулам 2 и 4 из § 18 имеем
/' (х) = 1 — cos х.
Поэтому формула Ньютона принимает в нашем случае вид
л,,-sin xn-0,5
1 — cos х„
ll-2 4 H. Я- Виленкин
(81)
67
Чтобы узнать, какое из значений 1 или 2 надо принять за
х0, найдем вторую производную от функции / (х). По форму-
формуле 5 § 18 она имеет вид /" (л') = sin*. Но на отрезке [1, 21
функция sin л' положительна*). Значит, пользуясь при-
приведенным выше правилом, за х0 надо взять значение 2, при
котором положительна и функция / (х).
Имеем по формуле (81)
о 2—sin 2—0,5 о 2— 0,903— 0,5
Xl = ZГ^^2^1+0,416
С другой стороны, по формуле G8) имеем
ах = 1 - (_ 0,341) ^^7-0,3417 =
Примгняя далее формулы (81) и G8) к отрезку \ах, xj,
находим
Xt= 1,583- и™Г+™и°-= 1'501
,366 + 0,113 Q'O83 . Q'113 = 1,491.
Далее находим
xs = 1,498,
a3 = 1,498.
Итак, корень нашего уравнения с точностью до 0,001 есть
1,498.
§ 21. ПРИЗНАК СХОДИМОСТИ ПРОЦЕССА ИТЕРАЦИЙ
Применим теперь понятие производной для вывода но-
нового признака сходимости процесса итераций. Нам по-
нкдо'штся для этого одна формула, называемая формулой
Лагранжа (Лагранж — математик XVIII века, живший
во Франции).
Рассмотрим на отрезке [а, Ь\ кривую у — f (х). Обозна-
Обозначим через М начальную точку этой кривой, а через N —
*) sin х положителен на отрезке [0; я] = [0; 3,141...] Значит, sin x
положителен и на части [1, 2J этого отрезка.
68
ее конечную точку и проведем хорду MN. Угловой коэф-
коэффициент этой хорды имеет вид
«_ . , PN
ьхорды
МР
(рис. 19). Но МР = Ь — a, a PN = f (b) — / (а), и потому
и - f(b)-f(a)
точку дуги MN, наиболее
Обозначим теперь через Т
удаленную от хорды MN. Ес-
Если провести через эту точку
прямую, параллельную хорде,
то она будет касаться кривой:
в случае пересечения на кри-
кривой были бы точки, более уда-
удаленные от хорды MN, чем
точка Т. Иными словами, ка-
касательная к кривой, проведен-
проведенная в точке Т, параллельна
хорде MN, и потому имеет
тот же угловой коэффициент,
что и хорда. Но угловой ко-
коэффициент касательной равен
/' (с), где с— абсцисса точки Т. Поэтому имеет место формула
f{b)-f(a)
Рис. 19.
/' (С) =
Ь-а
(82)
Эта формула и называется формулой Лагранжа. Заме-
Заметим, что точка с в формуле Лагранжа всегда лежит между
точками а и Ь. Формулу Лагранжа моншо также записать
в следующем виде:
/ (Ь) - f (а) = /' (с) (Ь-а). (83)
Вернемся теперь к решению уравнения х = ф (х) по спо-
способу итераций. Пусть отображение у = ср (х) переводит
отрезок [а, Ь\ в себя, причем на этом отрезке выполняется
неравенство | ср' (х) \ < q, где q — некоторое число, меньшее
единицы, q ¦< 1. Возьмем на отрезке [а, Ь] любые две точки
х{ и хг. Тогда точки (р (х^ и ф (а2) также принадлежат от-
отрезку [а, Ь\. При этом по формуле Лагранжа имеем
Ф U'a) — Ф (-4) = ф'
4* 69
где с — некоторая точка, лежащая между хг и х2, а потому
принадлежащая отрезку [а, Ь]. Справедливо неравенство
| ф' (с) | < q < 1, а потому
<7|*a — *il- (84)
Неравенство (84) показывает, что ф (х) задает сжимающее
отображение. Но мы знаем, что если х -* ф (х) — сжима-
сжимающее отображение отрезка la, b] в себя, то для любой точ-
точки х0 этого отрезка последовательность х0, хх,..., хп где
xn+i = ф {хп), сходится к корню уравнения х = ф (х).
Таким образом, мы доказали следующую теорему:
Теорема. Пусть функция у = ф (х) задает отобра-
отображение отрезка [а, Ь] в себя и пусть на этом отрезке выпол-
выполняется неравенство | q/ (х) | <С q, где q <С 1. Тогда, какова
бы ни была точка х0 отрезка [а, Ь], последовательность точек
хо,х1,..., хп,..., где хп+1 = ц> (хп), сходится к корню уравнения
Грубо говоря, смысл доказанной теоремы заключает-
заключается в том, что процесс последовательных приближений поз-
позволяет найти те корни % уравнения х = ф (х), в которых
выполняется неравенство | ф' (?) | < 1. Можно сказать, что
эти точки притягивают к себе ломаную, геометрически
изображающую процесс итераций (см. § 8), а точки, где
| ф' Ш1 > 1, отталкивают от себя эту ломаную.
Если неравенство | ф' (х) [ < q < 1 выполняется на
всей числовой оси, то процесс итераций сходится при лю-
любом выборе начального приближения х0 (см. § 10).
Пример 1. Можно ли применить процесс итераций
для решения уравнения
cos х -)- sin х р
Х 4 •
В данном случае
cos х — sin х
Поэтому
, , ч — sin х 4- cos x
Но jsinx| ^ 1, | cos л: | <^ 1, поэтому
— sin х 4- cos x
sin x\ 4- cos-л:
2
й процесс итерации применим.
70
Пример 2. Применим ли процесс итераций для ре-
решения уравнения
х = 4 — 2*? (85)
Искомый корень лежит на отрезке [1, 2], так как непре-
непрерывная функция у = х — 4 + 2* меняет знак на этом от-
отрезке:
1 _ 4 + 21 < 0, а 2 — 4 + 22 > 0.
Но в данном случае имеем
ц'(х) = — 2х 1п 2.
Оценим выражение 2х In 2 на отрезке [1, 2]. Если
1 < х < 2, то 2 < 2* < 4,
и потому
2 In 2 < 2х In 2 < 4 In 2.
По таблицам натуральных логарифмов (основанием кото-
которых является число е ш 2,78...) имеем In 2 = 0,69... Зна-
Значит, на отрезке 11, 2] выполняется неравенство
1,38... < 2х 1п 2< 2,76...
и процесс итераций неприменим.
Чтобы применить процесс итераций, преобразуем урав-
уравнение (85). Перепишем его в виде
2х = 4 — х
и прологарифмируем обе части по основанию 2. 1огда по-
получим
х = log 2 D — х).
В этом случае
<P'W = D-1) in 2
н на отрезке [1,2] выполнено неравенство
<1
(Вывод этого неравенства читатель легко сделает сам.)
Поэтому при такой записи уравнения процесс итераций
сходится.
71
§ 22. БЫСТРОТА СХОДИМОСТИ ПРОЦЕССА
ИТЕРАЦИИ*)
Используем теперь производную функции гр (х) для оцен-
оценки скорости сходимости итераций при решении уравнения
х = ф (х). Мы хотим оценить скорость, с которой убывают
погрешности а„ = I — хп приближенных значений хх,
..., хп>... корня s-
а ? с, х, - о
Рис. 20
Заметим, что справедливы равенства ?= <р (?) и xn+i =
= ф (хп). Из них вытекает
%п+1 = I — *п+1 = ф (Ю — ф {Хп).
Но по формуле Лагранжа имеем
Ф (е) — Ф (л:„) = ф' (с„) {I — хп) =-- ф' (с„) ос„,
где сп — точка, лежащая между точками л:„ и ?. Поэтому
ап+1 = ф' (с„) а„. (86)
Из равенства (86) вытекает следующий вывод:
Пусть % — корень уравнения х — ц> (х) — лежит на
отрезке \а, Ь]. Если на этом отрезке выполняется неравен-
неравенство | ф' (х) | < q < 1, а начальное приближение хх также
выбрано на отрезке [а, Ь], то при любом п выполняется со-
отноишние
ссг+i | < qn | ях |. (87)
В самом деле, из равенства (86) имеем
«г| = I ф' (ci) II «il-
Но точка с1 лежит на отрезке [а, Ь] (рис. 20), и потому
Отсюда следует, что
а.,
*) Этот параграф при перво.м чтении можно опустить.
72
Точно так же мы получаем, что
21 < q | а21
и вообще
Тем самым наше утверждение доказано.
Так как при 0 < q < 1 последовательность чисел q,
q2,..., qn,... стремится к нулю, то и погрешность а„+1 стре-
стремится к нулю с возрастанием п. Иными словами, при ука-
указанных выше предположениях числа *,,..., хп>... приближа-
приближаются к числу ?, причем разность | | — Хщ\ | убывает бы-
быстрее, чем | tx | qn.
Точно так же можно доказать, что если на отрезке
\а, Ь] выполнено неравенство
>1,
то процесс итераций расходится.
Особенно быстро сходится процесс последовательных
приближений, если в точке ? производная функция q; (x)
обращается в нуль. В этом случае по мере приближения к
? значение <р' (х) стремится к нулю. Так как
К+1| = | <р'(с„)| К|,
то сходимость процесса ускоряется по мере приближения
к точке ?.
Мы уже столкнулись с этим обстоятельством при извле-
извлечении квадратных корней по способу итераций. На-
Напомним, что при этом мы заменили уравнение х'г — а урав-
пением х = —гр— . Но производная функции ф (х) — —rp-
равна выражению
2х-2х— (х2 + а) 2 __ х2 — а
Ах2 ~ гх-
(см. правило 4 из § 18 и формулу E5) из § 13), поэтому
73
Таким образом, в точке x—Ya производная функции <р (х)
обращается в нуль, а это вызывает ускорение сходимости
процесса по мере приближения к точке х = У а.
Явление ускорения процесса по мере приближения к
корню уравнения наблюдается и для способа Ньютона (част-
(частным случаем которого является указанный способ извле-
извлечения корней). В самом деле, мы уже отмечали, что способ
Ньютона связан с заменой уравнения/ (х) = 0 уравнением
у у
f (х)
и последующим решением этого уравнения последователь-
последовательными приближениями. В этом случаем мы имеем
но
JifLT i f'(x)U(x)Y-f(x)[f'(x)]'
= 1 [fwi'-/wfw = f w f"
Так как в точке ? выполнено равенство / (?) = 0, то ф' (?) =
= 0. А это, как было показано, обеспечивает ускорение
сходимости процесса приближений по мере стремления к
точке ?.
§ 23. РЕШЕНИЕ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ
МЕТОДОМ ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ
Мы решали до сих пор уравнения с одним неизвестным.
Перейдем теперь к решению систем уравнений. При этом
мы начнем с рассмотрения систем первой степени.
Пусть даны т уравнений первой степени с т неизвест-
неизвестными *)
п..*- -j- а-цХъ + ...-)- а.1тхт = o2i /ооч
(об)
аттхт = Ьт.
*) Мы обозначаем в этих уравнениях неизвестные буквами хъ х2, . . .
..., хт, а коэффициенты — буквами пц. Здесь Первый значок обо-
обозначает номер уравнения, а второй — номер неизвестного. Например,
Я47 —это коэффициент в четвертом уравнении при седьмом неизвестном.
74
Такие системы встречаются в различных приложениях.
Например, когда геодезисты уравнивают результаты из-
измерений больших частей земной поверхности, им приходит-
приходится иногда решать системы, состоящие из многих сотен
уравнений. Приходится решать такие системы уравнений
и инженерам при расчете стержневых конструкций и мно-
многим другим специалистам.
Решать такие системы обычными методами (например,
методом исключения неизвестных) часто бывает чрезвы-
чрезвычайно затруднительно. Более удобным оказывается метод
последовательных гоиближений. Покажем сначала на при-
примере, как это делается.
Пусть дана система уравнений
10*г — 2*2 + х3 = 9,
<i i 5*2 — х3 = 8,
4*! + 2*2 + 8х3 = 39.
Требуется найти неизвестные хи *2, х3 с точностью до 0,01.
Выразим из первого уравнения хъ из второго уравне-
уравнения *2 и из третьего уравнения х3. Тогда система примет
такой вид:
*i = 0,9 + 0,2 жа — 0,1*3,
*„= 1,6 — 0,2*!+ 0,2х3, (89)
х3 = 4 — 0,5xi — 0,25x2-
Возьмем любые значения хъ *2, *3 в качестве начальных
приближений, например, положим 40) = 0, *20) = 0, *;,0) = 0.
Подставим эти значения в правые части равенства (89) и
примем получающиеся значения хх, хг, *3 за следующие
приближенные значения. Мы получаем
х\1) = 0,9;
х? = 1,6;
xf = 4.
Найденные значения снова подставим в правые части урав-
уравнений (89). Получаем приближения
42) = 0,9 + 0,2.1,6 — 0,1.4 = 0,82,
42) = 1,6 — 0,2-0,9 + 0,2-4 = 2,22,
хр = 4 — 0,5-0,9 — 0,25-1,6 = 3,15.
75
Вообще, если найдены значения х^, хBп\ х^\ то сле-
следующие приближения вычисляются по формулам
(90)
Результаты вычислений приведены в табл. 2.
п
х(п)
1
0
1
4
,9
,6
,0
0
2
3
2
,82
,22
,15
1
2
3
3
,03
,07
,03
1
2
2
4
,01
,00
,97
Та б
5
1,00
1,99
3,00
л и ц а 2
6
1,00
2,00
3,00
Мы видим, что в пределах заданной точности выполняются
равенства
„(Б) „F) E) _ (в) (б) _ (в) ,Q1X
#1 = 2-1 , Х2 — X<i , Хз — Х3 . (i>1)
Полагая в равенствах (90) л = 5и принимая во внимание
равенства (91), получаем, что в пределах заданной точности
Y(S) ¦
—0,5*}BJ —0,25*!
.(и
(на самом деле, эти равенства выполняются точно, но это
несущественно). Отсюда следует, что числа xf = 1,00;
46) = 2,00; xi} = 3,00 являются (в пределах заданной точ-
точности) решениями заданной системы уравнений.
Точно так же поступают в общем случае *). Пусть дана
система уравнений (88). Выразим из первого уравнения хи
*) Дальнейший текст до конца этого napai рафа может быть опущен
при первом чтении.
76
из второго — хг и т. д. Тогда система (88) примет такой
вид:
&гт
(hi
У "» пи m'j, m,m-i
т ~*~ а ~~а х ~а 3 ' ' ' а т~1'
mm mm mm mm
(92)
Пустьx(l] ,..., xAm—некоторые начальные приближения
для неизвестных хх,...,хт.
Подставляя эти приближенные значения в правые части
равенств (92), мы получим вторые приближения *(?\...
•••> х(т Для искомых неизвестных:
B) _ _h_ ^1L х{1) g2m x(l)
„B) _ fcm "ml A) ат.т-\ A)
Точно так же если уже найдены я-е приближения х^
A'Bn) ,..., х(т для неизвестных, то следующий шаг вы полня
ется по формулам
Jn+i) h а,2 (п.) ахт х(п)
(n+i) __ h an in) alm (n)
2 ~" ~a^ a^ l ' ' " «22 '
(n+l) n* aml In)
Xm — *i
(93)
Рассмотрим теперь задачу, в которой речь будет идти
не о решении системы линейных уравнений методом после-
последовательных приближений а, наоборот, о нахождении
5 Н. Я- Вилеикин 77
предельного состояния некоторого процесса приближений
путем решения системы уравнений.
Имеется три ведра. В первом, из них 12 л воды, а второе
и третье ведра пустые. Из первого ведра переливают поло-
половину воды во второе, потом из второго ведра — половину воды
в третье и, наконец, из третьего ведра — половину воды в
первое ведро. Этот цикл повторяют 20 раз. Требуется оп-
определить (с точностью ёо OjOOOl л), сколько воды окажется
после этого в каждом, ведре.
Ясно, что здесь речь идет о последовательных прибли-
приближениях к некоторому предельному распределению воды.
Это предельное распределение характеризуется тем, что оно
не меняется после проведения одного описанного выше цик-
цикла переливаний. Если в начале цикла в первом ведре х
литров воды, во втором у, а в третьем 12 — х — у литров
(общее количество воды не меняется в процессе перели-
переливания), то описанный выше цикл задается следующей таб-
таблицей;
Начальное состояние
После 1-го переливания
После 2-го переливания
После 3-го переливания
Для того чтобы этот цикл переливаний не изменял коли-
количества воды в каждом ведре, должны выполняться следую-
следующие уравнения:
„ х у
Решая их, находим, что х = 6, у = 3. Значит, предель-
предельное распределение характеризуется тем, что в первом вед-
ведре 6 л воды, во втором 3 л, а тогда и в третьем будет 3 л
воды.
Выясним, с какой скоростью приближается заданное
распределение воды к предельному. Пусть первое ведро
еодержит а литров, а второе b литров. После одного цикла
78
1-е ведро
X
X
1Г
X
2-е 1
X
2
X
Т
X
ведро
У
~+у
и
3-е ведро
12—х—у
12-х-у
3 у
G— -g-x—у
в первом ведре окажется
R _1_ _.
8 4
6,0-0 г, . v
+ 1Г — т (94)
литров, а во втором
Ь = Т + Т ^
литров.
Обозначим а — 6 через a, b — 3 через р, ах — 6 через
ах и Ьх — 3 через pt. Тогда из равенств (94) и (95) следует,
что
я — О Ь — 3 а В
И
i _ - 4 -f 2 .
После второго цикла погрешности будут выражаться фор-
формулами
1L _ А _ 1 /± __ 1, _ 1 f^ j_ i
3 8 4 ~ 8Л 8 4 J 4^4 t 2
3_ , ___ _5_
~~ 64 а 32
3 - "' i- Pl - ЧJL _ ^ 4- i f3 4- ^ - 5 t-i-B
Р* - -j- +- ~ ~ Т \ 8 Т/ "•" 2 U + 2 / ~ 32 16 Р>
Позто.\гу если | а | ¦< е и I P | •< 8, то
сто означает, что два цикла переливаний уменьшают по-
погрешности а и р не менее чем в три раза. Поэтому после 20
циклов она уменьшится по крайней мере в З10 ~ 70 000
раз. Значит, с точностью до 0,0001 л после 20 циклов пере-
переливаний в первом ведре будет б л воды, во втором — 3 л
и в третьем 3 л.
§ 24. РЕШЕНИЕ СИСТЕМ
НЕЛИНЕЙНЫХ УРАВНЕНИЙ
МЕТОДОМ ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ
Методом последовательных приближений (итераций)
можно решать и некоторые системы нелинейных уравнений.
Рассмотрим, например, систему уравнений
и
У =
20
(96)
Выберем в качестве первых приближений х0 = 0, у0 = 0.
Подставляя эги приближения вместо х и у в правые части
уравнений, получим следующие приближения: х1 = ,
Ух = 1. Подставляя эти приближения в правые части урав-
уравнений (96), получаем
х2 - 2 + ^±1 = 2,25,
1/2= 1 +-^()-:"=: 1'1
Продолжая этот процесс, мы получим
2,25'4-1,15
~ z>6 1»
Н
20
2,31s+ 1,18
и 1 ¦ 2,31 + 1,18
9 ЧЧ5 I 4 1
э —= I -г • т^
«/5-1
20
Мы видим, что с точностью до 0,01 выполняются равенст-
равенства ж4 = хь — 2,33 и г/4 = ^5 = 1.18. Поэтому с указанной
точностью имеем х = 2,33 и г/ = 1,18.
Вообще, если задана система уравнений
* = Ф(*,г/), 1 (97)
г/ = ^(х, г/), J
80
где ф (х, у) и 1J5 (х, у) — какие-то функции, то мы выбираем
начальные приближения х0 и у0, подставляем их в правые
части уравнений (97) и далее ведем расчеты по формулам
Хп+1 = ф (Хп, Уп), 1
Уп-il — 'Ф (Х,г, Уп)- J
(98)
Рис 21.
Если при некотором номере п с заданной степенью точности
выполняются равенства л'л+1 ~ хп, уп^ ~ х„, то с этой сте-
степенью точности имеем x-zzxn,
У~ Уп-
Точно так же решаются
системы уравнений с тремя и
большим числом неизвестных.
Выясним теперь, при ка-
каких условиях можно гаранти-
гарантировать сходимость процесса
последовательных приближе-
ннй при решении систем.
Мы будем считать, что функции ф (х, у) и ty(x, у) в си-
системе уравнений (97) заданы в некоторой ограниченной
замкнутой области D на плоскости х, у. Иными словами,
мы будем считать, что область D целиком лежит внутри
какого-то квадрата и что ей принадлежат все ее граничные
точки. Примерами таких областей могут служить круг,
многоугольник (взятый вместе с граничной ломаной),
эллипс и т. д. Мы будем считать, кроме того, что функции
Ф (х, у) и -ф (х, у) непрерывны в области D. Функции <р (х, у)
и i|) (х, у) задают отображение области D на какую-то
область, лежащую в той же плоскости. Чтобы найти, в
какую точку переходит точка Мо (х0, у0) области D, надо
подставить ее координаты вместо х и у в ф (х, у) и if (x, у).
Результаты подстановки и дадут координаты образа точки
Мо. Например, если
Ф (х, у) = х% + у2,
я|з (а-, у) = 2ху,
то точка Мо (I, 3) переходит в точку No A0, 6).
В дальнейшем мы будем обозначать отображение, за-
заданное функциями ф (х, у) и if (x, у) одной буквой Ф, а об-
образ точки М при этом отображении обозначим Ф (М).
Через Ф (D) обозначим образ всей области D,
81
Пусть отображение Ф переводит область D в ее часть
D, = Ф (D). Тогда можно повторно применить то же са-
самое отображение. При этом область D1 перейдет в свою
часть D.a — Ф (Dj), которая, конечно, тоже лежит в области D.
Продолжая этот процесс, мы получим систему вложенных
друг в друга областей D, Dlt ..., Dn,... (рис. 21).
Назовем отображение Ф сжимающим, если существует
такое число q, что 0 < q < 1, и для любых двух точек Мг
и УИ2 из области D выполняется неравенство
г (Ф (МО, Ф (Л12)) < цг (М1; М,).
Здесь через г (М, N) обозначено расстояние между
точками М и N.
Точно так же как и в случае одного переменного, до-
доказывается следующее утверждение:
Пусть отображение Ф переводит область D в свою
часть и является сжимающим. Тогда в области D есть единст-
единственная точка N такая, что N = Ф (Лт). Эта тонка принад-
принадлежит всем областям Dn. Координаты |, v, точки N удов-
удовлетворяют системе уравнений (97), то есть
Ф A,
¦П = f (|, Tj),
Как и в случае одного переменного, значения | и т]
приближенно вычисляются методом итераций. Если
Мо (хо, Уо) — любая точка области D и Mn-ri = Ф (М,г)
(то есть xn+i = ф (хп, уп), Уп-tt — 'ф (x,,, и,)), то последова-
последовательность точек Мй, А1и...,. Мп,... сходится к неподвиж-
неподвижной точке N отображения Ф,
§ 26. ВИДОИЗМЕНЕННОЕ РАССТОЯНИЕ
Условие, что отображение Ф является сжимающим, дает
достаточный признак сходимости процесса итераций. Но
этот признак не является необходимым. Отображение Ф
может не быть сжимающим, а процесс итераций все-таки
сходится. Например, отображение Ф, заданное функци-
функциями ф (х, у) —\-\-2y, ф(х, г/) = 3 +-g-, не сжимающее.
Если взять А (8, 0), В (8, 4), то
Г (А, В) - 4, Ф (А) - A, 4), Ф (В) = (9, 4)
82
г(Ф (А), Ф (В)) = 8>г(Д, В).
Однако, какую бы точку Мо мы ни взяли, последователь
ность точек Мо, Ми..., Мп,.., сходится к точке
i — , 4 -r
В некоторых случаях удается установить сходимость
процесса итераций, видоизменив определение расстояния
между точками на плоскости. Дело в том, что расстояние
Рис. 22.
между точками можно определять по-разному. Для путе-
путешественника естественно измерять расстояние временем, ко-
которое надо потратить, чтобы добраться из точки А в точ-
точку В. А тогда расстояние между точками А и В на рис. 22, а
определится суммой длин отрезков AC, CD и DB (что-
(чтобы попасть из точки А в точку В, надо дойти до моста CD,
перейти этот мост и из точки D попасть в точку В). А если
движение на плоскости может происходить только в двух
взаимно перпендикулярных направлениях, то за рассто-
расстояние между точками А и В на рис. 22, б надо принять еум-
му отрезков АС и СВ. В других случаях удобнее считать
«расстоянием» между точками А и В длину большего из от-
отрезков АС и СВ. Можно придумать и другие определения
«расстояний» между точками плоскости. (Подробнее е раз-
разных определениях расстояний можно узнать из книги
Ю. А. Шрейдера «Что такое расстояние?».)
83
Обычно требуют, чтобы расстояние г (Л, В) между точ-
точками обладало следующими свойствами:
1) Расстояние г (А, В) между любыми двумя точками
А я В неотрицательно, причем оно равно нулю лишь в
случае, когда точки А и В совпадают.
2) Для любых двух точек А и В выполняется условие
симметрии
г {А, В) =- г (В, А).
3) Для любых трех точек Л, В, С выполняется неравен-
неравенство треугольника
г (А, В) <^г(А, С) + г (С, В).
Если в каком-нибудь множестве объектов определено
расстояние, обладающее этими свойствами, то это множе-
множество называют метрическим пространством, а элементы
множества — точками этого пространства. Точками мет-
метрического пространства могут быть даже функции. Для
непрерывных функций ср (х) и яр (у) на отрезке [а, Ь] рас-
расстояние определяют как наибольшее значение функции
Ф (х) — vj; (x) | на этом отрезке:
г(ф,о|})= шах | ф (х) — i|}(x)|.
Мы уже видели выше, что плоскость можно различными
способами превратить в метрическое пространство: для
всех указанных выше способов определения расстояния вы-
выполняются условия 1) — 3).
Укажем интересный пример, когда условия 1) и 3) выполнены, а
условие симметрии 2) не выполняется. Будем измерять расстояние
между точками А и В в горной местности временем, нужным, чтобы по-
попасть из А в В. Так как время подъема на вершину горы отличается
от времени спуска с нее, то г (А, В) == г (В, А).
Оказывается, что для сходимости процесса последова-
последовательных приближений при решении системы уразнеинй
{99)
у = t|) (х, у) J
достаточно выполнения следующего условия:
Отображение Ф, задаваемое функциями (fix,у) ио|з (х, у),
переводит область D в себя и является сжимающим от-
84
носительно хотя бы одного «расстояния» г (А, В). Иными
словами, должно существовать число q такое, что 0<<7<^
< 1, и для любых двух точек Мг и М2 из D выполняется не-
неравенство
г( Ф (Мг), Ф (М2)) < qr Ш], М.г).
Возьмем, например, функции ср (х, у) = 1 + 2г/ и
\р{х,у) ~ 3 + -тг-. Оказывается, что определяемое ими ото-
отображение Ф является сжимающим с коэффициентом 1/2,
если определить расстояние г (А, В) между точками A (xlt ух)
и В{х2, г/,) формулой
г (А, В) = | — (*я — xi) + 2 (г/2 — у,_) | +
' I V- И О /«. ,;
г— { А2 "\) ' ^ \*/2 У
I
Например, для точек А (8, 0) и В (8, 4) имеем г (Л, В) =
= 16, а для их образов Ф (А) и Ф (В) имеем
г (Ф (Л), Ф (В)) = 8.
После отображения Ф «расстояние» вдвое уменьшилось.
Именно этим объясняется, что процесс итераций для реше-
решения системы уравнении
х = 1 + 2у,
У = 3 + -f
сходится, хотя отображение Ф и не является сжимающим
относительно обычного расстояния (см. стр. 82).
§ 26. ПРИЗНАКИ СХОДИМОСТИ ПРОЦЕССА
ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ
ДЛЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ
Применим полученный выше признак сходимости к си-
системам линейных урагнений. Выбирая различным образом
«расстояния», мы получим признаки сходимости для этих
систем, выраженные "ерез свойства их коэффициентов.
Рассмотрим сначала систему двух линейных уравнений
с двумя неизвестными
(]00)
а21х + аг/ Ь J
Пусть ап =р 0 и я22 =?= 0. Решим первое уравнение отно-
относительно х, а второе — относительно у. Получим систему
уравнений
au аи ¦"
Для краткости положим — =рь — = аъ —- = В2,
¦— —— — а2.
0.21
Тогда система примет вид
* = «tf + Pi, | A00')
У — <%<ьХ 4 г2' J
В данном случае функции, задающие отображение Ф,
имеют вид
ф (х, у) = аху + ръ t|)( х, г/) = а2х + р2.
Выясним, какими должны быть коэффициенты ах и а2
для того, чтобы это отображение было сжимающим.
Как известно, расстояние г (А, В) между точками
^4(^i, Uxl и В (х2, уг) выражается форглулой
г (Л, В) = f{x2 — хг)* + (у, — ух)\
Преобразование Ф переводит точку А в точку ^^у
4- Pi, a2xt + Ра), а точку В — в точку Вг [аху2 +
4- Pi,a2x2 4~ Рг)- Расстояние между этими точками выража-
выражается формулой
- /а* («/, - г/02 4~ а\ (х2 - xxf. A01)
Обозначим большее из чисел 1 ссх j и | а, | через ^:
^ = max (lotji, ja,,j).
86
Тогда из формулы A01) вытекает неравенство
г (Ль В,) < q f^-xlf + {^—ylf = qr (Л. В).
Значит, если q <L 1, то отображение Ф является сжи-
сжимающим на всей плоскости. Тогда, как мы знаем, процесс
последовательных приближений сходится.
Итак, мы доказали, что если
max
|а2
< 1,
A02)
то процесс последовательных приближений при решении
системы уравнений A00') всегда сходится.
Выразим полученный признак сходимости непосредст-
непосредственно через коэффициенты системы уравнений A00). Для
этого вспомним, что
'«2 =
а-л
Подставляя эти выражения в условие A02), получаем следую
щий вывод:
Для сходимости процесса последовательных приближе-
приближений при решении системы линейных уравнений
= blt
апх
достаточно, чтобы выполнялось условие
max
Это условие выражает, что диагональные коэффициен-
коэффициенты должны быть больше, чем недиагональные коэффици-
коэффициенты, стоящие в той же строке. Поэтому, например, при
решении системы
х — Зу = — 11,
6х 4- у = 10
первое уравнение надо решить относительно у, а второе —
87
относительно х:
11
1
У =- -ГГ" -\ о" Х1 Х —
Иногда полезно предварительно преобразовать систе-
систему уравнений, заменив неизвестные хну пропорциональ-
пропорциональными им неизвестными. Возьмем, например, систему урав-
уравнений
12* + ,= 14, X (ШЗ)
Для нее
max
с + у=14, Л
(± ±)
\12 ' г)
= max I
и поэтому не выполняется достаточный признак сходимо-
сходимости процесса приближений. Но если положить х = -5- z, то
О
получим систему
4г
г —
г/.= 14,
1,
A04)
для которой
max 1
= max
Значит, систему A04) можно решать последовательными
приближениями.
Разумеется, никому не придет в голову решать столь
простые системы, как A04), методом последовательных
приближений. Но для систем с большим числом неизвест-
неизвестных этот метод бывает очень полезен. Достаточные призна-
признаки сходимости для решения системы
+ аыхп = Ьъ
i a2llX!l — &2,
' ОчгпХп — Ьп
A05)
устанавливаются примерно так же, как и для системы урав-
уравнений с двумя неизвестными. Однако здесь разные опре-
определения расстояния между точками приводят к разным ре-
результатам. Именно, справедливо следующее утверждение:
Процесс последовательных приближений для систе-
системы A05) сходится, если выполнено одно из следующих
88
условии:
1) max У
п
2) maxV
1=1
п
3) max V,t(
г, /=1
A06)
A07)
A08)
В суммах A06) и A07) штрих обозначает, что опущено
слагаемое, для которого i = /. В сумме A08) значок (k)
означает, что опущены не только слагаемые, для которых
i — /, но и слагаемые, для которых i = k. Отметим, что ус-
условие 3) заведомо выполняется, если
2'
а...
A09)
где штрих означает пропуск слагаемых, для которых i = /.
В большинстве книг по вычислительной математике это ус-
условие приводится именно в форме A09).
Как мы уже говорили, условия A06) — A08) получа-
получаются, если потребовать, чтобы отображение
"и
П
Х
ЛП-1
было сжимающим относительно некоторого расстояния.
Именно, условие A06) соответствует расстоянию
г (А, Б) =--max (l^ —j/,,1,..., \xn—yn\),
п
условие A07) соответствует расстоянию г (А, /?)= V |х; — yt\
i=\
Л/ y^ixt-ytf
и условие A08) — расстоянию г(А,В)=--
между точками А(хи..., хп) и В (ух,..., уп).
89
Как и в случае двух переменных, иногда бывает полезно заменить
неизвестные хг, . . ., хп пропорциональными им неизвестными
Vi = РЛ' ¦ ¦ ¦' Уп" Рпхп< г^е Pi > ° Рп > °-
В эгом случае условия A06), A07), A08) примут вид
Г) max
2') max
3') max
Pi
Л
pi
1,
ZJ
A06')
A07')
A08')
В частности, при pi -¦ \а.ц\ эти условия принимают вид
1") max у.
i .
2") max 2'
n
3") max V(*
a
aii
(*)
aft-
A06")
(ЮГ)
A08")
Для примера рассмотрим систему уравнений
х — 0,6у — 0,5г = — 2,6,
— 0,2л: + г/ — 0,4г = 3,
— 0,1а: -+- 0,5г/ + г = 3,9.
Условия 1), 2), а также Г), 2') для этой системы не вы-
выполняются. Точно так же для нее не имеет места неравен-
неравенство A09) — сумма квадратов недиагональных элементов
равна 1,07. Но
a// i2
= max @,62 + 0,52 + 0,22 -(- 0,42; 0,62
max 2j
+ 0,52 -f 0,l2 +0.52 ; 0,22 + 0,42 + 0,l2 + 0,52) =
= 0,87<l,
и поэтому систему можно решить методом последовательных
приближений.
90
Заметим, что все сформулированные выше условия до-
достаточны для сходимости процесса последовательных при-
приближений, но они никоим образом не являются необходи-
необходимыми. Выбирая другие определения расстояния между
точками и записывая условие сжимаемости, мы получаем
иные условия сходимости. Однако этот вопрос мы не бу-
будем сейчас рассматривать.
Для систем линейных уравнений верны те же замеча-
замечания, какие были сделаны в § 5. Например, результат при-
приближений не зависит от выбора начального приближения.
Поэтому если в ходе вычислений была допущена ошибка,
то она не обесценивает дальнейших вычислений, а лишь
замедляет достижение окончательного результата.
Существует ряд разновидностей способа последователь-
последовательных приближений для решения систем линейных урав-
уравнений. Так, в некоторых способах, найдя приближенное
значение л^', подставляют для нахождения л4"+1! значе-
значения x(i+1), х(з\ хD* ,..., х(т\ потом для нахождения л4п+1>
подставляют значения х\п+1), 4"+4> **n\ • • •, х(т и т. д. Опи-
Описание всевозможных способов приближений для систем ли.
нейных уравнений могло бы стать темой другой книжки-
§ 27. ПОСЛЕДОВАТЕЛЬНЫЕ ПРИБЛИЖЕНИЯ
В ГЕОМЕТРИИ
Мы описали применения способа последовательных
приближений для решения уравнений и систем уравнений.
Этот метод находит приложения и в некоторых вопросах
геометрии, например, при вычислении длины окружности.
Как известно, чтобы вычислить длину окружности, снача-
сначала находят периметр вписанного в нее квадрата, потом пе-
периметр вписанного правильного восьмиугольника, пра-
правильного шестнадцатиугольника и т. д. Предел этих пе-
периметров и равен длине окружности. При этом каждый по-
последующий периметр вычисляется с помощью предыдуще-
предыдущего. Это делается следующим образом:
Обозначим сторону правильного 2"-угольника через Ап,
а его периметр через Рп. Например, Ла является стороной
квадрата, и потому А2 ~ R ^2, Р2 — 4R }'Л2. Предположим,
91
что мы уже нашли Р„. Тогда, очевидно,
2"
В геометрии доказывается, что сторона а2п правильного
вписанного 2/г-угольника выражается через сторону ап
правильного вписанного я-угольника и радиус R окруж-
окружности по формуле*)
A10)
Значит, сторона Anil правильного 2д+1-угольника вы-
выражается через сторону Ап правильного 2п-угольника
по формуле
An+i=R\/ 2-j/4-
3.
R2
Поскольку Ап = -ф- и Ап+1 = -ф? , то
п+1 —
2— / 4
}2 '
(НО')
*) Эту формулу легче всего вывести с помощью тригонометрии. Оче-
Очевидно, если ап — сторона правильного вписанного n-угольиика, а
°2п — сторона правильиого вписаниого 2/г-уголь-
2/г-угольника, то
ап = 2R sin — и а2п = 2tf sin -g^-
(см. рисунок). Так как
• cos a
то
a2n = 2/?sin^L. = :
= й
1 — cos ¦
Последовательность чисел Рг, Р3,..., Рп-.- стремится к дли-
длине окружности, то есть к значению 2nR. Поэтому формулу
A10) можно рассматривать как формулу для вычисления
значения 2n,R по способу последовательных приближений.
Пользуясь этим способом, можно найти значение я с лю-
любым числом десятичных знаков.
Существует другой способ приближенного вычисления
я, называемый способом равных периметров. При этом спо-
способе правильный 2"-угольник заменяется правильным 2Л+1-
угольником, имеющим тот же периметр. Обозначим апо-
апофему правильного 2™-угольника через /„, а радиус описан-
описанной окружности через г„. Апофему же правильного 2п+1-
Рис. 23.
угольника, имеющего тот же периметр, что и 2п-угольник,
обозначим через tn+1, а радиус описанной окружности —
через гп+1.
Пусть АВ (рис. 23) — сторона 2п-угольника, вписанного
в окружность радиуса гп. Соединим середину С дуги А В
с точками Л и б и проведем среднюю линию DE треуголь-
треугольника АСВ. Очевидно, что угол DOE равен половине угла
АОВ. Поэтому DE является стороной правильного 2п+1-уголь-
ника, вписанного в окружность с радиусом OD. Так как
DE = у Лб, то периметр 2"+1-угольника равен пери-
периметру 2"-угольника. Это означает, что rn+1 = OD,
1-пм = ОК.
93
Легко сосчитать, что
Далее, из прямоугольного треугольника ODC находим
Гп+1 = YrJn+l. A12)
Формулы A11) и A12) выражают гп+1 и 1п+1 через гп и /„.
При возрастании п периметры многоугольников не ме-
меняются, а числа гп и 1п приближаются к одному и тому же
пределу. Этот предел равен радиусу окружности, длина ко-
которой равна периметру наших многоугольников. Если
выбрать начальный многоугольник так, чтобы его периметр
равнялся двум, то как г„, так и 1п стремятся к числу —:
1- 1 1- / 1
hm /•„= — ; Игл /„=—-.
п-^оэ п я-*со я
Например, если выбрать за первый многоугольник квад-
квадрат со стороной 1/2, то г2 = —— ) h — ~г ¦ Поэтому имеет
V2
место следующее утверждение: если положить г2 = -—- ,
1% = -т-и вычислять значения /vn, /«+i, n = 2, 3,... по
формулам A11) и A12), то
Hm rn= lim /„ = —.
По этим формулам можно приближенно найти значе-
1 „
ние — . Для этого надо вести расчет до тех пор, пока значе-
значения гп и 1п не совпадут в пределах выбранной точности.
Это общее значение тп и /„ и будет значением — с заданной
точностью.
§ 28. ЗАКЛЮЧЕНИЕ
Мы познакомились в этой книге с применениями способа
последовательных приближений к различным вопросам:
к составлению планов, к извлечению корней, к решению
уравнений, к вычислению длины окружности. Этим неис-
94
чериывается многообразие применений этого способа. Очень
многие задачи приводят к дифференциальным уравнениям
(в которые входят производные искомых функций), к ин-
интегральным уравнениям и уравнениям еще более сложного
вида. Одним из самых сильных методов приближенного
решения таких уравнений также является способ последо-
последовательных приближений. Разумеется, его применение в
этих случаях значительно сложнее, чем в случае решения
алгебраических уравнений. Но можно смело сказать, что
без применения способа последовательных приближений
нельзя было бы решить ни одной из грандиозных физичес-
физических и технических задач, которые решаются в настоящее
время. И при расчете движения спутника, и при расчете
атомного реактора, и при исследовании строения атома
применяют этот метод. Однако рассказ о применениях
метода последовательных приближений за пределами эле-
элементарной математики выходит за рамки этой книги.
УПРАЖНЕНИЯ
Для того чтобы читатель мог проверить, насколько он овладел изло-
изложенными в этой книге методами приближенного решения уравнений, мы
приводим несколько примеров на приближенное решение уравнений.
Решить по способу итераций уравнения*)
¦
2.
3.
4.
5.
0.
7.
8.
9.
10
X-
X -
X-
X =
А~
X2:
X3:
X =
. X =
I
(х+ IJ
= (* + 1Л
4
3
= У — х.
- ж =--= tg х.
= sin л:.
= sin х.
х
: arcsin
= cos x.
x—l
x+l '
+1
4 •
11. X-
12. x
13. x
14. x2
15. In
16. In
17. x2
18. lg
19. t
20. x
I
cosx
1
= ±Vlg(x + 2).
= ln(x-f Ij.
x = 2 — x.
= ex + 2.
¦x = 0,l*.
gx = lg^.
1 ^
Решить по способу Ньютона уравнения
21. х3 — 5х + 1 = 0. 24. л-6 + 5* + 1 ¦= 0.
22. х3 — 9л-2 + 20* — 11 = 0. 25. sin л-+л-= 1.
23. Xs — Зл-2— Зл- + 11 = 0. 26. л-2 — 10 lg х — 3 = 0.
*) В некоторых из приведенных здесь примеров надо сначала пре-
преобразовать уравнение к виду х = ср (л").
27. Решить с точностью До 0,001 методом последовательных приб-
приближений системы уравнений:
y = 0,3x + 0,!5г+1,383,
z = Q,25x — 0,Ay +3,677;
1
f-=—sin (x-\-y)+ 0,336,
1
[У = ?- sin (x— y) + 0. 362;
РЕШЕНИЯ
1 2
1. Положим ф (х) — ~ПГгТй ' Тогда ^'^ ""ТТЖ' Имеем
Ф @) -- 1 > 0, ф A) =»-—<; 1. Поэтому отрезок [0, 1] содержит корень
данного уравнения. Однако мы не можем применить метод последова-
последовательных приближений к этому отрезку, так как |ф' @)| = 2> 1. Чтобы
сузить отрезок, заметим, что ф @,4) — ] qq ^> ®А- Поэтому уравне-
2
ние имеет корень иа отрезке [0,4, 1]. При этом | ф' (х)\ < у^г<С 1. если
0,4 ^ х ^ 1, и, значит, можно применить метод последовательных
приближений. Полагая xt = 0,4, получаем после 11 шагов приближе-
приближения, что д-ц я;ф (д-и) ж 0,4655.
Значит, с точностью до 0,0001 имеем х = 0,4655.
2. Положим ф {>:) = (д-+ IK. Тогда ф' (дг) = 3 (дг + IK. Имеем
Ф (— 2) = — 1 > — 2, ф (— 3) = — 8 < — 3. Поэтому отрезок
[— 3, — 2] содержит корень данного уравнения. Однако мы не можем
применить метод последовательных приближений, так как на отрезке
I— 3, — 2] имеем |ф' (х)\ > 1. Перепишем заданное уравнение в виде
з
х— V7—1.
Тогда г]) (х) = У~х — 1 и f' (х) = —~,— . На отрезке [—3,-2] име-
3 Vx?
ем | г|)' (д;) | < g— <С 1, и поэтому можно использовать метод после-
довагельиых приближений. Полагая хх——2, получаем дгвж¦];(д-в) л
¦х, — 2,325. Значит, с точностью до 0,001 имеем х = — 2,325.
3. Положим ф (х) — 4 + "|/ -1- . Мы имеем
г х Аг 1
•А
з V
98
Рис. 24 показывает, что прямая у
3 /~~i—~
7 X '
в двух точках,
отрезках [— 1,0] и [4, 5]. На
отрезке [4, 5] имеем | го' (х) I <;
2
¦^ g <^ 1. Полагая Д=4,
15 /45
имеем хя жф (х3) -х. 4,870. Зна-
Значит, с точностью до 0,001 по-
получаем xs •m 4,870.
На отрезке [— 1,0] метод по-
последовательных приближений не-
непосредственно не применим. Пе-
Перепишем иа этом отрезке урав-
х — 1
иение в виде (х ^— 4)я =- ~гц~~г.
х — 1
откуда ^уз — х + 1 к
Здесь ^ (х) =
(х-if
х—1
— 1
(х -4I
при —1 ^л- < 0 имеем | ф' (х) |
У'5
л- пересекается с кривой у =
лежащих соответственно на
Рис. 24.
' (X) - -7
Ясно, что
1
Ъ '» и тепеРь можно применить
метод последовательных приб-
приближений. Полагая хх <=• 0,
имеем х3 ¦хf (*г) ss — 0,9840.
Значит, с точностью до 0,0001
имеем х = — 0,9840.
Мы нашли два корня: х =•
= — 0,9840, х = 4,870. 4
4. Здесь срх (дг) = 2 + у7^ и
4
ер2 (,г) ==2 — / д-. Из рис. 25 вид-
но, что уравнение лг = 2 + у х
имеет корень иа отрезке [3, 4].
На этом отрезке
Рис. 25.
Теперь решим уравнение х ™ 2
Ита>г, корни уравнения равны 1 и 3
Применяем метод последова-
последовательных приближений. Полагая
.Xi"" 4, имеем л-4«ср (х4) я^3,353.
Значит, сточиостью до 0,001 име-
имеем х •=• 3,353.
— \гх. Оно имеет корень х =• !.
,353.
99
5. Здесь ф (х) = У'Ь — х ифA) =
¦ . Имеем
3 УE —дс)«
Поэтому существует корень уравнения иа отрезке [1, 2]. На этом отрезке
1<Р'(*I<—ч—<1. Полагая хг= \, имеем дгб «ф (*в) ~ 1,516.
q чЛсГ
Значит, с точностью до 0,001
имеем х = 1,516.
6. Запишем уравнение в виде
х — arctg D — д-).
Здесь ф (х) — arctg D — х).
Мы имеем ф A) = arctg 3 ж 1,25,
Ф B) = arctg 2 ж 1,10 Отсюда
следует, что существует корень
этого уравнения, лежащий иа
отрезке [1, 2]. На этом отрезке
имеем
Рис. 26.
Поэтому можно применить метод
последовательных приближений.
х 1,225. Значит, с точностью
Полагая jtj ¦= 1, имеем jr4 ~<f
до 0,001 имеем х = 1,225.
7. Заданное уравнение имеет корень х = 0. Из рис. 26 видно, что
второй корень уравнения положителен. Поэтому он удовлетворяет урав-
COS X
нению х =у sin х. Здесь <p(x)=ysmx и ф' (х) =—, ,. Так как
фA):= |Лпп 1 х- уг0,8414<1,
то уравнение имеет корень на отрезке [д/з; 1]. На этом отрезке имеем
и потому метод последовательных приближений сходится. Полагая
д-, — 1, имеем х7 жф (л-7) ж 0,8768. Значит, с точностью до 0,0001
второй корень уравнения равен 0,8768.
!00
8. Решается аналогично предыдущему. Переписываем
в виде
уравнение
полагаем хг = 1 и получаем х% Хф (ле) х 0,9286. Поэтому с точностью
до 0,001 один из корней уравнения равен 0,9286. Так как обе части
уравнения — нечетные функ-
функции, то имеем еще корень
—0,9286. Третьим корнем яв-
является 0.
9. Уравнение можно пе-
х+1
реписать в виде —
=r sin х, — я/2
у
т=
/ х < я/2. Из
рис. 27 видно, что это урав-
уравнение имеет единствечный ко-
корень, лежащий между 0 и
я/2. В данном случае
—V
л
г
(х) = arcsin ¦
1
1
я
г
Рис. 27.
JT>
На отрезке [0, я/2] имеем | ф' (х) | <
1
/3
<[1. Полагая хх = 0, находим
(л-8) ж 0,3422. Значит, с точностью до 0,0001 имеем х = 0,3422.
10. Так как cos 0 = 1,
cos I > 0, то уравнение х = cos x
имеет корень на отрезке [0, 1 ].
Поскольку |ф' (а-) | ^ sin 1 < 1,
то можно применить метод после-
последовательных приближений. По-
Полагая хх = 1, получаем, что с
точностью до 0,0001 х = 0,7391.
11. На рис. 28 видно, что
положительные корни уравне-
уравнения близки к точкам пересече-
пересечения графика функции у = cos x
с осью абсцисс и расположены
справа от точек пересечения ви-
виРис. 28.
да -75-+ B&+ 1) я и слева от
точек пересечения вида -к- + 2Ы. Чтобы найти решение, расположенное
п п
около точки х — -ту + ия, положим х — пп — -ту =- у. Уравнение
примет вид
\ _ (-D"+!
я
у j пп + -ту =
sin г/
101
A ft
При згой — — <; у <С 7Г . я потому уравнение можно записать так:
1
г/ = (— l)n+1 arcsin ^— •
г/ + /гя -f -тг
Здесь
у + ля + "у
и
ф (у) =
Ясно, что вблизи точки г/ = 0 имеем | ф' ((/) | <С <7 <С 1 > и потому можно
применить метод последовательных приближений. Найдем решение при
(!¦= 1 с точностью до 0,001. Пусть у0 = 0. Тогда ул г;ф (r/2) ^t 0,204.
3
Поэтому у «. 0,204; л- = у я + г/ ж 4,917,
Чтобы иайти первый отрицательный корень, положим я "» — 1.
Мы получим уравнение
1
у = arcsin -^—.
Положим у» =« 0. Тогда
г/« »фЫ~- о,5оз.
Таким образом, у ж — 0,503, а потому д- « — 2,074.
При больших значениях | я | метод последовательных приближений
дает приближенную формулу для у:
\ (
у « (р (j,0) = (- 1)»« arcsin — « Bп+1)я •
ПЯ + -7Г
Поэтому
я (— l)"+i-2
*«— Bп+1) + ^Т)-й.
12. Полагая д-х =» 0, находим, что д-3я;ф (л-3) яг 1,088. Значит, с
точностью до 0,001 х ж 1,088.
13. Сначала решим уравнение х = |/' \g (x -f- 2). Мы имеем
<р .д) - "^ig (j; + 2), и потому
\ge
Ф' W
+ 2) yig(*+2)
Так как ф @) — ]Ag 2 > 0, ф A) = У lg 3 < 1, то уравнение имеет
корень на отрезке [0, 1J. На этом отрезке выполняется неравенство
102
|ф (х) | <[ q <^ 1. Значит, можно применить метод послгдовательных при-
приближений. Полагая хх = 1, имеем хь ж ф (д-5) ж 0,6507. Значит, ко-
корень уравнения д- ¦=> у' lg (* -f- 2) с точностью до 0,0001 равен
х •= 0,6507.
Рассмотрим уравнение
х = - Уig"(Jr + 2).
Здесь
ф(х)=- /lg (х +27.
Так как ф @) = — /lgl = — 0,55, ф ( |-) = — V\gT,5= —0,42,
то данное уравнение имеет корень на отрезке [— Vs. 0]. Полагая
хг — 0, находим, что дг8 ~ ф (хц) ж — 0,4397. Итак, с точностью до-
0,0001 имеем х = — 0,4397.
14. Одним из корней уравнения является х = 0. Чтобы найти вто-
второй корень, запишем уравнение в виде х — -^ У In О* ~Ь !)• Для УРав"
нения х •= V In (л- + 1) имеем
Значит, уравиеине имеет корень на отрезке [V*, 1]. Так как ср'(,т) =
' Т° И3 отрезке i4*'
2
Положим хх — 1, тогда xt «ф (*s) ж 0,7469. Итак, с точностью до 0,0001
имеем х =» 0,7469. Уравнение х *~ — У~1п (х + 1) ие имеет корней,
кроме х •=» 0. Итак, д- = 0 или д- •- 0,7469.
15. Перепишем уравнение в виде
*:= УТ^Тпх.
- i
; (i) == 2, ф B) = у 4 — in 2, ф' (х) ~ -
2* ]/4 — Sn х
Так какф A) ^ 2, ф B) =» у' 4 — 1п 2 <^ 2, то уравнение имеет корень
на отрезке [I, 2]. Из рис. 29 видно, что других корней уравнение не
имеет. Полагая хг => 2, получаем
д-.жф^» 1,841.
Итак, с точностью до 0,001 х = 1,841.
16. Запишем уравнение в виде
ж— 2 — in х.
Здесь ф (х) — 2 — In *,ф' (дг) — — _ . Из рис. 30 видно, что корень.
X
уравнения лежит иа отрезке [1, 2]. На этом отрезке |ф'(*I<1-
103
Полагая хг~ 1,5, находим л-13~ф (*iS) ~ 1,557. Итак, х ¦=- 1,557 с
точностью до 0,001.
Рис. 29.
ins
Рис. 30.
U-3-х
17. Из рис. 31 видно, что уравнение имеет лишь один отрицатель-
отрицательный корень. Запишем уравнение в виде
Тогда
ц>(х)
1,54; ф (— 2) = — Y2 +
1,46
\
Значит, корень лежит на отрезке [~ 1, — 2]. Полагая хх = — 1, нахо-
находим лг4 ss ф (л-4) ж — 1,492. Значит, с точностью до 0,001 имеем
х= — 1,492.
18. Ясно, что одним из корней
уравнения является хх = 10. Чтобы
найти второй корень, запишем урав-
уравнение в виде х = 10°'1х. Здесь
Ф (л-) = 10°.1ж,ф'(л-)=0,Ы0°>1х In 10.
Кроме того, ф A) •= 10"-1 > 1, ф B) =
= 10е-2 <[ 2. Поэтому уравнение имеет
корень на отрезке [1, 2]. На этом от-
отрезке
|ф' (х)| < 0, МО".'- -In 10 ж 0,37 < 1.
Теперь можно применить метод после-
последовательных приближений. Полагая
Рис.31. х\ — 2. находим, что х1 х<р {х7) ^
¦Х- 1,372. Итак, с точностью до 0,001
имеем х — 1,372.
19. Из рис. 32 видно, что уравнение имеет по одному корню на
каждом из отрезков
104
причем эти корни лежат в правых половинах отрезков. Чтобы найти
Зя
первый положительный корень, сделаем подстановку х =¦ -тг- — у. Урав-
Уравнение примет вид
( Зя \
откуда, поскольку 0 < у < я, имеем
(/= arcctg |jg ("у-я — г/jj.
Здесь
Ф («/) = arcctg lg i~ я — у) I
Р' (г/) =
— lg e
т—«/
Рис. 32.
На отрезке [О,зх] есть корень нашего
уравнения, причем наэтом отрезке|ф' (у)\ < 1. Применим метод после-
последовательных приближений. Полагая ух = 0, имеем у^ ¦х.ф (//4)~1,059.
Значит, с точностью до 0,001 имеем у = 1,059, а потому х = 3,654.
о
Чтобы найти второй положительный корень, полагаем jr= ~2~я—У-
Уравнение принимает вид
у — arcctg lg [-it-
Полагая уг — 0, получаем yt s^
5^ф((/4) ж 0,876. Значит, с точно-
точностью'до 0,001 у =¦ 0,870 и .г = 6,984.
20. Из рис.33 видно, что урав-
уравнение имеет один корень, лежащий
между 0 и 1. Мы имеем <р (х) =
= 1ог^х. ф' (*)= —-!о"е"ж- На
отрезке [0, 1] выполняется нера-
1
венство | ф' (х) | ^ -щ- , обеспечи-
Рис. 33.
вающее возможность применения
метода последовательных прибли-
приближений. Полагая хх = 0, находим xt даф (л-4) я; 0,091. Значит, с точ-
точностью до 0,0001 имеем х = 0,091.
21. Пусть
f (х) = л-* — 5.v+ 1.
Тогда
/' (л-) = Зх2 — 5, /" (л-) = 6х.
105
По формуле Ньютона имеем
Составим таблицу значений функции:
X
fix)
—3
—11
-2
3
0
1
1
-3
2
j
3
13
Из этой таблицы видно, что уравнение Xs — 5х + 1 = 0 имеет корни на
отрезках [—3, —2], [0,1], [2,3].
Найдем сначала корень, лежащий на отрезке [— 3, — 2]. Так как
на этом отрезке f" (х) <^ 0, то в качестве начального значения берем
Ро = — 3 (так как f (So) = — 11 — отрицательное число). Мы имеем
В , (-ЗР-5 (-3L-1
В- ,
Продолжая вычисления, находим, что C8 ¦» Р4 ¦х. — 2,331. Получаем,
что с точностью до 0,001 корень уравнения иа отрезке [— 3, —2| равен
— 2,331.
Теперь найдем корень, лежащий на отрезке [0, 1]. Здесь мы имеем
f" (х) ^> 0. Поэтому полагаем §о ¦=• 0. Отсюда получаем
= 0—
== 0,2,
= 0,202.
С точностью до 0,001 имеем х ™ 0,202.
Наконец, для нахождения корпя на отрезке [2, 3] полагаем f5« -" 3
и имеем
Pi -З-
2,409.
Продолжая вычисления, находим, что р4 ~ §ь ет 2,128. Поэтому с точ-
точностью до 0,001 корень равен 2,128. Мы нашли три корня: хх— — 2,331;
.г., = 0,202; л-3=- 2,128.
Решим это же уравнение усовершенствованным методом хорд.
На отрезке [— 3, — 2] находим
(-3)
— 14
:— 2,214.
Так как на этом отрезке /" (х) <] 0, то кривая вогнута вниз и мы опреде-
определяем а, по формуле
— 3— (
• 3- / (- 3) ^Z-3Y37
2,214)
~.— 2,293,
106
Далее находим
а3 = — 2,293 — / (— t, 2УЗ) —
•2,293 |-2,214
— 2,293) —/(—2,214)
; — 2,331.
Это совпадает с точностью до 0,001 с ранее найденным значе-
значением х.
Точно так же решаем уравнение иа отрезках [0, 1] и [2, 3].
22. Здесь мы имеем
t (х) == Xs — 9л-2+ 20а-— 11,
f (,v) =¦ За2 — 18а- + 20,
I" (х) — 6л- —18—6 (*—3).
Составим таблицу функции / (а-):
X
](х)
0
— 11
1
1
2
1
3
4
— 11
5
— 11
6
1
Корни уравнения лежат на отрезках [0, 1], [2, 3], [5, 6].
На отрезке [0,1] полагаем ро = 0 и находим, что |34 яь |35 ~ 0,834.
На отрезке [2, 3] полагаем [Зо = 3 и находим, что ?>2 ~ |33 ж 2,216. На
отрезке [5, 6] полагаем (Зг = 0 и находим, что р4 х- рв ж 5,249. Мы на-
нашли (с точностью до 0,001) три корня уравнения
х1 ¦= 0,834; х2 = 2,216; х3 ¦= 5,249.
23. Здесь / (а-) = дл! — Зх2 — Зд- + 11, /' (х) = З.г2 — 6л- — 3,
/" (л-) =» 6л- — 6 = 6 (х — 1). Составим таблицу значений для f (x):
X
fix)
2
-3
-1
10
°
11
1
G
2
1
3
2
Уравнение имеет один действительный корень, лежащий на отрезке
!—2, —1]. Чтобы найти этот корень, полагаем Ро = — 2. Мы получаем,
что р2 :=i р3 ¦х-—1,847. Поэтому с точностью до 0,001 имеем *='
= — 1,847.
24. Здесь / (х) - а-5 + 5а- + 1, /' (л-) = 5л-4 + 5, /" (л-) = 20 х3.
Таблица значений функции / (х):
X
fix)
-1 0
-5 1
1
7
107
Поэтому уравнение имеет один корень на отрезке [— 1, 0]. Полагаем
Ро "¦ — 1- Имеем с точностью до 0,0001 ps»p4 ж — 0,1999. Поэтому с
указанной точностью х ¦=¦ —0,1999.
25. Здесь / (A-)«^siii х-\- х— 1, /' (х) *=¦ cos х-\ 1, /" (х) ¦» — sin ,v.
Таблица значений функции:
о
—1
1
0.8115
2
1,9093
Корень лежит на отрезке [0, 1]. Полагаем Ро — 0 и находим, что
Pa Q Ps = 0,5110, Поэтому с точностью go 0,0001 имеем х = 0,5110.
10
26. Здесь f(*) = *2--101g*--3, f'(x)=2x— x{nlQ , f (x)
10
=2-}- —a in 4() "Таблица значений функции / (x):
X
f(x)
0,5
0,26
1 2
—2 —2,01
1
3
1,23
Корни уравнения лежат на отрезках [0,5, 1] и [2, 3]. На отрезке
[0,5, 1J полагаем ро = 0,5 и получаем, что C2 = рз~ 0,535. Поэтому со-
соответствующий корень с точностью до 0,001 равен 0,535. На отрезке
[2, 3] полагаем ро = 3 и находим р2 ж рз ж 2,705.
Уравнение имеет два корня: хх =• 0,535; х2 = 2,705.
27. В системе а) полагаем л-о = 0, г/о =¦ 0, 2о = 0 и после несколь-
нескольких приближений находим, что с точностью до 0,001 х = 1,021,
у= 2,150, г= 3,072.
В системе б) полагаем хо = 0, г/о = 0 и после нескольких прибли-
приближений получаем (с точностью до 0,001) х = 0,520, у = 0,310.
В системе в) полагаем дго = 0, г/о = 0 и находим, что х = 1,000,
у =¦ 2,000.
JToполярные лекции
ПО МАТЕМАТИКЕ
•.Я.ВИЛЕНКИН
МЕТОЛ
ПОСЛЕДОВАТЕЛЬНЫХ
ПРИБЛИЖЕНИЙ