Text
                    В.А. Ильин, А.В. Куркина
ВЫСШАЯ
МАТЕМАТИКА
УЧЕБНИК
•ПРОСПЕКТ*

Московский государственный университет им. М.В. Ломоносова В.А. Ильин, А.В. Куркина ВЫСШАЯ МАТЕМАТИКА УЧЕБНИК гкомендовано Министерством образования Российской Федерации в качестве учебника для студентов высших учебных заведений, обучающихся по направлениям 521600 «Экономика», 521500 «Менеджмент», 522200 «Статистика», 521000 «Психология», 521200 «Социология», 510600 «Биология», 0800 «География», 510500 «Химия», 511000 «Геология», 510700 «Почвоведение» JU •ПРОСПЕКТ* Москва 2002
УДК 51(075.8) ББК 22.1Я73 И46 Рекомендовано УМО по классическому университетскому образованию в качестве учебника для студентов, обучающихся по специальности «Прикладная математика и информатика» ВЫСШАЯ МАТЕМАТИКА Учебник Авторы: Владимир Александрович Ильин - доктор физ.-мат. наук, профессор, зав. кафедрой МГУ им. М.В. Ломоносова, академик РАН; Анна Владимировна Куркина - канд. физ.-мат. наук, доцент Института стран Азии и Африки при МГУ им. М.В. Ломоносова. Ильин В.А., Куркина А.В. Высшая математика: Учебник. - М.: ООО «ТК Велби», 2002.—592 с. ISBN 5-902171-29-6 Данный учебник полностью охватывает материал, входящий в программу по высшей математике для студентов, обучающихся по всем перечисленным в его грифе специальностям. При изложении материала авторы сделали попытку свести до минимума язык кванторов, заменяя его четкими словесными объяснениями проводимых рассуждений, и внесли ряд методических усовершенствований. Материал этого учебника был апробирован при чтении лекций на социально- экономическом отделении Института стран Азии и Африки при МГУ им. М.В. Ломоносова. Для студентов всех перечисленных специальностей, а также для преподающих высшую математику и использующих ее аппарат. Учебное издание Главный редактор В. X. Педро Редактор Н. В. Андрианова Технический редактор А. В. Болотников Художественный редактор Н. С. Шувалова Ответственный за выпуск М. В. Кулешова Подписано в печать 04.06.2002. Формат 60x90 ’/и. Печать офсетная. Печ. л. 37. Тираж 10 000 экз. Заказ № 0206720. ООО «ТК Велби» 107120, г. Москва, Хлебников пер., д. 7, стр. 2 Отпечатано в полном соответствии с качеством предоставленного оригинал-макета в ОАО «Ярославский полиграфкомбинат» 150049, Ярославль, ул. Свободы, 97. <|| ||7» ISBN 5-902171 -29-6 © В. А. Ильин, А.В. Куркина, 2002 9 785 902 1 7 1 2 9 4
ПРЕДИСЛОВИЕ Данный учебник полностью охватывает материал, входящий в про- грамму по высшей математике для студентов, обучающихся по всем специальностям, указанным в его грифе. При изложении материала авторы сделали попытку свести до ми- нимума язык кванторов, заменяя его четкими словесными объяснения- ми проводимых рассуждений. Вместе с тем они старались везде, где это возможно, продемонстрировать краткость, изящество и логиче- скую безупречность математических рассуждений, избегая описатель- ного изложения изучаемой темы. Внутри каждой из глав авторы старались расположить материал так, чтобы обеспечить возможность закончить изучение данной главы, ограничиваясь только частью излагаемого в ней материала. При написании учебника были использованы некоторые методиче- ские приемы и находки, уже встречавшиеся в учебниках, написанных при участии одного из авторов данного учебника, однако число этих приемов и находок в учебнике существенно пополнено новыми, ранее не встречавшимися в учебной литературе. К разделам учебника, в которые внесены наиболее существенные методические усовершенствования, относятся: компактная глава «Векторная алгебра»; также компактная глава «Основы аналитической геометрии», со- держащая понятия линии и поверхности и законченную теорию линей- ных образов на плоскости и в пространстве и теорию кривых второго порядка; главы «Предел последовательности» и «Непрерывность функции»; изложение вывода формулы Тейлора для функции одной перемен- ной; глава «Неопределенный интеграл» (особенно вторая ее часть, по- священная выяснению классов функций, интегрируемых в элементар- ных функциях); вся глава «Определенный интеграл»; изложение вывода формулы Тейлора и теории безусловного и условного экстремумов для функции нескольких переменных; 3
изложение теории степенных рядов и рядов Фурье; компактная глава «Дифференциальные уравнения», содержащая постановки основных задач для обыкновенных уравнений и уравне- ний в частных производных и фактически полную теорию линейных обыкновенных дифференциальных уравнений первого и второго по- рядков; компактная и вместе с тем достаточно полная по содержанию гла- ва «Основы теории вероятностей»; сверхкомпактная глава, содержащая все основные аспекты теории задач линейного программирования. Весь материал данного учебника может быть прочитан примерно за 136 лекционных часов, а при наличии его у слушателей — и за бо- лее короткое время. Частично материал этого учебника был апробирован одним из ее авторов при чтении лекций на социально-экономическом отделении Института стран Азии и Африки при Московском государственном университете имени М. В. Ломоносова. Авторы надеются, что эта книга, написанная как учебник для сту- дентов, окажется полезной для всех преподающих высшую математи- ку и использующих ее аппарат. Авторы благодарят члена-корреспондента РАН Е. И. Моисеева и профессора А. М. Денисова за отзывы на рукопись этого учебника. Особую благодарность авторы выражают выдающемуся ученому и педагогу академику С. М. Никольскому за очень полезное обсужде- ние задач и методов математического образования. Авторы очень благодарны издательству «Проспект» и в первую очередь Л. В. Рожникову и М. В. Кулешовой, существенно облегчив- шим подготовку рукописи к изданию, а также редактору Н. В. Андриа- новой за ее работу по улучшению текста этой книги. Москва, май 2002 г.
Глава 1 Вещественные числа. Множества вещественных чисел Понятие числа относится к основным понятиям всей математики. Еще в арифметике в процессе счета вводятся натуральные числа 1,2, ..., п,... и операции сложения и умножения этих чисел. Однако для множества одних натуральных чисел оказываются не всегда выполнимыми операции вычитания и деления. Для того чтобы сделать всегда выполнимыми и эти две операции, приходится расши- рить множество натуральных чисел сначала до множества целых чисел (как положительных, так и отрицательных с добавлением числа нуль), а затем до множества рациональных чисел, т. е. чисел, представимых в виде отношения двух целых чисел. Но и рациональных чисел оказывается недостаточно, например, для выполнимости операции извлечения квадратного корня или вычис- ления логарифма. Поэтому множество рациональных чисел приходится расширить до множества всех вещественных (или, как их еще называют, действительных) чисел. Выяснению понятия вещественных чисел и их основных свойств и будет посвящен § 1 настоящей главы. § 1. Вещественные числа 1.1. Рациональные числа и их основные свойства Мы начнем с систематизации уже известных нам из курса элемен- тарной математики свойств рациональных чисел. Напомним, что рациональным называется число, предста- вимое в виде отношения двух целых чисел, причем одно и то же рацио- нальное число представимо в виде отношения различных целых чисел 12 3 (например, ...). Перечислим основные свойства рациональных чисел, вытекающие из соответствующих свойств целых чисел. Фундаментальную роль среди этих свойств играют три правила: правило сравнения и правила образования суммы и произведения. 5
I. Любые два рациональных числа а и b связаны одним и только одним из трех знаков >, < или =, причем если а> Ь, то b < а. Иными словами, существует правило, позволяющее установить, каким из указанных трех знаков связаны два данных рациональных числа. Это правило называется правилом сравнения1. II. Существует правило2, посредством которого любым двум ра- циональным числам а и b ставится в соответствие определенное ра- циональное число с, называемое их су мм о и и обозначаемое симво- лом с = а + Ь. Операция нахождения суммы называется сложением. III. Существует правило3, посредством которого любым двум ра- циональным числам а и b ставится в соответствие определенное ра- циональное число с\, называемое их произведением и обозна- чаемое символом с\ = а • Ь. Операция нахождения произведения называется умножением. Правило сравнения рациональных чисел обладает следующим свойством: 1°. Из a>bub>c вытекает, что а > с (свойство транзитивности знака >У,иза = Ьи b = с вытекает, что а = с (свойство транзитивно- сти знака = ). Правило сложения рациональных чисел обладает следующими че- тырьмя свойствами: 2°. а + b = b + а (переместительное свойство). 3°. (а + Ь) + с = а + (Ь + с) (сочетательное свойство). 4°. Существует рациональное число 0 такое, что а + 0 = а для лю- бого рационального числа а (особая роль нуля). ’Правило сравнения двух рациональных чисел формулируется следующим - L т2 образом: два неотрицательных рациональных числа а = — и b = — связаны тем же знаком, что и два целых числа т\ • п2 и т2 • т; два неположительных рациональных числа а и b связаны тем же знаком, что и два неотрицательных рациональных числа |Ь| и |а|; если а — неотрицательное, а b — отрицательное рациональное число, то а > Ь. 2 Правило образования суммы двух рациональных чисел а = — и Ь = — , т. т, т. • п, + т, • п. Ц Jh определяется с помощью формулы —!• + —£ = —в—±£—L, получающейся посредством приведения складываемых рациональных дробей к общему знаменателю. з „ - т. . т. Правило образования произведения двух рациональных чисел а = — и b = — , т. т, т. • т, п. п, определяется посредством формулы ——2- = —!—\ 4 ц % Ц-Лз 6
5°. Для каждого рационального числа а существует противопо- ложное ему рациональное число а' такое, что а + а' = 0. Правило умножения рациональных чисел обладает следующими четырьмя свойствами: 6°. а • b = b • а (переместительное свойство). 7°. {а • Ь) • с = а • (Ь • с) (сочетательное свойство). 8°. Существует рациональное число 1 такое, что а - 1 = а для лю- бого рационального числа а (особая роль единицы). 9°. Для каждого рационального числа а, отличного от нуля, суще- ствует обратное ему рациональное число а' такое, что а-а'= 1. Правила сложения и умножения связаны следующим свойством: 10°. (а + Ь}с = а • с + b • с (распределительное свойство умножения относительно суммы). Следующие два свойства связывают знак > со знаками сложения и умножения: 11°. Из а> b вытекает, что а + с > b + с. 12°. Из а > Ь и с > 0 вытекает, что а • с>Ь • с. Особая роль принадлежит последнему совйству, часто называемо- му аксиомой Архимеда: 13°. Каково бы ни было рациональное число а, можно число 1 по- вторить слагаемым столько раз, что полученная сумма превзойдет а. Перечисленные 13 свойств обычно называют основными свойствами рациональных чисел, ибо все другие алгебраические свойства этих чисел, относящиеся к арифметическим действиям и к сочетанию равенств и неравенств, являются следствиями этих основ- ных свойств. В частности, из этих свойств вытекает используемое в дальнейшем свойство, позволяющее почленно складывать неравенства одного зна- ка: если а> b и с> d, то а + с> b + d. Действительно, из неравенства а >Ь и из свойства 11° вытекает, что а + с > b + с, из неравенства с > d и из свойств 11° и 2° вытекает, что b + с> b + d, а из неравенств а + с> Ь + с и Ь + с> b + d и из свойства 1° вытекает, что а + с > b + d. 1.2. Вещественные числа и правило их сравнения Для расширения множества рациональных чисел рассмотрим мно- жество всевозможных бесконечных десятичных дробей. Числа, пред- ставимые этими дробями, будем называть вещественными (или действительными). Данное вещественное число мы будем называть положительным (соответственно отрицательным), если оно представимо в виде поло- 7
жительной (соответственно в виде отрицательной) бесконечной деся- тичной дроби. В состав множества вещественных чисел входят, конечно, и все ра- циональные числа, ибо все они представимы в виде бесконечных деся- тичных дробей. Для того чтобы обосновать это, достаточно рассмот- реть произвольное неотрицательное рациональное число вида —. Поделив числитель т на знаменатель п «столбиком», мы и no- ri лучим представление рационального числа — в виде бесконечной деся- п 4 тичной дроби. Так, для рационального числа —, поделив 4 на 3 «стол- биком», получим: _4 3_____ _3_ 1,333... _10 9 10 9 • _Ю _____9 10 Таким образом, рациональное число — представимо в виде беско- нечной десятичной дроби 1,333... . Заметим теперь, что для рационального числа, представимого ко- нечной десятичной дробью (например, для числа ^ = 0,5), возмож- но двоякое представление в виде бесконечной десятичной дроби. Так, для числа -, поделив 1 на 2 «столбиком», мы получим как раз число 0,5, и дописыванием нулей в последующих десятичных знаках мы получим бесконечную десятичную дробь 0,5000... . Однако это же рациональное число - представимо и в виде другой 2 бесконечной десятичной дроби 0,4999... . Такая же ситуация имеет место для любого рационального числа, представимого конечной десятичной дробью а», а\ аг ... ап, у которой а„*0. 8
При делении целого числа а0 at а2 ... ап на целое число 10" «стол- биком» мы получим как раз число ао, сц а2 ... ап, которое дописывани- ем нулей в последующих десятичных знаках превращается в бесконеч- ную десятичную дробь а0, а\ а2 ... а„000 .... Это же рациональное число ао, а\ а2 ... ап представимо и в виде другой бесконечной десятичной дроби ао, ai а2 ... ап-\(ап - 1) 999 ..., ко- торая не может быть получена посредством деления «столбиком». Для упрощения формулировки правила сравнения вещественных чисел договоримся при сравнении вещественных чисел не пользовать- ся вторым (заканчивающимся бесконечным числом девяток) представ- лением указанных рациональных чисел в виде бесконечных десяти- чных дробей. Теперь, договорившись называть иррациональными ве- щественные числа, не являющиеся рациональными, перейдем к форму- лировке правила сравнения двух произвольных веществен- ных чисел. Рассмотрим два произвольных вещественных числа а и Ь. Предпо- ложим, что эти числа представимы следующими бесконечными деся- тичными дробями: а = ± ао, а\ а2... ап ..., (1.1) b = ± Ьо, Ь\ Ь2... Ьп ..., (1-2) причем в каждом из представлений (1.1) и (1.2) из двух знаков ± бе- рется какой-то один. Два вещественных числа (1.1) и (1.2) называются равными, если они имеют одинаковые знаки и если справедлива бесконечная це- почка равенств ао = bo, ai = bj, а2 = Ь2, ..., ап = Ь„, ... . (1.3) Пусть даны два неравных вещественных числа а и Ь. Устано- вим правило, позволяющее заключить, каким из двух знаков > или < связаны эти два числа. 1. Пусть сначала оба числа а и Ь неотр иц ате л ьны и име- ют следующие представления: а = ао, ai а2 ... ап ..., Ь = Ьо, Ь\ Ь2... Ьп... . Так как числа а и Ь не равны, то нарушается хотя бы одно из равенств Цепочки (1.3). Обозначим через к наименьший из номеров п, Для которых нарушается равенство ап = Ьп, т. е. предположим, что «о = Ьо, а\-Ь\, ..., ak-i = Ьк-ъ но ак*Ък. Тогда мы будем считать, что а>Ь, если ак> Ьк, и а < Ь, если йк < Ьк. 9
2. Если одно из чисел а и b неотрицательно, а другое отрицательно, то мы естественно будем считать, что неот- рицательное число больше отрицательного. 3. Остается рассмотреть случай, когда оба числа а и b от- рицательны. Договоримся называть модулем (или абсолютной ве- личиной) вещественного числа а неотрицательное вещественное число, обозначаемое символом |а| и представимое той же бесконечной десятичной дробью, что и число а, но всегда взятой со знаком +. Если оба числа а и b отрицательны, то мы будем счи- тать, что а> Ь, если |6| > |а|, и а < Ь, если |Z>| < |а|. Заметим, что в применении к двум рациональным числам сформу- лированное нами правило сравнения вещественных чисел приводит к тому же результату, что и правило сравнения рациональных чисел, сформулированное в 1-й сноске разд. 1.1 L Убедимся теперь в том, что установленное нами правило сравне- ния вещественных чисел обладает свойством транзитивности знаков > и =, т. е. свойством 1°, сформулированным в разд. 1.1 для рациональ- ных чисел. Свойство транзитивности знака =, заключающееся в том, что для любых трех вещественных чисел а, Ь и с из равенств а = b, b = с вытекает равенство а = с, сразу следует из определения равенства вещественных чисел и из справедливости этого свойства для целых чисел. Установим справедливость свойства транзитивности знака >. Дока- жем, что для любых трех вещественных чисел а, b и с из неравенств а> Ь, Ь> с вытекает неравенство а> с. Рассмотрим отдельно три возможных случая. 1. Пусть сначала с > 0. Тогда из того, что а> b и Ь> с, и из прави- ла сравнения вещественных чисел вытекает, что b > 0 и а > 0. Пусть а = ао, Д1Д2... ап ..., b = b$, b\b2... bn .... с = со, с\с2... сп ... . Обозначим через Наименьший из номеров п, для которого нарушается ра- венство ап = Ьп, т. е. положим, что ао = Ьо, а\ = Ь\, ... а^\ = ^-ь я* > и 1 Это вытекает из того, что бесконечные десятичные дроби, представляющие два т. ГП.-П. т? п.-пц неотрицательных рациональных числа — = —1—- и — = ~£ и получающиеся Л, Ц-Лз «2 Ц.Лз посредством деления «столбиком» каждого из чисел т\ • п2 и п\ • т2 на одно и то же число п\ • л2> очевидно, связаны тем же знаком >, < или «, что и два числа т\п2 и Л1/И2, тл. т, т. е. тем же знаком, что и два числа — и —. 10
обозначим черезр наименьший из номеров п, для которого на- рушается равенство Ьп = сп, т. е. положим bo = CQ, b\ = с\, ..., Ьр_\ =Ср_ь Ьр > ср. Тогда, если обозначить через т наименьший из двух номеров к и р, то будут справедливы соотношения а^~с^ а\ = с\, ..., ат_\ = cm-j, ат > ст, из которых вытекает, что а > с. 2. Пусть теперь с < 0, а > 0. Тогда неравенство а > с будет справед- ливо при любом Ь. 3. Пусть, наконец, все три числа а, ^неотрицательны. Так как а > b и b > с, то |Z>| >|а|, |с| >|Z>|, и (в силу уже рассмотренного случая трех неотрицательных чисел) |с| >|а|, а это и означает, что а > с. Свойство транзитивности знаков = и > полностью доказано. В следующем разделе, опираясь только на правило сравнения ве- щественных чисел и свойство транзитивности знаков = и >, мы дока- жем фундаментальную теорему 1, используемую в дальнейшем для установления многих основных теорем математического анализа. 1.3. Множества вещественных чисел, ограниченные сверху или снизу __ Рассмотрим произвольное множество вещественных чисел, которое мы будем обозначать символом {х}. Отдельные числа х, входящие в состав этого множества, мы будем называть его элементами. При этом мы будем считать, что множество {х} не является пустым, т. е. содержит хотя бы один элемент. Определение 1. Множество вещественных чисел {х} называется ограниченным с в е р ху (соответственно снизу), если су- ществует вещественное число М (соответственно вещественное чис- ло т), обеспечивающее справедливость для всех его элементов х нера- венства х<М (соответственно х>т). При этом число М (соответственно число т) называется верх- ней гранью (соответственно нижней гранью) множества {х}. Заметим, что любое ограниченное сверху множество {х} имеет бесконечно много верхних граней. Действительно, если М— одна из верхних граней этого множества, то и любое число М*, большее М, является его верхней гранью. Аналогичное замечание можно сделать в отношении нижних граней ограниченного снизу множества {х}. Так, например, множество {х} всех отрицательных вещественных чисел х ограничено сверху. В качестве верхней грани М этого множе- ства можно взять любое неотрицательное вещественное число. 11
Множество всех положительных целых чисел 1, 2, 3, ... ограничено снизу. В качестве его нижней грани можно взять любое веществен- ное число т, удовлетворяющее неравенству т < 1. Естественно возникает вопрос о существовании наименьшей верхней грани ограниченного сверху множества и о существовании наибольшей нижней грани ограниченного снизу множества. Определение 2. То число х, которое является наименьшей из всех верхних граней ограниченного сверху множества {х}, называется точной верхней гранью этого множества и обозначает- ся символом* х = sup {х}. То число х, которое является наибольшей из всех нижних граней ограниченного снизу множества {х}, называется точной нижней гранью этого множества и обозначается символом1 2 х = inf {х}. Определение 2 можно сформулировать и в другой эквивалентной форме. Определение 2*. Число х (соответственно число х) называется точной верхней (соответственно точной нижней) гранью ограниченного сверху (соответственно снизу) множества {х}, если выполнены следующие два требования'. 1) каждый элемент х множества {х} удовлетворяет неравенству х<х (соответственно х > х), 2) каково бы ни было вещественное число х\ меньшее х (соот- ветственно большее х), найдется хотя бы один элемент х множества {х}, удовлетворяющий неравенству х>х' (соответственно х<х^). В этом определении требование 1 означает, что число х (соответст- венно число х) является одной из верхних (соответственно нижних) граней множества {х}, а требование 2 говорит о том, что эта грань яв- ляется наименьшей (соответственно наибольшей) и уме- ньшена (соответственно увеличена) быть не может. Заметим, что у рассмотренного выше множества {х} всех отрица- тельных вещественных чисел х существует точная верхняя грань х = О, причем это число х = 0 н е принадлежит множеству {х}, а у рассмотренного выше множества всех положительных целых чисел 1, 2, 3, ... существует точная нижняя грань х=1, причем число х=1 принадлежит указанному множеству и является его наи- меньшим элементом. Таким образом, точная верхняя (соот- ветственно точная нижняя) грань множества {х} может как принадле- жать, так и не принадлежать множеству {х}. 1 sup — первые три буквы латинского слова «supremum» («супремум»), которое переводится как «наивысшее». 2 inf—первые три буквы латинского слова «infimum» («инфимум»), которое переводится как «наинизшее». 12
Вопрос же о существовании у любого ограниченного сверху (соот- ветственно снизу) множества точной верхней (соответственно точной нижней) грани не является очевидным и требует строгого математиче- ского обоснования. Теорема 1. Если множество вещественных чисел {х} имеет хотя бы один элемент и является ограниченным сверху (соответственно снизу), то существует вещественное число х (соответственно х), ко- торое является точной верхней (соответственно точной нижней) гранью этого множества. Доказательство. Мы проведем доказательство существо- вания только точной верхней грани у ограниченного сверху множест- ва, ибо существование точной нижней грани у ограниченного снизу множества доказывается аналогично. Итак, пусть множество {х} содержит хотя бы один элемент и огра- ничено сверху. Тогда в силу определения 1 найдется вещественное число М такое, что каждый элемент х множества {х} удовлетворяет неравенству х<М. (1.4) Могут представиться два случая: 1°. Среди элементов множества {х} есть хотя бы одно неотрицательное вещественное число. 2°. Все элементы множества {х} являются отрицательными вещественными числами. Эти два случая мы рассмотрим отдельно. 1°. Рассмотрим лишь те элементы х множества {х}, которые явля- ются неотрицательными вещественными числами, и каждое из этих чисел х представим в виде бесконечной десятичной , дроби х = хо, Х|Х2.._гл.. . В силу неравенства (1.4) и правила сравнения вещест- венных чисел все целые части х0 указанных чисел удовлетворяют не- равенству хй<М, а потому найдется наибольшая из этих целых частей, которую мы обозначим через хо- Сохраним среди элементов множества {х} только те неотрицатель- ные числа, у которых целая часть равна х0, а все остальные элементы отбросим. У сохраненных элементов рассмотрим первые десятичные знаки Х| после запятой. Наибольший из этих знаков обозначим через jq. Сохраним далее среди элементов множества {х} только те неотри- цательные числа, у которых целая часть равна хо, а первый десяти- чный знак равен х\; все остальные элементы отбросим. У сохраненных элементов рассмотрим вторые десятичные знаки Х2 после запятой и обозначим наибольший из этих знаков, через хг- 13
Продолжая аналогичные рассуждения далее, мы последовательно определим все десятичные знаки некоторого вещественного числа х, имеющего вид X = Х0, Х\Х2 ...хп... . Докажем, что это вещественное число х и является точной верхней гранью множества {х}. Для этого в силу определения 2* достаточно доказать два утверждения: 1) что каждый элемент х множества {х} удовлетворяет неравенству х < х, 2) что, каково бы ни было веществен- ное число х', меньшее х, найдется хотя бы один элемент х множества {х}, удовлетворяющий неравенству х>х'. Сначала докажем утверждение 1. Так как число х неотрицательно, то любой элемент х множества {х}, который является отрицательным вещественным числом, заведомо удовлетворяет неравенству х < х и тем более неравенству х < х. Рас- смотрим теперь любой элемент х множества {х}, являющийся неотри- цательным вещественным числом, и представим этот элемент в виде бесконечной десятичной дроби х =х0, х\х2... хп ... . Предположим, что этот элемент не удовлетворяет доказываемому неравенству х < х. Тогда х > х, и по правилу сравнения вещественных чисел найдется такой номер к, что справедливы соотношения х0 = х0, xi=xb ..., ...,Xjt_j = xjt-i, xk > xk. Эти соотношения противоречат тому, что по по- строению числа х число Xk является наибольшим изЛ-х знаков после запятой х^ тех элементов множества, у которых целая часть рав- на х0, первый десятичный знак равен xj, ..., (Л-1)-й десятичный знак равен хм. Полученное противоречие доказывает ошибочность предположе- ния о том, что х > х, т. е. доказывает справедливость неравенства х < х. Тем самым утверждение 1 доказано. Докажем теперь утверждение 2. Пусть х' — произвольное вещест- венное число, меньшее х. Если число х' является отрицатель- н ы м, то неравенству х > х' удовлетворяет элемент х, являющийся не- отрицательным вещественным числом. Если же х' является произвольным неотрицательным веществен- ным числом, меньшим х, то в силу правила сравнения вещественных чисел найдется такой номер к, что будут справедливы соотношения х'о = х0, Х|'=Х1, х'к_} =хА_|, х'к <хк. (1.5) С другой стороны, число х мы построили так, что среди элементов 14
множества {х} найдется неотрицательное вещественное число х -xq,x\X2 ...хп..., у которого целая часть х0 и любое число к десяти- чных знаков Х|, ха, Хк те же, что и у числа х, т. е. справедливы соот- ношения *0 =*0, *1 = *Ь ...» Xt-I =xt-l, = (1.6) Из сопоставления (1.5) и (1.6) вытекают соотношения Хо=х'о, Х\ = х', ..., Хк-\ = х[ч, хк>х'к. (1.7) Из соотношений (1.7) и из правила сравнения вещественных чисел вытекает, что х > х'. Утверждение 2 полностью доказано, и для случая 1° существова- ние точной верхней грани установлено. 2°. Аналогично доказывается существование точной верхней грани и в случае, когда все элементы множества {х} являются отрицательны- ми вещественными числами. В этом случае все элементы множества {х} мы представим в виде отрицательных бесконечных десятичных дробей и обозначим через х0 наименьшую из целых частей этих дробей, через Xi — наи- меньший из первых десятичных знаков тех из этих дробей, у ко- торых целая часть равна хо, через хз — наименьший из вторых десятичных знаков тех из этих дробей, у которых целая часть равна хо, а первый десятичный знак равен хь и т. д. Таким путем мы последова- тельно определим все десятичные знаки отрицательного вещественно- го числа X =-Х0, Х[Х2 ... хп... . В полной аналогии со случаем 1° доказывается, что это число х яв- ляется точной верхней гранью множества {х}, т. е. удовлетворяет тре- бованиям 1 и 2, сформулированным при рассмотрении случая 1°. Теорема 1 доказана. В заключение заметим, что множество вещественных чисел {х} называется ограниченным с обеих сторон или про- сто ограниченным, если оно ограничено и сверху, и снизу, т. е. если существуют вещественные числа т и М, обеспечивающие спра- ведливость неравенства т<х<М для всех элементов х этого мно- жества. Из теоремы 1 вытекает, что у всякого непустого ограниченного множества {х} существуют точная нижняя и точная верхняя грани. 15
1.4. Приближение вещественного числа рациональными числами Утверждение 1. Для любого номера п и для произвольного вещественного числа а найдутся два рациональных числа он и аг та- кие, что а, < а <а, и а, -а, =—. 2 2 1 10" Доказательство. Мы можем ограничиться случаем не- отрицательного вещественного числа а, ибо случай неполо- жительного вещественного числа сводится к указанному случаю по- средством перехода к модулям. Представим число а бесконечной деся- тичной дробью а = а0, 01^2 ... ап ... . Фиксировав произвольный номер п и оборвав указанную бесконечную десятичную дробь на и-м знаке по- сле запятой, мы получим рациональное число ai = «о, а\аг ... ап. Прибавляя к этому рациональному числу рациональное число 1 сг мы получим другое рациональное число аг = я0, «1^2 ... +-. Ясно, 10" 1 о что а 2 - а! = С помощью правила сравнения вещественных чисел легко проверить, что a1<a<a2I. Утверждение 1 доказано. На практике всегда имеют дело с приближенным значением веще- ственного числа, заменяя его рациональным числом с требуемой сте- пенью точности. Утверждение 2. Каковы бы ни были два вещественных числа а и b такие, что а< Ь, найдется рациональное число у, заклю- ченное между ними, т, е, такое, что а <у < b (а потому найдется и бесконечное множество различных рациональных чисел, заклю- ченных между а и Ь). Доказательство. Очевидно, достаточно рассмотреть слу- чай, когда оба числа аийнеотрицательны, ибо случай, когда оба числа а и b неположительны, сводится к указанному слу- чаю посредством перехода к модулям, а случай, когда а отрица- тельно, а b положительно, тривиален (в качестве у можно взять число нуль). 1 Действительно, так как ai = aQ, aia2... ап ООО ..., а у бесконечной десятичной дроби а - aQ, а\а2 ... anan+i — все десятичные знаки ая+ь ап+2— неотрицательные целые числа, то cq £ а. Число а2 может быть записано в виде аг = ао, «1... ап^(ап + 1) в случае ап < 9, в виде а2 = а0, а\ ..* пя-2(ая-1 + 1) в случае ап = 9, ап_\ < 9, в виде а2 = а0, а\ ... art-3((2n-2 + 1) в случае ап - ап_\ = 9, а^2 < 9,..., в виде a2 = a0 + 1 в случае ^я-ая_1в ... =Я1 = 9. Во всех случаях a<a2. / ' 16
Итак, пусть а > О, b > а, а-а§, ащг ... ап ..., b = bo, b\bi... b„ ... . По правилу сравнения вещественных чисел найдется номер к та- кой, что ao = bo, at -Ъ\, ..., а*-1 = ^*-ь ак<Ьк. По принятой в разд. 1.2 договоренности все десятичные знаки ап при п>к не могут быть рав- ны 9. Пустьр — наименьший из номеров п, превосходящих к, для которого ап < 9, т. е. пусть а имеет вид а = а0, а(а2 ... а*99 ... 9ар ..., где ар < 9. Тогда из правила сравнения вещественных чисел вытекает, что рациональное число у = ао, а\аг ... ак99 ... 9 (ар +1) удовлетворяет неравенствам а < у < Ь. Утверждение 2 доказано. 1.5. Операции сложения и умножения и свойства вещественных чисел Важнейшим вопросом теории вещественных чисел является вопрос об определении операций сложения и умножения этих чисел и о свой- ствах этих операций. Начнем с определения операции сложения вещественных чисел. Хорошо известно, как складывают два вещественных числа а и b на практике: их заменяют с требуемой степенью точности рациональны- ми числами и за приближенное значение их суммы (а + Ь) берут сум- му указанных рациональных чисел. При этом совершенно не заботятся о том, с какой стороны (по недостатку или по избытку) взятые рацио- нальные числа приближают данные вещественные числа а и Ь. Факти- чески указанный практический способ сложения вещественных чисел предполагает, что чем точнее рациональные числа аир приближают (с любой стороны) вещественные числа а и b соответственно, тем точ- нее сумма а + Р приближает то вещественное число, которое должно являться суммой вещественных чисел а и Ь. Желание оправдать указанный практический способ сложения ве- щественных чисел естественно приводит к следующему определению суммы вещественных чисел. С у м м о й вещественных чисел а и b называется такое вещест- венное число х, которое удовлетворяет неравенствам а, +Р] <х<а2 +Р2, (1.8) для любых рациональных чисел аь а2, Pi и р2, удовлетворяющих нера- венствам а1 а ^а2, Р! 6^Р2. (1.9) Оказывается, что такое вещественное число х существует, и при- том только одно. Можно убедиться в том, что таким числом х явля- 17
ется точная верхняя грань множества {ос j +PJ сумм всех рациональ- ных чисел ai и а2, удовлетворяющих левым неравенствам (1.9), т. е. неравенствам1 а}<а, Pj < b. Действительно, фиксируем произвольные рациональные числа аз и Рг, удовлетворяющие правым неравенствам (1.9), т. е. неравенствам а<а2, b <р2, и рассмотрим всевозможные рациональные числа ai и рь удовлетворяющие левым неравенствам (1.9), т. е. неравенствам а, <а, р1 <Ь. Из свойства транзитивности знаков > и = (см. разд. 1.2) вытекает, что a(£a2, р, < р2. Так как для рациональных чисел неравенства одного знака можно складывать почленно2, то справедливо неравенство aj + Р, £ а2 + р2, которое позволяет утверждать, что множество всех сумм {aj + pJ ограничено сверху и число (а2+р2) является одной из верхних граней этого множества. По теореме 1 у множества {aj + pJ существует точная верхняя грань, которую мы обозначим через х. Убедимся в том, что это число х и является суммой вещественных чисел а и т.е. удовлетворяет неравенствам (1.8). Действительно, справедливость левого неравенства (1.8) вытекает из того, что любой элемент множества {a2 + pj не превосходит верхней грани х этого множества, а справедливость правого неравенства (1.8) вытекает из того, что число (а2 + р2) является одной из верхних граней множества {a, + Pj}, а х является точной (т. е. наименьшей) верхней гранью этого множества. Существование суммы вещественных чисел а и b установлено. Для доказательства того, что существует только одно вещественное число, являющееся суммой вещественных чисел а утверждения 1 из разд. 1.4 для любого удовлетворяющие неравенствам (1.9) рациональные которых а2 -а( =^, ₽2 -₽1 и потому и Ь, заметим, что в силу номера п существуют числа aj, аг, pi и р2, для 7 (а2 + р2)-(а,+ ₽.) = —. 0-1°) Предположим теперь, что существуют два не равных друг другу вещественных числа jq и х2, являющихся суммой вещественных чисел а и Ь. Так как Х| *х2, то мы можем считать, что Xj <х2. Поскольку каждое из чисел Х| и х2 при подстановке на место х удовлетворяет неравенствам (1.8), то справедливы неравенства a, + pj <л;<х2 £а2 + р2. (1.11) С другой стороны, из того, что *1<х2, и из утверждения 2 разд. 1.4 вытекает, что существуют рациональные числа yj и у2 такие, что <Ув <У2 <х2- О-12) 1 Аналогично можно было бы убедиться в том, что таким числом х является точная нижняя грань множества {а2+р2} сумм всех рациональных чисел а2 и р2, удовлетворяющих правым неравенствам (1.9), т. е. неравенствам a^a2, &^Р2. 2 Это установлено в самом конце разд. 1.1. 18
Из сопоставления неравенств (1.11) и (1.12) вытекают неравенства ai + Pi < Yi <Y2 < а2 + Р2» следствием которых является заведомо неверное неравенство (a2 + P2)”(a]+P])>Y2~Yp в левой части которого (в силу равенства (1.10)) 2 - стоит число — с как угодно большим номером л, а в правой части — фиксированное положительное рациональное число у2 —yi- Полученное противоречие доказывает ошибочность предположения о том, что xi^x2, т. е. доказывает, что jq » х2. Убедимся теперь в том, что в применении к двум рациональным числам а и b сформулированное нами определение суммы веществен- ных чисел приводит к тому же результату, что и определение суммы рациональных чисел, сформулированное в разд. 1.1 (см. 2-ю сноску это- го раздела). Действительно, если а и b — два рациональных числа, а + b — их сумма по определению суммы рациональных чисел, а аь а2, Pi и р2 —любые рациональные числа, удовлетворяющие неравенствам (1.9), то, поскольку для рациональных чисел неравенства одного знака можно складывать почленно1, будут справедливы неравенства a1+P1<a+fe<a2+P2. Таким образом, рациональное число х = а + b является тем единственным вещественным числом, которое удовлетво- ряет неравенствам (1.8), т. е. является суммой чисел а и b по определе- нию суммы вещественных чисел. ' Вопросы, связанные с определением произведения вещественных чисел, в основном аналогичны вопросам, связанным с определением суммы вещественных чисел. Поэтому мы ограничимся краткими фор- мулировками. Произведением положительных вещест- венных чисел а и b называется вещественное число х, удовлет- воряющее неравенствам а1*Р1<х<а2*Р2 для любых положите- льных рациональных чисел аь а2, Pi и р2, удовлетворяющих нера- венствам (1.9). Точно так же, как и для суммы, устанавливается, что такое число х существует, и притом только одно. Нетрудно проверить, что таким числом х является точная верхняя грань множества {at -PJ произведе- ний всех рациональных чисел oq и рь удовлетворяющих неравенствам 0<a,<a, 0<Pj < Ъ. 1 Это установлено в конце разд. 1.1. 19
Произведение вещественных чисел любого знака определя- ется по следующему правилу: 1) 2) считают, что а • 0 = 0 • а = О, считают, что а- | а| • 16|, если числа а и Ь одного знака, -| а| • | , если числа а и Ь разных знаков. Точно так же, как для суммы, можно доказать, что в применении к двум рациональным числам определение произведения вещественных чисел приводит к тому же результату, что и определение произведе- ния рациональных чисел, сформулированное в разд. 1.1 (см. 3-ю сноску этого раздела). Теперь мы имеем возможность убедиться в том, что для вещест- венных чисел остаются справедливыми 13 основных свойств, сформулированных в разд. 1.1 для рациональных чисел. Формулировка этих свойств для вещественных чисел остается такой же, как для рациональных чисел, с заменой термина «рациональное число» на «вещественное число». Справедливость для вещественных чисел свойства 1° (транзитивно- сти знаков = и >) уже установлена в разд. 1.2. Справедливость для вещественных чисел, относящихся к поня- тию суммы свойств 2° — 5°, сразу вытекает из определения суммы вещественных чисел и из справедливости этих свойств для рациона- льных чисел. Так, например, справедливость свойства 2° вытекает из того, что если а и b — два произвольных вещественных числа и если at, а2, Pi и р2 — произвольные рациональные числа, удовлетво- ряющие неравенствам (1.9), то по определению суммы числа а + Ь и b + а являются единственными вещественными числами, удовлетворя- ющими неравенствам а1+Р1<а + 6^а2+Р2, р1+а1<6 + а<Р2+а2 и из равенств оц+Р^Р^ар а2+Р2=Р2+а2 вытекает, что а + b = Ь + а. Отметим лишь, что число нуль представляется бесконечной деся- тичной дробью 0,000 ..., а число а', противоположное числу а, опреде- ляется той же бесконечной десятичной дробью, что и а, но взятой с противоположным знаком. Аналогично справедливость для вещественных чисел относящихся к понятию произведения свойств 6° — 9° и распределительного свойст- ва произведения относительно суммы 10° сразу вытекает из определе- ний произведения и суммы и из справедливости этих свойств для ра- циональных чисел. 20
Отметим лишь, что число а', обратное числу а > 0, является точной 1 верхней гранью множества a2J взятого для всех рациональных чи- сел аг, удовлетворяющих неравенству аг>а. Заметим, что вопрос овычитании вещественных чисел как о действии, обратном сложению, однозначно решается при помощи свойств 2°—5°. Назовем разностью вещественных чисел а и b вещественное число с такое, что с + b = а. Проверим, что разностью вещественных чисел а и b является ве- щественное число с, равное с = а + Ь', где Ь' — вещественное число, противоположное Ь. Действительно, в силу свойств 2°—5° получим, что с + b = (а + 6 х) + b — а + (Ь + Ь") — а + 0 = а. Убедимся в том, что существует только одно вещественное число, являющееся разностью двух данных вещественных чисел а и Ь. Действительно, предположив, что, кроме указанного числа с = а + Ь', существует еще одно вещественное число d такое, что d+b = а, мы по- лучим, используя свойства 2°—5°, что, с одной стороны, (d + b) + Ь' = а + Ь' = с, а с другой стороны, (d + b) + b' = d + (b + Ь') = = d + 0 = d, т. е. d = с. Из определения разности и из свойства 5° вытекает, что число а', противоположное числу а, равно разности вещественных чисел 0 и а. Свойства 6°—9° позволяют заключить, что для произвольных двух вещественных чисел а и Ь, второе из которых отлично от нуля, суще- ствует единственное число с, удовлетворяющее условию с • b = а и на- зываемое частным чисел а и Ь. Из свойства 9° вытекает, что чис- ло а', обратное числу а, равно частному вещественных чисел 1 и а. Справедливость для вещественных чисел свойств 11° и 12°, уста- навливающих связь операций сложения или умножения с операцией сравнения, устанавливается стереотипно, и мы остановимся только на обосновании свойства 11°: для любых вещественных чисел а, b и с из неравенства а> b вытекает неравенство а + с> b + с. Из неравенства а > b (в силу утверждения 2 из разд. 1.4) вытекает су- ществование рациональных чисел ai и 0г таких, что a>a1>02>6, так что разность а, -02 является положительным рациональным числом. В силу утверждения 1 из разд. 1.4 для вещественного числа с и для любого номера п найдутся рациональные числа yi и уг такие, что 21
у, < c< y2 и y2 ”Yi = и’ ПОСКОЛЬКУ ai -Рг лля достаточно бо- льших номеров п, то существуют рациональные числа у, и уг такие, что Y2-Y.<a|-₽2- (1ЛЗ) Взяв теперь произвольные рациональные числа аз и Pi, удовлетво- ряющие неравенствам а2 > а, Ь> рр мы получим (в силу определения суммы), что вещественные числа а + с и b + с должны удовлетворять неравенствам a2 + у2 > а + с> a j + ур Р2 + у2 > b + c> Р, + уг Из последних неравенств следует, что для доказательства неравен- ства а + с> b + с в силу свойства 1° транзитивности знака > достаточ- но доказать, что aI4-y1>P2-f-y2, а это неравенство эквивалентно (1.13). Для доказательства справедливости последнего свойства 13° до- статочно рассмотреть случай произвольного положительно- г о вещественного числа а = aQ) а\а2 ... и учесть, что, повторив чис- ло 1 слагаемым (д0 + 1) раз, мы получим целое число (a0 + 1), которое по правилу сравнения вещественных чисел будет превосходить число а = До» ••• • Таким образом, на случай вещественных чисел переносятся все 13 основных свойств, сформулированных в разд. 1.1 для рациональных чи- сел. Следовательно, для вещественных чисел справедливы все правила алгебры, относящиеся к арифметическим действиям и к сочетанию равенств и неравенств. Заключительные замечания. Нам удалось расширить множество рациональных чисел до более широкого множества вещест- венных чисел, для элементов которого остались справедливыми прави- ла сравнения, сложения и умножения и 13 основных свойств. Оказывается, что множество вещественных чисел уже нельзя рас- ширить до более широкого множества, в котором остались бы спра- ведливыми правила сравнения, сложения и умножения и 13 основных свойств, т. е. множество вещественных чисел уже является полным от- носительно трех указанных правил и 13 основных свойств. Полным логическим завершением теории вещественных чисел яв- ляется аксиоматический метод введения этих чисел, при котором ве- щественные числа вводятся как объекты любой природы, удовлетворя- ющие 17 аксиомам, в качестве которых берутся правила сравнения, сложения и умножения, 13 основных свойств и аксиома о полноте от- носительно указанных правил и свойств. 22
Доказательство полноты введенного нами множества веществен- ных чисел относительно трех правил и 13 основных свойств и изложе- ние аксиоматического метода введения этих чисел можно найти в при- ложении к тому 1 книги В. А. Ильина и Э. Г. Позняка «Основы матема- тического анализа» (М.: Физматлит, 2001). Следует отметить, что если отказаться от правила сравнения и от относящихся к этому правилу свойств 1°, 11°—13° и потребовать со- хранения только правил сложения и умножения и относящихся к ним свойств 2°—10°, то множество вещественных чисел удается расширить до множества так называемых комплексных чисел (эти чис- ла будут введены в § 5 гл. 2). 1.6. Некоторые часто используемые соотношения Для любых вещественных чисел а и b справедливы следующие два соотношения: 1^1 = И • 1Я (1.14) \а + Z>| < \а\ +\Ь\, (1.15) т. е. модуль произведения двух вещественных чисел равен произведе- нию модулей этих чисел, а модуль суммы двух вещественных чисел не превосходит суммы модулей этих чисел. Равенство (1.14) непосредственно вытекает из определения модуля и определения произведения вещественных чисел. Для доказательства неравенства (1.15) заметим, что из определения модуля и из правила сравнения вещественных чисел вытекает, что для любых вещественных чисел а и b справедливы неравенства -|а| < а < |а|, -|Z>| < b < |Z>|, почленное сложение которых1 приводит к неравенству -(|a| + |6|)<a + 6<|a| + |fe|. (1.16) Используя в случае а + b > 0 правое, а в случае а + b < 0 левое не- равенство (1.16), мы получим неравенство (1.15). Укажем еще одно часто используемое неравенство: |а - Ь\ > \а| - |6|, т. е. докажем, что модуль разности двух произвольных вещественных чисел не меньше разности модулей этих чисел. Действительно, из равенства а = (а - b) + Ь мы получим в силу (1.15) неравенство |а| < \а -Z>| + |Z>|, эквивалентное доказываемому нера- венству. 1 Возможность почленного сложения неравенств одного знака вытекает из 13 основных свойств. 23
§ 2. Некоторые конкретные множества вещественных чисел Апеллируя к возможности установления взаимно однозначного со- ответствия между множеством всех вещественных чисел и множест- вом всех точек прямой линии, мы будем широко использовать геомет- рический язык. Элементы произвольного множества вещественных чи- сел {х} мы будем называть точками. Будем говорить, что точка Xi множества {х} отлична от точки Хг этого множества, если веще- ственные числа Х| и Х2 не равны друг другу. Если при этом справедливо неравенство Xi > Х2 (соответственно *1 < хз), то мы будем говорить, что точка Xi лежит правее (соответ- ственно левее) точки Хг- Перечислим некоторые часто используемые множества веществен- ных чисел. 1°. Если а и b — любые два фиксированных вещественных числа, удовлетворяющих неравенству а < Ь, то множество всех вещественных чисел х, удовлетворяющих неравенствам а < х £ Ь, мы будем называть сегментом и обозначать символом [а, />]. При этом веществен- ные числа а и Ь мы будем называть граничными точками или концами этого сегмента, а любое число х, удовлетворяющее строгим неравенствам а < х < Ь, его внутренней точкой. 2°. Множество всех вещественных чисел х, удовлетворяющих нера- венствам а < х < Ь (или а < х < Ь), мы будем называть полусег- ментом и обозначать символом [а, Ь) (соответственно (а, 6]). 3°. Множество всех вещественных чисел х, удовлетворяющих нера- венствам а < х < Ь, будем называть интервалом и обозначать символом (а, Ь). 4°. Любой интервал, содержащий точку с, будем называть окре- стностью точки с. 5°. Интервал (с - е, с + е), где е > 0, будем называть е-о к р е с т - ностью точки с. 6°. Множество всех вещественных чисел будем называть беско- нечной прямой иличисловой прямой и обозначать символом (-00, оо). 7°. Множество всех вещественных чисел х, удовлетворяющих нера- венству х>а (соответственно х<Ь), будем называть полупря- мой и обозначать символом [а, оо) (соответственно (-оо, Z>]). 8°. Множество всех вещественных чисел х, удовлетворяющих нера- венству х > а (соответственно х < Ь), будем называть открытой 24
полупрямой и обозначать символом (а, оо) (соответственно (-оо, Ь)). § 3. Элементы комбинаторики. Формула бинома Ньютона Материал, излагаемый в настоящем параграфе, ранее входил в про- грамму по математике для средней школы. Рассмотрим произвольное множество, состоящее из конечного чис- ла п элементов. Из элементов этого множества можно составить раз- личные упорядоченные подмножества, состоящие из к элементов. При этом, конечно, считается, что 0 < к < п, а термин «упорядочен- ное подмножество» означает, что в этом подмножестве определен по- рядок следования элементов. Определение 1. Каждое состоящее из к элементов упорядоченное подмножество содержащего п элементов множества называется размещением из п элементов по к элементов. Подсчитаем число всех размещений из п элементов по к элемен- тов, обычно обозначаемое символом* Л*. Требуется подсчитать число всех различных содержащих к элемен- тов упорядоченных подмножеств, которые можно составить из данных п элементов. Первый элемент каждого такого подмножества, очевидно, можно выбрать п способами, беря в качестве него любой из данных п эле- ментов. Второй же элемент каждого такого подмножества (независимо от того, какой элемент был выбран в качестве первого) можно выбрать из оставшихся после первого выбора (и - 1) элементов (п - 1) способами. Так как каждый из (п -1) выборов второго элемента независимо ком- бинируется с каждым из ранее произведенных п выборов первого эле- мента, то общее число различных выборов первых двух элементов рав- но п (п -1). Третий элемент подмножества (независимо от того, какие элемен- ты были выбраны в качестве первых двух) можно выбрать из остав- шихся после первых двух выборов (п - 2) элементов (л - 2) способами, и, поскольку каждый из этих (л - 2) выборов независимо комбинирует- ся с каждым из ранее произведенных п (п -1) выборов первых двух элементов, то общее число различных выборов первых трех элементов равно п (п - 1)(л - 2). 1 А — первая буква французского слова «arrangement» — «размещение». 25
Продолжая эти рассуждения далее, мы получим, что для любого к, I удовлетворяющего неравенствам 1 < к < п, число Ак всех размещений I из п элементов по к элементов равно и Ак = п (п - 1) (п - 2)... [и - (к- 1)]. (1.17) Если обозначить через и! произведение 1 • 2 • 3 •... • п всех натура- льных чисел от 1 до п, то, умножив и разделив правую часть (1.17) на (и-Л)!, мы получим для Ак другое выражение: - п\ (1.18) п (п-к}\ Формулу (1.17) мы установили для значений к, удовлетворяющих условию 1 < к < п, а формулой (1.18) можно пользоваться для значений к, удовлетворяющих условию 0 < к< п, ибо и при к= 0 формула (1.18) дает правильный результат Ап = -—— =1. Замечание. Формула (1.17), а потому и формула (1.18) уста- новлены нами для п > 1. Однако если учесть, что при п = 0 рассматри- I ваемое множество элементов является пустым и что единственным | подмножеством пустого множества является само это пустое множест- во, то можно утверждать, что Ло° = 1. Поэтому если мы условимся счи- тать, что 0! = 1, то формула (1.18) окажется справедливой и при п = 0. Определение 2. Каждое размещение из п элементов по п элемен- тов называется перестановкой из п элементов. | Из формулы (1.18), взятой при к = п, вытекает, что число различ- | ных перестановок из п элементов, обычно обозначаемое символом1 Рп, I равно 1 Л = и!. I Заметим, что так как каждая перестановка из п элементов содер- I жит все эти п элементов, то различные перестановки отличаются друг от друга только порядком следования этих элементов. Определение 3. Каждое состоящее из к элементов подмножест- во содержащего п элементов множества называется сочетани- ем из п элементов по к элементов. Подчеркнем, что при этом подмножества, содержащие одни и те же элементы и отличающиеся друг от друга только порядком следова- * ния этих элементов, не считаются различными. I 1 Р — первая буква французского слова «permutation» — «перестановка». } 26 Л
Подсчитаем число различных сочетаний из п элементов по к эле- ментов, обычно обозначаемое символом1 С*. Чтобы получить из всех различных сочетаний из п элементов по к элементов все различные размещения из п элементов по к элементов, следует в каждом сочета- нии произвести все Л! возможных перестановок элементов. Отсюда вытекает, что число Л* всех различных размещений из п элементов по к элементов связано с числом С* всех различных сочета- ний из п элементов по к элементов равенством А* = к!Ск. Из последнего равенства и из равенства (1.18) мы получим следую- щее выражение для числа С*: С1 п! (1.19) ” к\(п-к)\ Если условиться считать, что 0! = 1, то формула (1.19) будет спра- ведлива для всех л > О и Q£k<n. Из формулы (1.19) сразу же вытекает, что Ск=С”~к для всех О <к<п. Кроме того, с помощью формулы (1.19) легко проверить, что при условии I <к<п справедливо равенство Ск+Ск-1 = С^. (1.20) Действительно, Ск + С*’1 =--------+----------------= " " Л!(л-Л)! (Аг-1)!(и-А+1)! =--------------[(л - к +1) + Л] = —= с^. £!(л-£+1)! £!(л+1-£)! Докажем теперь следующее замечательное утверждение. Теорема 2. Для любых вещественных чисел а и Ь и любого натура- льного п справедливо равенство2 (а+ЬУ =С*ап + C'a"~'b + C2a”~2b2 +... + C”„b” ^СЦа^Ь2, (L21) х ✓ л л л л Хм/ л 1 k-Q называемое формулой бинома Ньютона. Доказательство. Докажем формулу (1.21) методом мате- матической индукции, для чего следует проверить, что эта формула справедлива при п = 1, и, предположив, что она справедлива для номе- 1С — первая буква французского слова «combinasion» — «сочетание». 2 Символ здесь и в дальнейшем означает, что следует произвести суммирование слагаемых а*, взятых для всех к, равных 0, 1, п. 27
pa n > 1, убедиться, что в таком случае она справедлива и для следую- щего номера (п +1). Справедливость формулы (1.21) при и = 1 сразу вытекает из равен- ства (а + 6)1 = С® а + С}Ь и из того, что С® = 1 и С' = 1. Предположим теперь, что формула (1.21) справедлива для номера п > 1. Тогда (а + Ь)"* ={а+Ь)-{а+ Ь)" =(а + Ь)- '£ска'"кЬк = k=Q » а (1-22) \ ' z-i А: г к , \ А: Л п-к гкЦ =Ъс«а ° +Ъс»а ° к=0 к=0 Из первой суммы, стоящей в правой части (1.22), вынесем и отде- льно запишем слагаемое, отвечающее номеру к = 0, а во второй сумме, стоящей в правой части (1.22), сначала сдвинем на единицу индекс суммирования к, а затем вынесем и отдельно запишем последнее сла- гаемое. В результате получим (а + b)"* = Сйпа^ + ^Ckan,l-tbk + = Аг=1 Аг=1 и (1.23) = C®aw1 +£(С; + Ck~')a"'i~kbk +С"„Ьп*. м Так как С® =С^, С” = С% и справедливо равенство (1.20), то ра- венство (1.23) можно переписать в виде (а + ЬГ=^Ск^кЬк, k=Q а это и есть формула (1.21), записанная для номера (п + 1). Теорема 2 доказана.
Глава 2. Системы координат и их простейшие применения В настоящей главе мы введем декартовы координаты на прямой, на плоскости и в пространстве. Координатами называются числа, зада- нием которых определяется положение точки на прямой, на плоскости или в пространстве (соответственно на линии или на поверхности). Метод координат, с помощью которого задачи геометрии могут быть истолкованы на языке математического анализа и обратно, факты ана- лиза могут приобрести геометрическое толкование, был введен фран- цузским ученым Рене Декартом. § 1. Декартовы координаты на прямой 1.1. Направленные отрезки на оси Прямую линию с указанным на ней направлением будем называть осью. Отрезок на оси называется направленным, если указа- но, какая из его граничных точек является началом и какая — концом. Будем обозначать направленный отрезок с началом в точке А и кон- —> цом в точке В символом АВ (на рис. 2.1 изображены направленные от- -> -> резки АВ и CD). Мы будем рассматривать также и так назывемые ну- левые направленные отрезки, у ко- А В С торых начало и конец совпадают. QCb С каждым направленным отрезком сопоставляется его числовая характе- Рис 2д ристика — так называемая величина —> направленного отрезка. Величиной АВ направленного отрезка АВ —> называется число, равное длине отрезка АВ, взятой со знаком «плюс», если направление АВ совпадает с направлением оси, и со знаком «ми- —> нус», если направление АВ противоположно направлению оси. Вели- чины всех нулевых направленных отрезков считаются равными нулю. 1.2. Линейные операции над направленными отрезками Предварительно определим равенство направленных отрезков. На- правленные отрезки мы будем перемещать вдоль оси, на которой они лежат, сохраняя при этом их длину и направление. Два ненулевых направленных отрезка называются равными, если при совмещении начал этих отрезков совпадают и их концы. Лю- бые два нулевых направленных отрезка считаются равными. 29
Очевидно, необходимым и достаточным условием равенства двух направленных отрезков на данной оси является равенство величин этих отрезков. Линейными операциями над направленными отрезка- ми будем называть операцию сложения таких отрезков и операцию умножения направленного отрезка на вещественное число. Перейдем к определению этих операций. —> —> Для определения суммы направленных отрезков АВ и CD совме- —> —> стам начало С отрезка CD с концом В отрезка АВ (рис. 2.2). Получен- ный при этом направленный отрезок AD называется суммой на- -> -> С D правленных отрезков АВ и CD и обо- -О- Г “* g значается символом АВ + CD. Справедлива следующая основная Рис. 2.2 теорема. Теорема 1. Величина суммы на- правленных отрезков равна сумме величин слагаемых отрезков. Доказательство. Пусть сначала хотя бы один из отрезков —> —> —> АВ и CD является нулевым. Если, например, отрезок CD нулевой, то сумма AB + CD совпадает с отрезком АВ, и утверждение теоремы справедливо. Пусть теперь оба отрезка АВ и CD ненулевые. Совмес- тим начало С отрезка CD с концом В отрезка АВ. Тогда АВ + CD = AD. Нам нужно доказать справедливость равенства АВ + CD = AD. Рассмот- рим случай, когда оба отрезка АВ и CD направлены в одну сторону (рис. 2.2). В этом случае длина отрезка AD равна сумме длин отрезков —> —> —> АВ и CD и, кроме того, направление отрезка AD совпадает с направле- нием каждого из отрезков АВ и CD. Поэтому интересующее нас равен- ство АВ + CD = AD справедливо. Рассмотрим, наконец, еще один DC возможный случаи, когда отрезки АВ с г-~< и CD направлены в противоположные В стороны (рис. 2.3). В этом случае ве- 23 личины отрезков АВ и CD имеют раз- ные знаки, и поэтому длина отрезка AD равна \АВ +CD|. Так как на- —> правление отрезка AD совпадает с направлением наибольшего по дли- —> —> не из отрезков АВ и CD, то знак величины отрезка AD совпадает со 30
знаком числа АВ + CD, т. е. справедливо равенство АВ + CD = AD. Тео- рема доказана. Следствие. При любом расположении точек А, В, С на числовой —> оси величины направленных отрезков АВ, ВС и АС удовлетворяют со- отношению АВ + ВС = АС, (2.1) которое называется основным тождеством. Операция умножения направленного отрезка на вещественное чис- ло а определяется следующим образом. Произведением направленного отрезка АВ на число а называется направленный отрезок, обозначаемый —> символ ом а • АВ, длина которого равна произведению числа |а| на дли- —> ну отрезка АВ и направление которого совпадает с направлением от- резка АВ при а > 0 и противоположно направлению АВ при а < 0. Очевидно, величина направленного отрезка а • АВ равна а • АВ. 1.3. Декартовы координаты на прямой Декартовы координаты на прямой вводятся следующим образом. Выберем на прямой определенное направление (напомним, что прямая с указанным на ней направлением называется осью) и некоторую точ- ку О (начало координат) (рис. 2.4). Кроме того, укажем единицу масш- таба. Рассмотрим теперь произвольную точку М на прямой. Декар- товой координатой точки М будем называть величину ОМ на- j -+ о о правленного отрезка ОМ. ? Тот факт, что точка М имеет коор- о М динату х, символически обозначают «z г х Рис. 2.4 так: Л/(х). Замечание. Введение декартовых координат на прямой пред- ставляет собой один из способов, с помощью которого любой точке М прямой ставится в соответствие вполне определенное вещественное число х. Вопрос о том, исчерпывается ли при этом способе все множе- ство вещественных чисел, т. е. будет ли указанное соответствие взаим- нооднозначным, решается положительно при помощи аксиом геомет- рии и аксиом теории вещественного числа*. 1 Краткое изложение решения этого вопроса можно найти в приложении к книге: Ильин В. А., Позняк Э.Г. Аналитическая геометрия. М.: Физматлит, 2001. 31
Пусть М\(х\) и Мг(х2) — две точки на оси. В следующем утвержде- нии устанавливается выражение величины М\М2 направленного отрез- ка МХМ2 через координаты Х] и х2 его начала и конца. Теорема 2. Если точка М\ имеет координату хь а точка Мг име- ет координату х2, то величина М\М^ направленного отрезка М{М2 равна х2—Xj, т. е. Mt М2 = х2 - X,. (2.2) Доказательство. Рассмотрим на оси три точки О, М\, М2. Согласно теореме 1 справедливо равенство OMi+MlM2=OM2. (2.3) Так как OMt =х,, ОМ2 =х2, то из (2.3) вытекает доказываемое соот- ношение (2.2). Теорема доказана. Следствие. Расстояние р(Л/1Л/2) между точками Мх{хх) и М2(х2) может быть найдено по формуле p(AftA/2) = |x2 -xj. (2.4) § 2. Декартовы прямоугольные координаты на плоскости и в пространстве 2.1. Декартовы прямоугольные координаты на плоскости Две перпендикулярные оси на плоскости с общим началом и оди- наковой масштабной единицей (рис. 2.5) образуют декартову прямоугольную систему координат на плос- кости. Одну из указанных осей называют осью Ох или осью О Мх Рис. 2.5 абсцисс, другую — осью Оу или осью у" о р д и н а т. Эти оси называют также к о о р- динатными осями. Обозначим через Мх Му1>._____м и Му проекции произвольной точки М плоскости । на оси Ох и Оу соответственно. Декартовыми прямоугольны- х ми координатами х и у точки М бу- дем называть величины направленных отрезков ОМХ и ОМу, осей Ох и Оу соответственно. Декартовы координаты х и у точки М назы- ваются соответственно абсциссой и ор- динатой. Тот факт, что точка М имеет координаты х и у, символи- чески обозначают так: М(х,у). 32
Координатные оси разбивают плоскость, на четыре квадранта, нумерация которых указана на рис. 2.6. -На этом же рисунке ука- зана расстановка знаков координат точек в зависимости от их расположения в том или ином квадранте. . у II х<0, уХ) 1 I хХ), уХ) О III х<0, j<0 IV хХ), у<0 Рис. 2.6 на плоскости. 2.2. Декартовы прямоугольные координаты в пространстве Декартовы прямоугольные координаты в пространстве вводятся в полной аналогии с декартовыми прямоугольными координатами Три взаимно перпендикулярные оси в пространстве (координатные оси) с общим началом в точке О и одинаковой масштабной единицей (рис. 2.7) образуют декартову прямоугольную с и с те- Рис. 2.7 ю Ох ИЛИ другую — ординат, или осью му координат в про- странстве. Одну из указанных осей называют ось осью абсцисс, о с ь ю Оу Или осью третью — осью Oz аппликат. Пусть Мх, Му и М2 — проекции произвольной точки, М пространства на оси Ох, Оу и Oz со- ответственно. Декартовыми прямо- угольными координа- тами х, у и z точки М будем называть соответственно величины направленных отрезков ОМХ, ОМу и ОМг. Декартовы координаты х, у и z точки М называются соответствен- но ее абсциссой, ординатой и аппликатой. Тот факт, что точка М имеет координаты х, у и z, символически обозначают так: М(х,у, z). Попарно взятые координатные оси располагаются в так называе- мых к о о р д ин атных плоскостях хОу, yOz и zOx (рис. 2.7). Эти плоскости разбивают пространство на восемь октантов. Читатель без труда выяснит расстановку знаков координат точек в зависимости от их расположения в том или ином октанте. 33
§ 3. Простейшие задачи аналитической геометрии 3.1. Понятие направленного отрезка в пространстве и его проекции на ось Отрезок в пространстве называется направленным, если указано; какая из его граничных точек является началом и какая — ; концом. Как и в разд. 1.1 данной главы, символом АВ будем обозна- чать направленный отрезок с началом в точке А и концом в точке В. —> Рассмотрим в пространстве направленный отрезок МХМ2 и ось Ох (рис. 2.8). При этом будем считать, что на оси Ох введены декартовы координаты точек. , , -> Проекцией прОх МХМ2 на- —> правденного отрезка МХМ2 на ось Ох называется величина направленного : отрезка этой оси М^М-^, началом : М\х которого служит проекция на эту ; ось начала М\ отрезка МХМ2, а кон- цом Mix — проекция конца М2 отрез- • ка МХМ2. 1 Пусть точки М\х и Mix имеют на I —> * оси Ох координаты Xi и хг соответственно. Из определения прОх МХМ2 и теоремы 2 вытекает справедливость соотношения прОхМ^М2=х2-хх. (2-5). Установим еще одну формулу для вычисления пр^ МХМ2. Для это- го перенесем направленный отрезок МХМ2 параллельно самому себе так, чтобы его начало совпадало с какой-либо точкой оси Ох (на рис. 2.8 этой точкой является точка Л/u). Обозначим через <р наимень- ший угол между направлением оси Ох и направлением отрезка М^М^, полученного указанным выше параллельным переносом отрезка МХМ2. , Отметим, что угол ср заключен между О и п. При этом очевидно, что j —> угол ср острый, если направление отрезка М^М^ совпадает с направ- | лением оси Ох. и тупой, если направление М^М^ противоположно i 34
направлению Ох. Используя это, легко убедиться в справедливости следующей формулы: прОх МХМ2 = М|Л/2 -cos<р, (2.6) в которой символ Л/,Л/2 обозначает длину отрезка МХМ2. 3.2. Расстояние между двумя точками В этом разделе мы установим формулу для вычисления расстояния между двумя точками по известным координатам этих точек. Эта зада- ча уже решена для случая точек на прямой в разд. 1.3 данной главы (см. формулу (2.4)). Ради определенности подробно остановимся на случае, когда точки расположены в пространстве. Рассмотрим в пространстве декартову прямоугольную систему ко- ординат Oxyz и точки М\(х\,у\,2\) и Л/г(х2,у2,22) (рис. 2.9). Очевидно, расстояние р(М[М2) между точками Mi и М2, равное длине направлен- —> ного отрезка МхМг, равно также длине диагонали параллелепипеда, грани которого параллельны коорди- натным плоскостям и проходят через точки М\ и М2 (на рис. 2.9 этот парал- лелепипед изображен штриховой ли- нией). Длина параллельного оси Ох ребра этого параллелепипеда равна, очевидно, абсолютной величине проек- —> ции отрезка МХМ2 на ось Ох, т. е. со- гласно формуле (2.5) равна |х2 -х(|. По аналогичным соображениям длины ре- Рис. 2.9 бер, параллельных осям Оу и Oz, равны соответственно |у2 - yj и |z2 - z,|. Используя теорему Пифагора, полу- чим следующую формулу для р(М\, Л/г): р(Л/ь М2) = V(^2 ~xi)2 +(J2 -У1)2 +(z2 ~zi)2- Замечание. Формула расстояния между двумя точками в слу- чае их расположения на плоскости Оху имеет следующий вид: р(Л/ь М2) = -j(x2-xx)2 +(у2-ух)2. (2-8) 3.3. Деление отрезка в данном отношении Рассмотрим в пространстве две различные точки М\ и М2 и пря- мую, определяемую этими точками. Выберем на этой прямой некото- 35
рое направление (рис. 2.10). На полученной оси точки М\ и М2 опреде- —> ляют направленный отрезок МхМг. Рис. 2.10 Пусть М — любая отличная от М2 точка указанной выше оси. Число (2.9) ММг называется отношением, в котором :точкаЛ/делит направленный отрезок МхМг. Таким образом, любая от- личная от М2 точка М делит отре- зок МхМг в некотором отношении X, где X определяется равенством (2.9). Замечание 1. При изменении направления на прямой, прохо- дящей через точки М\ и М2, меняют знаки величины всех направлен- ных отрезков. Поэтому отношение в правой части формулы (2.9) не зависит от выбора направления на прямой M\Mi. Рассмотрим задачу о вычислении координат точки М, делящей от- резок МхМг в отношении X, считая известными координаты точек М\ н М2 н число X, которое не равно -1. Введем в пространстве декартову прямоугольную систему коорди- нат Oxyz, и пусть в этой системе координат точки М\, М2 и М имеют соответственно координаты (xi,yi,zi), (x2,y2,z2) и (х,у, z). Спроектиру- ем точки Mi, М2 и М на координатные оси (на рис. 2.10 указаны лишь проекции Mix, М^ и Мх точек Mi, М2н М на ось Ох). Очевидно, точка Мх делит направленный отрезок М^М^ в отношении X. Поэтому MixMx _х (2.10) МхМи Согласно теореме 2 справедливы равенства MixMx = x-xi, МхМ2х = х2-х. Из этих равенств и из соотношения (2.10) найдем, что х, +Хх, _ х = —-----. Совершенно аналогично вычисляются координаты у и z 1 + Х точки М. Таким образом, 36
T_X|+to2. У+^У2. Z_z,+Xz2 (2.11) i 1+X 1+X 1 + X Формулы (2.11) называются формулами деления отрезка в данном отношении X. Замечание 2. Очевидно, если X = 1, то точка М делит отрезок М\Мг пополам. Получающиеся при этом из соотношений (2.11) форму- лы называются формулами деления отрезка пополам. положительных значений X точка М лежит между точками М\ и Мг (в этом случае, как это видно из (2.9), отрезки МХМ и ММ2 оди- наково направлены), а для отрицательных значений — вне отрезка М\Мг. Соотношения (2.11) имеют смысл для любых значений Х^-1. Этим, в частности, и объяснялось указанное ранее ограничение для значений X. § 4. Полярные, цилиндрические и сферические координаты 4.1. Полярные координаты Полярные координаты на плоскости вводятся следующим образом^ Выберем на плоскости некоторую точку О (полюс) и некоторый выхо- дящий из нее луч Ох (рис. 2.11). Кроме того, укажем единицу масшта- ба. Полярными координатами точки М Называются два числа р и ср, первое из которых (полярный р а д и у с р) равно расстоянию точки М от полюса О, а второе (полярный у г о л ср) — углу, на который нужно повернуть против часовой стрелки луч Ох до совмещения с лучом ОМ. (При этом предполагается, что точка М отлична от полю- са.) Для полюса О полярный радиус равен нулю, а полярный угол неопределенный (т. е. любое значение). ему можно приписать Точку М с полярными координатами р и ср обозначают символом м (р, <р). Для того чтобы соответствие между отличными от полюса точками плоскости и парами полярных координат (р, ср) было взаимно одно- значным, обычно считают, что р и ср изменяются в следующих грани- цах: 0<р< +оо, 0< <р<2я. (2.12) 37
Замечание. В некоторых задачах, связанных с непрерывным перемещением точки по плоскости, требуется непрерывное изменение полярных координат этой точки. В таких задачах удобнее отказаться от ограничений для р и <р, указанных в соотношениях (2.12). Если, на- пример, рассматривается вращение точки по окружности против часо- вой стрелки (р = const), то естественно считать, что полярный угол этой точки может принимать при большом числе оборотов значения, большие 2л. Если же рассматривается движение точки по прямой, про- ходящей черех полюс (ср = const), то естественно считать, что при пе- реходе через полюс ее полярный радиус меняет знак. Закон изменения величин р и ср выясняется в каждом конкретном случае. Установим связь между полярными координатами точки М и ее декартовыми координатами. При этом будем предполагать, что нача- ло декартовой прямоугольной системы координат находится в полюсе, а положительная полуось абсцисс совпадает с полярной осью (см. рис. 2.11). Пусть точка М имеет декартовы координаты х и у и поляр- ные координаты р и ср. Очевидно, что x=pcoscp, y = psinqx (2.13) Полярные координаты р и ср точки М определяются по ее декарто- вым координатам х и у, очевидно, следующим образом: р = у]х2 + у1. Для того чтобы найти величину угла ср, нужно, используя знаки х и у, определить квадрант, в котором находится точка М (см. разд. 2.1 данной главы и рис. 2.6), и, кроме того, учесть, что tg(p=y/x. 4.2. Цилиндрические координаты Цилиндрические координаты в пространстве вводятся следующим образом. Выберем на фиксированной плоскости П некоторую точку О и выходящий из нее луч Ох (рис. 2.12). Кроме того, рассмотрим ось Oz, проходящую черер О перпендикулярно плоскости П. Пусть М — любая точка пространства, N — проекция этой точки на плоскость П, а Мг — проекция М на ось Oz. Цилиндрическими координата- м и точки М называются три числа р, ср и z, первые два из которых (р и <р) являются полярными координатами точки N в плоскости П относи- тельно полюса О и полярной оси Ох, а число z есть величина отрезка OMZ оси Oz. Точку М с цилиндрическими координатами р, ф и z обо- значают символом М(р, ф, z). Наименование «цилиндрические коорди- наты» связано с тем, что координатная поверхность р = const (т. е. по- верхность, все точки которой имеют одну и ту же координату р) являет- 38
Рис. 2.12 ся цилиндром, прямолинейные образующие которого параллельны оси Oz (на рис. 2.12 такой цилиндр изображен штриховыми линиями). Если выбрать оси декартовой прямоугольной системы координат Oxyz так, как указано на рис. 2.12, то декартовы координаты х, у, z точки М будут связаны с ее цилиндрическими координатами р, ф и z соотношениями х = р созф; у=р-зшф; z = z. (2.14) Замечание. Так как первые две цилиндрические координаты р и ф явля- ются полярными координатами проек- ции N точки М на плоскость П, то к этим двум координатам относятся заме- чание и выводы, сделанные в разд. 4.1. в пространстве рассмотрим 4.3. Сферические координаты Для введения сферических координат три взаимно перпендикулярные оси Ох, Оу и Oz с общим началом О (рис. 2.13). Пусть М — любая отличная от О точка пространства, N — ее про- екция на плоскость Оху, р — расстояние М от О. Пусть, далее, 0 — угол, который образует направленный отрезок ОМ с осью Oz, а (р — угол, на который нужно повернуть против часовой стрелки* ось Ох до совмещения с лучом ON. 0 и ф на- зывают широтой и долготой соответственно. Сферическими коорди- натами точки М называются три числа: р, ф и 0. Если точка М совпадает с точкой О, то р = 0. Для точки О коорди- наты ф и 0 не имеют определенного значения. Наименование «сферические координаты» связано с тем, что коор- динатная поверхность р = const (т. е. поверхность, все точки которой имеют одну и ту же координату р) является сферой (на рис. 2.13 такая сфера изображена штриховой линией). 1 Если при этом смотреть на вращение Ох со стороны положительного направления оси Oz. 39
Для того чтобы соответствие между точками пространства и трой- ками сферических координат (р, ср, 0) было взаимооднозначным, обыч- но считают, что р и ср изменяются в следующих границах: 0<р< +оо; 0< ср<2л. Координата 0 по самому определению заключена между Опп. Отметим, что в задачах, связанных с непрерывным перемещением точ- ки в пространстве, часто отказываются от указанных ограничений на изменение сферических координат (см. замечание в разд. 4.1). Если выбрать оси декартовой прямоугольной системы координат так, как указано на рис. 2.13, то декартовы координаты х, у, z точки М связаны с ее сферическими координатами р, ср, 0 соотношениями x = psin0coscp; y = psin0sincp; z = pcos0. (2.15) § 5. Краткие сведения о комплексных числах Два вещественных числа х и у мы будем называть упорядо- ченной парой, если указано, какое из этих чисел является пер- вым, какое — вторым. Упорядоченную пару вещественных чисел х и у будем обозначать символом (х,у), записывая на первом месте первый элемент пары х. Комплексным числом называется упорядоченная пара (х, у\ вещественных чисел, первое из которых х называется дейст- вительной ч а с т ъ ю, а второе у — мнимой частью этого комплексного числа. В случае, когда мнимая часть у равна нулю, соответствующую пару (х, 0) договариваются отождествлять с вещественным теслом х. Это позволяет рассматривать множество всех вещественных чисел как часть множества комплексных чисел. Два комплексных числа zx = (хр ух) и z2 = (х2, у2) называются рав- ными, если х\ =Х2, yi =У2- Говорят, что комплексное число z = (х,у) равно нулю, если х = 0 и у = 0. Определим операции сложения и умножения комплесных чисел. Поскольку вещественные числа являются частью множества комплекс- ных чисел, эти операции должны быть определены так, чтобы в при- менении к двум вещественным числам они приводили к уже извест- ным нам из § 1 гл. 1 определениям суммы и произведения веществен- ных чисел. Су м м о й двух комплексных чисел zx = (хр ух) и z2 = (х2, у2) назо- вем комплексное число z вида z = (x,+x2,y1 + y2). (2.16) 40
х _ ~У .2’2, ,,2 такое, что 2 Произведением двух комплексных чисел zx=(xl9 у,) и z2—(x2, у2) назовем комплексное число z вида z = (ХЛ “ У1У2,ЪУг +х2У)- (2-17) Легко проверить, что сумма и произведение комплексных чисел обладают теми же свойствами, что и сумма и произведение веществен- ных чисел. Именно справедливы следующие свойства: 1°. Z| + z2 = z2 + z, (переместительное свойство суммы). 2°. (zt + z2) + z3 = z, + (z2 + z3) (срчетательное свойство суммы). 3°. z + (0,0) = z (особая роль числа (0, 0)). 4°. Для каждого числа z = (х, у) существует противоположное ему число z' = (-х, —у) такое, что z + z' = (0,0). 5°. Z] • z2 = z2 • z, (переместительное свойство произведения). 6°. (Zj • z2) • z3 = Zj • (z2 • z3) (сочетательное свойство произведения). 7°. z-(l,0) = z (особая роль числа (1,0)). 8°. Для любого комплексного числа z = (х, у), не равного нулю, су- _ 1 шествует обратное ему число — = z z-—= (1,0). Z 9°. (Z] + z2) • z3 = Z] • z3 + z2 • z3 (распределительное свойство произ- ведения относительно суммы). Свойства 1°—9° позволяют утверждать, что для комплексных чи- сел полностью сохраняются все правила элементарной алгебры, отно- сящиеся к арифметическим действиям и к сочетанию равенств. Кроме того, эти свойства полностью решают вопрос овычита- н и и комплексных чисел как о действии, обратном сложению, и о делении комплексных чисел как о действии, обратном умноже- нию. Разностью двух комплексных чисел z1=(x1,y)) и z2 = (х2, у2) называется такое комплексное число z, которое в сумме с z2 дает z\. С помощью свойств 1°—4° элементарно устанавливается существование и единственность разности двух комплексных чисел. Легко проверить, что разностью двух комплексных чисел zi = (xi>7i) и 22=(х2>Л) является комплексное число z вида z = (x1-x2,y1-y2). (2.18) Частным двух комплексных ч и с е л гх=(х19 у}) и z2 = (х2, у2\ второе из которых не равно нулю, называется такое ком- 41
плексное число z, которое при умножении на Z2 дает z\. С помощью свойств 5°—8° легко установить, что единственным частным двух ука- занных комплексных чисел является комплексное число z вида z = Гх\х2 + уу2 х2у,-х,у2^ (2.19) L х2 + Уг х2 У2 J В операциях с комплексными числами особую роль играет число, представимое парой (0,1) и обозначаемое буквой i. Умножая эту пару саму на себя (т. е. возводя ее в квадрат), получим в силу определения произведения комплексных чисел: (0,1) • (0,1) = (-1,0) = -1, т. е. i1 = -1. Заметив это, мы можем любое комплексное число z = (х, у) пред- ставить в виде z = (х, у) = (х, 0) + (0, у) = (х, 0) + (у, 0) (0, 1) = х +iy. В дальнейшем мы будем широко использовать для комплексного числа z = (х, у) представление z = х +iy. Это представление и рассмотре- ние i в качестве множителя, квадрат которого равен -1, позволяет про- изводить операции с комплексными числами так же, как они произво- дятся с алгебраическими многочленами. Комплексное число z = (х, - у) = х - iy принято называть сопря- женным по отношению к комплексному числу z = (х, у) = х + iy. Очевидно, что комплексное число равно нулю тогда и только тог- да, когда равно нулю сопряженное ему число (ибо равенства х = 0, у = 0 эквивалентны равенствам х = 0, -у = 0). Для геометрического изображения комплексных чисел и для про- ведения операций их сложения и вычитания удобно пользоваться де- картовой прямоугольной системой Оху. При этом комплексное число z = (х, у) изображается либо точкой М с координатами (х, у), либо на- правленным отрезком ОМ, идущим из начала координат О в точку М с координатами (х,у). Такой направленный отрезок ОМ обычно называ- ют радиусом-вектором точки М. Если складываются два комплексных числа zi=(xt,yl) и z2=(x2, _у2), то по определению их суммой является комплексное —> —> число z = (x1 +х2, у, + у2)- Легко убедиться в том, что если OMt, ОМ2 —> и ОМ — радиусы-векторы точек Мх(хх, у{), М2(х2, у2) и -> Af(x, + х2, у, + у2) соответственно, то радиус-вектор ОМ суммы комп- 42
лексных чисел z\ + zi является диагональю параллелограмма, построен- ного на радиусах-векторах ОМХ и 0Мг суммируемых комплексных чи- сел Z\ и Z2- Действительно, пусть радиус-вектор ОМ является диагональю па- —> —> раллелограмма, построенного на радиусах-векторах ОМХ и ОМ2, отве- чающих комплексным числам z{=(x{, у,) и z2=(x2,y2). Требуется доказать, что точка М имеет координаты (х, +х2, у{ + у2), но эт0 сразу вытекает из равенства двух заштрихо- ванных на рис. 2.14 горизонталь- ными штрихами прямоугольных треугольников с катетами, паралле- льными координатным осям и рав- ными Xi и уь и из равенства двух других заштрихованных на том же рисунке вертикальными штрихами прямоугольных треугольников с катетами, параллельными коорди- натным осям и равными х2 и у2. Читатель без труда убедится в том, что если радиус-вектор умень- шаемого комплексного числа явля- ется диагональю, а радиус-вектор вычитаемого комплексного числа — одной из сторон параллелограмма, имеющего вершиной начало ко- ординат, то радиус-вектор разности этих комплексных чисел является другой из сторон этого параллелограмма. Если наряду с декартовой прямоугольной системой координат вве- сти полярную систему координат так, чтобы полюс находился в нача- ле О декартовой системы, а полярная ось была направлена вдоль поло- жительного направления оси Ох, то, как мы уже знаем из разд. 4.1, де- картовы координаты (х,у) и полярные координаты (р, <р) любой точки А/ будут связаны соотношениями x=p-cos<ft y=p-sin<p. (2.20) Соотношения (2.20) приводят нас к так называемой тригоно- метрической форме представления комплексного числа г = (*>У): z = (x, y) = (pcos<ftpsin<p)=p(cos<p+ism(p). (2.21) 43
В тригонометрической форме представления (2.21) число р называ- ется модулем, а угол <р — аргументом данного комплексно- го числа z. Конечно, аргумент комплексного числа определен неоднозначно: вместо уже взятого его значения <р можно использовать значение <р + 2лл, где п — любое целое число, т. е. п = 0, +1, ±2, ... . Однако всегда можно потребовать, чтобы аргумент <р принимал значения только из полусегмента —тг< ср< 7t. Угол <р, лежащий в указанном полусегменте, принято называть главным значением аргумента и обозначать симво- лом arg z (при написании этого символа ставится буква «а» строчная). Всю бесконечную совокупность значений угла <р обозначают сим- волом Arg z (при написании этого символа ставится буква «А» пропис- ная). В тригонометрической форме удобно производить операции умно- жения и деления комплексных чисел. Пусть даны два произвольных комплексных числа Zj = (х,, yt) =p!(cos<p, -t-zsihcp,) и z2 = (х2, y2)=p2(cos<p2+zsm<p2). Тогда по определению операции умножения комплексных чисел (т. е. в силу соотношения (2.17)) получим Z, • z2 = (х,х2 - у,у2, xty2 + х2у,) = (р,р2 cos (ft cos <р2 - -pjPj sin <p, sin (pj.p^coscpj sin cp2 +p1p2sin(p1coscp2)= (2.22) = ((PiP2)cos(cpI +<p2), (p,p2)sin(cp1 +cp2)). Аналогично из формулы (2.19) заключаем, что частное — двух Z2 комплексных чисел zx = (хр ух) = (pj cos <рр р, sin cpj и z2 = (х2> Уг) = (Р2cosФг> Р2 s^n Ф2) имеет вид1: cos(<p,-cp2), 1р2 (2-23) sin(cp,-cp2) . Из формул (2.22) и (2.23) заключаем, что при умножении двух ком- плексных чисел их модули перемножаются, а аргументы складывают- ся (при делении двух комплексных чисел их модули делятся, а аргумен- ты вычитаются). Это свойство последовательно переносится на слу- 1 При этом предполагается, что комплексное число z2 не равно, нулю, т. е. р2 * 0. 44
чай'произведения любого конечного числа комплексных чисел. В част- ности, если перемножаются п равных комплексных чисел (т. е. комп- лексное число возводится в степень п), то (pcos<p,psin<p)" = (р" сов(л<р), р" sin(n<p)). (2.24) Из формулы (2.24) при р = 1 получим так называемую форму- лу Муавра (cos ср, sin ср)” =(cos(ncp),sin(n<p)). (2.25) Формулу Муавра, (2.25) записывают и в следующем виде: , (cos ср + z sin ср)" = cos(ncp) + i sin(n<p)i (2.26) Заметим, что комплексное число равно нулю тогда и только тогда, когда равен нулю его модуль. Отсюда и из того, что при перемножении комплексных чисел их модули перемножаются, вытекает, что произве- дение нескольких комплексных чисел равно нулю тогда и только тог- да, когда равен нулю хотя бы один из сомножителей. В заключение рассмотрим вопрос об извлечении из комплексного числа корня степени л (л = 2, 3, ...). Пусть не равное нулю комплексное число z записывается в виде (2.21). Так как искомый корень Vz также является комплексным чис- лом, то мы будем искать его в тригонометрической форме: Vz = r(cos \|/ + i sin ср ). (2.27) Возвышая равенство (2.27) в степень л и пользуясь формулой Муавра (2.26), получим z = r"[cos(n\|/) + zsin(n\|/)]. (2.28) Сопоставляя равенства (2.21) и (2.28), получим, что р = г", л\|/=<р= argz+2n^, где к = 0, ±1, ±2... Из этих равенств, понимая в дальнейшем под корнем степени л из положительного вещественного числа арифметический ко- рень степени л, получим, что ’ л Итак, окончательно „Г И ( aigz+2itk . . argz+2n^'\ (2.29) ’ n nJ 45
В формуле (2.29) в качестве к можно брать любые целочисленные значения, но достаточно взять значения к, равные 0, 1, 2, п- 1, ибо для всех других значений к, кроме указанных, мы придем к повторе- нию уже найденных значений Vz. Отсюда следует, что корень степени п из комплексного числа z*0 имеет точно п значений (определяемых соотношением (2.29), взятым при к = 0, 1, ..., п - 1). В частности, если z является вещественным числом, т. е. z = x + iy при у = 0, то, поскольку arg z = 0, мы получим из (2.29), что корень степени п из действительного числа х также имеет ровно п комплек- сных Значений, определяемых равенством в котором символ обозначает арифметический корень степени п из числа |х|, а к пробегает значения 0, 1, 2, ..., я - 1.
Глава 3 Определители и системы линейных уравнений § 1. Определители второго и третьего порядков и их свойства 1.1. Понятие матрицы и определителя второго порядка Прямоугольную таблицу из чисел, содержащую произвольное чис- ло т строк и произвольное число п столбцов, называют матрицей. Для обозначения матрицы исподьзуют либо сдвоенные вертикальные черточки, либо круглые скобки. Например: ( 1 7 1 7 9,2 28 20 18 -6 11 2 ИЛИ 28 20 9,2 > 18 1-6 и Если число строк матрицы совпадает с числом ее столбцов, то мат- рица называется квадратной. Числа, входящие в состав матрицы, называют ее элементами. Рассмотрим квадратную матрицу, состоящую из четырех элемен- тов: Определителем второго порядка, соответству- ющим матрице (3.1), называется число, равное ахЬ2 -а2Ьх и обозначае- мое символом а\ ь> а2 Ьг Итак, по определению *1 *1 «2 = аД-а2/>,. (3-2) Элементы, составляющие матрицу данного определителя, обычно называют элементами этого определителя. Справедливо следующее утверждение: для того чтобы определитель второго порядка был равен нулю, необходимо и доста- АП
точно, чтобы элементы его строк (или соответственно его столб- цов) были пропорциональны. Для доказательства этого утверждения достаточно заметить, что каждая из пропорций а\/а2 = b\lb2 и ajb\ = а21Ь2 эквивалентна равенст- ву ахЬ2 -а2Ьх, а последнее равенство в силу (3.2) эквивалентно обраще- нию в нуль определителя. 1.2. Система двух линейных уравнений с двумя неизвестными Покажем, как применяются определители второго порядка для ис- следования и отыскания решений системы двух линейных уравнений с двумя неизвестными axx + bxy = l\. a2x + b2y = h2 (3.3) (коэффициенты аь Ь\, а2, Ь2 и свободные члены h\ и h2 считаются при этом заданными). Напомним, что пара чисел хо, уо называется реше- нием системы (3.3), если подстановка этих чисел на место х и у в данную систему обращает оба уравнения (3.3) в тождества. Умножая первое уравнение системы (3.3) на Ь2, а второе — на -Ь\ и затем складывая полученные при этом равенства, получим (atb2 - a2bt)x = b2\ - bth2. (3.4) Аналогично путем умножения уравнений (3.3) на -а2 и at соответ- ственно получим: (alb2-a2bl)y=alh2 -а2\. Введем следующие обозначения: д = * л*- . Дх = Л, z>, А2 Ь2 > Ду - -sT О* (3-5) (3.6) С помощью этих обозначений и выражения для определителя вто- рого порядка уравнения (3.4) и (3.5) могут быть переписаны в виде Д-х = Дж, Д-у=Ду. (3.7) Определитель Д, составленный из коэффициентов при неизвестных системы (3.3), принято называть определителем этой сис- темы. Заметим, что определители Дх и Ду получаются из определи- теля системы Д посредством замены его первого или соответственно второго столбца свободными членами. Могут представиться два случая: 1) определитель системы Д отличен от нуля; 2) этот определитель равен нулю. 48
Рассмотрим сначала случай А#0. Из уравнений (3.7) мы сразу же получаем формулы для неизвестных, называемые формулами Крамера: х = Д,/Д, у=Ду/Д. (3.8) Полученные формулы Крамера (3.8) дают решение системы (3.7) и потому доказывают единственность решения исходной системы (3.3). В самом деле, система (3.7) является следствием системы (3.3), поэто- му всякое решение системы (3.3) (в случае, если оно существует!) дол- жно являться решением и системы (3.7). Итак, пока доказано, что если у исходной системы (3.3) существует при Д^О решение, то это ре- шение однозначно определяется формулами Крамера (3.8). Легко убедиться и в существовании решения, т. е. в том, что при Д Ф 0 два числа х и у, определяемые формулами Крамера (3.8), будучи поставлены на место неизвестных в уравнения (3.3), обращают эти уравнения в тождества. (Предоставляем читателю самому расписать выражения для определителей Д, Дх и Дл. и убедиться в справедливо- сти указанных тождеств.) Мы приходим к следующему выводу: если определитель Д систе- мы (3.3) отличен от нуля, то существует, и притом единственное, решение этой системы, определяемое формулами Крамера (3.8). Рассмотрим теперь случай, когда определитель Д системы равен нулю. Могут представиться два подслучая: а) хотя бы один из определителей Дх или Д^, отличен от нуля; б) оба определителя Дх и Ду равны нулю. (Из утверждения в конце разд. 1.1 вытекает, что если определитель Д и один из двух определителей Дх и Ду равны нулю, то и другой из указанных двух определителей равен нулю. В самом деле, пусть, например Д = 0 и Д х = 0, т. е. а\1аг = bilbz и h\lhz = Z>i/Z>2. Тогда из этих пропорций получим, что a\la2 = h\lhi, т. е. Д/ = 0). В подслучае а) оказывается невозможным хотя бы одно из ра- венств (3.7), т. е. система (3.7) не имеет решений, а поэтому не имеет решений и исходная система (3.3) (следствием которой является систе- ма (3.7)). В под случае б) исходная система (3.3) имеет бесчисленное мно- жество решений. В самом деле, из равенств Д=Дх=Ду=0 и из утверждения в конце разд. 1.1 заключаем, что второе уравнение систе- мы (3.3) является следствием первого и его можно отбросить. Но одно Уравнение с двумя неизвестными а1х + />1у=й| (3.9) 49
имеет бесконечно много решений (хотя бы один из коэффициентов а\ или Ь\ отличен от нуля, и стоящее при нем неизвестное может быть определено из уравнения (3.9) через произвольно заданное значение другого неизвестного). Таким образом, если определитель Д системы (3.3) равен нулю, то система (3.3) либо вовсе не имеет решений (в случае, если хотя бы один из определителей Дх или ДЛ. отличен от нуля), либо имеет бес- численное множество решений (в случае, когда Дх = Д?. =0). В послед- нем случае два уравнения (3.3) можно заменить одним и при решении его одно неизвестное задавать произвольно. Замечание. В случае, когда свободные члены h\ и Лг равны нулю, линейная система (3.3) называется однородной. Отметим, что однородная система всегда имеет так называемое тривиаль- ное решение: х = 0, у = 0 (эти два числа обращают оба однород- ных уравнения в тождества). Если определитель однородной системы Д отличен от нуля, то эта система имеет только тривиальное решение. Если же Д = 0, то одно- родная система имеет бесчисленное множество решений (поскольку для однородной системы возможность отсутствия решений исключена). Таким образом, однородная система имеет нетривиальное решение в том и только в том случае, когда определитель ее равен нулю. 1.3. Определители третьего порядка Рассмотрим квадратную матрицу, состоящую из девяти элементов а, 6, с, а2 Ь2 с2 а3 Ь3 с3 (3.10) Определителем третьего порядка, соответст- вующим матрице (3.10), называется число, равное a}b2c3 + 6jC2a3 + qa2Z>3 - cxb2а3 - bxa2c3 - axc2b3 (3.11) и обозначаемое символом а, 6, с, а2 Ь2 с2 а3 Ь3 с3 50
Итак, по определены. А = «I «2 аз Ь\ ь2 Ьз ci С2 С3 = ахЬ2су + Ъхс2а2 + _ сДаз ”^1а2сз “а\сФз- (3-12) Как и в случае определителя второго порядка, элементы матрицы (3.10) будем называть элементами самого определи- теля. Кроме того, договоримся называть диагональ, образованную элементами а\, b2 и с2, главной, а диагональ, образованную эле- ментами аз, Ь2 и ci, — побочной. Для запоминания конструкции слагаемых, входящих в выражение для определителя (3.11), укажем следующее правило, не требую- щее большого напряжения внимания и памяти. Для этого к матрице, из которой составлен определитель, допишем справа еще раз первый, а затем второй столбец. В полученной при этом матрице сплошной чертой соединены три тройки членов, получаемые паралле- льным переносом главной диагонали и отвечающие трем слагаемым, входящим в выражение (3.11) со знаком «плюс»; пунктирной же чер- той соединены три другие тройки членов, получаемые параллельным переносом побочной диагонали и отвечающие трем слагаемым, входя- щим в выражение (3.11) со знаком «минус». 1.4. Свойства определителей В этом разделе мы установим ряд свойств определителей. Эти свойства будем формулировать и устанавливать для определителей третьего порядка, хотя, конечно, они справедливы и для определите- лей второго порядка. Свойство 1. Величина определителя не изменится, если стро- ки и столбцы этого определителя поменять ролями, т. е. fl2 аз (3.13) 51
Для доказательства этого свойства достаточно расписать определи- тели, стоящие в левой и правой частях (3.13), по указанному в разд. 1.3 правилу и убедиться в равенстве полученных при этом чле- нов. Свойство 1 устанавливает полную равноправность строк и столб- цов. Поэтому все дальнейшие свойства определителя можно формули- ровать и для строк, и для столбцов, а доказывать — или только для строк, или только для столбцов. Свойство 2. Перестановка двух строк (или двух столбцов) определителя равносильна умножению его на число -1. Доказательство также получается из правила, указанного в преды- дущем разделе (мы предоставляем его читателю). Свойство 3. Если определитель имеет две одинаковые стро- ки (или два одинаковых столбца), то он равен нулю. Действительно, при перестановке двух одинаковых строк, с одной стороны, определитель Д не изменится, а с другой стороны, в силу свойства 2 он изменит знак на противоположный. Таким образом, Д = -Д, т. е. 2Д = 0 или Д = 0. Свойство 4. Умножение всех элементов некоторой строки (или некоторого столбца) определителя на число X равносильно умно- жению определителя на это число X. Иными словами, общий множитель всех элементов некоторой строки (или некоторого столбца) определителя можно выносить за знак этого определителя. Например, А С2 сз Для доказательства этого свойства достаточно заметить, что опре- делитель выражается в виде суммы (3.12), каждый член которой со- держит один и только один элемент из каждой строки и один и только один элемент из каждого столбца. Свойство 5. Если все элементы некоторой строки (или неко- торого столбца) определителя равны нулю, то и сам определитель равен нулю. Это свойство вытекает из предыдущего (при Х = 0). Свойство 6. Если элементы двух строк (или двух столбцов) определителя пропорциональны, то определитель равен нулю. 52
В самом деле, в силу свойства 4 множитель пропорциональности можно вынести за знак определителя, после чего остается определитель с двумя одинаковыми строками, равный нулю согласно свойству 3. Свойство 7. Если каждый элемент п-й строки (или п-го столбца) определителя представляет собой сумму двух слагаемых, то определитель может быть представлен в виде суммы двух определи- телей, первый из которых имеет в п-й строке (или в п-м столбце) первые из упомянутых слагаемых и те же элементы, что и исходный определитель, в остальных строках (столбцах), а второй определи- тель имеет в п-й строке (в п-м столбце) вторые из упомянутых сла- гаемых и те же элементы, что и исходный определитель, в осталь- ных строках (столбцах). Например, Для доказательства этого свойства снова достаточно заметить, что определитель выражается в виде суммы слагаемых, каждое из которых содержит один и только один элемент из каждой строки и один и то- лько один элемент из каждого столбца. Свойство 8. Если к элементам некоторой строки (или неко- торого столбца) определителя прибавить соответствующие элемен- ты другой строки (другого столбца), умноженные на произвольный множитель X, то величина определителя не изменится. Действительно, полученный в результате указанного прибавления определитель можно (в силу свойства 7) разбить на сумму двух опре- делителей, первый из которых совпадает с исходным, а второй равен нулю вследствие пропорциональности элементов двух строк (или столбцов) и свойства 6. Для формулировки еще одного фундаментального свойства опреде- лителя нам понадобятся новые понятия. 1.5. Алгебраические дополнения и миноры Соберем в выражении (3.12) для определителя члены, содержащие какой-нибудь один элемент этого определителя, и вынесем указанный элемент за скобки; величина, остающаяся при этом в скобках, называет- ся алгебраическим дополнением указанного элемента. Алгебраическое дополнение данного элемента мы будем обозна- чать прописной латинской буквой того же наименования, что и дан- 53
ный элемент, и снабжать тем же номером, который имеет данный эле- мент. Например, алгебраическое дополнение элемента Ь2 будем обо- значать через В2, алгебраическое дополнение элемента а3 — через Аз и т.д. Непосредственно из выражения для определителя (3.12) и из того, что каждое слагаемое в правой части (3.12) содержит один и только один элемент из каждой строки (из каждого столбца), вытекают следу- ющие равенства: Д = atAt + fyBt + с,С|, Д = а2А2 + Ь2В2 + с2С2, ^=а3А3+Ь3В3+с3С3, (3.14) J J J J J J z XZ Д = а.Л. + а,А2 + а. А., Д = Ь.В. + bJL + Ь.В., Д = с1С1+с2С2+с3С3. (3.15) Эти равенства выражают следующее свойство определителя: опре- делитель равен сумме произведений элементов какой-либо строки (ка- кого-либо столбца) на соответствующие алгебраические дополнения элементов этой строки (этого столбца). Равенства (3.14) принято называть разложением о п р е - делителя по элементам соответственно первой, второй или тре- тьей строки, а равенства (3.15) — р а з л о ж е н и е м о пр е д е -, лит е л я по элементам соответственно первого, второго или тре- тьего столбца. Введем теперь важное понятие минора данного элемента опре- делителя. Минором данного элемента определителя п-го порядка (в нашем случае п-3) называется определитель (п - 1)-го порядка, получаемый из данного определителя путем вычеркивания той строки и того столбца, на пересечении которых стоит данный элемент. Например, минор элемента а{ равен Ьг Ьз С2 С3 , минором элемента а2 служит определитель bi Ьз 4 сз , и т. д. Предлагаем читателю самому убедиться в том, что алгебраические дополнения и миноры связаны между собой по следующему п р а в и - л у: алгебраическое дополнение любого элемента определителя равня- ется минору этого элемента, взятому со знаком «плюс», если сумма номеров строки и столбца, на пересечении которых стоит данный элемент, есть число четное, и со знаком «минус» — в противном слу- чае. Таким образом, соответствующие алгебраическое дополнение и минор могут отличаться только знаком. 54
Следующая таблица дает наглядное представление о том, каким знаком связаны соответствующие алгебраическое дополнение и минор: Установленное правило позволяет в формулах (3.14) и (3.15) разло- жения определителя по элементам строк и столбцов всюду вместо ал- гебраических дополнений писать соответствующие миноры (с нужным знаком). Так, например, первая из формул (3.14), дающая разложение опре- делителя по элементам первой строки, принимает вид В заключение установим следующее фундаментальное свойство определителя. Свойство 9. Сумма произведений элементов какого-либо столбца определителя на соответствующие алгебраические дополне- ния элементов этого (другого) столбца равна величине этого опреде- лителя (равна нулю). Конечно, аналогичное свойство справедливо и в применении к строкам определителя. Случай, когда алгебраические дополнения и элементы отвечают одному и тому же столбцу, уже рассмотрен выше. Остается доказать, что сумма произведений элементов какого-либо столбца на соответствующие алгебраические дополнения элементов другого столбца равна нулю. Докажем, например, что сумма произведений элементов первого или второго столбца на соответствующие алгебраические дополнения элементов третьего столбца равна нулю. Будем исходить из третьей формулы (3.15), дающей разложение определителя по элементам третьего столбца: bx q 62 с2 *3 сз — ^jC*j 12 "Ь* '3 • (3.17) 55
Так как алгебраические дополнения Ci, С2 и С3 элементов третьего столбца не зависят от самих элементов с\, сг и сз этого столбца, то в равенстве (3.17) числа ci, а и сз можно заменить произвольными s числами h\, hz и hj, сохраняя при этом в левой части (3.17) первые два | столбца определителя, а в правой части — величины Сь С2 и Сз алгеб- 1 раических дополнений. | Таким образом, при любых hi, hi и Лз справедливо равенство •* ai A а2 b2 h2 =hxCx+h2C2+h3C3. (3-18) а3 b3 h3 j Беря теперь в равенстве (3.18) в качестве йь й2 и й3 сначала эле- менты а2 и а3. первого столбца, а затем элементы Ь\9 Ьг и 63 второго ] столбца и учитывая, что определитель с двумя совпадающими столб- цами в силу свойства 3 равен нулю, мы придем к следующим равенст- вам: < а.С. + а1С1 + а3С3 =0, 6.С. + bJC, + Ь.С. =0. « Тем самым доказано, что сумма произведений элементов первого или I второго столбца на соответствующие алгебраические дополнения эле- | ментов третьего столбца равна нулю: | Аналогично доказываются равенства: | а,Вх + а2В2 + а3В3 = 0, сД + с2В2 + с3В3 = 0, ’ I ЬХАХ +Ь2А2 + Ь3А3 =0, с,А, +с2А2 +с3А3 =0 | и соответствующие равенства, относящиеся не к столбцам, а к строкам: | atA3 + btB3 + clC3 =0, а2А3 + b2B3 + с2С3 =0, | ахА2 + bxB2 + с,С2 =0, а3А2 + Ь3В2 + с3С2 =0, j а2Ах + b2Bt + CjCj = 0, а3А, + b3Bt + c3Ct = 0. j £ § 2. Системы линейных уравнений с тремя неизвестными 2.1. Системы трех линейных уравнений с тремя неизвестными с | определителем, отличным от нуля * В качестве приложения изложенной выше теории рассмотрим сис- тему трех линейных уравнений с тремя неизвестными: alx + b,y+clz = hl, a2x + b2y+c2z = h2, (3.19) a3x + Z>3y + c3z = A3 56
(коэффициенты а\, а2, а3, Ь1} Ь2, Ь3, сь с2, с3 и свободные члены h2, h3 считаются заданными). Тройка чисел *о, Уо, называется реше- нием системы (3.19), если подстановка этих чисел на место х, у, z в систему (3.19) обращает все три уравнения (3.19) в тождества. Фундаментальную роль в дальнейшем будут играть следующие че- тыре определителя: а, Ьх с, Д = а2 Ь2 с2 а3 Ь3 с3 ci С2 с} Д> = й и и W ь» — JS- Р Р , дг= J5 ь? -° р- р- р- Определитель Д принято называть определителем сис- темы (3.19) (он составлен из коэффициентов при неизвестных). Определители ДЛ, Ду и Д2 получаются из опрёделителя системы Д по- средством замены свободными членами элементов соответственно пер- вого, второго и третьего столбцов. Для исключения из системы (3.19) неизвестных у и х умножим уравнения (3.19) соответственно на алгебраические дополнения А}, А2 и А3 элементов первого столбца определителя Д системы, и после это- го сложим полученные при этом уравнения. В результате получим (alAl + а2А2 + а3А3)х + (btAt +Ь2А2 +Ь3А3)у+ +(ctAt + с2А2 + c3A3)z = hiAl + h2A2 + h^. (3.20) Учитывая, что сумма произведений элементов данного столбца определителя на соответствующие алгебраические дополнения элемен- тов этого (другого) столбца равна определителю (нулю) (см. свойство 9), получим ахАх + а2А2 + а3А3 = Д, bxAt + Ь2А2 + Ь3А3 =0, ct А, + с2 А2 +с3А3 = 0. (3-21) Кроме того, посредством разложения определителя Дл по элемен- там первого столбца получается формула Дж=/Ц1+М2+Мз- (3.22) С помощью формул (3.21) и (3.22) равенство (3.20) перепишется в следующем (не содержащем неизвестных у и z) виде: Д-х = Дх. 57
Совершенно аналогично выводятся из системы (3.19) равенства Д- y = Av и Д-г = Д,. 'У z Таким образом, мы установили, что система уравнений Д-х = Дх, Д-у=Ду, Д-г = Дг (3.23) является следствием исходной системы (3.19). В дальнейшем мы отдельно рассмотрим два случая: 1) когда определитель системы Д отличен от нуля, 2) когда этот определитель равен нулю. Здесь мы рассмотрим лишь первый случай (рассмотрение второго , случая отложим до разд. 2.4). Итак, пусть Д 0. Тогда из системы (3.23) мы сразу получаем фор- мулы для неизвестных, называемые формулами Крамера: х = Дж/Д, у = Ду/Д, х = Дг/Д. (3.24) Полученные нами формулы Крамера дают решение системы (3.23) и потому доказывают единственность решения исходной системы (3.19), ибо система (3.23) является следствием системы (3.19), и всякое решение системы (3.19) обязано быть решением и системы (3.23). Итак, мы доказали, что если у исходной системы (ЗЛ9) существу- ет при Д 0 решение, то это решение однозначно определяется фор- мулами Крамера (3.24). Чтобы доказать, что решение в самом деле существует, мы должны подставить в исходную систему (3.19) на место х, у и z их значения, определяемые формулами Крамера (3.24), и убедиться в том, что все три уравнения (3.19) обращаются при этом в тождества. Убедимся, на- пример, что первое уравнение (3.19) обращается в тождество при под- становке значений х, у и z, определяемых формулами Крамера (3.24). Учитывая, что Дх = М{ + h2A2 + h3A3>. -1\В{ + h2B2 + h3B3, получим, подставив в левую часть первого из уравнений (3.19) значе- ния х, у и z, определяемые формулами Крамера: t Д: А, дг atx + bly+clz = al-^ + bl — + cl-^ = д д д = Т {fl! (Mi +fhA2+ f^A^ + 6, (hxBl + h2B2 + h3B3) + (AjCj + h2C2 + h3C3)}. 58
Группируя внутри фигурной скобки члены относительно йь hi и hi, получим, что alx + bty + ctz = — {hx(axAl +blBl +с1С|) + й2[а)Л2 + btB2 + с1С2] + Д +Лз[«Л +biB3 +qc?]}- В силу свойства 9 в последнем равенстве обе квадратные скобки равны нулю, а круглая скобка равна определителю Д. Таким образом, мы получим alx + biy+ciz = hv и обращение в тождество первого урав- нения системы (3.19) установлено. Аналогично устанавливается обра- щение в тождество второго и третьего уравнений (3.19). Мы приходим к следующему выводу: если определитель Д систе- мы (3.19) отличен от нуля, то существует, и притом единственное, решение этой системы, определяемое формулами Крамера (3.24). 2.2. Однородная система двух линейных уравнений с тремя неизвестными В этом и в следующих разделах мы разовьем аппарат, необходи- мый для рассмотрения неоднородной системы (3.19) с определителем, равным нулю. Сначала рассмотрим однородную систему двух линей- ных уравнений с тремя неизвестными: aix + bty+ciz = Q, (3.25) a2x + b2y + c2z=0. Если все три определителя второго порядка, которые можно со- ставить из матрицы Ip! 6| с, II (3.26) ||а2 Ь2 с2|| равны нулю, то в силу утверждения из разд. 1.1 коэффициенты первого из уравнений (3.25) пропорциональны соответствующим коэффициен- там второго из этих уравнений. Стало быть, в этом случае второе Уравнение (3.25) является следствием первого, и его можно отбро- сить. Но одно уравнение с тремя неизвестными ахх + bty+c\z=Q, есте- ственно, имеет бесчисленное множество решений (двум неизвестным можно предписывать произвольные значения, а третье неизвестное определять из уравнения). Рассмотрим теперь систему (3.25) для случая, когда хотя бы один “з определителей второго порядка, составленных из матрицы (3.26), 59
отличен от нуля. Не ограничивая общности, будем считать, что отли- чен от нуля определитель1 «1 «2 (3.27) Тогда мы можем переписать систему (3.25) в виде alx + bly=-clz, а2х + b2y=-c2z и утверждать, что для каждого z существует единственное решение этой системы, определяемое формулами Крамера (см. разд. 1.2, форму- лы (3.8)): (3.28) Далее удобно использовать алгебраические дополнения Аз, В3 и Сз элементов третьей строки определителя «I Ь q а2 ^2 С2 * аз Ь3 с3 В силу результатов разд. 1.5 о связи алгебраических дополнений и миноров можно записать 4 = 6| q > с3 = a, (3.29) с2 а2 с2 а2 Ь2 Основываясь на (3.29), мы можем переписать формулы (3.28) в виде Л3 В3 x = — z, y = — z. С3 у сг (3.30) Для того чтобы получить решение в виде, симметричном относи- тельно всех неизвестных х, у, и z, положим t = z/Сз (отметим, что в силу (3.27) определитель Сз отличен от нуля). Поскольку z может при- 1 Это предположение не снижает общности, ибо порядок следования неизвестных ; х, у, z находится в нашем распоряжении. 60
нимать любые значения, то и новая переменная t может принимать любые значения. Мы приходим к выводу, что в случае, когда определитель (3.27) отличен от нуля, однородная система (3.25) имеет бесчисленное мно- жество решений, определяемых формулами x = A3t} y = B3t, z = C3t, (3.31) в которых t принимает какие угодно значения, а алгебраические до- полнения Аз; Вз и Сз определяются формулами (3.29). 2.3. Однородная система трех линейных уравнений с тремя неизвестными Рассмотрим теперь однородную систему трех уравнений с тремя неизвестными axx + bxy+ qz = 0, а2х + b2y+c2z=Q9 (3.32) a3x + 63y+c3z = 0. Очевидно, что эта система всегда имеет так называемое тривиа- льное решение: х = = О, z = 0. В случае, когда определитель системы Д^О, это тривиальное ре- шение является единственным (в силу разд. 2.1). Докажем, что в случае, когда определитель Д равен нулю, однород- ная система (3.32) имеет бесчисленное множество решений. Если все определители второго порядка, которые можно составить из матрицы а\ Ь} сх а2 Ь2 с2 а3 Ь3 с3 (3.33) равны нулю, то в силу утверждения из разд. 1.1 соответствующие ко- эффициенты всех трех уравнений (3.32) пропорциональны. Но тогда второе и третье уравнения (3.32) являются следствиями первого и мо- гут быть отброшены, а одно уравнение a1x + fe1y+qz = 0, как уже отме- чалось в разд. 2.2, имеет бесчисленное множество решений. Остается рассмотреть случай, когда хотя бы один минор матрицы (3.33) отличен от нуля. Так как порядок следования уравнений и неиз- вестных находится в нашем распоряжении, то, не охраничивая общно- сти, мы можем считать, что отличен от нуля определитель (3.27). Но тогда, как установлено в разд. 2.2, система первых двух уравне- 61
ний (3.32) имеет бесчисленное множество решений, определяемых формулами (3.31) (при любом /). Остается доказать, что х, у, z, определяемые формулами (3.31) (при любом f), обращают в тождество и третье уравнение (3.32). Подставляя в левую часть третьего уравнения (3.32) х, у и z, определяемые форму- лами (3.31), получим а3х + Ь3у + c3z = (а3А3 + b3B3 + c3C3)t = k-t. Мы воспользовались тем, что в силу свойства 9 выражение в круг- лых скобках равно определителю Д системы (3.32). Но определитель Д по условию равен нулю, и поэтому при любом t мы получим a3x + b3y + c3z = Q. Итак, доказано, что однородная система (3.32) с определителем Д, равным нулю, имеет бесчисленное множество решений. Если отличен от нуля минор (3.27), то эти решения определяются формулами (3.31) при произвольно взятом t. Полученный результат можно сформулировать еще и так: однород- ная система (3.32) имеет нетривиальное решение в том и только в том случае, когда определитель ее равен нулю. 2.4. Неоднородная система трех линейных уравнений с тремя неизвестными с определителем, равным нулю Теперь мы располагаем аппаратом для рассмотрения неоднородной системы (3.19) с определителем Д, равным нулю. Могут представиться два случая: а) хотя бы один из определителей Дх, Д, или Дг отли- чен от нуля; б) все три определителя Дх, Д, и Д- равны нулю. , В случае а) оказывается невозможным хотя бы одно из равенств (3.23), т. е. система (3.23) не имеет решений, а поэтому не имеет ре- шений и исходная система (3.19) (следствием которой является систе- ма (3.23)). Переходим к рассмотрению случая б), когда все четыре определи- теля Дх, Ду и равны нулю. Начнем с примера, показывающего, что и в этом случае система может не иметь ни одного решения. Рассмотрим систему х + y + z = l, 2x+2y+2z = 3, 3x + 3y+3z = 4. Ясно, что эта система не имеет решений. В самом деле, если бы реше- ние хо, Уо, zo существовало, то из первых двух уравнений мы получили 62
бы х0 +jo + *о = 1, 2х0 + 2у0 + 2z0 = 3, а отсюда, умножая первое равен- ство на 2, получили бы, что 2 = 3. Далее, очевидно, что все четыре определителя Д, ДЛ, Д^ и Д2 равны нулю. Действительно, определитель системы 1 1 1 Д = 2 2 2 3 3 3 имеет три одинаковых столбца, определители ДЛ, &у и Д2 получаются путем замены одного из этих столбцов свободными членами и, стало быть, имеют nd два одинаковых столбца. В силу свойства 3 все эти определители равны нулю. Докажем теперь, что если система (3.19) с определителем Д, рав- ным нулю, имеет хотя бы одно решение, то она имеет бесчисленное множество различных решений. Предположим, что указанная система имеет решение хо, уо, ?о- Тог- да справедливы тождества «Л + Vo +c,z0 = h„ «2*0 ~^^2Уо ^2^0 = ^2» (3.34) «з*о+Vo+<3zo =Лз- Вычитая почленно из уравнений (3.19) тождества (3.34), получим систему уравнений «1(* “*о) + bt(y~ Уо) + c,(z “ zo) = 0, . «2(*-*о) + 62(у-yo) + c2(z-zo)=°> (3,35Э «з(*-*о) + ^з(У-Уо) + Сз(2-го) = О, эквивалентную системе (3.19). Но система (3.35) является однородной системой трех линейных уравнений относительно трех неизвестных (*-*о), (у-уо) и (z —zq) с определителем Д, равным нулю. Согласно разд. 2.3 последняя система (а стало быть, и система (3.19)) имеет бес- численное множество решений. Например, в случае, когда отличен от нуля минор (3.27), мы с помощью формул (3.31) получим следующее бесконечное множество решений системы (3.19): х=х0 +A3t, у=у0 +B3t, z = z0 +C3t (t принимает любые значения). 63
Сформулированное утверждение доказано, и мы можем сделать следующее заключение: если А = Дх = Д^, = Д2 = О, то неоднородная сис- тема уравнений (3.19) либо совсем не имеет решений, либо имеет их бесконечное множество. § 3. Понятие об определителях любого порядка и о линейных системах с любым числом неизвестных Установленное нами свойство разложения определителя третьего порядка по элементам любой (например, первой) строки может быть положено в основу последовательного введения по индукции опреде- лителя четвертого, пятого и всех последующих порядков. Предположим, что нами уже введено понятие определителя поряд- ка (л -1), и рассмотрим произвольную квадратную матрицу, состоя- щую из л2 элементов а\\ а\2 а\3 •* “ъ, Л21 а22 а23 ' " а2п а3\ а32 а33 • .. а3„ (3.36) аЛ ап2 апЗ ••• ат Назовем минором любого элемента ау матрицы (3.36) уже вве- денный нами определитель порядка (п -1), отвечающий матрице (3.36), у которой удалены z-я строка и у-й столбец. Договоримся обо- значать минор элемента ау символом Му. Например, минор любого элемента ау первой строки мат- к рицы (3.36) является следующим определителем порядка (л -1): а21 ... а2(у_|) л2(у+1) ... а2п Му = а3\ ••• аЗ(/-1) аЗ(/Я) ••• а3п , (/=1, 2, ..., и). ... ^л(у+1) ••• &пп Назовем определителем порядкам, отвечающим мат- рице (3.36), число Д, равное сумме Д = ^(—1) jaXjMXj =аиМп —апМп + я13М13 + — + (~1) аы^\п | 7=1 (337) { и обозначаемое символом I 64
1 Д = aU a\2 a2l «31 a22 «32 «13 •" «1л «23 "• a2n a33 a3n (3.38) an\ an2 an3 "• aim Заметим, что при n = 3 разложение (3.37) совпадает с разложением (3.16) определителя третьего порядка по первой строке. Такая схема введения определителя любого порядка реализована в книге В.А. Ильина и Э.Г. Позняка «Линейная алгебра» (М.: Физмат- лит, 2001). Там же доказано, что определители любого порядка п обла- дают теми же самыми свойствами 1—9, которыми, как мы установили в разд. 1.4 и 1.5, обладают определители третьего порядка. Рассмотрим теперь неоднородную систему п уравнений с п неизве- стными: а11х1+а,2х2+... + а1яхв=й1, . «21*1 + а22Х2 +- + а2'Х„ =h2> п M+a,ax1+...+a^,=h,. Определитель порядка п, составленный из коэффициентов при не- известных системы (3.39) и совпадающий с определителем Д из равен- ства (3.38), называется определителем этой системы. При любом у, равном 1, 2, ..., л, обозначим символом Д7- определитель порядка и, полученный из определителя системы Д путем замены его у-го столбца столбцом свободных членов Ль Л2, ..., Лй. В полной аналогии со случаем п = 3 оказывается справедлив следу- ющий замечательный результат: если определитель Д неоднородной системы (3.39) отличен от нуля, то эта система имеет единствен- ное решение, определяемое формулами Крамера: Далее можно доказать, что если определитель системы Д равен нулю, а хотя бы один из определителей Дь Д2, ..., Дй отличен от нуля, то система (3.39) не имеет решений. В случае же, если п>2 и все определители Дь Д2, ..., Дй равны нулю, система (3.39) может также не иметь решений, но если она 65
имеет хотя бы одно решение, то она имеет их бесчисленное множе- ство. Доказательство сформулированных утверждений и полную тео- рию линейных систем т уравнений с п неизвестными можно найти в кн.: Ильин В. А. и Позняк Э. Г. Линейная алгебра. М.: Физматлит, 2001. § 4. Отыскание решения линейной системы методом Гаусса Рассмотрим неоднородную систему (3.39), в которой мы теперь для сокращения записи переобозначим свободные члены h\, h2, ..., hn, используя для них обозначение й, = а/(пИ) при i= 1, 2, ..., п. Изложим один из самых простых методов решения этой системы, заключаю- щийся в последовательном исключении неизвестных и называемый методомГаусса. Выберем из коэффициентов а„ при неизвестных коэффициент, от- личный от нуля, и назовем его ведущим. Не ограничивая общности, будем считать, что таким коэффициентом является ац (ина- че мы могли бы поменять порядок следования неизвестных и уравне- ний). Поделив все члены первого уравнения (3.39) на ац, получим пер- вое приведенное уравнение xi + 4 2х 2 + • • • + = -40) аи в котором by =— при j= 1, 2, ..., (п+ 1). а\\ Напомним, что а|(пИ) =ht и, в частности, аКпИ) =й,. Для исключения неизвестного х\ вычтем из z-ro уравнения системы (3.39) алх1+ад+-+ал=а<(»и) (г'=2> 3> •••>«) умноженное на аа приведенное уравнение (3.40). В результате получим для любого i = 2, 3, ..., п уравнение в котором а® = а„ - ап • Ьу при j = 2, 3, (л + 1). (3.41) Таким образом, мы получаем первую укороченную систему 66
1 а22Х2 +-" + аЬХя ~ a2(»rt)’ (3.42) <...................... а«2Х2 + ••• + атХ„ = an(L)> коэффициенты которой определяются по формулам (3.41). В системе (3.42) находим отличный от нуля ведущий коэффици- ент. Пусть это будет а22. Тогда, поделив первое уравнение (3.42) на этот коэффициент, мы получим второе приведенное уравнение и, исключив с помощью этого уравнения по описанной выше схеме неизвестное х2, при- дем ко второй укороченной системе, не содержащей Xi и х2. Продолжая рассуждения по этой схеме, называемой прямым ходом метода Гаусса, мы либо завершим ее реализацию, дойдя до линейного уравнения, содержащего только одно неизвестное, либо не сможем завершить ее реализацию (вследствие того, что исход- ная система (3.39) не имеет решений). В случае, если исходная систе- ма (3.39) имеет решения, мы получим цепочку приведен- ных уравнений X] + Ь12х2 + +... + bblxn = х2 + +... + Ь®х„ = Ь^, из которой обратным ходом метода Гаусса последова- тельно находятся неизвестные х = Ь"~' лп ип(пЧ)’ , x»-i - °(я-1Х"*1) °(п-1)Л» (3.43) X] = — bhlxn — b^x^ —... — bl2x2., Подчеркнем, что все операции при обратном ходе метода Гаусса (3.43) выполняются без деления. В качестве примера рассмотрим неоднородную систему трех урав- нений с тремя неизвестными 2Х] -Зх2 + 4х3 =20, Зх1+4х2-2х3=-11, <3-44) 4х, +2х2 + Зх3 =9. 67
Конечно, можно убедиться в том, что определитель системы (3.44) отличен от нуля, и найти хь х2 и х3 по формулам Крамера, но мы при- меним метод Гаусса. Поделив первое уравнение системы (3.44) на 2, получим первое приведенное уравнение: х, ~-х2 + 2х3 =10. (3-43 * 45) 2 3 Вычитая из второго уравнения системы (3.44) приведенное урав- нение (3.45), умноженное на 3, и вычитая из третьего уравнения систе- мы (3.44) приведенное уравнение (3.45), умноженное на 4, мы полу- чим укороченную систему двух уравнений с двумя неизвестными —х2-8х3=-41, (3.46) 8х2 - 5х3 = -31. 17 Поделив первое уравнение (3.46) на —, получим второе приведен- ное уравнение: х -^х =_М (3.47) 2 17 3 17 Вычитая из второго уравнения (3.46) приведенное уравнение (3.47), умноженное на 8, получим уравнение: 43 129 —хз =-----> 17 17 43 _ которое после сокращения на — дает х3 = 3. \ Подставляя это значение х3 во второе приведенное уравнение (3.47), получим, что х2 = -2. Наконец, подставляя найденные значения х2 = -2 и х3 = 3 в первое приведенное уравнение (3.45), получим, что Х| = 1.
Глава 4 Векторная алгебра § 1. Понятие вектора и линейные операции над векторами 1.1. Понятие вектора Абстрагируясь от конкретных свойств встречающихся в природе физических векторных величин, мы приходим к понятию геомет- рического вектора, или просто вектора. Геометрическим вектором, или просто векто- ром, будем называть направленный отрезок. Мы будем обозначать вектор либо как направленный отрезок сим- —> 1 волом АВ, где точки А и В обозначают соответственно начало и конец данного направленного отрезка (вектора), либо од- ной жирной латинской буквой, например, а или Ь. На чертеже будем изображать вектор стрелкой, при- чем латинскую букву, обозначающую этот вектор, будем писать у его конца (рис. 4.1). Начало вектора называют точкой его приложения. Если точка А является началом Рис- 4.1 вектора а, то мы будем говорить, что вектор а приложен в точке А. Для обозначения длины вектора будем пользоваться символом модуля (или_абсолютной величины). Так, |ЛВ| и |а| обозначают длины векторов АВ и а соответственно. Вектор называется нулевым, если начало и конец его совпада- ют. Нулевой вектор не имеет определенного направления и имеет длину, равную нулю. Это позволяет нам при записи отождествлять ну- левой вектор с вещественным числом нуль. Векторы называются коллинеарными, если они лежат либо на одной прямой, либо на параллельных прямых. Сформулируем понятие равенства двух векторов: два вектора называются равными, если они коллинеарны, имеют оди- наковую длину и одинаковое направление. Все нулевые векторы счита- ются равными. На рис. 4.2 изображены слева неравные, а справа — равные векто- ры а и Ь. 69
Za Из определения равенства векторов не- посредственно вытекает следующее утвер- *b s S'” ждение: каковы бы ни были вектор а и yfa ' точка Р, существует, и притом единст- /венный, вектор PQ с началом в точке Р, ' Ъ равный вектору а.х Рис 4 2 Иными словами, точка приложения дан- ного вектора а может быть выбрана про- извольно (мы не различаем двух равных векторов, имеющих разные точ- ки приложения и получающихся один из другого параллельным перено- сом). В соответствии с этим векторы, изучаемые в геометрии, называют свободными (они определены с точностью до точки приложения). В механике и физике, кроме свободных векторов, иногда рассматривают сколь- зящие и связанные векторы. Скользящими называют такие векторы, которые считаются эквивалентными, если они не только равны, но и лежат на одной прямой. Примером скользящего вектора может служить сила, приложенная к абсолютно твердо- му телу (известно, что две силы, равные и расположенные на одной прямой, оказывают на абсолютно твердое тело одинаковое механическое воздействие). Связанными называ- ются такие векторы, которые считаются эквивалентными, если они не только равны, но и имеют общее начало. Примером связанного вектора может служить сила, приложенная к некоторой точке нетвердого (например, упругого) тела. 1.2. Линейные операции над векторами Линейными операциями принято называть операцию сложения векторов и операцию умножения векторов на вещественные числа. Сначала определим операцию сложения двух векторов. Определение 1. Суммой а + Ь двух векторов а и Ь называется вектор, идущий из начала вектора а в конец вектора Ь, при условии, что вектор Ь приложен к концу вектора а. Правило сложения двух векторов, содержащееся в этом определе- нии, обычно называют правилом треугольника. Это название объясняется тем, что в соответствии с указанным правилом слагаемые векторы а и Ь (в случае, если они не коллинеар- ны) и их сумма а + Ь образуют треугольник (рис. 4.3).. Правило сложения векторов обладает теми же самыми четырьмя свойствами, что и правило сложения вещественных (или рациональ- ных) чисел1 2. 1 Действительно, существует лишь одна прямая, проходящая через точку Р и па- . раллельная той прямой, на которой лежит вектор а. На указанной прямой существует / единственная точка Q такая, что отрезок PQ имеет длину, равную длине вектора а, и $ направлен в ту же сторону, что и вектор а. | 2См. § 1 гл. 1. J 70
1°. a+b=b+a (переместительное свойство). 2°. (a + b) + c = a + (b + c) (сочетательное свойство). 3°. Существует нулевой вектор 0 такой, что а + 0 = а для любого вектора а (особая роль нулевого вектора). Ь 4°. Для каждого вектора а существует противо- положный ему вектор а' такой, что а + а' = 0. а\ / ъ Убедимся в справедливости этих свойств. Свой- \ / ство 3° непосредственно вытекает из определения 1. \/ Для доказательства свойства 4° определим вектор а', противоположный вектору а, как вектор, Рис- коллинеарный вектору а, имеющий одинаковую с вектором а длину и противоположное направление1. Очевидно, что взятая согласно определению 1 сумма вектора а с таким вектором а' нулевой вектор. Рис. 4.4 Для доказательства свойства 1° приложим два произвольных вектора а и b к общему на- чалу О (рис. 4.4). Обозначим буквами А п В концы векторов а и b соответственно и рас- смотрим параллелограмм ОВСА. Из определе- ния равенства векторов следует, что ВС = ОЛ = а, АС = ОВ = Ь. Из определения 1 и из треугольника О АС -> следует, что диагональ ОС указанного парал- лелограмма представляет собой сумму векто- ров а + Ь, а из треугольника ОВС следует, что та же самая диагональ ОС представляет собой сумму векторов b + а. Тем самым свойство 1° установлено. Остается доказать свойство 2°. Для этого приложим вектор а к произвольной точке О, вектор b к концу вектора а и вектор с к концу вектора b (рис. 4.5). Обозначим буквами А, В и С концы векторов а, Ь и с соответственно. Тогда (в + Ь) + с = (04+ АВ) + ВС = ОВ+ ВС = ОС, a + (b + c) = ОА+ (АВ+ ВС) = ОА+ АС = ОС, т. е. свойство 2° доказано. Замечание!. При доказательстве свойства 1° нами обоснова- но еще одно правило сложения неколлинеарных векторов, называемое 'Для получения а’ достаточно поменять ролями начало и конец вектора а. 71
правилом параллелограмма: если векторы а и b прило- жены к общему началу и на них построен параллелограмм*, то сумма Рис. 4.5 а + Ь (или Ь + а) этих векторов представ- ляет собой диагональ указанного паралле- лограмма, идущую из общего начала век- торов а и Ь. Доказанные свойства 1°—4° позволяют нам оперировать с суммой векторов так же, как с суммой вещественных чисел. В частности, при сложении трех векторов а, Ь и с нет необходимости указывать, как мы понимаем сумму а + Ь + с (как а + (Ь + с) или как (а + Ь) + с). Свойства 1°— 4° позво- ляют нам распространить правило сложения на сумму любого конеч- ного числа векторов. При этом нет необходимости производить сложе- ние последовательно, фиксируя каждйй промежуточный результат; сумма любого числа векторов может быть построена с помощью сле- дующего правила: если приложить вектор а2 к концу вектора а\9 вектор аз к концу вектора а2, ... вектор ап к концу вектора ап_\, то сумма а\+ а2 + +а3 + ... + ап будет представ- лять собой вектор, идущий из начала вектора а\ в конец вектора ап. Сформулированное правило сложения, проиллюстрированное на рис. 4.6, естественно назвать правилом замыкания ло- маной до многоугольника (на рис. 4.6 ломаная ОЯ|Я2Я3...ЯЙ замыкается до многоугольника путем добавления звена ОАп). Наконец, свойства.!0—4° позволяют ис- черпывающим образом решить вопрос о вы- читании векторов. Определение 2. Разностью а-Ь Рис. 4.6 вектора а и вектора b называется такой вектор с, который в сумме с вектором Ь дает вектор а. С помощью свойств 1°—4° элементарно доказывается, что суще- ствует, и притом единственный, вектор с, представляющий собой 1 Следует особо оговорить случай, когда векторы а и b коллинеарны. В этом случае параллелограмм, построенный на векторах а и Ь, вырождается в отрезок, понятие его диагонали теряет смысл, а сумма векторов а и b может быть получена из определе- ния 1. 72
разность а-b, причем этот вектор равен с = а + Ь' где Ь' — вектор, противоположный Ь. В самом деле, если с = а + Ь', то на основании свойств 1°—4° с + b = (а + b*) + b = а + (Ь' + Ь) = а + 0 = а, т. е. вектор с представляет собой разность а-Ь. Убедимся теперь в однозначности разности а-b. Предположим, что, кроме вектора с = а + Ь'9 существует еще один вектор d такой, что d + b = a. Тогда, с одной стороны, (rf + b) + Ь' = а + Ь' = с, с другой сто- роны, (d + b) + b' = d + (b' + b) = d + 0 = rf, т. e. c — d. Непосредственно из определения 2 и из правила треугольника сло- жения векторов вытекает следующее правило построения разности а-Ь\ разность а-b приведенных к общему началу век- торов а и b представляет собой вектор, идущий из конца вычитаемо- го вектора b в конец уменьшаемого вектора а. Это правило иллюстрируется на рис. 4.7. а~ь Перейдем, наконец, к рассмотрению one- рации умножения вектора на / вещественноечисло. / * Определение 3. Произведением а • а (или •-** а -а) вектора а на вещественное число а назы- 0 вается вектор Ь, коллинеарный вектору а, име- рис 4 7 ющий длину, равную |а| -|а|, и направление, совпа- дающее с направлением вектора а в случае а >"0 и противоположное направлению вектора а в случае а<0. Замечание 2. В случае, когда а = 0 или а = 0, произведение а • а представляет собой нулевой вектор, направление которого неоп- ределенно. Геометрический смысл операции умножения вектора на число можно выразить так: при умножении вектора а на число а вектор а «растягивается» в а раз. Конечно, мы должны тут же оговорить условность термина «растя- гивается», ибо действительное растяжение происходит лишь при а > 1; при 0 < а < 1 происходит не растяжение, а сжатие, а при отрицатель- ном а, кроме растяжения (при |а|> 1) или сжатия (при |а|< 1), происхо- дит еще изменение направления вектора на противоположное. Операция умножения вектора на число обладает следующими тре- мя свойствами: 5°. а -(а+Ь) = а. • а +а -Ь (распределительное свойство числового сомножителя относительно суммы векторов). 73
6°. (a +P)a = a-a + 0-a (распределительное свойство векторного сомножителя относительно суммы чисел). 7°. a • (Р • a) = (а • Р) • а (сочетательное свойство числовых сомножителей). Для доказательства свойства 5° приложим векторы а и b к общему началу О и построим на них параллелограмм, диагональ которого бу- дет представлять собой сумму а + b (рис. 4.8). При растяжении1 сторон этого параллелограмма в а раз в силу свойств подобия диагональ также растягивается в а раз, но это и означает, что сумма aa+a-6 равна a - (a +b). Свойства 6° и 7° почти очевид- ны из наглядных геометрических соображений. С учетом оговоренной выше условности термина «растя- жение» свойство 6° означает, что при растяжении вектора а в (a + Р) раз получается такой же вектор, как при сложении вектора а, растяну- того в а раз, с вектором а, растянутым в Р раз. Свойство 7° в тех же терминах означает, что при растяжении век- тора а сначала в р раз, а потом еще в а раз получается такой же век- тор, как и при растяжении вектора а сразу в а -р раз. Итак, мы устано- вили, что линейные операции над векторами обладают свойствами 1—7°. Эти свойства имеют фундаментальное значение, ибо они позволя- ют производить выкладки в векторной алгебре по тем правилам, по которым производятся аналогичные выкладки в обычной алгебре. В заключение докажем следующее утверждение. Теорема 1. Если вектор b коллинеарен нулевому вектору а, то су- ществует вещественное число X такое, что b = Ха. Доказательство. Приложим векторы а и Ь к общему нача- лу О. Тогда эти векторы расположатся на одной прямой, на которой мы выберем начало отсчета, масштабный отрезок и положительное на- правление. Возможны два случая: 1) векторы а и Ь направлены в одну сторону; 2) указанные векторы направлены в противоположные сторо- ны . На рис. 4.9 изображен первый из указанных случаев. * Термин «растяжение» следует понимать в указанном выше условном смысле. Ри- сунок 4.8 отвечает случаю а> 1. 2 Тривиальный случай, когда вектор b нулевой и направление его неопределенно, можно исключить из рассмотрения, ибо в этом случае равенство b = Ха реализуется ? при А = 0. i 74
g, g-| „ Обозначим буквами AwB концы векторов а О АВ и b соответственно и заметим, что, поскольку вектор а ненулевой, точка А отлична от точки Рис. 4.9 q ц0 тогда> исключив тривиальный случай* совпадения точек А и В, мы (в силу разд. 3.3 гл. 2) можем утверждать, что точка О делит направленный отрезок ВА в некотором отношении, которое мы обозначим через -X, т. е. <4Л> ОЛ или, что то же самое2, ОВ=ХОА. (4.2) В случае, когда векторы а и b направлены в одну сторону (как на рис. 4.9), точка О лежит вне отрезка ВА, и потому отношение (4.1) отрицательно, а Х>0. Если же векторы а и Ь направлены в противоположные стороны, то точка О лежит внутри отрезка ВА, и потому отношение (4.1) по- ложительно, а Х<0. х Докажем, что в обоих случаях Ь = Ха. Достаточно доказать, что два вектора Ь и Хе 1) коллинеарны, 2) имеют одинаковую длину, 3) имеют одинаковое направление. Коллинеарность векторов b и Хе вытекает из коллинеарности век- торов а и b и определения произведения вектора на число. Равенство длин векторов 6 и Хе непосредственно следует из опре- деления произведения вектора на число и соотношения (4.2). . Наконец, тот факт, что векторы 6 и Ха имеют одинаковое направ- ление, следует из определения произведения вектора на число и из того, что X > 0, когда а и b одинаково направлены, и X < 0, когда а и b противоположно направлены. Теорема доказана. КЗ. Проекция вектора на ось и ее свойства Прежде всего, определим проекцию вектора а-АВ на произволь- ную ось и. Обозначим буквами А' и В' основания перпендикуляров, опущенных на ось и из точек А и В соответственно (рис. 4.10). Проекцией вектора а = АВ на ось и называется ее- —> личина А'В' направленного отрезка А*В1 оси и. 1В этом случае векторы а и b совпадают и равенство b = Ха реализуется при X = 1. Здесь под ОА и ОВ следует понимать величины направленных отрезков. 75
Договоримся обозначать проекцию вектора а на ось и символом приа. Построение проекции вектора а = АВ на ось и иллюстрируется на рис. 4.10, где символами аир обозначены две проектирующие плоскости (т. е. плоскости, пер- пендикулярные оси и и проходящие через концы -> А и В вектора а = АВ). J1^5L дальнейшего нам понадобится понятие —> угла наклона вектораа = АВ к оси и. Этот угол может быть определен как угол ф между двумя выходящими из произвольной точ- ки М лучами, один из которых имеет направле- ние, совпадающее с направлением вектора —> а = АВ, а другой — направление, совпадающее с направлением оси и (рис. 4.10). Очевидно, на величину угла наклона вектора а к оси и не влияют выбор точки М выхода указанных выше лучей и замена оси и любой другой осью у, имеющей то же направление, что и ось и. Докажем следующее утверждение. Теорема 2. Проекция вектора а на ось и равна длине вектора а, умноженной на косинус ф — угла наклона вектора а к оси и. Доказательство. Обозначим через v ось, проходящую че- рез начало А вектора а и имеющую то же направление, что и ось и (рис. 4.10), и пусть С — проекция В на ось у. —> Тогда /.ВАС равен углу ср наклона вектора а = АВ к любой из осей и или v, причем точка С заведомо лежит в указанной на рис. 4.10 про- ектирующей плоскости р (т. е. в плоскости, перпендикулярной оси и и проходящей через точку В). Далее можно утверждать, что* 1 А'В' = АС, ибо оси и и v параллель- ны и одинаково направлены и отрезки этих осей, заключенные между параллельными плоскостями аир, равны. Так как по определению приа = А'В', то мы приходим к равенству приа = АС. (4.3) Но величина А С представляет собой проекцию направленного от- резка АВ на ось v, которая (в силу разд. 3.1 гл. 2) равна ‘ АС = | АВ |- cos ср = |а|cos ср ^-4) —> 1 Здесь под А'В' следует понимать величину направленного отрезка А*В* оси и, а под АС — величину направленного отрезка АС оси v. 76
Из сопоставления равенств (4.3) и (4.4) вытекает равенство лри а = |а|cos ср. (4.5) Теорема доказана. Основные свойства проекции вектора на ось заключают- ся в том, что линейные операции над векторами приводят к соответст- вующим линейным операциям над проекциями этих векторов (на про- извольную ось). Именно справедливо следующее утверждение: при сло- жении двух векторов di и d2 их проекции на про- извольную ось и складываются. При умноже- нии вектора d\ на любое число X проекция это- го вектора на произвольную ось и также ум- ножается на число X. Доказательство этого утверждения мы отложим до следующего раздела. Основные свойства проекции вектора на ось естественно на- звать линейными свойствами. 1.4. Декартовы прямоугольные координаты вектора Введем в пространстве декартову прямоугольную систему с нача- лом в точке О. Обозначим через i, j и к тройку векторов единичной длины, приложенных к точке О, лежащих на осях Ох, Оу и Oz соответ- ственно и имеющих направления, совпадаю- щие с направлениями этих осей (рис. 4.11). Мы сейчас убедимся в том, что для про- извольного вектора d существуют три одно- значно определяемых вещественных числа X, Y и Z таких, что d=Xi + Yj+Zk. (4.6) Эти три числа называются декартовы- ми прямоугольными коорди- натами вектора'd. Мы будем называть эти три числа про- сто координатами вектора d (опуская слова «декартовыми», «прямоугольными») и для записи координат будем использовать сле- дующую символику: d = {X, Y,Z}. Приложим вектор d в точке О и проведем через его конец D плос- кости, параллельные координатным плоскостям (рис. 4.11). Точки пе- ресечения этих плоскостей с осями Ох, Оу и Oz обозначим соответст- 77
венно через А, В и С. Из прямоугольника OCDE и из правила сложе- —> —> ния векторов вытекает, что d = ОС+ОЕ. Аналогично из прямоугольни- ка ОВЕА вытекает, что ОЕ = ОА+ ОВ. Сопоставляя последние два ра- венства, получим, что d = OA+OB+OC. <4-7> —> Так как вектор ОА коллинеарен ненулевому вектору i (с которым он лежит на одной прямой), то в силу теоремы 1 существует число X такое, что OA=X-i. (4.8) Из аналогичных соображений вытекает существование веществен- ных чисел Y и Z. таких, что ОЯ = Уу; OC = Zk. <49> Вставляя (4.8) и (4.9) в (4.7), мы получим равенство (4.6). Докажем теперь, что фигурирующие в равенстве (4.6) координаты X, Y и Z вектора d равны проекциям этого вектора на оси Ох, Оу и Oz соответственно. (Тем самым будет доказана однозначность опре- деления координат вектора.) Ограничимся проведением рассуждений для первой координаты, ибо для второй и третьей они проводятся ана- логично. Так как проекция вектора d на ось Ох равна величине ОА на- правленного отрезка этой оси, то следует доказать, что Х=ОА. Из ра- венства (4.8) и из того, что | /| =1, вытекает, что |ОЛ| = |АГ|. Но и знаки ОА и X совпадают, ибо в случае, когда векторы ОА и i направлены в одну сторону, оба числа ОА и X положительны, а в случае, когда век- —> торы ОА и i направлены в противоположные стороны, оба числа. ОА и X отрицательны. Убедимся теперь в том, что линейным операциям над векторами отвечают аналогичные линейные операции над координатами этих век- торов. Теорема 3. При сложении двух векторов d\ и di их координаты складываются. При умножении вектора d\ на любое вещественное число X все его координаты умножаются на это число. Доказательство. Пусть d} =Х} *i + Y} -j +Z] k, d2=X2i + Y2j +Z2- k. Тогда в силу свойств линейных операций над векторами (см. разд. 1.2, свойства 1°—7°) dl+d2 = (Xt+X2)i + (Yl+Y2)j+(Zt+Z2)k, (4.10) Xrf, = (МГ,)/ + (ХУ,)/ + (XZ, )А. (4.11) 78
В силу, однозначности определения координат теорема доказана. В заключение докажем справедливость сформулированных в конце разд. 1.3 линейных свойств проекции вектора на ось. Теорема 4. При сложении двух векторов d\ и d2 их проекции на произвольную ось складываются, а при умножении вектора d\ на лю- бое число 1 его проекция на произвольную ось умножается на число 1. Доказательство. Пусть даны произвольная ось и и любые векторы di и d2. Введем декартовы прямоугольные координаты так, чтобы ось и совпала с осью Ох. Пусть при таком выборе декартовой системы d. = X. -i + К. • /' +Z. -k; d2=X2-i + Y2- J + Z2 -k. Тогда в силу теоремы 3 справедливы равенства (4.10) и (4.11). В силу доказанного в данном разделе утверждения о том, что первая коорди- ната любого вектора равна его проекции на ось Ох, и в силу того, что ось и совпадает с осью Ох, получим, что X\=npadt, X2 = npud2, Х\ + Х2 = при (d, +d2), XX, = при (Ыг). Таким образом, npu(d, + d2) = npud} +npud2, npu(X-dt)=l-npudv Теорема доказана. § 2. Скалярное произведение двух векторов 2.1. Определение скалярного произведения Сначала введем понятие угла между двумя ненулевыми векторами —> —> а и Ь. Приложим эти векторы к одной точке О, и пусть а = ОА, Ь = ОВ (рис. 4.12). Углом.между в е к т о р а м и а и b на- а/А зовем наименьший угол между лучами ОА и / °В' /\<р=(а>) Этот угол мы будем обозначать либо через ср, А —у» либо символом (а,Ь). Ясно, что 0<ср<л. Л Рис. 4.12 Определение 1. Скалярным произве- дением двух векторов а и b называется число, обозначаемое симво- лом (а, Ь), которое равно произведению длин этих векторов на косинус уела ф между ними в случае, когда оба вектора не являются нулевы- ми, и равно нулю в случае, когда хотя бы один из векторов является нулевым. 79
Итак, скалярное произведение двух ненулевых векторов а и b по определению равно (a,b) =|a|-|6|-coscp. (4.12) Дадим другое эквивалентное определение скалярного произведения двух векторов, хотя бы один из которых является ненулевым. В соответствии с символикой, принятой в разд. 1.3, будем обозна- чать проекцию вектора b на ось, определяемую ненулевым вектором а, символом праЬ и учтем, что в силу теоремы 2 (см. равенство (4.5)) n/>e6 = |6|-coscp, (4.13) где <р — угол между векторами а и Ь. Сопоставляя равенства (4.12) и (4.13), мы получим другое выраже- ние для скалярного произведения двух ненулевых векторов а и Ь-. (а,6)=|а|-лдД _ (4.14) которое остается справедливым и в случае нулевого вектора Ь. Конечно, в проведенных рассуждениях векторы а и b можно поме- нять ролями и для случая ненулевого вектора b получить выражение (а,й)=|б|-л/?да, (4.15) справедливое для любого (в том числе и нулевого) вектора а. Равенства (4.14) и (4.15) приводят к следующему определению. Определение 2. Скалярным произведением двух век- торов, хотя бы один из которых является ненулевым, называется число, равное произведению длины того из этих векторов, который является ненулевым, на проекцию другого из этих векторов на ось, определяемую первым из указанных векторов. Понятие скалярного произведения родилось в механике. Если век- тор а изображает силу, точка приложения которой перемещается из начала в конец вектора д, то работа, производимая указанной силой, будет равна скалярному произведению (п,д). 2.2. Свойства скалярного произведения Определение 3. Два ненулевых вектора а и b называются ор- тогональными (или перпендикулярными), если угол ср между этими векторами является прямым. Если хотя бы один из век- торов а и Ь является нулевым, то эти векторы также считаются ортогональными (ибо нулевой вектор можно считать вектором, имею- щим произвольное направление). 80
Теорема 5. Необходимым и достаточным условием ортогонально- сти двух векторов а и b является равенство нулю их скалярного про- изведения (а,Ь). Доказательство. Исключим из рассмотрения тривиальный случай, когда хотя бы один из векторов а и b является нулевым (в этом случае эти векторы ортогональны и их скалярное произведение (a,i) равно нулю). Два ненулевых вектора а и Ь ортогональны тогда и только тогда, когда косинус угла ср между ними равен нулю, т. е. тогда и только тог- да, когда определяемое равенством (4.12) их скалярное произведение равно нулю. К алгебраическим свойствам скалярного произведе- ния относятся следующие четыре свойства (справедливые для любых векторов а, Ь и с и любого вещественного числа X): 1°. (а,д) = (д,а) (перестановочность множителей). 2°. {а + Ь, с) = (а, с) + (Ь, с) (распределительное свойство). 3°. (Ха,6)=Х(а,6) (вынос числового множителя за знак скалярного произведения). 4°. (а,л)>0, если вектор а ненулевой, (а,а)=0, если вектор а нуле- вой. , ’ Справедливость свойства 1Q непосредственно вытекает из. опреде- ления 1 скалярного произведения. Для обоснования справедливости свойства 4° достаточно убедиться в том, что для любого вектора а его скалярный квадрат (а, а) равен квадрату его длины |а|2, а это вытекает из того, что для нулевого век- тора а оба числа (а, а) и |а|2 равны нулю, а для ненулевого вектора а в равенстве (4.12), взятом при b = a, cos ср = 1. Справедливость свойства 2° для случая, когда хотя бы один из трех векторов а, Ь и с является нулевым, проверяется тривиально: если с = 0, то справедливость свойства 2° вытекает из того, что все три чис- ла (а + Ь, с), (а, с) и (Ь, с) равны нулю; если Ь = 0, то справедливость свойства 2° вытекает из того, что а + Ь = а, (Ь,с)=0; если а = 0, то справедливость свойства 2° вытекает из того, что а + b = b, (а, с) = 0. Для доказательства справедливости свойства 2° для случая ненуле- вых векторов а, Ь и с воспользуемся равенством (4.15), согласно кото- рому (а, с) = |с| • прса\ (6, с) = [с| • прсЬ; (а + Ь, с) = |с| • прс (а+Ь), и заметим, что прс(а + 6)~прса +прсЬ (в силу теоремы 4). 81
Справедливость свойства 3° для случая, когда хотя бы один из век- торов а и b является нулевым, проверяется тривиально: если b = 0, то справедливость свойства 3° вытекает из того, что (в, Ь) = 0 и (Хв, Ь) =0; если а = 0, то справедливость свойства 3° вытекает из того, что Ха =0, (Ха,6)=0 и (а,6)=0. Для доказательства справедливости свойства 3° для случая нену- левых векторов а и b воспользуемся равенством (4.15), согласно ко- торому (Хе, Ь) = |/>| • npb (X • а); (а, Ь) = |б| • прьа, и заметим, что прь(}. -а) = Х -прьа (в силу теоремы 4). В совокупности свойства 2° и 3° естественно назвать свойст- вом линейности скалярного произведения по первому множителю: скалярное произведение, первый мно- житель которого является суммой векторов а и Ь, равно сумме скаляр- ных произведений с первыми множителями, соответственно равными а и Ь; число X, стоящее перед первым множителем скалярного произ- ведения, можно вынести из-под знака этого скалярного произведения. Из свойств 2° и 3° и из свойства перестановочности 1° вытекает, что скалярное произведение обладает свойством линейности и по второму множителю, т. е. (в, Ь + с) = (а, Ь) + (в, с); (a,X-Z>) = X-(a,6). Доказанные свойства 1°—4° имеют фундаментальное значение: они позволяют при скалярном перемножении векторных многочленов вы- полнять действия почленно, не заботясь при этом о порядке вектор- ных множителей и сочетая числовые, множители. 2.3. Выражение скалярного произведения в координатах Теорема 6. Если два вектора а и b определены своими декартовы- ми координатами a = {Xi,Yl,Zi}, b = {X2,Y2,Z2}, то их скалярное про- изведение равно сумме попарных произведений их соответствующих координат, т. е. (a,b) = Xx-X2+Yx-Y2+Zx-Z2. (4.16) Доказательство. Если (как и в разд. 1.4) обозначить через /, j и к векторы единичной длины вдоль осей Ох, Оу и Oz соответст- венно, то a = Xx-i + Yx-j+Zxk-, b =X2i+ Y2-j+Z2k. (4.17) Так как расположенные вдоль декартовых прямоугольных осей векторы i, j и к попарно ортогональны и имеют длину, равную едини- це, то в силу теоремы 5 82
\i,i) = i, (iJ)=O, (i,k)=O, UJ)=1, U,k) = O, <4-18) (k,i)=O, (k,j)=O, (А,Л) = 1. В силу установленных в предыдущем разделе свойств 1°—4° век- торные многочлены, стоящие в равенствах (4.17), можно перемножать почленно, так что (a,6) = (^ri + yi.j+Z1.Ar, Jf2./ + y2.j+Z2.^) = = ^^2.(/,9+^.y2.(/,j)+^-z2.(/,*) + +YcX2-U9i) + YcY2^J) + YcZ2-U,k)^ +Zl-X2-(k9i) + Zl-Y2-(k9j) + ZcZ2-(k9k). Из последнего равенства и соотношений (4.18) вытекает равенство (4.16). Теорема доказана. Следствие из теорем 5 и 6. Необходимым и достаточным услови- ем ортогональности двух векторов а = {X^Y^Z^ и b = {X2,Y29Z2} яв- ляется равенство ХхХ2 +YXY2 + Z,Z2 =0. § 3. Векторное и смешанное произведения векторов 3.1. Правые и левые тройки векторов Определение 1. Векторы называются компланарными, если они лежат либо в одной плоскости, либо в параллельных плоско- стях. Заметим, что три некомпланарных вектора, будучи приведены к общему началу, не лежат в одной плоскости. Определение 2. Три вектора называются упорядоченной тройкой или просто тройкой, если указано, какой из этих векторов является первым, какой вторым и какой — третьим. При записи тройки векторов мы всегда будем располагать эти век- торы в порядке их следования. Так, запись Ь, с, а означает, что вектор b является первым элементом тройки, вектор с — вторым и вектор а — третьим. Определение 3. Тройка некомпланарных векторов а, Ь, с называ- ется правой (соответственно левой), если выполнено одно из следующих двух условий: 1°) если, будучи приведены к общему началу, эти векторы распола- гаются так, как могут быть расположены соответственно большой, несогнутый указательный и средний пальцы правой (соответственно левой) руки', 83
2°) если после приведения к общему началу вектор с располагается по ту сторону от плоскости, определяемой векторами а и Ь, откуда кратчайший поворот от а к b кажется совершающимся против часо- вой стрелки (соответственно по часовой стрелке). Рис. 4.16 Легко проверить, что условия 1° и 2° эквивалентны между собой. Использование условия 1° для проверки того, что тройка а, 6, с яв- ляется правой (соответственно левой), иллюстрирует рис. 4.13 (соот- ветственно рис. 4.14), а использование для тех же целей условия 2° ил- люстрирует рис. 4.15 (соответственно рис. 4.16). Замечание. Понятия правой и левой тройки теряют смысл для компланарных векторов. Если две тройки либо обе являются правыми, либо обе являются левыми, то говорят, что эти тройки одной ориентации. Если же одна из двух троек является правой, а другая — левой, то говорят, что эти тройки противоположной ориентации. 84
Всего из трех векторов а, b и с можно составить следующие шесть троек: а, Ь9 с; 6, с, а; с, а, Ь'9 (4.19) Ь9 а, с; а, с, А; с, Ь, а. (4.20) С помощью любого из условий 1° и 2° определения 3 легко прове- рить, что все три тройки (4.19) той же ориентации, что и тройка а, Ь, с9 а все три тройки (4.20) имеют ориентацию, противоположную ориен- тации тройки а, Ь9 с. Ради определенности договоримся в дальнейшем рассматривать то- лько такие декартовы прямоугольные системы координат, для которых тройка /, у, к векторов единичной длины, расположенных вдоль осей Ох, Оу и Oz соответственно, является правой. (Такие декартовы прямоугольные системы называются правыми.) 3.2. Определения и свойства векторного и смешанного произведений z Определение 1. В е к т о р н ы м произведением двух не- нулевых векторов а и Ь называется вектор с9 удовлетворяющий трем требованиям'. 1) длина |с| этого вектора равна произведению длин век- торов а и b на синус угла (а9Ь) между ними, т. е. |с[ = |л|-|б|-sin(a, Ь)9 2) вектор с ортогонален каждому из векторов а и Ь, 3) вектор с (в случае, если он не является нулевым) направлен так, что тройка век- торов а, Ь9 с является правой. Векторное произведение двух векторов а и Ь9 хотя бы один из которых является нулевым, равно нулю. Для обозначения векторного произведения векторов а и Ь будем использовать символ [М]. Теорема 7 (критерий коллинеарности). Векторы а и b коллине- арны тогда и только тогда, когда их векторное произведение [а, 6] равно нулю. Доказательство. Действительно, векторы а и b коллинеар- ны тогда и только тогда, когда либо а = 0, либо 6 = 0, либо sin(a, 6) = 0. В каждом из этих трех случаев |[в, 6^ = 0, а потому [О] = 0. Замечание. В случае, когда векторы а и Ь неколлинеарны, мо- дуль |[а,6^ векторного произведения [в, 6] равен площади параллелог- рамма1, построенного на приведенных к общему началу векторах а и 1 Ибо площадь указанного параллелограмма как раз и равна произведению его сто- рон на синус угла между ними. 85
b, и вектор [а, 6] перпендикулярен к плоскости, определяемой приве- денными к общему началу векторами а и Ь. Определение 2. Смешанным произведением трех векторов а, b и с называется число ([а, 6], с), равное скалярному про- изведению вектора [в, 6], являющегося векторным произведением пер- вых двух из этих векторов, на третий вектор с. Теорема 8 (критерий компланарности). Три вектора а, b и с компланарны тогда и только тогда, когда их смешанное произведе- ние ([а, 6], с) равно нулю. Доказательство. 1. Пусть сначала векторы й, бис компла- нарны, и требуется доказать, что (fa, Z>], с) = 0. Указанное смешанное произведение заведомо равно нулю в случае, если векторы а и b коллинеарны (в этом случае в силу теоремы 7 рав- но нулю [а, />]) и в случае, если вектор с нулевой. Остается рассмот- реть случай, когда векторы а и b неколлинеарны и вектор с не являет- ся нулевым. В этом случае вектор с или параллелен или совпадает с плоскостью, определяемой приведенными к общему началу векторами а и Ь, а вектор [«, 6] перпендикулярен этой плоскости, и потому ([а,Пс)=0. 2. Пусть смешанное произведение ([а,6],с)=0, и требуется дока- зать компланарность векторов а, b и с. Из равенства нулю смешанного произведения следует, что либо |[а,^ = 0, либо |с| = 0, либо cos<p=0, где <р — угол между векторами [а, 6] и с. Это означает, что либо векторы а и b коллинеарны, либо вектор с является нулевым, либо вектор с параллелен плоскости, опре- деляемой приведенными к общему началу векторами а и Ь. Во всех этих случаях векторы а, b и с компланарны. Теорема 9. Смешанное произведение трех некомпланарных векто- ров а, b и с равно по абсолютной величине объему V параллелепипеда, построенного на приведенных к общему началу векторах а, b и с, при- чем указанное смешанное произведение ([а,Ь],с) равно +V, если трой- ка а, Ь, с правая, и равно -V, если тройка а, Ь, с левая. Доказательство. Из некомпланарности векторов а, b и с следует, что векторы а и b неколлинеарны, а вектор с не является ну- левым. Отлржив векторы а, b и с от одной точки О, мы получим па- раллелепипед, ребрами которого являются эти векторы (рис. 4.17). Обозначим через h высоту этого параллелепипеда, опущенную из конца вектора с на плоскость, определяемую векторами а и Ь. Так как объем параллелепипеда V равен произведению S • h, где S — площадь построенного на векторах а и b параллелограмма, равная в силу замег 86
чания |[a,6| a A=|np(e>i]c| = |c|-|cos<p|, где <р — угол между векторами [а, 6] И С, ТО .... . । г =ца,о|-|с|-|со8(р| (4.21) С другой стороны, по определе- нию скалярного произведения ([в, 6], с) = |[а, 6 J • | с| • cos ф (4.22) Из сопоставления (4.21) и (4.22) вытекает, что V =|([в,6],с)|. Вместе с тем в силу (4.22) знак смешанного произведения ([а, 6], с) совпадает со знаком cos (р и является положительным в том и только в том случае, когда векторы [а, А] и с лежат по одну сторону от плоскости, опреде- ляемой векторами а и Ь, т. е. является положительным в том и только в том случае, когда тройка а, Ь, с так же, как и тройка а, Ь, [а, 6], явля- ется правой. Теорема доказана. Теорема 10. Для любых трех векторов а, b и с ([а,6],с) = (а,[6,с]). (4.23) Доказательство. В случае компланарных векторов а, Ь, с в левой и в правой частях выражения (4.23) стоят нули. Справедливость равенства (4.23) для некомпланарных векторов а, Ь и с вытекает из равенства (а, [6, с]) = ([6, с], а), из теоремы 9 и из того, что тройки а, Ь, с и Ь, с, а, входящие в группу (4.19), имеют одну ори- ентацию. Теорема 11. Для любых трех векторов а, Ь и с справедливы равен- ства , ([«. b ], с) = ([*, с], а) = ([с, а], Ъ) = (4.24) = -([А, а], с) = -([а, с], Ь) = -([с, 6], а). Доказательство. В случае компланарных векторов а, b и с все шесть смешанных произведений, стоящих в (4.24), равны нулю. Справедливость равенств (4.24) для некомпланарных векторов а, b и с вытекает из теоремы 9 и из того, что все тройки (4.19) имеют ту же ориентацию, что и тройка а, 6, с, а все тройки (4.20) имеют ориента- цию, противоположную ориентации тройки а, Ь, с. В заключение установим алгебраические свойства смешанного и векторного произведений. Непосредственно из свойства линейности скалярного произведения ио второму множителю (см. конец разд. 2.2) вытекает, что смешанное произведение трех векторов обладает свойством линейности по по- следнему множителю, т. е. 87
([«, 6], с, + c2) = ([a, Л],ct) + ([a, 6], c2), ([a, &],Xc) =X • ([л, 6], c). Из этого свойства и из равенств (4.24) вытекает, что смешанное произведение обладает свойством линейности по любому из трех множителей. Установим четыре алгебраических свойства векторного произведения (справедливых для любых век- торов а, Ь и с и любого вещественного числа X): 1°. [a,6] = -[6,a] (антиперестановочность). 2°. [а + Ь, с] = [а, с] + [д, с] (распределительное свойство). 3°. [X а, А] = Х •[«,£] (вынос числового множителя). 4°. [а,а]=0. Справедливость свойства 4° вытекает из теоремы 7 и из того, что вектор а коллинеарен самому себе. Для обоснования свойства 1° положим с = [a,6J d = [d,a]. Если векторы а и Ь коллинеарны, то (в силу теоремы 7) с = d = 0, и свойство Г справедливо. Если же а и Ь неколлинеарны, то в силу замечания после доказате- льства теоремы 7 векторы cud имеют одинаковую длину (равную площади параллелограмма, построенного на приведенных к общему началу векторах а и Ь) и оба перпендикулярны к плоскости, определяе- мой приведенными к общему началу векторами а и Ь. Поэтому либо c-d, либо c--d. Равенство c-d следует отбросить, ибо оно означало бы, что тройка Ь, а, с (как и тройка а, Ь, с) является правой, а эти две тройки, принадлежащие к разным группам (4.19) и (4.20), имеют про- тивоположную ориентацию. Для доказательства справедливости свойства 2° обозначим через d вектор d = [a + А, с] - [а, с] - [6, с} Достаточно доказать, что вектор d равен нулю. В силу того что скалярное произведение обладает свойством ли- нейности по первому множителю, получим, что (d,d) = ([a + b, с], d) - ([a, c], d) - ([&, c], rf). (4.25) Далее, в силу того что смешанное произведение обладает свойством линейности по первому множителю, получим, что ([а + 6, с], d) = ([а, с], d) + ([i, с], d). (4.26) Из (4.25) и (4.26) вытекает, что (rf,rf)=0, т. е. d=0. Свойство 3° доказывается аналогично. Если положить rf=[X-a,6]-X-[a,6] и учесть, что и смешанное и скалярное произве- дения обладают свойством линейности по первому множителю, то мы 88
получим, что (rf, d} = ([X • а, Н rf) - (X. [а, 6], d) = Х([а, Л], rf) - X ([а, 6], rf) = 0. В совокупности свойства 2° и 3° означают, что векторное произве- дение обладает свойством линейности по первому множителю. Сопоставляя этот факт со свойством антиперестановочности 1°, мы получим, что векторное произведение обладает свойством линейно- сти и по второму множителю, т. е. [а, Ь + с] = [а, Ь] + [а, cj [а,X • d] = X • [а, 6]. Доказанные свойства 1°—4° имеют фундаментальное значение: они позволяют при векторном перемножении векторных многочленов вы- полнять действия почленно и производить сочетание числовых мно- жителей (но при этом необходимо либо сохранять порядок вектор- ных множителей, либо при изменении этого порядка менять знак на противоположный!). 3.3. Выражение векторного и смешанного произведений в координатах Теорема 12. Если два вектора а и b определены своими декарто- выми координатами а = {Xx,Yx,Zx}, b = {X2,Y2,Z2}, то векторное про- изведение этих векторов имеет вид = -Y2Zx,ZxX2-Z2Xx,XxY2-X2Yx}. &.2Т) Если обозначить через i, j, к векторы единичной длины, направлен- ные вдоль осей Ох, Оу и Oz соответственно, то равенство (4.27) можно переписать в виде [a,b] = (YtZ2-Y2Z,)-i + (Z,X2-Z2XxYj+{XxY2-X2Y,)-k (4.28) или в удобном для запоминания виде1 [а,6] = i j k XxYxZx X2Y2Z2 (4-29) Доказательство. Для получения равенства (4.28) достаточ- но в выражении, полученном при почленном перемножении векторных трехчленов 'Действительно, если воспользоваться результатами разд. 1.5 гл. 3 и разложить определитель, стоящий в правой части формулы (4.29), по первой строке, то мы полу- чим выражение, стоящее в правой части формулы (4.28). 89
[a,A] = (X i + У, j + Z, к, X2-i + Y2 j + Z2 -A] = = Xx • X2 • [j,i] + X, • y2 • [j, j] + X' Z2 • [i, A] + + YCX2-[j, r] + У, • У2 • [/, j] + У, Z2 • [j, к] + +Z, • X2 • [A, i] + Z, • У2 • [A, j] + Z, -Z2 • [A, A], воспользоваться свойством 1° и соотношениями [»,/] = -[/,*] = Л, [/> A] = -[A,j] = », [А,/] = -{/,А] = j, вытекающими из того, что векторы i, j, к попарно ортогональны, име- ют единичную длину и образуют правую тройку. Теорема 13. Если три вектора а, b и с определены своими декар- товыми координатами a = {Xi,Yl,Zl}, b = {X2,Y2,Z2}, c = {X3,Y},Z}}, то их смешанное произведение определяется равенством ([«, А], с) = (y,Z2 - y2Z,) • Х3 + (ZX2 - Z2X) • Уз + - ад) • (4.30) или эквивалентным ему равенством1 ([U<) = хад x>y2z2 x3y3z2 (4.31) Доказательство. Для получения равенства (4.30) достаточ- но привлечь теорему 6 и воспользоваться для скалярного произведения вектора (4.28) и вектора с = Х3 -i + Y3 -j +Z3 -А равенством (4.16). 3.4. Двойное векторное произведение трех ненулевых векторов В приложениях часто используется формула [л,[ft,с]] = Ь-(а,с) - с- (а,Ь) (4.32) для так называемого двойного векторного произведения [«.[Ml- 1 Для ее обоснования направим ось Oz вдоль вектора с, а ось Оу возьмем лежа- щей в плоскости, образованной приведенными к общему началу векторами b и с. При таком выборе декартовых осей векторы а, Ь и с будут иметь координаты, со- ответственно равные {O,Y2,Z2} и {O,O,Z3}, и в силу формулы (4.27) мы получим, что (ft,c] = {Y3Z3,O,O}, и потому [e,[ft,c]] = {O.Z^Z,, -Ip^Zj}. Так как в силу формулы (4.16) b(a,c) = {O,YJZlZ3,Z2ZiZ3}, c(a,b) = = {0,0, ^Y3Z3 +ZlZ3ZJ}, то формула (4.32) доказана. 'Действительно, если воспользоваться результатами разд. 1.5 гл. 3 и разложить определитель, стоящий в правой части формулы (4.31), по третьей строке, то мы полу- чим выражение, стоящее в правой части формулы (4.30). 90
Глава 5 Преобразование декартовых прямоугольных координат на плоскости и в пространстве § 1. Преобразование декартовых прямоугольных координат на плоскости Декартова прямоугольная система координат Оху называется правой (соответственно левой), если кратчайший поворот от оси Ох к оси Оу кажется совершающимся в направлении против часо- вой стрелки (соответственно по часовой стрелке). В дальнейшем мы будем рассматривать только правые декартовы прямоугольные системы координат. При решении многих прикладных и теоретических задач возника- ет необходимость перейти от данной декартовой прямоугольной систе- мы координат Оху к другой декартовой прямоугольной системе коор- динат О'х'у', определенным образом ориентированной относительно первой системы. Изучим вопрос о переходе от данной правой декартовой прямоуго- льной системы Оху к новой правой декартовой прямоугольной системе О'х’у’. Сначала рассмотрим простейший случай, когда оси О'х' и О'у' но- вой системы О’х’у' параллельны соответствующим осям Ох и Оу ста- рой системы Оху и имеют одинаковые с ними направления (рис. 5.1), т. е. слу- чай, когда новая система О'х'у' получа- ется из старой системы Оху посредст- вом ее параллельного пере- носа. Предположим, что начало О' новой системы координат О'х'у' имеет коор- динаты (а, Ь) в старой системе Оху. Тог- да точка М плоскости со старыми коор- динатами (х, у) будет иметь новые ко- ординаты (х', у'), определяемые равен- ством М(х,у) Рис. 5.1 х' =х-а, у' = у-Ь, (5-1) 91
т. е. новые координаты точки равны разности старых ее координат и старых координат нового начала координат. Из равенств (5.1) тривиально получаются формулы х = х' + а, у = у' + Ь, (5.2) выражающие старые координаты (х, у) через новые координаты (х', у7)- Рассмотрим теперь случай, когда новая система координат Ох'у' при неизменном начале О получается из старой системы Оху посредст- вом поворота этой старой системы вокруг точки О на угол а, ко- торый считается положительным, если поворот производится в направ- лении против часовой ном случае. стрелки и отрицательным — в противополож- На рис. 5.2 изображен случай положите- льного угла а. Фиксировав на плоскости произволь- ную точку М, обозначим через 0 угол, об- разованный радиусом-вектором Ом с осью Ох'. Этот угол Р мы будем считать положительным в случае, если ради- ус-вектор ОЛ? повернут относительно оси Ох' в направлении против часовой стрел- ки, и отрицательным в случае, если ради- ус-вектор ОМ повернут относительно оси Ох' по часовой стрелке. При такой договоренности при любом расположении точки М на плоскости (с учетом знаков углов а и 0) угол, который радиус-вектор Oil составляет со старой осью Ох, будет равен а+0. Поэтому, если мы обозначим через г длину |(?л/| радиуса-вектора Ом, то старые коорди- наты (х, у) точки М определятся равенствами х = r-cos(a+0) = r-cosa -cosp - r-sina -sinp, у = r-sin(a+P) = r-sina -cosp + r-cosa -sinp. Так как новые координаты (х7, у') точки М равны на) (5-4) х' = r-cos0, у' = r-sin0, то, используя эти равенства в соотношениях (5.3) и (5.4), мы получим выражения старых координат (х, у) через новые координаты (х7, у'): х = x'-cosa-y'-sina, ~ у = x'-sina + y'-cosa. 92
Для получения обратных выражений новых координат (х', у') через старые координаты (х,у) достаточно рассмотреть равенства (5.5) как систему двух уравнений относительно двух неизвестных х' и у'. Мы получим при этом, что х' = x-cosa +ysinaj у' = - x-sina + ycosa. Обращаясь теперь к общему случаю, когда начало О' новой систе- мы координат имеет в старой системе координаты (а, Ь) и новая ось О’х' образует со старой осью Ох угол а, мы получим из соединения соотношений (5.2) и (5.5) следующие равенства: х = a + x'-cosa -y-sina, у = b + x'-sina +y'-cosa, выражающие старые координаты (х, у) через новые координаты (х', у7). Для получения обратных выражений новых координат (х', у') через старые координаты (х, у) достаточно рассмотреть равенства (5.7) как систему двух уравнений относительно двух неизвестных х' и у'. Мы получим при этом следующие выражения: х' = (х-а) -cosa + (y-Z>)-sina, g^ у' = - (х - a) -sina + (у - Z>)-cosa. Соотношения (5.7) и (5.8) позволяют нам сделать следующий заме- чательный вывод: при переходе на плоскости от одной декартовой прямоугольной системы к другой декартовой прямоугольной системе координаты любой точки этой плоскости по одной из этих систем являются линейными функциями координат этой же точки по другой из этих систем. х § 2. Преобразование декартовых прямоугольных координат в пространстве Декартова прямоугольная система координат Oxyz называется правой (соответственно левой), если с той стороны от плоско- сти Оху, куда направлена ось Oz, кратчайший поворот в плоскости Оху от оси Ох к оси Оу кажется совершающимся против часовой стрелки (соответственно по часовой стрелке). В дальнейшем мы будем рассматривать только правые декартовы прямоугольные системы координат. Изучение вопроса о переходе от данной правой декартовой прямо- угольной системы координат Oxyz к другой правой декартовой прямо- угольной системе координат O'x'y'z' мы начнем с простейшего случая, 93
когда оси О’х', O'y', O'z' новой системы O'x'y'z' параллельны соответ- ствующим осям Ох, Оу и Oz старой системы Oxyz и имеют одинако- вые с ними направления, т. е. со случая,' когда новая система O'x'y'z' получается из старой системы Oxyz посредством ее параллель- ногопереноса. Предположим, что начало О' новой системы координат O'x'y'z' имеет координаты (а, Ь, с) в старой системе координат Oxyz. Тогда произвольная точка М пространства со старыми координатами (х, у, z) будет иметь новые координаты (х', у', z'), определяемые равенствами х'=х-а, y'=y-b, z' = z-c, , (5.9) т. е. новые координаты точки равны разностям старых ее координат и старых координат нового начала координат. Из равенств (5.9) тривиально получаются формулы х=х' + а, y=y' + b, z = z'+c, (5.10) выражающие старые координаты (х, у, z) через новые координаты (x'.y'.z'). Рассмотрим теперь две произвольные правые декартовы прямоуго- льные системы координат Oxyz и Ox'y'z', имеющие общее начало О. Введем в рассмотрение три угла, полностью характеризующие расположение осей второй из этих систем относительно первой систе- мы. Обозначим через Ои ось, совпадающую с линией пересечения ко- ординатной плоскости Оху первой системы с координатной плоско- стью Ох'у' второй системы и направленную в ту сторону, откуда крат- чайший поворот от оси Oz к оси Oz' кажется совершающимся против часовой стрелки (см. рис. 5.3). Пусть теперь у — угол между осями Ох и Ои, отсчитываемый в плоскости Оху от оси Ох в направлении кратчайшего поворота от оси Ох к оси Оу, 0 — не превосходящий л угол между осями Oz и Oz' и, наконец, ср — угол между осями Ои и Ох', отсчитываемый в плоскости Ох'у' от оси Ои в направлении кратчайшего поворота от оси Ох' к оси Оу'. Три угла ср, у и 0 называются углами Эйлера. Очевидно, что по трем углам Эйлера и по направлениям осей Ох, Оу и Oz одно- значно определяются направления осей Ох', Оу' и Oz'. 94
Если заданы три угла Эйлера, то преобразование первой системы Oxyz во вторую систему Ox'y'z' можно представить в виде последова- тельного проведения следующих трех поворотов: 1) поворота системы Oxyz на угол у вокруг оси Oz, переводящего эту систему в систему Oxty\Z\ (рис. 5.4); 2) поворота системы Ox^ytZi на угол 0 вокруг оси Ох\, переводяще- го эту систему в систему Oxzyzzz (рис. 5.5); 3) поворота системы Oxzyzzz на угол <р вокруг оси Ozz = Oz', пере- водящего эту систему в систему Ox'y'z' (рис. 5.6). Рис. 5.5 Рис. 5.6 Каждый из указанных трех поворотов производится в одной из ко- ординатной плоскостей соответствующей’ системы. Поэтому для соот- ветствующих координат при каждом таком повороте будут справедли- вы формулы вида (5.5) из § 1. Это позволяет нам написать следующие формулы: 95
1) для первого поворота: Х=Х, -СО5ф - у -ЗШф, < У = Х] -ЗШф + У, -СОвф, Z = Zp 2) для второго поворота: х, =х2, (5.П) (5.12) у, = У2 cos0 - z2 -sin0, zi = У2 "Sin© + z2 -cos0, 3) для третьего поворота: r x2 = x'-cos ф - y-sin ф, (5.13) < у2 =x'-sin(p + y-cos<p, Л =< Внося хг, уг и z2, определяемые равенствами (5.13), в правые части равенств (5.12), а затем внося хь yt и zb определямые равенствами (5.12), в правые части равенств (5.11), мы получим следующие выра- жения координат (х, у, z) в системе Oxyz через координаты (х', у', z') в системе Ox'y'z': х = (x'-cos <р - y-sin (p) • cos у - [(x'-sin ф + y-cos ф) • cos 0 - z'-sin 0] • siny, . у = (x'-cos ф ~ y*sin ф) • sin ф + [(x'-sin ф+ y-cos ф)-cos 0-z'-sin0]-cosф, z = (x'-sin ф + y-cos ф) • sin 0 + x'-cos 0. (5-14) Собирая в правых частях соотношений (5.14) коэффициенты при х', у' и z', мы получим равенства х = ап -х’+а21 *У+а31 • z’, . y = at2-x'+a22y+a32-z‘, z = al3 • х'+а23 У+а3} • 2, (5-15) в которых коэффициенты aki следующим образом выражаются через углы Эйлера: 96
ан = cos \|/• cos <p - sin у • cos 0 • sin <pt a12 = sin ф-cos ф+cosy-cos 0-sin ' a13 = sin0-sincp, a2l = - cos у • sin ф - sin у • cos 0 • cos у < a22 =-siny •sin9+cos\|/-cos0«cosy (5-16) a23 =sin0-cos9, a31 =siny -cos0, a32 =-cosy -sin0, a33 =cos0. Мы вывели соотношения (5.16), сделав допущение о том, что обе системы имеют общее начало. Если же эти системы имеют начало в разных точках, но получаются одна из другой параллельным переносом, то соотношения (5.16) не ме- няют своего вида, ибо ни направление осей, ни величина углов Эйлера при этом не изменяются. Таким образом, в самом общем случае, когда начало О' системы O'x'y'z' имеет в системе Oxyz координаты (а, Ь, с), из соединения соотношений (5.10) и (5.15) мы получим следующие вы- ражения для координат (х, у, z) произвольной точки в системе Oxyz че- рез координаты (х', у', z') той же точки в системе O'x'y'z': х-а + ан ‘Х'+а2| -У+а31 (5.17) < у = Ь + а12-х’+а22У+а32-г1, z = c + al3 * х'+а23 • У+а33 • z* с коэффициентами определяемыми соотношениями (5.16). Рассматривая равенства (5.17) как систему трех линейных уравне- ний относительно трех неизвестных х', у' и z', читатель без труда полу- чит обратные выражения координат (х', у', z7) через координаты (х, yf z). Мы приходим к следующим двум фундаментальным выводам: 1) самое общее преобразование декартовых прямоугольных коор- динат в пространстве состоит из последовательного проведения па- раллельного переноса и трех проводимых в соответствующих коорди- натных плоскостях поворотов; 2) при переходе в пространстве от одной декартовой прямоуголь- ной системы к другой декартовой прямоугольной системе координа- ты любой точки пространства по одной из этих систем являются линейными функциями координат этой же точки по другой из этих систем. 97
Глава 6 Основы аналитической геометрии § 1. Уравнение линии на плоскости 1.1. Понятие об уравнении линии Предположим, что на плоскости л нам заданы некоторая линия L и некоторая декартова прямоугольная система координат Оху. Рассмотрим, кроме того, некоторое уравнение1, связывающее две переменные х и у: Ф(х,у) = 0. (6.1) Определение 1. Уравнение (6.1) называется уравнением линии L (относительно заданной системы координат), если этому уравнению удовлетворяют координаты любой точки, лежащей на ли- нии L, и не удовлетворяют координаты ни одной точки, не лежащей на линии L. Можно сказать, что линия L представляет собой в заданной систе- ме координат геометрическое место точек, координаты которых удов- летворяют уравнению (6.1). При этом про уравнение (6.1) говорят, что оно определяет линию! (в заданной системе координат). Заметим, что уравнение (6.1) не всегда определяет геометрический образ, который воспринимается нами как линия. Так, уравнение х2 +у2 = 0 определяет на плоскости Оху лишь одну точку (0, 0), а урав- нение х2+у2+ 1 = 0 вообще не определяет никакого геометрического образа. Убедимся в том, что уравнение (х-а)2+(у-Ь)2 =г2 (6.2) является уравнением окружности радиуса г>0 с центром в точке MQ(a, Ь). Действительно, точка М(х,у) лежит на указанной окружно- сти тогда и только тогда, когда расстояние между точками М(х,у) и Mq (а, Ь) равно г, т. е. тогда и только тогда, когда квадрат указанного расстояния (х-а)2 +(у-Ь)2 равен г2. Таким образом, координаты лю- бой точки М (х,у), лежащей на указанной окружности, удовлетворяют 1 Равенство Ф(х,у) = 0 принято называть уравнением, если оно справедливо не для всех пар вещественных чисел хи у, и тождеством, если оно справедливо для всех пар вещественных чисел х и у. 98
уравнению (6.2), а координаты любой точки М(х,у), не лежащей на указанной окружности, не удовлетворяют уравнению (6.2). В случае если центром рассматриваемой окружности' является на- чало координат, т. е. а = 0 и b = 0, уравнение (6.2) принимает более простой вид: х2+у2 = г2. (6.3) Для аналитического представления линии L часто бывает удобно выражать переменные координаты х и у точек этой линии в виде фун- кций некоторой третьей переменной t, называемой параметром, т. е. в виде х = <р(Г), у = ф(0, где функции <р(/) и у (Г) предполагаются непрерывными функциями параметра t (в некоторой области измене- ния этого параметра). Параметрическое представление линии естественно возникает, если эту линию рассматривать как путь, пройденный материальной точкой за время t, отсчитываемое от некоторого начального момента, а функ- ции х = ср(О и у = ф(/) рассматривать как закон движения этой точки. В качестве примера установим параметрические уравнения окруж- ности радиуса г > 0 с центром в начале координат (0, 0), определяемой уравнением (6.3). Взяв на этой окружности произвольную точку М(х,у) и обозначив через t угол между ради- -+ . -У" усом-вектором ОМ и осью Ох, отсчитывав- __ мый в направлении против часовой стрелки м (см. рис. 6.1), мы (по существу используя / ГЛ установленные в гл. 2 формулы перехода от [ /V \ декартовых прямоугольных координат к по- "4---~Гх*" лярным), получим параметрические уравне- \ / ния указанной окружности в виде \ / x = r-cost, y = r-sint. (6.4) Параметр t может принимать при этом Рис. 6.1 любые значения, но, для того чтобы точка М(х,у) один раз обошла окружность, следует ограничить изменение параметра полусегментом 0</<2л. Заметим, что для исключения параметра t из уравнений (6.4) сле- дует возвести в квадрат и сложить эти уравнения (мы получим при этом уравнение (6.3)). В заключение заметим, что иногда уравнение линии (для упроще- ния его вида) удобно записывать не относительно декартовой прямо- угольной, а относительно другой (например, полярной) системы коор- динат. 99
Примером может служить так называемая спираль А р х и - м ед а, представляющая собой линию, описываемую точкой М, дви- жущейся от точки О вдоль оси Ои, вращающейся вокруг точки О про- тив часовой стрелки, при условии, что длина р пути ОМ, пройденного точкой М при движении вдоль оси Ои, и угол ср поворота оси Ои отно- сительно некоторой неподвижной оси Ох при некотором постоянном а связаны соотношением < р = а • <р. (6.5) Если ввести полярную систему координат, поместив полюс в точку О и направив полярную ось вдоль оси Ох, то по самому определению спирали Архимеда ее уравнение в этой системе будет иметь вид (6.5), в котором р — полярный радиус, а ср — полярный угол. На рис. 6.2 сплошной линией изображена часть спирали Архимеда для случая а>0, к пунктирной ли- нией — часть спирали Архимеда для случая. а < 0. В аналитической геометрии рассматривают два типа задач, связанных с уравнением линии: 1) составление уравнения линии, заданной как геометрическое место точек, удовлетворяющих определенным условиям; 2) изучение по заданному уравнению линии ее геометрических свойств (формы и расположения). 1.2. Алгебраические линии на плоскости Определение. Линия L на плоскости называется алгебр аи-, ческой линией п-го порядка или просто линией^ п, - г о порядка, если эта линия в некоторой декартовой прямо- угольной системе координат определяется уравнением (6.1), в кото- ром функция Ф(х,у) является алгебраическим многочленом степени п относительно двух переменных х и у. Другими словами, линией n-го порядка называется ли- ния, определяемая в некоторой декартовой прямоугольной системе ко- ординат алгебраическим уравнением степени п с двумя неизвестными. • Для обоснования корректности сформулированного определения докажем следующее утверждение. Теорема 1. Если линия в некоторой декартовой прямоугольной си- стеме координат определяется алгебраическим уравнением с двумя переменными степени п, то эта линия и в любой другой декартовой прямоугольной системе координат определяется алгебраическим урав-'- нением с двумя переменными той же степени п. .4 100
Доказательство. Предположим, что линия L в некоторой декартовой прямоугольной системе координат Оху определяется урав- нением (6.1), левая часть Ф(х,у) которого представляет собой алгебра- ический многочлен степени п, т. е. сумму слагаемых вида aw-x*-y', (6.6) в которой к и I — целые неотрицательные числа такие, что наиболь- шее значение суммы (к + /) равно п; ак1 — некоторые постоянные чис- ла, причем хотя бы для одной пары к и /, составляющих в сумме п, число аы отлично от нуля. Введем на плоскости любую новую декартову прямоугольную сис- тему координат О'х'у'. Тогда, как доказано в § 1 гл. 5, для координат любой точки в старой и в новой системах координат справедливы фор- мулы (5.7) и (5.8). Чтобы получить уравнение линии L в новой системе координат О'х'у', следует в каждый член (6.6), стоящий в левой части уравнения (6.1), подставить на место х и у их значения, определяемые указанными формулами (5.7). При этом член (6.6) принимает вид аы(а +x‘-cosa -y-sina)* -(fe + x' sina +y'-cosa)/. Отсюда вытекает, что уравнение линии L в новой системе координат О'х'у' будет являться алгебраическим уравнением степени не выше, чем п. Если в проведенных рассуждениях поменять ролями системы Оху и О'х'у', то мы убедимся в том, что алгебраическое уравнение линии L в новой системе О'х'у' имеет степень не ниже, чем п (иначе пе- реход от системы О'х'у' к системе Оху с помощью формул (5.8) § 1 гл. 5 повысил бы степень уравнения линии). Таким образом, линия L опре- деляется в новой системе O'x'y'z' алгебраическим уравнением степени; р а в н о й л. Теорема доказана. Общее уравнение линии первого порядка на плоскости имеет вид Ах + By + С = 0, в котором хотя бы один из коэффициентов А н В отличен от нуля. В § 3 мы убедимся, что это уравнение опреде- ляет прямую линию, и досконально изучим его. Общее уравнение линии второго порядка на плоскости имеет вид Ах2 + Вху + Су2 + Dx + Еу + F = 0, в котором хотя бы один из трех коэффициентов А, В и С отличен от нуля. Линии второго порядка будут изучены в § 5, но уже сейчас мы мо- жем отметить, что линией второго порядка является окружность, опре- деляемая уравнением (6.2). 101
1.3. О пересечении двух линий Рассмотрим задачу о нахождении точек пересечения двух произво- льных линий L\ и L2, определяемых уравнениями Ф)(х, у) = 0 и Ф2(х, у) = 0 соответственно. Так как искомые точки пересечения (в слу- чае, если они существуют) должны одновременно лежать как на линии L\, так и на линии L2, то координаты этих точек должны удовлетво- рять каждому из уравнений Ф](х,у) = 0 и Ф2(х,у) = 0. Таким образом, для нахождения координат всех точек пересечения следует решить си- стему уравнений Ф1(х,у)=0, Ф2(х,у)=0. Каждое решение системы (6.7) определяет координаты точки пересечения линий L\ и L2. Если система (6.7) не имеет решений, то линии L\ и £2 не пересекаются. Найдем, например, точки пересечения двух окружностей х2 +у2 = 1 , и (х — I)2 +у2 = 2. Они являются решениями си- стемы уравнений х2 + у2 -1=0, (х-1)2+у2-2 = 0. Вычитая из первого уравнения (6.8) второе, получим, что 2х = 0, откуда х = 0. Вставляя это значение х в первое уравнение (6.8), найдем, что у = ± 1. Получаем две точки пересечения М\ (0,1) и М2 (0, -1) (см. рис. 6.3). § 2. Уравнение поверхности и уравнения линии в пространстве 2.1. Понятие об уравнении поверхности Предположим, что в пространстве нам заданы некоторая поверх- ность S и некоторая декартова прямоугольная система Oxyz. Рассмот- рим, кроме того, некоторое уравнение, связывающее три переменные х, у и z Ф(х,у, z) = 0. (6.9) Определение 1. Уравнение (6.9) называется уравнением по в е р х н о с т и S {относительно заданной системы координат), если этому уравнению удовлетворяют координаты любой, точки, лег 102
экащей на поверхности S, и не удовлетворяют координаты ни одной точки, не Лежащей на поверхности S. Можно сказать, что поверхность S представляет собой в заданной системе координат геометрическое место точек, координаты которых удовлетворяют уравнению (6.9). При этом про уравнение (6.9) говорят, что оно определяет поверхность S (в заданной системе координат). Конечно, не всякое уравнение (6.9) определяет геометрический об- раз, отвечающий нашему представлению о поверхности (а иногда это уравнение не определяет никакого геометрического образа). Приведите сами соответствующие примеры. Иногда для упрощения вида уравнения для определения поверхно- сти используют не декартову прямоугольную, а другую (например, сферическую) систему координат. Легко убедиться в том, что в декартовой прямоугольной системе координат Oxyz уравнение сферы радиуса R > 0 с центром в точке Мо (а, Ь, с) имеет вид (х-а)2 +(y-b)2 +(z-c)2 =R2. (6.10) Действительно, точка М (х, у, z) лежит на указанной сфере тогда и то- лько тогда, когда квадрат расстояния между точками М(х,у, z) и Л/q (а, Ь, с), определяемый соотношением (х - а)2 + (у-b)2 + (z - с)2, равен Я2. В случае, когда центром Мо сферы служит начало координат (т. е. а = 0, b = 0 и с = 0), уравнение (6.10) принимает более простой вид: х2 + у2 +z2 =R2. (6.11) Еще более простой вид принимает уравнение сферы, если его запи- сать относительно сферической системы координат г, 0, <р. Если ввес- ти сферическую систему координат так, как указано в разд. 4.3 гл. 2, то уравнение сферы радиуса R с центром в начале координат принима- ет вид r = R. Последнее уравнение, полученное из геометрического определения сферы, может быть выведено и посредством подстановки в уравнение (6.11) выражений х, у и z через сферические координаты x = r-sin0-cos<p, y=r-sin0-sm<p, z = r-cos0. В заключение этого раздела остановимся на определении и выводе в декартовой прямоугольной системе Oxyz уравнения цилиндри- ческой поверхности. Определение 2. Поверхность S называется цилиндриче- ской поверхностьюс образующей, параллельной оси Oz, если 103
она обладает следующим свойством: какова бы ни была лежащая на этой поверхности точка M^ix^y^z^), прямая линия, проходящая че- рез эту точку и параллельная оси Oz, целиком лежит на этой поверх- ности. Совершенно аналогично определяются цилиндрические поверхно- сти с образующими, параллельными осям Ох и Оу. Докажем, что всякое уравнение вида F(x,y)=0, (6.12) связывающее две переменные х и у и не содержащее переменной z, определяет цилиндрическую поверхность с образующей, параллельной оси Oz. Действительно, пусть Л/о (х0, уо> ^о) — любая точка, лежащая на по- верхности S, определяемой уравнением (6.12). Тогда координаты этой точки удовлетворяют уравнению (6.12), т. е. справедливо равенство ^(*о,Уо)=О. (6.13) Достаточно доказать, что любая точка М прямой, проходящей че- рез точку Mq и параллельной оси Oz, имеет координаты, удовлетворя- ющие уравнению (6.11). Какова бы ни была точка М прямой, проходя- щей через точку Мо (хо, Уо, 2о) и параллельной оси Oz, ее абсцисса и ор- дината те же, что и у точки MQ, т. е. равны соответственно хо и уо, а аппликата z имеет какое угодно значение. Но в уравнение (6.12) вхо- дят только абсцисса и ордината, а они в силу равенства (6.13) удовлет- воряют этому уравнению. Тем самым доказано, что S — цилиндриче- ская поверхность с образующей, параллельной оси Oz. Заметим, что на координатной плоскости Оху уравнение (6.12) определяет линию, которую обычно называют направляющей цилиндрической поверхности S. В качестве примера приведем уравнение х2 + у1 -г2, которое опре- деляет поверхность круглого цилиндра с образующей, параллельной оси Oz, и с направляющей, представляющей собой лежащую в плоско- сти Оху окружность радиуса г с центром в начале координат. 2.2. Алгебраические поверхности в пространстве Определение. Поверхность S в пространстве называется ал- гебраической поверхностью п-го порядка или просто поверхностью п-го порядка, если эта поверх- ность в некоторой декартовой прямоугольной системе координат определяется алгебраическим уравнением степени п с тремя перемен- ными. 104
. Корректность этого определения вытекает из следующего утверж- дения. Теорема 2. Если поверхность S в некоторой декартовой прямоуго- льной системе координат определяется алгебраическим уравнением с тремя переменными степени п, то эта поверхность и в любой другой декартовой прямоугольной системе координат определяется алгебра- ическим уравнением с тремя переменными той же степени п. Доказательство этой теоремы полностью повторяет схему доказате- льства теоремы 1. Опираясь на доказанное в § Z гл. 5 утверждение о том, что при переходе в пространстве от одной декартовой прямоуго- льной системы к другой декартовой прямоугольной системе координа- ты любой точки по одной из этих систем являются линейными функ- циями координат этой же точки по другой из этих систем, мы полу- чим, что если поверхность S в декартовой прямоугольной системе Oxyz определяется алгебраическим уравнением с тремя переменными степени п, то эта поверхность в произвольной другой декартовой пря- моугольной системе O'x'y'z' определяется алгебраическим уравнением с тремя переменными степени не вышел. Поменяв ролями систе- мы Oxyz и O'x'y'z', мы завершим доказательство теоремы 2. Общее уравнение поверхности первого порядка в про- странстве имеет вид Ах + By + Cz + D = 0, в котором хотя бы один из трех коэффициентов А, В и С отличен от нуля. В § 4 мы убедимся, что это уравнение определяет плоскость, и досконально изучим его. В § 6 будут рассмотрены основные типы поверхностей второ- го порядка. 2.3. Уравнения линии в пространстве Линию в пространстве естественно рассматривать как пересечение двух поверхностей, т. е. как геометрическое место точек, находящих- ся одновременно на двух поверхностях. Если Ф1(х,у, z) = 0 и Фг(х,у, z) = 0 — уравнения двух поверхно- стей, пересечением которых является линия L, то 1) координаты лю- бой точки, лежащей на линии L, удовлетворяют обоим указанным уравнениям; 2) обоим указанным уравнениям не удовлетворяют коор- динаты ни одной точки, не лежащей на линии L. Таким образом, два уравнения ^(x,y,z) = 0, (6.14) Ф2(х,у,я)=0 совместно определяют линию L, т. е. являются уравнениями этой ли- нии. 105
Конечно, любую рассматриваемую линию L можно представить не единственной парой уравнений: вместо двух данных поверхностей можно взять любую другую пару поверхностей, пересекающихся по этой же линии L. Аналитически это означает, что вместо системы (6.14) можно взять любую другую эквивалентную ей систему. Например, уравнения двух сфер х2 + у2 +z2 -1=0, х2 + у2 + (z-3)2-10 = 0 совместно определяют лежащую в плоскости Оху окружность радиуса, равного единице, с центром в начале координат. Ту же самую окруж- ность можно определить уравнениями двух сфер х2 + у2 + z2 -1=0, х2 + у2 + (z-V/?2-l)2 - Л2 = 0, в уравнении второй из которых в качестве R может быть взято любое вещественное число, большее единицы. 2.4. Параметрические уравнения линии и поверхности в пространстве Параметрические уравнения линии L в пространст- ве, задающие координаты х, у и z любой точки этой линии как три не- прерывные функции * = ф(0, У=¥(0, z=x(Z) (6.15) некоторой называемой параметром переменной t, естественно возникают, если эту линию L рассматривать как путь, пройденный ма- териальной точкой за время t, отсчитываемое от некоторого начально- го момента, а функции (6.15) рассматривать как закон движе- ния этой точки. ( Для параметрического задания поверхности 5 координаты любой точки этой поверхности должны быть заданы как непрерывные функ- ции не одного, адвух параметров и и v x = <p(u,v), y = v(u,v), z=x(u,v) (6.16) с обязательным условием, чтобы хотя бы одна пара из трех уравнений (6.16) была разрешима относительно параметров и и v. Если, например, из первых двух уравнений (6.16) можно выразить и и v как функции и = F] (х, у), v~F2 (х, у) переменных х и у, то, подставляя эти выражения для и и v в третье уравнение (6.16), мы получим уравнение вида (6.9) 106
Ф(х, У, z) = z- %[Ft (х, у), F2 (х, у)] = О с тремя переменными х, у и z, которое, как мы уже знаем, определяет некоторую поверхность. В качестве примера приведем параметрические уравнения сферы радиуса г>0 с центром в начале координат x = r-sin0-cosc^ y=r-sin0-sin<p, z = r-cos0. В этих уравнениях параметры 0 и <р представляют собой угловые сфе- рические координаты (широту и долготу) точек поверхности сферы (см. разд. 4.3 гл. 2). Для того чтобы все точки сферы обходились один раз, следует ограничить область изменения параметров промежутками 0< 0 < л; 0< <р<2л. § 3. Прямая линия на плоскости 3.1. Общее уравнение прямой Утверждение 1. Если на плоскости л фиксирована произвольная декартова прямоугольная система Оху и задана произвольная прямая линия L, то эта прямая определяется в системе Оху уравнением пер- вой степени. Достаточно доказать, что прямая L определяется уравнением пер- вой степени при каком-то одном специальном выборе декартовой пря- моугольной системы на плоскости л, ибо тогда в силу теоремы 1 пря- мая L определяется уравнением первой степени при любом выборе де- картовой прямоугольной системы. Направим ось Ох вдоль прямой L, а ось Оу — перпендикулярно к ней. При таком выборе осей уравнением прямой L будет уравнение первой степени у - 0, ибо этому уравнению будут удовлетворять коор- динаты любой точки, лежащей на прямой L, и не будут удовлетворять координаты ни одной точки, не лежащей на прямой L. Утверждение 1 доказано. Утверждение 2. Если на плоскости л фиксирована произвольная декартова прямоугольная система Оху, пго всякое уравнение первой степени с двумя переменными Лх + By + С = 0, в котором хотя бы одна из постоянных А и В отлична от нуля, определяет относитель- но этой системы прямую линию. Действительно, уравнение первой степени Лх + Ду + С = 0, (6.17) в котором хотя бы одна из постоянных А и В отлична от нуля, заведо- 107
мо имеет хотя бы одно решение хо, Уо\ т. е. существует хотя бы одна точка Mq (хо,уо), координаты которой удовлетворяют уравнению (6.17): Ахо + Вуо + С=О. (6.18) Вычитая из уравнения (6.17) тождество (6.18), мы получим уравне- ние А(х-хо)+В(у-уо) = 0, (6.19) эквивалентное уравнению (6.17). л Докажем, что уравнение (6.19) (а потому и уравнение (6.17)) опре- деляет прямую L, проходящую через точку Мо (хо,Уо) и ортогональную ненулевому вектору п = {А,В} (этот вектор является ненуле- вым, поскольку хотя бы одно из чисел А и В отлично от нуля). Действительно, точка М(х,у) лежит на указанной прямой L тогда и только тогда, когда два вектора л = {А,В} и М0М = {х-х0,у-у0} ортогональны, т. е. (в силу теоремы 5 из § 2 гл. 4) тогда и только тог- да, когда скалярное произведение этих двух векторов, стоящее в левой части (6.19), равно нулю. Таким образом, координаты (х, у) точки М удовлетворяют уравнению (6.19) (и потому и уравнению (6.17)) тогда и только тогда, когда точка М лежит на прямой L. Утверждение 2 доказано. Уравнение (6.17) с произвольными коэффициентами А, В и С, пер- вые два из которых не равны нулю одновременно, называется об- щим уравнением прямой. Мы доказали, что прямая, опре- деляемая общим уравнением (6.17), ортогональна вектору п = {А, В}. Этот вектор называют нормальным вектором прямой (6.17). 3.2. Неполные уравнения прямой. Уравнение прямой в отрезках Общее уравнение прямой (6.17) называется полным, если все его коэффициенты А, В и С отличны от нуля. Если же хотя бы один из этих трех коэффициентов равен нулю, уравнение (6.17) называется неполным. Рассмотрим все возможные виды неполных уравнений. 1. С-0. Уравнение Ах + Ву = 0 определяет прямую, проходящую через начало координат (поскольку координаты начала удовлетворяют этому уравнению). 1 Если, например, В * 0, то, взяв произвольное х0, мы получим из уравнения (6.17) А С Л" Вх° в 108
2. В = 0. Уравнение Ах + С = 0 определяет прямую, параллельную оси Оу (поскольку нормальный вектор этой прямой п = {А, 0} ортого- нален оси Оу). 3. А = 0. Уравнение By + С = 0 определяет прямую, параллельную оси Ох (поскольку нормальный вектор этой прямой л = {0, В} ортого- нален оси Ох). 4. В = 0 и С = 0. Уравнение Ах = 0 определяет ось Оу (поскольку прямая, определяемая этим уравнением, параллельна оси Оу и прохо- дит через начало координат). 5. А = 0 и С = 0. Уравнение Ву = 0 определяет ось Ох (поскольку прямая, определяемая этим уравнением, параллельна оси Ох и прохо- дит через начало координат). •" ,, Покажем теперь, что полное уравнение прямой (6.17) может быть приведено к следующему виду: £ + 2 = 1 (6-20) а b называемому у р а в н е н и е м прямой в отрезках. Действительно, так как все коэффициенты А, В и С отличны от нуля, мы можем переписать уравнение (6.17) в виде С С и после этого положить а-—, Ь = —. А В Уравнение прямой в отрезках (6.20) имеет простой геометричесюш смысл: стоящие в нем числа а и b равны величинам направлен- ных отрезков О А' и OB’, которые отсекает пря- мая на осях Ох и Оу соответственно (см. рис. 6.4). Чтобы убедиться в этом, достаточно найти точки пересечения прямой (6.20) с осями коор- динат. Точка пересечения прямой (6.20) с осью Ох находится из совместного рассмотрения уравнения прямой (6.20) и уравнения у = 0 оси Ох. Мы получим координаты точки пересечения А' с осью Ох, равные х = а, у-0. Аналогично устанавливаются координаты х ~ 0, у = Ь точки перечения В' прямой (6.20) с осью Оу. Уравнение прямой в отрезках удобно использовать для построе- ния прямой на чертеже. 109
3.3. Каноническое уравнение прямой и уравнение прямой, проходящей через две данные точки Любой ненулевой вектор, параллельный данной прямой, называет- ся н а п р а в л я ю щи м вектором этой прямой. Кканоническому уравнению прямой мы придем, если по- ставим цель — написать уравнение прямой, проходящей через данную точку М\ (хьу1) и имеющей заданный направляющий вектор q = {/, т}. Очевидно, что точка М(х,у) лежит на указанной прямой тогда и только тогда, когда векторы МХМ = {х -хр у- у,} и q = {/, т} коллине- арны, но для двух коллинеарных векторов, второй из которых, q явля- ется ненулевым, в силу теоремы 1 из гл. 4 найдется число 1 такое, что МХМ- = 1 • q, и так как (в силу теоремы 3 из той же главы) при умноже- нии вектора на какое-либо число координаты этого вектора умножают- ся на это число, то координаты векторов МХМ = {х-хх,у- ух] й q = {/, т} пропорциональны, т. е. справедливо равенство х-хх _ у-у * (6.21) 7 I т Равенство (6.21) и является искомым каноническим у р а в - нениемпрямой. Следует отметить, что в уравнении (6.21) одно из чисел I или т может оказаться равным нулю, но оба эти числа равняться нулю не могут, ибо вектор q = {/, т} не является нулевым. Обращение в нуль одного из знаменателей в (6.21) означает, что и отвечающий ему чис- литель равен нулю. В заключение запишем уравнение прямой, проходящей через две данные и отличные друг от друга точки М\ (xi,yt) и Мг(х2,У2)- Для этого достаточно в каноническом уравнении (6.21) взять в качестве на- —> I 5 правляющего вектора вектор q = МХМ2 = {х2 -хх, у2 - ух}. Мы получим при этом уравнение х-х, _ у-у (6.22) *2-*1 У2~У, 3.4. Параметрические уравнения прямой Параметрические уравнения прямой элементарно вытекают из ее канонического уравнения (6.21). Примем за параметр t величину, стоя- щую в левой и в правой частях (6.21), и заметим, что поскольку хотя бы один из знаменателей в (6.21) отличен от нуля, а стоящий при нем НО
числитель может принимать любые значения, то областью из- менения параметра t является вся бесконечная прямая -<»<?< -ко. Мы получим, что х-х\ = / • t, y-yi = т • t, или окончательно x = xt+l-t, (6.23) Уравнения (6.23) и являются искомыми параметрически- ми уравнениями прямой. Эти уравнения допускают на- глядную механическую интерпретацию: если параметр t — это время, отсчитываемое от некоторого начального момента, то параметрические уравнения (6.23) определяют закон движения материальной точки по прямой линии с постоянной скоростью, равной л//2 + 'll2 (такое движе- ние происходит по инерции). 3.5. Уравнение прямой с угловым коэффициентом Введем понятие угла наклона прямой к оси Ох. Предположив сначала, что прямая не параллельна оси Ох и пересекает ее в точке А,-возьмем на оси Ох произвольную точку М, лежащую по ту сторону от А, куда направлена ось Ох, а на прямой — произволь- ную точку N, лежащую по ту сторону от А, куда направлена ось Оу (см. рис. 6.5). Угол а = Z.NAM назовем углом наклона этой прямой к оси Ох. Если же прямая параллельна оси Ох или сов- у “ / падает с ней, то угол наклона этой прямой к оси / Ох будем считать равным нулю. fN Тангенс угла наклона прямой к оси Ох назовем / угловым коэффициентом этой пря- / мой и обозначим, через к. -----fS-----о—► Итак, по определению fc=tga. Для прямой, ° /А Мх параллельной оси Ох, угловой коэффициент к ра- рис 6 5 вен нулю1: Выведем уравнение прямой, проходящей через данную точку М\(х\, _vi) и имеющей данный угловой коэффициент к. Для этого убедимся в том, что какой бы угол наклона к оси Ох (острый или тупой) ни имела не параллельная оси Оу прямая и в ка- кую бы из двух сторон ни был ориентирован ее направляющий вектор Ч~ {1,т}, угловой коэффициент к этой прямой всегда равен отноше- нию — координат направляющего вектора. 1 Прямая, параллельная оси Оу, не имеет углового коэффициента, хотя иногда Формально говорят, что углойой коэффициент такой прямой равен бесконечности. Ш
Обозначим через а угол наклона прямой к оси Ох, а через 0 — угол наклона направляющего вектора q = {/, т} к оси Ох и рассмотрим четыре возможных случая, изображенных на рис. 6.6. В случаях 1 и 3 угол 0 = а и для проекций на оси вектора q спра- ведливы формулы: I = |<?| • cos 0, т = |#| • cosl j - 0 1 = |^| • sin 0. В случаях 2 и 4 угол 0 = л - а и для проекций на ,оси вектора q справедливы формулы: /=|f|'Cos0, zn = -|^|-sin0. Таким образом, в случаях 1 и 3 получим A.=tga =tg0=—, а в слу- чаях 2 и 4 получим к = tg a = , л т = -tg9=y Итак, всегда к = —. Используя последнее равенство и умножая каноническое уравне- ние прямой (6.21) на т, мы получим искомое уравнение прямой, про- ходящей через точку М\ (xi,yi) и имеющей заданный угловой коэффи- циент к, в виде у-у(=^(х-Х|). (6.24) Обозначив теперь через b постоянную Ь=у\-кх\, мы придадим уравнению (6.24) вид у = кх + Ь. (6.25) Уравнение (6.25) и называется уравнением прямой с угловым коэффициентом. В этом уравнении к обозначает угловой коэффи- циент данной прямой, а b представляет собой вели- чину ОВ направленного отрезка, отсекаемого прямой на оси Оу (см. рис. 6.7). Действительно, рассматри- вая совместно уравнение прямой (6.25) и уравнение х = 0 оси Оу, мы получим, что координаты точки В пересечения прямой (6.25) и оси Оу равны: х = 0, у = Ь. 112
3.6. Условия пересечения, коллинеарности и ортогональности двух прямых. Угол между двумя пересекающимися прямыми Сначала изучим указанные в заголовке этого раздела вопросы для двух прямых Ц и Ьг, определяемых общими уравнениями А,х + Вху+С, = 0 (6.26) А2х +В2у+С2=б. (6.27) Мы будем называть две прямые коллинеарными, если они либо параллельны, либо сливаются. Прямые, определяемые уравнениями (6.26) и (6.27), коллинеарны тогда и только тогда, когда их нормальные векторы ni = {Ai,Bi}_ и «2= {^2, Вг} коллинеарны, а условием коллинеарности двух векторов (как мы уже знаем из разд. 3.3) является пропорциональность их коор- динат. Таким образом, условием коллинеарности двух прямых L\ и Ьг, определяемых уравнениями (6.26) и (6.27), являет- ся равенство1 Д = А (6.28) Л Вг' Если условие (6.28) нарушено, т. е. если определитель второго по- И, В, А в2 рядка2 = А{В2 - А2Вх отличен от нуля, то прямые Lj и Ьг некол- линеарны, что означает, что эти прямые имеют единствен- ную точку пересечения, координаты которой являются единственным решением системы уравнений (6.26), (6.27) и определя- ются согласно разд. 1.2 гл. 3 формулами Крамера Если же условие (6.28) выполнено, то прямые Ц и Ьг коллинеарны, т. е. они либо параллельны и не имеют ни одной общей точки, либо сливаются. 1 Оба знаменателя в (6.28) обратиться в нуль не могут. При обращении в нуль одного из этих знаменателей соответствующий числитель также равен нулю. г Понятие определителя второго порядка было введено в § 1 гл. 3. 113 ।
Чтобы определить, какая из этих двух возможностей имеет место, обозначим каждое из отношений (6.28) через t, т. е. положим А=А=, А2 В2 ' (6.29) Тогда справедливы равенства At=A2-t; B}=B2-t. (6.30) Рассмотрим произвольную точку Мо (хо, Уо)> лежащую на прямой L\, т. е. произвольную точку Мо, координаты (х0,у0) которой удовлетворяют уравнению (6.26). Тогда справедливо тождество А1х0 + В{у0 +Ct=Q, которое в силу равенств (6.30) можно переписать в виде /•(Л2х0 + 2?2.Уо) (6-31) Могут представиться два случая: 1) точка Мо (хо.уо) н е лежит на прям о й £2> т. е. координа- ты (хо.уо) этой точки не удовлетворяют уравнению (6.27), и справедли- во соотношение Г(Л2х0 + В2у0 + С2)*0 (6.32) (в этом случае прямые L\ и Lz являются не имеющими общих точек параллельными прямыми); 2) точка Л£о(хо,уо) л ежит на прямой т- е. координаты (х0, уа) этой точки удовлетворяют уравнению (6.27) и справедливо ра- венство /•(Л2х0 +В2у0 +С2)=0 (6.33) (в этом случае прямые £i и Lz сливаются). В 1-м случае из (6.31) и (6.32) вытекает, что Ct*C2't, так что С —-*t, и, сопоставляя последнее соотношение с (6.29), мы получим 6^2 условие параллельности прямых £| и £2 (при отсут- ствии у них общих точек): А=А*А. (6.34) А В2 С2 Во 2-м случае из (6.31) и (6.33) вытекает, что С\ =C2-t, так что С —- = t, и, сопоставляя последнее равенство с (6.29), мы получим 6-2 условие .слияния прямых L\ и £2: 114
' A=A=£l (6.35> Л2 B2 C2 Заметим, что при выполнении условия (6.34) система двух уравне- ний (6.26), (6.27) не имеет решений (ибо при этом уравнение (6.27) противоречит уравнению (6.26)), а при выполнении условия (6.35) сис- тема двух уравнений (6.26), (6.27) имеет бесконечно много решений (ибо при этом уравнение (6.27) пропорционально и вследствие этого эквивалентно уравнению (6.26)). Любые две пересекающиеся в одной точке прямые образуют два угла, в сумме равных л. Нам достаточно определить один из них. Для этого достаточно определить угол ф между нормальными векторами т = {Ai, j?i} и«2 = {/$2, Вг} прямых L\ и Z,2. Так как по определению* скалярное произведение А\А2 + В\В2 этих нормальных векторов равно |«j| - |и2[ *cos ф и + В2, то мы получим следую- щее равенство для определения угла <р между п р я м ы м и L\ и L2: -„.-Г- , Л,-Л1+В,-В2 (6.36) :л; + в: В частности, при cos<р = 0 мы получим условие ортого- нальности прямых Li и Ь2: Ai-A2 + Bi-B2 = Q. (6.37) На этом мы заканчиваем изучение вопросов взаимного расположе- ния двух прямых, определяемых общими уравнениями (6.26) и (6.27). Для того чтобы сформулировать все установленные, нами условия для двух прямых L\ и L2, определяемых уравнениями с уг- лов ыми коэффициентами и y=ktx + bt (6.269 y = k2x + b2, (6.279 достаточно заметить, что уравнения (6.269 и (6.279 переходят в общие Уравнения прямых (6.26) и (6.27) при Ai = к[, В\ =-1, С\ = Ь\, А2 = к2, В2 = -1, С2 = Ь2. При этом из условий (6.28) и (6.34)—(6.37) мы получим для пря- мых Li и Ь2, определяемых уравнениями (6.269 и (6.279: 'См. § 2 гл. 4. 115
1) условие коллинеарности в виде 2) условие параллельности (при отсутствии общих точек) в виде к\ = k2, b\ -*Ь2', 3) условие слияния в виде к\ = кг, Ь\ = Ьг', 4) условие для определения угла (р в виде +1 cos <р = . ....L—. ; у] к* +1-7^2 +1 5) условие ортогональности в виде к\ • кг + 1 = 0. Аналогично для того чтобы сформулировать все установленные нами условия для двух прямых Ь\ и Ьг, определяемых канониче- скими уравнениями x~xt у-у, (6.26") к т\ и х-х2 _у-у2 (6.27") - 4 т2 достаточно заметить, что после приведения к общему знаменателю ка- нонические уравнения (6.26") и (6.27") переходят в общие уравнения прямых (6.26) и (6.27) при At = mh В\ =-l\, Ci =yi • /|-Xi • /«1, Аг = т2, В2 = -12, C2=y2'h-x2-m2. При этом из условий (6.28) и (6.34)—(6.37) мы получим для пря- мых Ь\ и Ь2, определяемых каноническими уравнениями (6.26") и (6.27"): М к т\ 1) условие коллинеарности в виде — = —; 4 т2 2) у с л о в и е п а р а л л е л ь н о с т и (при отсутствии общих . /. т. у! -х.т. точек) в виде — = —L ; 1г т2 У212 ~Хгт2 к mi Кк-хМ 3) условие слияния в виде — = —L = —---- 4 т2 У212 ~Хгт2 4) условие для определения угла ф в виде /.•/,+ т. • /и, сс>яф = — 1 1 — 2 ; 7^ + mi ’ 712 + т2 5) условие ортогональностив виде Ц • 12 + т\ • т2 = 0. 116
3.7. Нормированное уравнение прямой. Расстояние'от точки до прямой Нормированным уравнением прямой называется уравнение вида Ах + Ву+С (6.38) JFTb2 ’ получающееся из общего уравнения прямой Ах + By + С = 0 путем де- ления его на длину а/л2+Р2 ненулевого вектора {А, В}. Из разд. 3.6 вытекает, что общее уравнение Ax + By + C = Q и нор- мированное уравнение (6.38) определяют одну и ту же прямую, (или, образно говоря, пару слившихся прямых). Докажем, что абсолютная величина левой части нормированного уравнения прямой (6.38) равна расстоянию d точки М плоскости с ко- ординатами (х,у) от рассматриваемой прямой L, т. е. ^_|Лх+Ву + С| (6.39) л!а2+в2 ' Действительно, рассмотрим на плоскости произвольную прямую L, определяемую общим уравнением Ах + Ву + С=0. Обозначим через и С X вектор е д и н и ч н о й длины п = А______В ^а2+в2> Ja2 +в2 >, ортогональ- ный к прямой Z, и приложим этот вектор к началу координат О. Обозначим через Р точ- ку пересечения прямой, на которой лежит вектор л, с рассматриваемой прямой L (см. рис. 6.8). Фиксируем на плоскости произво- льную точку М(х,у), а на прямой L — про- извольную точку Mq (хо,уо). Тогда векторы ОМ и OMQ имеют координаты ОМ = {*,>>}> —♦ —> ОМ0 = {хо,Уо}, и потому вектор МйМ, равный разности векторов ОМ —> —-> и ОМ й, имеет координаты М0 М = {г - хй, у - у0}. Обозначим через Q проекцию точки М на прямую, на которой ле- жит вектор п (рис. 6.8). Тогда очевидно |Pg| и будет искомым рас- стоянием d точки М от прямой L. Поскольку PQ является проекцией вектора М0М на ось вектора и, то 117
d = |P2| = np„ М0М =|л| • np„ M0M = (n, M0M). (6.40) (мы учли, что I л I =1 и что согласно определению 2 скалярного про- I —> —> изведения имеет место равенство (п, М0М)=|л \-прпМйМ}. —> Используя выражение скалярного произведения векторов л и М0М в координатах, мы получим из (6.40), что d = М(*-*о) + Д(,У-Уо)1 = 1Ах + Ву+С-[Ах0 + Ву0 + С]| (6,41), Ja2+b2 Ja2+b2 Остается учесть, что выражение, стоящее в (6.41) в квадратных скобках, равно нулю (в силу того, что точка Mq (хо,уо) лежит на пря- мой L, определяемой уравнением Ах + By + С = 0). Мы получим при этом равенство (6.39). § 4. Плоскость и прямая в пространстве 4.1. Общее уравнение плоскости Содержание настоящего раздела полностью аналогично содержа- нию разд. 3.1. Справедливы два утверждения: 1°. Если в пространстве фиксирована произвольная декартова пря- моугольная система Oxyz и задана произвольная плоскость л, то эта плоскость определяется в системе Oxyz уравнением первой степени. 2°. Если в пространстве фиксирована произвольная декартова пря- моугольная система Oxyz, то всякое уравнение первой степени с тре- мя переменными X, у и z определяет относительно этой системы плоскость. ' Для доказательства утверждения 1° достаточно установить, что плоскость л определяется уравнением первой степени при каком-то одном специальном выборе декартовой прямоугольной системы, ибо тогда (в силу теоремы 2) она определяется уравнением первой степени и при любом другом выборе декартовой прямоугольной системы. Расположим оси Ох и Оу в плоскости л, а ось Oz направим перпен- дикулярно этой плоскости. Убедимся в том, что при таком выборе де- картовых прямоугольных осей уравнением плоскости л будет являться уравнение первой степени z = 0. Действительно, этому уравнению бу- дут удовлетворять координаты любой точки, лежащей на плоскости л, 'См. § 2 гл. 4. 118
и не будут удовлетворять координаты ни одной точки, не лежащей на плоскости л. Утверждение 1 доказано. Для доказательства утверждения 2° фиксируем произвольную де- картову прямоугольную систему Oxyz и рассмотрим произвольное уравнение первой степени Jx + By+Cz + Z> = 0, (6.42) в котором А, В, С и D — какие угодно постоянные числа такие, что из чисел А, ВиСхотя бы одно отлично от нуля. Уравне- ние (6.42) заведомо имеет хотя бы одно решение х0, Уо> zo’> т. е. суще- ствует хотя бы одна точка Мо (*о, Уо> zo)> координаты которой удовлет- воряют уравнению (6.42): Ах0 + Вуо + Czo + D = 0. (6.43) Вычитая из уравнения (6.42) тождество (6.43), мы получим уравнение Л(х-хо)+^-Л) + С(г-го)=О, (6.44) эквивалентное уравнению (6.42). Докажем, что уравнение (6.44) (а потому и уравнение (6.42)) опре- деляет относительно системы Oxyz плоскость л, проходящую через точку Мо (хо, уо, zo) w перпендикулярную ненулевому вектору1' п = {А,В,С}. Действительно, точка M(x,y,z) лежит на указанной плоскости л тогда и только тогда, когда два вектора л = {А, В, С} и ---> MQM = {x-xQiy-yQ,z-zQ} ортогональны, т. е. (в силу теоремы 5 из § 2 гл. 4) тогда и только тогда, когда скалярное произведение этих век- лоров, стоящее в левой части (6.44), равно нулю. Таким образом, коор- динаты (x,y,z) произвольной точки М удовлетворяют уравнению (6.44) (а потому и уравнению (6.42)) тогда и только тогда, когда точка М лежит на плоскости it. Утверждение 2°' доказано. Уравнение (6.42) с произвольными коэффициентами А, В, С и D такими, что из трех коэффициентов А, В и С хотя бы один отличен от нуля, называется общим уравнением плоскости. Действительно, если, например, отличным от нуля из трех чисел А, В и С является число С, то, взяв произвольные xq иу0, мы получим из уравнения (6.42), что z - А В . гь--х0--№ 2 Этот вектор является ненулевым в силу того, что хотя бы одно из трех чисел А, В и С отлично от нуля. 119
Мы доказали, что плоскость, определяемая общим уравнением (6.42), ортогональна вектору п = {А,В,С}. Этот вектор называют нормальным вектором плоскости (6.42). 4.2. Неполные уравнения плоскости. Уравнение плоскости в отрезках Содержание настоящего раздела полностью аналогично содержа- нию разд. 3.2. Общее уравнение плоскости (6.42) называется полным, если все его коэффициенты А, В, С и D отличны от нуля. Если же хотя бы один из этих четырех коэффициентов равен нулю, уравнение (6.42) называется неполным. Рассмотрим все возможные виды неполных уравнений. 1. D = Q, уравнение Лх + By+ Cz = 0 определяет плоскость, проходя- щую через начало координат (ибо координаты начала удовлетворяют этому уравнению). 2. А = 0, уравнение By + Cz + D = 0 определяет плоскость, паралле- льную оси Ох (ибо нормальный вектор этой плоскости п = {О, В, С} лежит в плоскости Oyz и перпендикулярен оси Ох). 3. В = 0, уравнение Ax + Cz + D=0 определяет плоскость, паралле- льную оси Оу (ибо нормальный вектор этой плоскости п = {А, О, С} лежит в плоскости Oxz и перпендикулярен оси Оу). 4. С=0, уравнение Ax+By + D = Q определяет плоскость, паралле- льную оси Oz (ибо нормальный вектор этой плоскости п = {А, В, О} лежит в плоскости Оху и перпендикулярен оси Oz). 5. А = О, В = 0, уравнение Cz + D = 0 определяет плоскость, парал- лельную координатной плоскости Оху (ибо эта плоскость параллельна осям Ох и Оу). 6. А = О, С = 0, уравнение By + D = 0 определяет плоскость, парал- лельную координатной плоскости Oxz (ибо эта плоскость параллельна осям Ох и Oz). 7. В = О, С = 0, уравнение Ах + D = 0 определяет плоскость, парал- лельную координатной плоскости Oyz (ибо эта плоскость параллельна осям Оу и Oz). 8. А = О, В = О, D = 0, уравнение Cz = 0 определяет координатную плоскость Оху (ибо эта плоскость параллельна Оху и проходит через начало координат). 9. А = О, С = О, D = 0, уравнение By = 0 определяет координатную плоскость Oxz (ибо эта плоскость параллельна Oxz и проходит через, начало координат). 10. В = 0, С = 0, D = 0, уравнение Ах = 0 определяет координатную 120
плоскость Oyz (ибо эта плоскость параллельна Oyz и проходит через начало координат). Покажем , теперь, что полное уравнение плоскости (6.42) может быть приведено к следующему виду: (6.45) а b с называемому уравнением плоскости в отрезках. Действительно, так как все коэффициенты А, В, С и D отличны от нуля, мы можем переписать уравнение (6.42) в виде А В С D , D D и после этого положить а =---, Ь =---, с =--. А В С Уравнение плоскости в отрезках (6.45) имеет простой геометриче- ский смысл: стоящие в нем числа а, b и с равны величинам на- правленных отрезков ОА', ОВ' и ОС', которые . отсекает плоскость на осях Ох, Оу и Oz соот- г| с, ветственно (см. рис. 6.9). Чтобы убедиться в К этом, достаточно найти точки пересечения /\с плоскости, определяемой уравнением (6.45), с / }0 х. осями координат. Например, точка А' Пересе- / / у* чения с осью Ох находится из совместного рассмотрения уравнения плоскости (6.45) с уравнениями у = 0 и z = 0 оси Ох. Мы полу- х чим, что координаты точки А’ равны х = а, Рис. 6.9 у = 0, z = 0. Аналогично устанавливается, что координаты точки пересечения В' плоскости с осью Оу равны х = 0, у = b, z = 0, а координаты точки пересечения С' плоскости о осью. Oz равны х = 0, у = 0, z = с. 4.3. Взаимное расположение двух плоскостей в пространстве Рассмотрим в пространстве две плоскости Л1 и л2, определяемые общими уравнениями Alx + Biy+Clz + Dl =0 и A2x + B2y + C2z+D2 =0. (6.46) Нормальные векторы этих плоскостей ni = {Ji,Bb и «2 = {А2, В2, С2} коллинеарны тогда и только тогда, когда плоскости Л] и п2 либо параллельны и не имеют общих точек, либо сливаются. Так 121
как ненулевые векторы Л| = Cj} и п2 = {А2,В2, С2} в силу тео- рем 1 и 3 из гл. 4 коллинеарны тогда и только тогда, когда их коорди- наты удовлетворяют условиям пропорциональности1 А = А = А (6.47) •^2 ^2 ^2 то соотношения (6.47) являются условием того, что плос- кости Л1 и п2 л и б о параллельны (при отсутствии у них общих точек), либо сливаются. Проводя рассуждения, совер- шенно аналогичные рассуждениям, проведенным для двух прямых в разд. 3.6, мы получим, что соотношения А _ А. — $. В' (6.48) В2 С2 D2 являются условием параллельности плоскостей Л] и п2 (при отсутствии у них общих точек), а соотношения А = А = А = А (6.49) А2 В2 С2 D2 являются условием слияния плоскостей Л(' и Лг. • Нарушение хотя бы одного из двух равенств в соотношениях (6.47) является условием того, что плоскости Л] и лг пе- ресекаются (по некоторой прямой линии L). При выполнении указанного условия рассматриваемые совместно два уравнения (6.46) являются уравнениями этой линии L. Плоскости Л1 и лг, пересекающиеся по прямой линии L, образуют два двугранных угла, в сумме равных л. Один из этих углов равен тому углу <р, который образуют нормальные векторы «i = {А\, Bit и ц2 = {А2,В2, С2}, и может быть определен через скалярное произведе- ние (п1,п2) = А1 • А2 +Bj-В2 +С\ -С2 и через длины = + А + С2 и \п2\ = ^А2 +В2 +С2 этих векторов по формуле2 cos ф = 4 • Л2 4- 2?, • 2?г + С,» Q (6.50) у]А?+В?+С? -^А2+В2+С2 1 Все три знаменателя в соотношениях (6.47) равны нулю быть не могут (в силу того, что вектор п2 ненулевой). Если некоторый из этих знаменателей равен нулю, то и соответствующий ему числитель равен нулю. 2 Мы используем определение скалярного произведения, данное в § 2 гл. 4. 122
Полагая в (6.50) cos <р = 0, мы получим условие перпен- дикулярности плоскостей Л| и пг. А} • А} + 2?| • В2 + С| • С2 = 0. (6-51) Условия (6.47)—(6.51) часто используются в приложениях. 4.4. Уравнение плоскости, проходящей через три различные точки, не лежащие на одной прямой Установим уравнение плоскости, проходящей через три заданные различные точки Af/(xi,ji,Z|), М2 (х2,у2,г2), М2(х2,у2,гу), не лежащие на одной прямой. Так как указанные три точки не лежат на одной прямой, то прило- женные к общему началу Afi векторы МхМг = {х2 -хр у2 - у,, гг - zj и MtM3 = {х3-xt,y3-y,,z3-zj неколлинеарны, а потому точка М(х,у, z) лежит в одной плоскости с точками М\, М2 и М$ тогда и то- лько тогда, когда три приложенные к общему началу М\ вектора —> —> —> МхМг, М^М3 и М'М = {x-xl,y-yl,z-zl} компланарны, т. е. (в силу теоремы 8 из § 3 гл. 4) тогда и только тогда, когда смешанное произ- ведение указанных трех векторов равно нулю. Записывая устанавлива- емое теоремой 13 из § 3 гл. 4 выражение этого смешанного произведем ния через определитель и приравнивая этот определитель нулю, мА получим искомое уравнение плоскости в виде: х —х, х2 -х, У" У z-z, У2~У, Z2"ZI =0. (6.52) *з-*1 Уз "У. z3“zi Подчеркнем, что разложение стоящего в (6.52) определителя по первой строке приводит к уравнению первой степени. * ♦ / 4.5. Нормированное уравнение плоскости. Расстояние точки от плоскости Содержание настоящего раздела полностью аналогично содержа- нию разд. 3.7. Нормированным уравнением плоскости назы- вается уравнение вида Ax + By + Cz+D Ja1 +вг+с2 (6.53) 123
получающееся из общего уравнения плоскости Ах + By + Cz + D = 0 пу- тем деления его на длину у/А2+В2+С2 ненулевого вектора {А, В, С};... Из разд. 4.3 вытекает, что общее уравнение Ах + By + Cz + D = 0 и нормированное уравнение (6.53) определяют одну и ту же плоскость (или, образно говоря, пару слившихся плоскостей). Докажем, что абсолютная величина левой части нормированного уравнения плоскости (6.53) равна расстоянию d точки М с координа- тами (x,y,z) от рассматриваемой плоскости л, т. е. dJAx+By+Cz + Dj ' (6.54) Ja2+b2+c2 ' . Действительно, рассмотрим произвольную плоскость л, определяе- мую общим уравнением Ах + By + Cz = 0. Обозначим через п вектор единичной длины < ‘ А '^А2+В2 В С + С7’ л/л2 +В2 +С2 ’ л!а2 +в2 +с2 Рис. 6.10 ортогональный к плоскости л, и приложим этот вектор к началу координат О. Обозначим через Р точку пересечения прямой, на которой лежит. м вектор п, с рассматриваемой плоскостью л (см. - рис. 6.10). - . Фиксируем в пространстве произвольную точ- ку M(x,y,z), а на плоскости л — произвольную точку Мо(хо,Уо, zo). Тогда векторы ОМ и ОМ0 имеют координаты —> —> ОМ - {x,y,z}, OMQ = {xQ>yQ,zo}, и потому вектор —> МйМ, равный разности векторов ОМ и ОМй, имеет координаты М0М = {х-х0,у-y0,z-z0}. Обозначим через Q проекцию точки М на прямую, на которой лежит вектор л (рис. 6.10). Тогда очевидно I PQ | и будет искомым расстоянием d точки М от плоскости л. Поско- —> льку PQ является проекцией вектора МйМ на ось вектора и, то d = |Pg| = пр„ М^М = |л| • пр„ М^М = (л, М^М) (6.55) 124
(мы учли, что I п I = 1 и что согласно определению 2 скалярного про- изведения* имеет место равенство (л, Л/0Л/)=|л \-прпМйМ~). Используя выражение скалярного произведения векторов л и МйМ в координатах (см. § 2 гл. 4), мы получим из (6.55), что _ |Я(х -х0) + В(у- у0) + C(z - z0 )| _ ^‘+Я!+С1 _\Ax + By + Cz + D-[Ax0 + Ву0 +Cz0 +D]| k ' Ja2+b2+c2 Остается учесть, что выражение, стоящее в (6.56) в квадратных скобках, равно нулю (в силу того что точка Л/о (хо,Уо> *о) лежит на плоскости л, определяемой уравнением Ах + By + Cz + D = 0). Мы получим при этом равенство (6.54). t 4.6. Канонические уравнения прямой линии в пространстве Из разд. 4.3 мы уже знаем, что прямую линию L в пространстве можно определить двумя уравнениями (6.46) пересекающихся по этой линии плоскостей (при условии, что в соотношении (6.47) нарушается хотя бы одно из двух равенств). Однако более удобным является другой специальный вид уравне- ний, который мы сейчас установим. Любой ненулевой вектор, параллельный данной прямой L, называ- ется направляющим вектором этой прямой. Поставим перед собой цель — написать уравнение прямой L, про- ходящей через данную точку М\ (xi,yi,zj) и имеющей заданный на- правляющий вектор q = {/, w, и}. Очевидно, что точка М(х,у, z) лежит на указанной прямой L тогда —> и только тогда, когда векторы = {х-х,, у-у, z - zt} и q = {/, т, л} коллинеарны, а указанные векторы (в силу теорем 1 и 3 из гл. 4) коллинеарны тогда и только тогда, когда их координаты пропорциональны. Таким образом, мы приходим к соотношениям х~х{ _у-у _z-z, (6.57) I т п называемым каноническими уравнениями прямой. Так как вектор q = {/, т, п} является ненулевым, то все три знаме- нателя /, т и п в соотношениях (6.57) обращаться в нуль не могут. 'См. § 2 гл. 4. 125
Один или два из этих знаменателей могут быть равны нулю, причем для каждого равного нулю знаменателя равен нулю и отвечающий ему числитель. Из канонических уравнений прямой (6.57) легко получаются уравнения прямой, проходящей через две различные точки М\ (хьуь z\) и. М2 (х2,у2, *3): достаточно взять в качестве направляющего вектора прямой q вектор МхМг. При этом мы получим следующие уравнения: Х~ХХ, = у-у, = Z-Z; *2"*| Уг~У1 г2-г,' 4.7. Параметрические уравнения прямой в пространстве Для получения этих уравнений примем за параметр t каждую из трех дробей, стоящих в канонических уравнениях (6.57), и заметим, что поскольку хотя бы один из знаменателей в (6.57) отличен от нуля, а стоящий при нем числитель может принимать любые значе- ния, то областью изменения параметра t является вся бесконечная прямая -оо< <<оо. Мы получим из (6.57), что х-х, =l-t, у-yx=m-t, z-zx=n-t, или Х=Х|+/<, • y=yI+»i<, (6.58) Z = Z] + nt. Три уравнения (6.58) и называются параметр и ч е с к ими уравнениями прямой!. Эти уравнения допускают наглядную механическую интерпретацию: если параметр t — это время, отсчиты- ваемое от некоторого начального момента, то уравнения (6.58) Опреде- ляют закон происходящего по инерции движения материальной точки по прямой линии L с постоянной скоростью, равной yf+m2 + п2. 4.8. Взаимное расположение двух прямых линий в пространстве Рассмотрим в пространстве две прямые L\ и Л2, определяемые ка- ноническими уравнениями _У-У\ н х-х2 _у-уг _z-z2 (6.59) 1Х тх л, /2 пг Первая из этих прямых L\ проходит через точку М\ (xi,yi,zi) и парал- лельна вектору q\ - {/ь гщ, п\}, а вторая проходит через . точку Л/2 (х2, Уг, z2) и параллельна вектору qi = {/2, ти2, л2}. 126
Прямые L\ и Li могут: 1) сливаться, 2) пересекаться в одной точке, 3) быть параллельными, 4) скрещиваться. В случаях 1, 2 и 3 прямые L\ и Li лежат в одной плоскости, а в случае 4 — не лежат в одной плоскости. Очевидно, что необходимым и достаточным условием принад- лежности двух прямых L\ й Li, определяемых уравнениями (6.59), к одной плоскости является тре- бование компланарности трех векторов q\ = {Z|, т।, nJ, qz = {/2, m2, «2} —> , ? ' и MXM2 = {х2 -Х|,у2 “ -zi}> эквивалентное (в силу теоремы 8 из гл. 4) равенству нулю их смешанного произведения, равного (в силу теоремы 13 из гл. 4) определителю k ni 1г /п2 «2 х2~хг У2 -У, z2 — Z, (6.60) Итак, если определитель (6.60) отличен от нуля, то прямые L\ и Ьъ определяемые уравнениями (6.59), скрещиваются. Заметим теперь, что коллинеарность направляющих векторов = {1\, т\, Л1}> 02 = {Ji, п2}, т. е. пропорциональность координат этих векторов A = = (6б1) /2 т2 п2 означает, что прямые L\ и L2) определяемые уравнениями (6.59), либо параллельны и не имеют общих точек, либо сливаются. Чтобы опреде- лить, какая из этих возможностей реализуется, следует выяснить, явля- ——> , ется ли вектор МхМг = {х2 -х1гуг -yt,z2-zl} коллинеарным вектору q\ = {/1, »ii, nJ, т. е. выяснить, являются ли справедливыми равенства». х2~х1 _У1~У1 _z2~zt (6.62) Z, nt ' . - Если справедливы оба равенства (6.61) и оба равенства (6.62), то прямые L\ и Ь2, определяемые уравнениями (6.59), сливаются. Если справедливы оба равенства (6.61) и нарушается хотя бы одно из равенств (6.62), то прямые L\ и Ь2, определяемые уравнениями (6.59), параллельны и не имеют общих точек. Наконец, для того чтобы прямые Ц и Ь2 пересекались в одной точ- ке, необходимо и достаточно, чтобы они лежали в одной плоскости и не являлись ни параллельными, ни сливающимися. 127
Итак, если определитель (6.60) равен нулю и нарушается хотя бы одно из двух равенств (6.61), то прямые Ц и L2i определяемые уравне- ниями (6.59), пересекаются в одной точке. Задача о нахождении угла между прямыми L\ и £2, заданными уравнениями (6.59), сводится к определению угла ф между направляю- щими векторами q\ = {/1, т\, nJ и q2 = {/2, ™2, «2}- Пользуясь определением скалярного произведения (#,,?z) =1 tfil*19:1 *cosФ и выражением в координатах этого скалярного произведения и длин векторов qi и q2 (см. § 2 гл. 4), мы получим сле- дующее равенство для нахождения угла ср: /. • L + т} • т, + пх • н, cos ср = - , 2 . .. =—- ~ =• Фх + тх + пх +т2 +п2 В частности, из (6.63) при cos ф = 0 получим условие орто- гональности рассматриваемых прямых /, -12 + тл, • т2 + 72, -п2 =0. 4.9. Взаимное расположение прямой и плоскости в пространстве Рассмотрим в пространстве прямую Z, определяемую канонически- х-х, у-ух z-zx ми уравнениями-------=-—— =-------L, и плоскость л, определяемую I т п общим уравнением Ах + By + Cz + D = 0. В их расположении могут представиться три возможности: 1) пря- мая L и плоскость л параллельны и не имеют общих точек; 2) прямая L принадлежит плоскости л; 3) прямая L и плоскость л пересекаются в одной точке. Очевидно, что если направляющий вектор прямой q = {Z, ти, 72} и нормальный вектор плоскости п= {А,В,С} ортогональны, т. е. если, равно нулю скалярное произведение этих векторов Л/ + Вти + Сп = 0, (6.64) то прямая L либо параллельна плоскости л и не имеет с ней общих точек, либо принадлежит плоскости л. Чтобы определить, какая из этих двух возможностей реализуется, следует проверить, принадлежит ли плоскости л лежащая на прямой L точка М\ (xi,yi,zi), т. е. проверить справедливость равенства Axi + Byi + Czj + D = 0. (6.65) Если выполняются оба равенства (6.64) и (6.65), то прямая L при- надлежит плоскости л. 128
Если же равенство (6.64) выполняется, а равенство (6.65) не вы- полняется, то прямая L параллельна плоскости п и не имеет с ней об- щих точек. Наконец, если нарушается равенство (6.64), то прямая L пересе- кает плоскость п в одной точке (координаты которой являются един- ственным решением системы, состоящей из двух уравнений прямой L и уравнения плоскости л). Для определения угла <р между прямой L и плоскостью л заметим, что этот угол ср является дополнительным к углу между направляю- щим вектором прямой q = {/, т, п} и нормальным вектором плоскости п = {А, В, С} (см. рис. 6.11). Поэтому из определения скалярного произве- дения (?,n)=|9|-|n|-cos\|/ и из равенства cos\/’=sin(p мы получим для определения угла фмежду прямой В и плоскостью л следующую формулу: . А1 + Вт + Си sin ф = -======—...... 7Л2+Б2+С2 • 7/2+и?+и2 В заключение заметим, что условие ортогональности прямой L и плоскости л, эквивалентное условию кол- линеарности векторов и = {А, В, С} и q—{l, т, л}, выражается пропорциональностью координат этих векторов Л=2? =С I т п (В этих равенствах допускается обращение в нуль одного или двух знаменателей, причем равенство нулю знаменателя означает, что и от- вечающий ему числитель равен нулю.) § 5. Линии второго порядка на плоскости 5.1. Стандартное упрощение уравнения линии второго порядка па плоскости Общее уравнение линии второго порядка на плоскости, уже выпи- санное нами в разд. 1.2, имеет вид Axi + Bxy + Су2 + Dx + Ey + F=0. (6.66) Мы сейчас убедимся в том, что в этом общем уравнении коэффи- циент В при произведении ху без ограничения общности можно счи- тать равным нулю. 129
Мы установим, что если в заданном уравнении (6.66) коэффици- ент В отличен от нуля, то можно повернуть систему Оху вокруг нача- ла О на такой угол а, что в новой (полученной после поворота на угол а) системе Ох'у' коэффициент при произведении х'у' будет ра- вен нулю. Действительно, если новая система Ох'у' получается из системы Оху посредством поворота на угол а, то координаты (х,у) любой точ-: ки М в системе Оху выражаются через координаты (х', у') той же точ- ки в системе Ох'у' по формулам1: x=x'-cosa -y-sina, (6.67) y=x'-sina + y-cosa. Подставляя в (6.66) на место х и у их значения, определяемые ра- венствами (6.67), мы преобразуем (6.66) к виду А'(х')2 + В'х? У + С'(У)2 +D'x' + £,y + F, = 0, (6.68) В котором I А' = у sin 2a +1 (А - С) • cos2a + | (А + С), 1 в В' = --(А-C)sin2a + — • cos2a, (6.69) С = sin2a - - (А - C)cos2a +1 (А + С), 2 2 jD’ = jDcosa + £sina, F’ = £cosa -Dsina, F' = F. Если в исходном уравнении (6.66) коэффициент В был отличен от нуля, то, как видно из равенства (6.69), выбрав угол поворота системы , п А-С а из условия ctg 2a =---, мы получим, что в преобразованном урав- В нении (6.68) коэффициент В’ равен нулю. Проведенное нами преобразование принято называть стандар- тным упрощением уравнения линии второго порядка. Чтобы в дальнейшем не усложнять запись уравнения, мы опустим штрихи при коэффициентах и переменных и без ограничения общнос- ’См. формулы (5.5) из § 1 гл. 5. 130
ти будем рассматривать уравнение (6.66) с коэффициентом В, равным нулю, т. е. уравнение Ах1 + Су2 + Dx + Ey +F = 0. (6.70) 5.2. Центральные линии второго порядка В этом разделе мы рассмотрим уравнение (6.70), в котором оба коэффициента ЛиСотличны от нуля. Дополняя члены, содержащие х, и члены, содержащие у, до пол- ных квадратов, мы приведем уравнение (6.70) к виду а(х +—'j +cf у+— 1 I 2AJ { 2CJ (6.71) 4А 4С Полагая в (6.71) хп --, уа =-, Н =—ч------F, мы прида- 0 2А ° 2С 4А 4С Н дим уравнению (6.71) вид А(х-х0)2+С(у-у0)2=Н. (6.72) Линию второго порядка приня- то называть центральной, если она цмеет единствен- ный центр симметрии, т. е. такую точку О', относительно которой все точки кривой располагаются сим- метричными парами; Для линии, определяемой уравнением (6.72), центром симметрии является точка О' (хо,уо)« Действительно, легко проверить, что для любой точки Л/i (хь У1), лежащей на линии, определяемой уравнением (6.72), сим- метричная ей относительно О' (хо, Уо) точка М2 (х2, уг) с координатами *2 = 2х0-Х1, у2 = 2уо“У1 также лежит на этой линии (это иллюстриру- ется на рис. 6.12). Легко проверить, что прямые у =уо и х = хо, параллельные осям Ох и Оу соответственно, являются осями симметрии линии, опре- деляемой уравнением (6.72). Действительно, если точка А/(хо,уо-Л) лежит на этой линии, то симметричная ей относительно прямой у =уо точка М' (хо,уо + Л) лежит на этой линии. Симметрия относительно прямой х = х0 устанавливается аналогично. В дальнейшем для простоты мы будем предполагать, что центр симметрии линии находится в начале координат, т. е. хо = О, уо = О (этого всегда можно добиться параллельным переносом осей). 131
При этом уравнение (6.72) принимает вид Ахг+Суг =Н. (6.73) Определение 1. Линия второго порядка, определяемая уравнением (6.73), называется линией эллиптического типа, если коэффициенты А и С имеют одинаковые знаки (т. е. если А • С> 0). Не ограничивая общности, будем считать, что Л > 0 и С> 0 (в про- тивном случае мы изменили бы все знаки в уравнении (6.73) на проти- воположные). Возможны три случая: 1) Н>0, 2) Н=0, 3) Н<0. В случае Н>0 говорят, что уравнение (6.73) определяет действи- тельный эллипс. Если положить а = J—, о = J—, то уравнение (6.73) запишется в виде £1 + /=] (6.74) а1 Ь1 ' Уравнение (6.74) называется каноническим уравнени- ем эллипса, а числа а и b — его полуосями. Обычно считают, что 0 < b < а (этого всегда можно добиться, пере- обозначив в случае необходимости оси). Эллипс именно с таким со- отношением полуосей а и b изображен на рис. 6.13. Точки А (а, 0), А' (-а, 0), В (0, Ь) и В' (0, -Ь) называются вершинами этого эллипса, а отрезки А'А-2а и В'В = 2Ь — его осями. Из уравнения (6.74) вытека- ет, что координаты (г, у) всех точек эллипса удовлетворяют неравенствам [х| < а, [у| < Ь. Заметим, что при a f b эллипс превращается в окружность, опреде- ляемую уравнением х2+у2 = а2. Во втором случае Я=0 говорят, что уравнение (6.73) определяет вырожденный эллипс (в этом случае уравнение (6.73) определяет на плоскости Оху только одну точку х = 0, у = 0). Наконец, в третьем случае Н<д говорят, что уравнение (6.73) определяет мнимый эллипс (в этом случае уравнение (6.73) не опреде- ляет на плоскости Оху никакого геометрического образа). 132
Определение 2. Линия второго порядка, определяемая уравнением (6.73), называется линией гиперболического типа, если коэффициенты А и С имеют противоположные знаки (т. е. если Я-С<0). Ради определенности будем считать, что А > 0 и С < 0 (иначе мы поменяли бы ролями оси Ох и Оу). Возможны три случая: В случае Н > 0, положив а = Я=0, 3) жо. , мы можем переписать уравнение (6.73) в виде а2 Ь2 (6.75) Линия, определяемая уравнением (6.75), называется г и п е р - б о л о й, а уравнение (6.75) — ее каноническим уравне- нием. Эта гипербола изображена жирной линией на рис. 6.14. При этом числа а и Ь называются соответст- венно ее действи- тельной и мни- мой полуося- м и, точки А (а, 0), А' (-а, 0) — ее вер- шинами, а отрезки А'А = 2а и В'В = 2Ь — ее действитель- ной и мнимой осями. При а = Ь гипербола, определяемая уравнением (6.75), называется равнобочной. Из уравнения (6.75) вытекает, что для всех точек гиперболы абс- цисса х удовлетворяет неравенству |х| > а. Во втором случае /7=0 уравнение (6.73) определяет пару пересека- ющихся прямых (7л • х - 4-С • у) = 0 и (дМ • х + V-C • у) = 0, которые называют вырожденной гипер бол о й. В третьем случае Н< 0, положив = мы можем пе" Реписать уравнение (6.73) в виде 133
X1____/_ = _) (6.76) (a1)2 (#)2 Уравнение (6.76) также определяет гиперболу, которая при а' = а и Ь'-Ь называется сопряженнойк гиперболе, определяемой урав- нением (6.75). Эта сопряженная гипербола изображена пунктиром на рис. 6.14. Ее вершинами являются точки В (О, Ь) и В' (0,-Ь). 5.3. Фокальные свойства эллипса и гиперболы Пусть а и b — постоянные из канонических уравнений эллипса (6.74) и гиперболы (6.75). Обозначим через с постоянную, равную с = (6-77) где знак «минус» берется для случая эллипса, а знак «плюс» — для случая гиперболы, определяемой уравнением (6.75). Точки F (с, 0) и F' {-с, 0) называются фокусами эллипса (соот- ветственно гиперболы, определяемой уравнением (6.75)). Эти точки изображены на рис. 6.13 и 6.14. Отношение е = £ (б-7») С называется эксцентриситетом эллипса (соответственно гиперболы, определяемой уравнением (6.75)). Из равенств (6.77) и (6.78) и из того, что для эллипса 0 < b < а, вы- текает, что эксцентриситет 8 удовлетворяет неравенствам: 0 < е < 1 (для случая эллипса) и 1 < е < +оо (для случая гиперболы). ! Отметим, что эксцентриситет окружности равен нулю. Для любой точки М (х, у), лежащей на эллипсе (или соответственно на гиперболе, определяемой уравнением (6.75)), введем понятие ее фокальных радиусов г и г', определив их как расстояния этой точки М от фокусов F и F', т. е. положив г = |A/F |, г' = |A/F' | (фо- кальные радиусы гиг' изображены на рис. 6.13 и 6.14). Тогда и для эллипса, и для гиперболы г = ^(х-сУ + у2, ^^(х + с)2 + у2. (6-79) Учитывая, что липса, а знак «минус» для случая гиперболы, мы получим, что —у + -^- = 1, где знак «плюс» берется для случая эл- а2 Ь2 у2 =±Ь2 • 134
Из (6.79) и последнего равенства с учетом равенства (6.77) мы по- лучим, что х2 -2сх + (с2 ±Ь2) = и совершенно аналогично I 7 Гё* И= а2 +2сх + с2 ±62 1-- =J—х2 +2сх + а2 =|£х + а|. У a J V а Итак, и для случая эллипса, и для случая гиперболы г = |Ех-а|, г’ = |ЕХ + а|. (6.80) Для случая эллипса (для которого 0 £ е < 1), |х| - а), из (6.80) полу- чим, что r-a-гх, И = а+ех, и потому г + г' = 2а, (6.81) причем любым г и г', удовлетворяющим равенству (6.81), отвечает точка М на эллипсе. Таким образом, для любой точки эллипса сумма ее фокальных ра- диусов является постоянной величиной. Это характеристиче- ' ское свойство э л л и п с а может быть принято за его опреде- ление. Для случая гиперболы (для которого е > 1, |х| > а) из (6.80) полу- чим, что г = ± (ex - a), i3=± (ех + а), где знаки «плюс» отвечают правой ветви гиперболы, т. е. значениям х > 0, а знаки «минус» отвечают ле- вой ветви гиперболы, т. е. значениям х < 0. Из выражений для гиг' вытекает, что г'-г = ±2а, так что |г' - г| = 2а. Мы установили основное характеристическое свой- ство гиперболы: для любой точки гиперболы абсолютная ве- личина разности ее фокальных радиусов является постоянной. 5.4. Асимптоты гиперболы. Равнобочная гипербола как график обратной пропорциональности Рассмотрим гиперболу, определяемую каноническим уравнением (6.75) й изображенную жирной линией на рис. 6.14. В каждом из четы- рех квадрантов, на которые оЬи Ох и Оу разбивают плоскость, у этой 135
гиперболы имеется ветвь, уходящая в бесконечность, причем в силу центральной симметрии относительно начала координат достаточно изучить поведение при больших |х| только одной из этих ветвей, на- пример, той ветви, которая лежит в первом квадранте х > 0, у > 0. Для значений х и у, лежащих в этом квадранте, из уравнения (6.75) мы получим, что УЛ.4^. <682) а Докажем, что ветвь гиперболы, лежащая в первом квадранте и определяемая уравнением (6.82), при увеличении х неограниченно приближается к прямой линии у= — х (эту прямую называют а с и м - а п т о т о й гиперболы). Действительно, отвечающая каждому значению х разность ординат указанной прямой и ветви гиперболы (6.82) равна b b Г~г z b, f~~2 2х b [х2 — (х2 -a2)] ab а а а а (x + vx2-a2) х + ух2-а2, и при увеличении х становится как угодно малой. Вследствие центральной симметрии можно утверждать, что ветви гиперболы, лежащие в первом и в третьем квадрантах, при увеличе- нии |х| неограниченно приближаются к асимптоте у =—х, а ее ветви, а лежащие во втором и в четвертом квадрантах, при увеличении |х| ne- tt Ь ограниченно приближаются к асимптоте у=—х. а Нетрудно проверить, что те же самые асимптоты имеет и сопря- х2 V2 женная гипербола — = -1, изображенная пунктиром на рис. 6.14. а2 Ь2 В заключение убедимся в той, что при постоянном а>0 график . а2 2 г функции у = — или х • у = а , выражающей обратную пропорциональ- х ность переменных х и у, представляет собой равнобочную гиперболу. Для этого достаточно повернуть декартову прямоугольную систему л Оху вокруг начала О на угол — (см. рис. 6.15). 4 Обозначив через Ох'у' систему, в которую переходит Оху после Л поворота, и, используя взятые при а = — формулы (5.5) из § 1 гл. 5, мы 4 получим, что 136
, It . . П x'-)> X = X-COS----У’Sin - = —, 4 4 V2 . . Л . It x'+\) y = r-Sin — + y-cos — = — 4 4 V2 Из последних равенств следует, что уравнение х-у = а2 переходит в системе Ох'у' в уравнение равнобоч- ной гиперболы (х7)2 - (у')2 = 2а2 с вер- шинами в точках А (а, а) и В (-а, -а) (см. рис. 6.15). Рис. 6.15 5.5. Нецентральные линии второго порядка Снова вернемся к рассмотрению уравнения (6.70), но теперь пред- положим, что один из коэффициентов А или С равен нулю1. Ради определенности предположим, что А = 0, С * 0. Тогда уравнение (6.70) принимает вид . Cy2 + £>x + Ey + F=0. (6.83) Если в (6.83) коэффициент D равен нулю, то (6.83) превращается в квадратное уравнение, которое либо не имеет действительных корней (и потому не определяет никакого геометрического образа), либо име- ет два действительных корня yi и у2 (быть может, совпадающие между собой) и может быть записано в виде С(у-у\) • (у-уг)= 0- В послед- нем случае уравнение (6.83) определяет пару параллельных прямых У=У\ и у =у2 (быть может, сливающихся). Рассмотрим теперь случай, когда в уравнении (6.83) коэффициент D не равен нулю. Дополняя в (6.83) члены, содержащие у, до полного квадрата, получим У £? п г В1 (6.84) С у + — = -Dx -F + —. V 2CJ 4С Если положить х0 ----+-----, у0 ----, 2р =---, то уравнение О 4OD 2С С (6.84) принимает вид (у-Уо)2 =2р(х~х0). (6.85) *Оба коэффициента А и С быть равны нулю не могут, ибо при этом (6.70) перестанет быть уравнением второго порядка. 137
Линия, определяемая уравнением (6.85), называется п а р а б о - л о й. На рис. 6.16 она изображена жирной линией для случая р > 0 й пунктирной линией для случая р < 0. При этом точка О' (хо,уо) называ- ется вершиной параболы (6.85), а число р — ее параметром. Легко видеть, что прямая у=уо является осью симметрии параболы (6.85) (эту прямую принято называть осью параболы) и что центра симметрии у параболы нет. Если вершина параболы находит- ся в начале координат (чего всегда можно добиться параллельным пере- носом осей), то ее уравнение прини? мает вид у2 =2рх. (6.86) Уравнение (6.86) называется к а - ионическим уравнени- ем параболы, причем пара- метр р в этом уравнении принято считать положительным (этого всегда можно добиться выбором направления оси Ох). Парабола, определяемая уравнени- ем (6.86) с р>0, изображена на рис. 6.17. Заметим, что если поменять ро- лями оси От и Оу, то канониче- ское уравнение парабо- л ы примет вид х2 =2ру. (6.87) Параболу, определяемую уравне- нием (6.87), называют парабо- лой с вертикальной осью. На рис. 6.18 она изображена жирной линией для случая р > 0 и пунктирной линией для случая р<0. В заключение установим фока- льное свойство параболы, Рис. 6.17 определяемой при р>0 каноническим уравнением (6.86). Точку FI —,0 I назовем ее ф о к у с о м, прямую х = ~ — — ее д и - (2 ) 2 ректрисой, а расстояние любой ее точки М(х,у) от фокуса г = |Л£Г| назовем фокальным радиусом этой точки (см. рис. 6.17). 138
Заметим, что для любой точки параболы М (х, у) ______________ И V V Г = Л1.Х — — I +|У2 = К 2) 12 Р ~ Jx -рх + ^-+2рх = 2 р2 Р Ах + рх + — =х + — V 4 2 и, как видно из рис. 6.17, расстояние \MN | этой точки от директрисы DE также равно х + —. Рис. 6.18 Мы приходим к характеристическому свойству: парабола является геометрическим местом точек, равноудаленных от данной точки (фокуса) и от данной прямой (директрисы). 5.6. График квадратного трехчлена Рассмотрим при А 0 квадратный трехчлен у = Лх2 + Вх + С. Дополне- ( В у нием по х до полного квадрата он приводится к виду С В2 А 4А2 . Поэ- В тому, если положить х0 =----- 2А 4АС-В2 у0 =-------, то указанный квад- 4А ратный трехчлен принимает вид у-уо = А (х-хо)2 и после паралле- льного переноса осей х' = х-х0, у'=У~Уо — вид У = Л(х’)2. (6.88) Уравнение (6.88) совпадает с каноническим уравнением параболы с вертикальной осью (6.87), пара- метр р которой равен —. 2/4 Таким образом, график квадратного трехчлена у = Ах2 + Вх + С яв- ляется параболой с вершиной О' (х0, 70Х с вертикальной осью x = xq и с 139
параметром р =—. График этой параболы изображен на рис. 6.19. За- 2А метим, что абсциссы х\ и Х2 точек пересечения этой параболы с осью Ох являются корнями квадратного уравнения Ах2 + Вх + С = 0 (на этом основан графический способ решения этого квадратного уравнения). § 6. Поверхности второго порядка в пространстве Мы не будем останавливаться на стандартном упрощении и на преобразованиях, основанных на переносе и поворотах осей, с помо- щью которых общее уравнение поверхности второго порядка может быть приведено кканоническим уравнениям возникаю- щих при его изучении поверхностей1. Мы укажем канонические уравнения всех возможных типов поверх- ностей второго порядка и выясним основные свойства этих поверхностей. 1°. Эллипсоид определяется каноническим уравнением <6-89) а2 Ь2 с2 Из уравнения (6.89) вытекает, что все три координатные плоскости являются плоскостями его симметрии, а начало координат является центром его симметрии. Числа а, b и с, называемые его п о л у о с я - м и, равны отрезкам от начала координат до точек его пересечения с осями координат. Эллипсоид является ограниченной поверхностью: все его точки содержатся в прямоугольном параллелепипеде |х | < а, [у | <Z>, |z| <с. Линии пересечения эллипсоида с плоскостями, параллельными лю- бой координатной плоскости, являются эллипсами. Например, при \h | < с линия Ц его пересечения с плоскостью z = Л, параллельной ко- ординатной плоскости Оху, является эллипсом, проекция £h которого х2 у2 h2 на плоскость Оху определяется уравнением — + = 1 —-, приводя- а2 о с2 х2 у2 щимся к каноническому уравнению эллипса — + ^-— = 1 с полуосями «* bh /i h к [i ал=а\1—Г» bA=bdl— N С N с На рис. 6.20 изображен эллипсоид, его сечения координатными ’При этом используются преобразования координат, изученные в § 2 гл. 5. 140
плоскостями, сечение плоскостью z = h (при 0<Л<с) и пунктиром — проекция этого сечения на плоскость Оху. 2°. Однополости ый ги- перболоид определяется канони- ческим уравнением £.£_£=1 <6-90) а2 Ь2 с2 ' Из уравнения (6.90) вытекает, что все три координатные плоскости явля- ются плоскостями его симметрии, а Рис. 6.20 начало координат является центром его симметрии. Рис. 6.21 Линиями его пересечения с координат- ными плоскостями Oyz и Oxz являются ги- перболы, определяемые уравнениями 2 %2 ^2 -^--^- = 1и-^---^- = 1 (они изображены на Ь2 с2 а1 с2 рис. 6.21). Линией пересечения его с координатной плоскостью Оху является эллипс х2 у2 — + ^— = 1. Линия пересечения Z* с плоско- а b стью z = h, параллельной плоскости Оху, также представляет собой эллипс, проекция которого на Плоскость Оху определяется х2 у2 . I, h2 уравнением —+ zt- = 1 при ah =a-Jl + —-, ____________bh N c I Л7 6A=6-J1 + —. Наименьший из этих эллип- сов, отвечающий значению h = 0, называется горловым. 3°. Двуполостный гиперболоид определяется кано- ническим уравнением л2 А2 „2 а о с (6.91) Из уравнения (6.91) вытекает, что все три координатные плоскости являются плоскостями его симметрии, а начало координат — центром его симметрии. 141
Рис. 6.22 На рис. 6.22 изображены две его полости, отве- чающие значениям z £ с и z < -с, линии его пересе- чения с плоскостями Oyz и Oxz, являющиеся ги- перболами, определяемыми уравнениями у^ z2 х2 Z1 —— = —1 и —— —- = -1, и при некотором h > с b с а2 с линия его пересечения с плоскостью z = Л, являю- щаяся эллипсом, проекция которого на плоскость х2 V2 Оху определяется уравнением —+ -^—= 1 при «л bh lb2 , , . |й2 . ал=а-]—-ь bh=b-J—-l. ус V с 4°. Конус второго порядка опреде- ляется каноническим уравнением 4 + £-4=0. (6.92) а о с Из уравнения (6.92) вытекает, что все три ко- ординатные плоскости являются плоскостями его симметрии, а начало коор- динат — центром его симметрии. Конус обладает следующим свойством1: если отличная от начала координат О точка Mq (*о, Уо> 2о) ему принадлежит, то и любая точка M(x,y,z), лежащая на прямой ОМ0, ему принадлежит (см. рис. 6.23). Линией пересечения конуса с координатны- ми плоскостями Oyz и Oxz является пара пересе- кающихся прямых, а линией его пересечения с плоскостью z - h, параллельной Оху, при любом h * 0 является эллипс, проекция которого на плоскость Оху определяется уравнением х2 у2 , h , ,h —+ 7Г = 1 при ah=a—, bh=b— аь b2 с c 1 Действительно, так как векторы ОМ = {х, yt z} и OMQ = {х0, yQ, zQ} коллинеарны, то существует число X такое, что ОМ = k-OMQ, так что х = X • х0, у = X • у0> 2 = X • z0 и Xq Zq л х2 у2 z2 потому из равенства —- = 0 вытекает равенство —г + —г = 0. b с а b сг 142
5°. Эллиптический параболоид определяется кано- ническим уравнением г=у.£ (6-93> а1 Ь2' Из уравнения (6.93) вытекает, что координатные плоскости Oyz и Oxz являются плоскостями его симметрии, а их пересечение ось Oz — осью его симметрии. Из уравнения (6.93), кроме того, следует, что все его точки лежат в полупространстве z > 0. Линиями его пересечения с плоскостями z = h при любом h > 0 являются эллипсы, проекции кото- хг у2 рых на плоскость Оху определяются уравнениями —=— + —— = 1. (a4h)2 (bjh)2 Рис. 6.24 При увеличении h эти эллипсы неограниченно увеличиваются (см. рис. 6.24). Линией его пересечения с плоскостью х = й, параллельной Oyz, яв- h2 У1 и ляется парабола z--- = х = й, которая получа- ет b у2 ется параллельным переносом параболы z = -^-, х = 0, являющейся его сечением плоскостью х = 0, при котором вершина (0, 0, 0) этой последней па- й2 раболы переходит в точку (х = й, у = 0, z = —). а Иными словами, эллиптический параболоид обра- зуется путем параллельного перемещения парабо- лы, являющейся его сечением плоскостью х = 0, вдоль параболы, являющейся его сечением плоско- стью у = 0. Конечно, в сформулированном утверждении сечения х = 0 и у = 0 можно поменять ролями. Рис. 6.25 6°. Гиперболический па- раболоид определяется канониче- ским уравнением г = У__£ (6.94) а2 Ь2 Из уравнения (6.94) вытекает, что ко- ординатные плоскости Oyz и Oxz являют- ся плоскостями его симметрии, а их пере- сечение ось Oz — осью его симметрии (см. рис. 6.25). 143
Линии его пересечения с плоскостями z = h являются при h > 0 ги- хг V2 перболами, определяемыми уравнениями —--— = 1, а при й<0 — a2h b2h сопряженными гиперболами, определяемыми уравнениями х1 У1 \ a2-(-h) b2.(_h) Как и в случае эллиптического параболоида, можно убедиться в том, что гиперболический параболоид может быть получен путем па- раллельного перемещения параболы, являющейся его сечением плоско- стью у = 0 (соответственно х = 0), при движении ее вершины вдоль параболы, являющейся его сечением плоскостью х = 0 (соответствен- но у = 0). 7°. Цилиндры второго порядка определяются уравне- х2 у2 . X2 у2 , 2 О ниями —+ -i-r = l, - --^ = 1 и у =2рх и называются соответственно 2 А2’ 2 /2 z Г а о а b эллиптическим, гиперболическим и параболи- ческим цилиндрами. Все они состоят из прямых линий, па- раллельных оси Oz. Рисунок 6.26 дает представление об их форме. Рис. 6.26 8°. Прямолинейные образующие поверхностей второго порядка. Любую целиком лежащую на поверхности второго порядка пря- мую линию называют прямолинейной образующей этой поверхности. Естественно возникает вопрос, какие из поверхностей второго порядка имеют прямолинейные образующие. Ясно, что их имеют конус второго порядка (его прямолинейными образующими являются прямые, проходящие через любую его точку и начало координат О) и все цилиндры второго порядка (их прямолиней- 144
Рис. 6.27 Рис. 6.28 ными образующими являются прямые, проходя- щие через любую их точку и параллельные оси Oz). Но оказывается, что прямолинейные образу- ющие имеют еще две поверхности второго по- \ рядка: однополостный гиперболоид и гиперболи- ческий параболоид. Можно доказать1, что через каждую точку однополостного гиперболоида и гиперболического параболоида прохо- дят две различные прямолинейные об- разующие. Иллюст- рацией этого факта являются рис. 6.27 и 6.28. Именно с использованием прямоли- нейных образующих инженером В. Г. Шу- ховым сконструирована имеющая форму однополостного гиперболоида телевизион- ная башня на улице Шаболовка в Москве. 1 См., напр.: Ильин В.А., Позняк Э. Г. Аналитическая геометрия. М.: Физматлит, 2001. Пункт 5 § 3 гл. 7.
Глава 7 Предел последовательности В математическом анализе фундаментальную роль играет операция предельного перехода. В этой главе мы изучим простейшую форму этой операции — предел так называемой числовой последовательно- сти. § 1. Понятия последовательности и ее предела 1.1. Понятия последовательности и арифметических операций над последовательностями Понятие числовой последовательности уже встречалось в элемен- тарной математике. Примерами числовых последовательностей явля- ются последовательности всех членов арифметической или геометри- ческой прогрессии или последовательности длин периметров правиль- ных и-угольников, вписанных в окружность. Если каждому значению п из натурального ряда чисел 1, 2, ..., п, ... ставится в соответствие по определенному закону некоторое веще- ственное число хп, то множество занумерованных вещественных чи- сел хь х2, х„, ... (7.1) мы и будем называть числовой последовательно- стью или просто последовательностью. Отдельные числа хп будем называть элементами или чле- нами последовательности (7.1), а для сокращенной записи этой по- следовательности будем использовать символ {х„}. Так, например, символ {и2} обозначает последовательность 1, 22, З2,..., п2,а символ {1+(-!)"} обозначает последовательность 0, 2, 0, 2, .... Вместе с последовательностью (7.1) рассмотрим еще одну произво- льную последовательность У1, У2, Уп, ... • (7.2) Назовем последовательность Xj+yi, х2+у2, .... хп+уп, ... сум- мой последовательностей (7.1) и (7.2), последовательность X\-yi, х2—у2, ..., хп-уп, ... — разностью последовательностей (7.1) и (7.2), последовательность xi -yi, х2 -у2, ..., хп-уп, ... — произве- дением последовательностей (7.1) и (7.2) и, наконец, последовате- ль
X. Х1 ХП х /_ льность .... —, ... — ч а с т н ы м последовательностей (7.1) У, Уг Уп и (7.2). Конечно, при определении частного последовательностей (7.1) и (7.2) необходимо требовать, чтобы все элементы последовательности (7.2) были отличны от нуля. Однако весьма часто возникает ситуация, когда у последовательности (у„} может обращаться в нуль лишь ко- нечное число первых элементов, и мы можем рассматривать частное . — с того номера, начиная с которого все элементы {уп} отличны ./J от нуля. 1.2. Ограниченные, неограниченные, бесконечно большие и бесконечно малые последовательности Совокупность всех элементов последовательности {х„} образует некоторое числовое множество. Поэтому, отправляясь от введенных в § 2 гл. 1 понятий ограниченного сверху, снизу или с обеих сторон чис- лового множества, мы приходим к следующим определениям. Определение 1. Последовательность {х„} называется ограни- ченной сверху (соответственно снизу), если существует ве- щественное число М (соответственно т), обеспечивающее справедли- вость для всех элементов хп неравенства хп< М (соответственно хп > т). При этом число М (соответственно т) называется верхней гранью (соответственно нижней гранью) этой последовате- льности, а неравенство х„ < М (соответственно х„ > т) ' называется условием ограниченности этой последовательности сверху (соответственно снизу). Конечно, любая ограниченная сверху (соответственно снизу) по- следовательность имеет бесконечное множество верхних (соответст- венно нижних) граней и в условии ограниченности сверху (соответст- венно снизу) может стоять л ю б а я из верхних (соответственно ниж- них) граней. Определение 2. Последовательность {хя} называется ограни- ченной с обеих сторон или просто ограниченной, если она ограничена и сверху, и снизу, т. е. если существуют вещест- венные числа т и М, обеспечивающие справедливость для всех элемен- тов хп неравенств т<х„<М. (7.3). Стоящие в неравенствах (7.3) числа т и М называются соответственно 147
нижней и верхней г р а н я м и последовательности {хл}, а неравенства (7.3) — условием ее ограниченности. При этом в неравенствах (7.3) могут стоять любая нижняя и любая верхняя грани. Определение 2 требует существования хотя бы одной пары чисел т и М, обеспечивающих справедливость для всех элементов хп неравенств (7.3). Можно дать и другое эквивалентное определение ограниченности последовательности {хл}. Определение 2*. Последовательность {хп} называется огра- ниченной, если существует положительное вещественное число А, обеспечивающее справедливость для всех элементов хп неравенства |х„|<Я. (7.4) Чтобы убедиться в эквивалентности определений 2 и 2*, заметим, что если каждый элемент хп удовлетворяет неравенству (7.4), то, поло- жив т=-А, М=А, мы получим, что хп удовлетворяет неравенствам (7.3), и, наоборот, если каждый элемент хп удовлетворяет неравенствам (7.3), то, обозначив через А наибольшее из двух чисел \т | и \М |, мы можем утверждать, что хп удовлетворяет неравенству (7.4). Последовательность {х«}, не являющаяся ограниченной, называет- ся неограниченной, т. е. последовательность {хй} называет- ся неограниченной, если для любого1 положительного веще- ственного числа А найдется хотя бы один элемент хп, удовлетворяю- щий неравенству |х„|>Я. (7.5) С точки зрения этого определения всякая последовательность, ко- торая ограничена или только сверху j или только снизу, является нео- граниченной. Так, например, последовательность 1, 2, 1, 4, ..., 1, 2и, ... является неограниченной: она ограничена снизу, но вместе с тем для любого вещественного числа А > 0 найдется элемент этой последовательности с четным номером, удовлетворяющий неравенству (7.5). Последовательность j, очевидно, является ограниченной: каж- дый ее элемент хп = — удовлетворяет неравенствам (7.3) при любых п т < 0 и М> 1. Введем теперь понятия бесконечно большой и бес- конечно малой последовательностей. ’Сколь бы большим это число А ни было. 148
Определение 3. Последовательность {хй} называется беско- нечно большой, если для любого' положительного веществен- ного числа А найдется номер N, обеспечивающий справедливость не- равенства (7.5) для всех элементов хп с номерами п, удовлетворяющи- ми условию n>N. . Очевидно, что всякая бесконечно большая последовательность яв- ляется неограниченной, ибо определение бесконечно большой после- довательности требует, чтобы для любого А > 0 неравенству (7.5) удовлетворяли все элементы хп начиная с некоторо- го номера 7V, а определение неограниченной последовательности требует, чтобы для любого А > 0 неравенству (7.5) удовлетворял хотя бы один элементу. Вместе с тем не всякая неограниченная последовательность являет- ся бесконечно большой. Так, например, рассмотренная выше последо- вательность 1, 2, 1, 4, ..., 1, 2п, ..., будучи неограниченной, не является бесконечно большой, ибо для А > 1 неравенство (7.5) не выполняется для элементов хп с о сколь угодно большими нечетными номерами п. Определение 4. Последовательность1 2 {а„} называется беско- нечно малой, если для любого3 положительного вещественного числа е найдется номер N, обеспечивающий справедливость неравен- ства |ал|<е (7.6) для всех элементов ая с номерами п, удовлетворяющими условию n>N. Докажем, что последовательность q, .... qn, ... является бес- конечно большой при \q | > 1 и бесконечно малой при \q | < 1. Рассмотрим сначала случай \q | > 1. Тогда найдется положительное число 8 > 0 такое, что \q | = 1 + 8. Используя формулу бинома Ньютона (см. § 3 гл. 1), мы получим, что | qr |* = (1 + 8)* = 1 + N • 8 + (положительные члены), откуда следует, что ItffStf.S. (7.7) Далее из того, что \q | > 1, следует, что для всех номеров и, удовлетво- ряющих условию n>N, справедливо неравенство ’Сколь бы большим это число А ни было. 2 Мы будем стремиться обозначать элементы бесконечно малых последователь- ностей греческими буквами. 3 Сколь бы малым это число е ни было. 149
к|я>|9Г (7.8) Фиксируем теперь произвольное положительное веществен- ное число А. Тогда найдется номер N, удовлетворяющий условию ЛГ8>Я. (7.9) Действительно, так как неравенство (7.9) эквивалентно неравенству , то для удовлетворения неравенству (7.9) достаточно взять в 5 А качестве N любое целое число, большее —. 8 В силу неравенств (7.8), (7.7) и (7.9) мы получим, что для всех но- меров и, удовлетворяющих условию n>N, справедливо неравенство 2И<7Г>ЛГ-3> А, которое и означает, что при \q | > 1 последовательность {<f} является бесконечно большой. Совершенно аналогично доказывается, что при \q | < 1 последовате- льность {qn} является бесконечно малой. Исключая тривиальный слу- чай q = 0, положим — =1+5, где 5 — некоторое положительное чис- 1?1 , . ло. Используя, как и выше, формулу бинома Ньютона, мы получим вместо (7.7) неравенство -i->N-8, или |?|х<—-—. (7-7*) |9|" W-5 Далее, учитывая, что \q | < 1, получим, что для любого номера п, удов- летворяющего условию n>N, справедливо неравенство Ы"<|<7Г. (7.8*) После этого фиксируем произвольное положительное вещест- венное число е и по нему номер N, удовлетворяющий неравенству (достаточно взять в качестве W любое целое число, большее ——). Из е -5 (7.8*), (7.7*) и (7.9*) получим, что для любого номера п, удовлетворя- ющего условию n>N, справедливо неравенство N-8 150
которое и означает, что при |? | < 1 последовательность {qn} является бесконечно малой. г J1! Совсем тривиально проверяется, что последовательность «! — явля- ли, ется бесконечно малой. Действительно, фиксировав произвольное чис- ло £ > 0 и выбрав номер N из условия N>-, мы получим, что для всех £ номеров п, удовлетворяющих условию п > N, справедливо неравенство п N 1.3. Основные свойства бесконечно малых последовательностей Теорема 1. Сумма {ал + рл} и разность {а„ - рл} двух бесконечно малых последовательностей {ал} и {рл} являются бесконечно малыми последовательностями. Доказательство. Фиксируем произвольное число е > 0. Так как последовательности {ал} и {Р„} являются бесконечно малыми, то для положительного числа найдутся номера М и N2 такие, что для всех номеров л, удовлетворяющих условию п > М, и |<£ (7.П) 2 для всех номеров п, удовлетворяющих условию л > #2- Если обозначить через WHaH6onbfflHiiH3 двух номеров N\ и Ni, то для всех номеров п, удовлетворяющих условию n>N, будут справедливы оба неравенства (7.10) и (7.11), и потому (в силу того, что модуль суммы и модуль-разности двух чисел не превосходят сум- мы модулей этих чисел) будут справедливы и неравенства 1«л +Рл1- 1«я1 +1₽л1<е и 1ал _Рл1^1ал1 + 1Рл1<е> которые и означают, что последовательности {ал + рл} и {ал - рл} яв- ляются бесконечно малыми. Теорема доказана. Следствие из теоремы 1. Алгебраическая сумма любого конечного числа бесконечно малых последовательностей является бесконечно малой последовательностью. 151
Теорема 2. Произведение {хл • ал} ограниченной последовательно- сти {хл} на бесконечно малую последовательность {а„} является бес- конечно малой последовательностью. Доказательство. По определению ограниченной последо- вательности существует положительное число А такое, что для всех номеров п справедливо неравенство |хя|^Л. (7.12) Фиксируем произвольное число е > 0. Так как последовательность {ал} является бесконечно малой, то для положительного числа — най- А дется номер N такой, что для всех номеров п, удовлетворяющих уело- g вию n>N, будет справедливо неравенство |а„|<—, и потому (в силу А (7.12) и этого неравенства, а также в силу того, что модуль произведе- ния двух чисел равен произведению модулей этих чисел) будет спра- ведливо и неравенство |х. „|=]аг„|-|<х.„|< А • — = £, I Л ПI • ПI I п • . 7 А которое и означает, что последовательность {хп • ая} является беско- нечно малой. Теорема доказана. Теорема 3. Всякая бесконечно малая последовательность {ай} яв- ляется ограниченной. Доказательство. Фиксируем некоторое положительное число £. По определению бесконечно малой последовательности най- дется номер N такой, что |ал|<£ для всех номеров и, удовлетворяю- щих условию n>N. Поэтому, если мы обозначим через А н а и б о - л ьш е е из N положительных чисел |aj|, laal, |адн|, то неравенст- во | а л|< А будет справедливо д л я всех номеров п. Теорема доказана. Следствие из теорем 2 и 3. Произведение двух (а потому и любого конечного числа) бесконечно малых последовательностей является бесконечно малой последовательностью. Теорема 4. Если {уп} — бесконечно большая последовательность, то начиная с некоторого номера п определено частное последо- IKJ вательностей 1, 1, 1, ... и уь Уъ которое является бесконечно малой последовательностью. 152
Доказательство. Фиксируем произвольное число 8>0. По определению бесконечно большой последовательности для положите- льного числа А = - найдется номер N такой, что для всех номеров и, 8 удовлетворяющих условию n>N, справедливо неравенство |ул|>- и эквивалентное ему неравенство 8, означающие, что начиная с не- которого номера можно рассматривать частное » и что это частное является бесконечно малой последовательностью. Теорема доказана. В качестве примера докажем, что для любого фиксированного 1 а > 0 последовательность {хй}, у которой хп =ап — = —, является бес- п\ п\ конечно малой. Так как при 0 < а < 1 последовательность {ан} является ограничен- ии f 1 1 -2 нои , а последовательность > является бесконечно малой , то по те- tn!] ореме 2 и последовательность {хй} является бесконечно малой. Если а>1, то, обозначив символом [а] наибольшее целое число, содержащееся в а, и приняв во внимание, что [а] < а < [а] + 1, мы мо- жем записать для любого номера п, большего [а] + 2, равенство а а а ТТ’М а а 1 --------... > • а • —. [а] + 1 п- 1J п Из этого равенства с учетом того, что внутри фигурной скобки стоит произведение множителей, меньших единицы, мы получим спра- ведливое для всех номеров п, больших [а] + 2, неравенство а™ 1 Хп ---------’ [а]! п из которого в силу теоремы 2 вытекает, что и при а > 1 последователь- ность {хй} является бесконечно малой. 1 Ибо при этом ап £ 1 для всех номеров п. 2Ибо для всех номеров п, а последовательность I-L как доказано в л! п [л] предыдущем разделе, является бесконечно малой. 153
1.4. Сходящиеся последовательности и их свойства Введем фундаментальные понятия сходящейся последовательности и ее предела. Определение 1. Последовательность {хй} называется сходя- щейся, если существует такое вещественное число а, что последо- вательность {хй - а} является бесконечно малой. При этом вещест- венное число а называется пределом последовательности {хй}. В соответствии с этим определением всякая бесконечно малая по- следовательность является сходящейся и имеет своим пределом число а = 0. Используя определение бесконечно малой последовательности, мы приходим к другому определению сходящейся последовательности, эк- вивалентному определению 1. Определение 2. Последовательность {хй} называется сходя- щейся, если существует такое вещественное число а, что для лю- бого' положительного вещественного числа £ найдется номер N, обеспечивающий справедливость неравенства |хЛ-а|<£ (7.13) для всех элементов хп с номерами п, удовлетворяющими условию n>N. При этом число а называется пределом последовательно- сти {хй}. Если последовательность {хй} является сходящейся и имеет своим пределом число а, то символически это записывают так: limx„ - а или Л-ЮО хл -> а при п -> оо. Неравенство (7.13) можно записать в эквивалентной форме -£<хя-а<+£ или, что то же самое, в форме а-£<хп< а+г. (7.13*) На геометрическом языке неравенства (7.13*) означают, что эле- менты хй лежат на интервале (а - £, а + б), который мы еще в § 2 гл. 1 договорились называть 8-окрестностью точки а. Это позволяет сформулировать еще одно определение сходящейся последовательности, эквивалентное определениям 1 и 2. Определение 3. Последовательность {хй} называется сходя- щейся, если существует такое число а, что в любой г-окрест- ности точки а лежат все элементы этой последовательности хп на- чиная с некоторого номера (зависящего, конечно, от г). Непосредственно из определения 1 вытекает, что если последова- 1 Сколь бы малым это число е ни было. 154
телъностъ {хл} сходится ц имеет своим пределом число а, то для ее элементов хп справедливо следующее специальное пред- ставление: х„ = а + а „, в котором а„ — элементы некоторой бесконечно малой последовательности. Замечание 1. Из определения сходящейся последовательно- сти и ее предела вытекает, что удаление любого конечного числа эле- ментов этой последоЬательности не влияет на сходимость этой после- довательности и величину ее предела. ' Замечание 2. Последовательности, не являющиеся сходящи- мися, называют расходящимися. В качестве примера установим сходимость последовательности {л/л} к пределу а = 1. Так как любая положительная степень числа, бо- льшего единицы, сама является числом, большим единицы, то л/л >1 для всех и >2. Поэтому для.каждого номера п >2 существует число 8„ >0 такое, что л/л =1 +8„, и нам достаточно доказать, что последова- тельность {8Л} является бесконечно малой. Возвышая равенство л/л = 1+8,, в степень л и пользуясь формулой бинома Ньютона, получим для всех л > 3 равенство л = (1+8я)"=1 + л- 8я + 3я + (положительные члены). тг л(л-1)»2 Из этого равенства вытекает, что п>—-----------о„, и потому 8 .< Из последнего неравенства и из того, что последователь- л —1 ность .л/л-1 является бесконечно малой, вытекает, что и последова- тельность {8„} является бесконечно малой. Переходим к установлению основных свойств сходящихся после- довательностей. Теорема 5. Сходящаяся последовательность имеет только один предел. Доказательство. Предположив-, что сходящаяся последова- тельность {хл} имеет два предела а и Ь, мы получим, что справедливы равенства х„ -а=а„, х„ -6 = Р„, в которых а„ ир„ — элементы двух бесконечно малых последовательностей. Вычитая второе равенство из первого, мы получим, что Z>-a = а„-0д. Так как в силу теоремы 1 разность {ал-рл} двух бесконечно малых последовательностей явля- 155
ние {х„ • уп} и частное < ется бесконечно малой последовательностью, то для любого числа £ > 0 все ее элементы начиная с некоторого' номера удовлетворяют не- равенству |а„ - р„ | < е. Из этого неравенства и из равенства |а„ - р„ | = |6 - а| вытекает, что |Z> - а| < в (для любого числа е > 0). Отсюда следует, что |Z>-a| = O, т. е. Ь = а. Теорема доказана. Теорема 6. Всякая сходящаяся последовательность ограничена. Доказательство. Если последовательность {х„} сходится и число а является ее пределом, то для элементов хп этой последователь- ности справедливо специальное представление х„ =а+а„, в котором а„ — элементы некоторой бесконечно малой последовательности. Так как в силу теоремы 3 всякая бесконечно малая последовательность ограничена, то существует число М>0 такое, что |а„|<А/ для всех номеров и. Из последнего неравенства и из того, что мо- дуль суммы двух чисел не превосходит суммы модулей этих чисел, вытекает, что |х„|=|а+ал|^|а| + |ая[<|а| + Л/(для всех номе- ров л). Это и означает, что последовательность {х„} ограничена. Тео- рема доказана. Теорема 7 (об арифметических операциях над сходящимися по- следовательностями). Сумма {хп + уп}, разность {хп-уп}, произведе- двух сходящихся последовательностей {х„} и {уп}, имеющих своими пределами числа а и b соответственно, являются сходящимися последовательностями, имеющими своими пределами числа а + b, а-Ь, а-bu^- соответственно (в случае част- ного следует дополнительно требовать, чтобы предел b был отличен от нуля, и рассматривать это частное только начиная с некоторого номера, с которого все уп отличны от нуля). Доказательство. Так как последовательности {х„} и {уп} сходятся к пределам а и b соответственно, то для их элементов спра- ведливы специальные представления х„ =а + а„, уп =6 + р„, в которых а„ и Р„ — элементы некоторых бесконечно малых последовательно- стей. Складывая, вычитая и перемножая почленно эти представления и в полученных равенствах перенося из правой части в левую слагае- мые, содержащие только а и Ь, получим, что Ч+Л-(а + 6)=ая+Рл> • х„-у,-(а-6)=а„+рл, (7Л4> х„ • У» _ <з • Ъ = аВ„ + Ьа. „ + а В„. п У п • п п п~ п 156
Так как сумма {ал + Р„} и разность {ал - рл} двух бесконечно ма- лых последовательностей являются (в силу теоремы 1) бесконечно ма- лыми последовательностями и так как произведения {а Р„} и {Ь • ал} постоянных на бесконечно малые последовательности и произведение {ал • рл} двух бесконечно малых последовательностей также являются (в силу теоремы 2 и следствия из теорем 2 и 3) бесконечно малыми последовательностями, то в правых частях всех трех равенств (7.14) стоят элементы бесконечно малых последовательностей. Это и означа- ет, что последовательности {ал + рл}, {ал -р„} и {ал • рл} сходятся к пределам а + Ь, а-b и а - b соответственно. Убедимся теперь в том, что в случае частного из условия 6*0 вы- текает, что все элементы уп начиная с некоторого номера удовлетво- I ы ряют неравенству |ул|>— или эквивалентному ему неравенству — < —, означающему, что последовательность Уп 1*1 если ее рас- сматривать начиная с указанного номера, является ограниченной. Действительно, учитывая, что последовательность {ул} сходится к пределу 6 * 0, и полагая положительное число е равным мы полу- чим, что найдется номер N такой, что для всех номеров п, удовлетво- I ы ряющих условию n>N, справедливо неравенство | уп - 6| < ^1, из кото- рого (в силу того, что модуль разности двух чисел больше или равен разности модулей этих чисел) вытекает неравенство 1лН*-(*-у»)1^1*Н*-л1=1*1-1л-6|>|6|-l|l=^i. Рассматривая далее последовательность • начиная с указанного номера N и пользуясь легко проверяемым с помощью представлений х„ = а + а п, уп = b+Р„ тождеством Уп ь в правой части которого стоит произведение ограниченной последова- тельности • — • на бесконечно малую последовательность ]а„ р„ I, .Уп) I b J 157
мы й получим, что последовательность .У„. " - а сходится к пределу —. Теорема доказана. Теорема 8 (о предельном переходе под знаком неравенства). Если последовательность {х„} сходится к некоторому пределу х и если все элементы хп, по крайней мере начиная с некоторого номера No, удовлетворяют неравенству хп>а (соответственно хп <Ь), то и предел х удовлетворяет неравенству х>а (соответственно хЬ). Доказательство. Ограничимся рассмотрением случая хп>а, ибо случай хп<Ь рассматривается аналогичной Предположим, что неравенство х>а не справедливо. Тогда х<а, т. е. a-x + z, где е — некоторое положительное число. 'Сопоставляя равенство а = х + е с неравенством хп £ а, мы получим, что х„ > х + г для всех но- меров п начиная с номера No, а это означает, что все хп начиная с но- мера Nq лежат за пределами Е-окрестности(х-е, х + е) точки х, а это противоречит тому, что х является пределом последовательности {х„}. Полученное противоречие доказывает ошибочность предположения d том, что х < а, и справедливость неравенства х > а. Теорема доказана. Замечание 3. Если все элементы сходящейся последователь- ности {х„} удовлетворяют строгому неравенству хп > а, то отсюда, вообще говоря, не следует, что и предел х этой последовательности удовлетворяет строгому неравенству х>а. Можно лишь утверждать, что х^а. • Например, если хП =—, то хп > 0 для всех номеров п, однако предел п limi=x = 0 не удовлетворяет неравенству х>0. п Следствие 1. Если все элементы сходящейся последовательности {х„} лежат на сегменте [a, £>], то и предел х этой последовательно- сти лежит на сегменте [а, 6]. • Действительно, так как а < х„ < b для всех номеров п, то а < х < b (в силу теоремы 8). Следствие 2. Если все элементы двух сходящихся последователь- ностей {х„} и {ул}> по крайней мере начиная с некоторого номера, удовлетворяют неравенству хп < у„, то и пределы х и у этих последо- вательностей удовлетворяют неравенству х < у. Действительно, начиная с указанного номера все элементы сходя- щейся в силу теоремы 7 последовательности {у„ - хл} неотрицательны, а потому в силу теоремы 8 и ее предел у-х неотрицателен, а это и означает, что х <, у. 158
Теорема 9. Если {хй} и {уп} — две сходящиеся последовательно- сти, имеющие общий предел а, и если элементы третьей последова- тельности {zn}, по крайней мере начиная с некоторого номера Nq, удовлетворяют неравенствам хп< zn< уп, то и последовательность {zn} сходится к пределу а. Доказательство. Фиксируем произвольное число е > 0. Тогда найдутся номера N\ и N2 такие, что все элементы последователь- ности {хй} начиная с номера N\ и все элементы последовательности {уп} начиная с номера N2 лежат в £-окрестности точки а. Если мы обо- значим через N наибольший из трех номеров Nq, N\ и N2, то начиная с номера N в е-окрестности точки а будут лежать все элементы обеих последовательностей {хй} и {уп}, а потому (в силу неравенства хп < zn < ул) и все элементы последовательности {zn}. Это и означает, что последовательность {zn} сходится к пределу а. Теорема доказана. § 2. Монотонные последовательности 2.1. Понятие монотонной последовательности Определение 1. Последовательность {хй} называется неубы- вающей (соответственно невозрастающей), если каждый ее элемент начиная со второго не меньше (соответственно не боль- ше) предыдущего ее элемента, т. е. если для всех номеров п справед- ливо неравенство хп < х/и1 (соответственно хп > х/и1). Определение 2. Последовательность {хй} называется моно- тонной, если она является либо неубывающей, либо невозрастаю- щей. Если элементы неубывающей последовательности {хй} для всех но- меров п удовлетворяют строгому неравенству хл<хлИ, то эта последо- вательность называется возрастающей. Аналогично, если элементы невозрастающей последовательности {хй} для всех номеров п удовлетворяют строгому неравенству хп >хлИ, то эта последовательность называется убывающей. Заметим, что всякая монотонная последовательность всегда огра- ничена с одной стороны (либо сверху, либо снизу). Действительно, всякая неубывающая последовательность ограничена снизу (в качестве нижней грани можно взять величину ее первого члена), а всякая невоз- растающая последовательность ограничена сверху (в качестве верхней грани также можно взять величину ее первого члена). Отсюда вытекает, что неубывающая последовательность является ограниченной с обеих сторон, или просто ограниченной, тогда и толь- ко тогда, когда она является ограниченной сверху, а невозрастающая 159
последовательность является ограниченной тогда и только тогда, когда она ограничена снизу. 4 Так, последовательность 1, 1, 2, 2, 3, 3, ... является неубывающей (она ограничена снизу величиной своего первого члена 1, а сверху не . 2 3 4 п + 1 ' - . ограничена), а последовательность -, -, —, ..., -, ... убывает (она 12 3 п ограничена с обеих сторон: сверху величиной своего первого члена 2, а снизу, например, числом 1). 2.2. Теорема о сходимости монотонной ограниченной последовательности Теорема 10. Если последовательность {х„} не убывает (соответ- ственно не возрастает) и ограничена сверху (соответственно снизу), то она сходится к пределу х (соответственно к пределу х), являюще- муся точной верхней гранью (соответственно точной нижней гра- нью) множества всех ее элементов хп. Доказательство. Пусть последовательность {хл} не убыва- ет и ограничена сверху. Тогда совокупность всех ее элементов хп явля- ется ограниченным сверху числовым множеством и по теореме 1 из гл. 1 обладает точной верхней гранью, которую мы обозначим через х. По определению х как одной из верхних граней все элементы хп удовлетворяют неравенству х„^х, (7.15) а в силу того что эта грань является точной, для любого числа £>0 найдется хотя бы один элемент последовательности (пусть это будет элемент х^ с номером N), удовлетворяющий неравенству x-e<xN. Из этого неравенства и из неубывания последовательности {хл} вытекает, что любой ее элемент хп с номером л, большим N, тем более удовлетворяет неравенству х -е< хп, а из сопоставления послед- него неравенства со справедливым для всех номеров п неравенством (7.15) следует, что любой элемент хп с номером и, большим N, удов- летворяет неравенствам х -е<хИ £х и потому лежит в е-окрестности (х-е,х+е) точки х. Это и означает, что число х является пределом последовательности {х„}. Совершенно аналогично доказывается, что невозрастающая и огра- ниченная снизу последовательность сходится к точной нижней грани х множества всех ее элементов. Теорема доказана. Замечание 1. Подчеркнем, что все элементы х„ неубывающей и ограниченной сверху последовательности меньше или равны ее пре- 160
делу х, а все элементы хп невозрастающей и ограниченной снизу по- следовательности больше или равны ее пределу х. Замечание 2. Как уже отмечалось выше, ограниченность сверху неубывающей последовательности и ограниченность снизу не- возрастающей последовательности эквивалентны ограниченности этих последовательностей с обеих сторон. Поэтому теорему 10 можно пере- формулировать так: для сходимости монотонной последовательности достаточно, чтобы она являлась ограниченной. Далее, поскольку в силу теоремы 6 всякая сходящаяся последова- тельность является ограниченной, эту формулировку можно усилить: для сходимости монотонной последовательности необходимо и до- статочно, чтобы она являлась ограниченной. Замечание 3. Конечно, не всякая сходящаяся последователь- ность является монотонной. Например, не является монотонной следу- ющая сходящаяся к нулю (т. е. бесконечно малая) последовательность: j 1 _1 1 1_ ’ 2’ 3’ 4* ’ 2л-1’ 2п 2.3. Число е Применим теорему 10 для доказательства сходимости последовате- ( 1Y льности {хя}, у которой хп = 1 + — . Достаточно доказать, что эта по- \ п) следовательность возрастает и ограничена сверху. Применяя формулу бинома Ньютона (см. теорему 2 § 3 гл. 1), получим п 2! п2 3! п3 , п(л-1)(л-2)...[л-(л-1)] 1 п! . п"' Это выражение можно переписать в следующем виде: 1 х =2+—Г1-—Y1-—1+... 2!^ п) 3!^ пД п) л!^ лД п) \ п ) Аналогичное выражение получается для члена 161
(7.17) Непосредственным сопоставлением правых частей равенств (7.16) и (7.17) убеждаемся в том, что хл<хж1. Это вытекает из того, что для любого к, равного 1, 2, ..., п-1, справедливо неравенство Г. *1 fi М 1 — <1--------, и, кроме того, хл+1 содержит по сравнению с х„ и J V л + 1 J лишний положительный член (последний член в правой части (7.17)). Итак, возрастание последовательности {х„} установлено. Для дока- зательства ограниченности этой последовательности сверху заметим, что каждое выражение, стоящее в (7.16) в круглых скобках, меньше единицы и что для любого к>2 справедливо неравенство Поэтому из равенства (7.16) вытекает неравенство х <2 + -+-^-+... + —= 3—?-<3. (7Л8) 2 22 2 2 Итак, последовательность {х„} возрастает и ограничена. По теоре- ме 10 она сходится к некоторому пределу, который мы обозначим че- рез е. В дальнейшем выяснится, что число е играет важную роль в мате- матике. Уже сейчас мы можем хотя бы грубо оценить величину этого числа. Отбрасывая в правой части (7.16) все положительные члены, кроме первого, мы получим, что хп > 2. Сопоставляя последнее нера- венство с неравенством (7.18), мы получим, что все элементы последо- вательности {х„} лежат на сегменте [2, 3]. Но тогда в силу следствия 1 из теоремы 8 и предел этой последовательности е лежит на сегменте [2, 3]. Можно доказать, что е является иррациональным числом, имею- щим с точностью до пятнадцати знаков после запятой вид: е = 2,718281828459045... 162
§ 3. Предельные точки последовательности и множества 3.1. Предельные точки последовательности Рассмотрим произвольную последовательность х1; х2, хп, ... и произвольную возрастающую последовательность целых поло- жительных чисел к\, к2, .... кп>.... Выберем из последовательности {хя} элементы с номерами к\, к2,..., кп,... и расположим их в порядке возра- стания указанных номеров. Мы получим при этом новую последовате- льность х^, х^, ..., хк , .... которую принято называть подпосле- довательностью исходной последовательности {хл}. В частности, и сама последовательность может рассматриваться как подпоследовательность с номерами кп = п. Заметим, что всегда кп > п, ибо любая подпоследовательность, не совпадающая со всей последовательностью, получается путем некото- рого прорежения элементов последовательности. Теорема 11. Если последовательность {хя} сходится к пределу а, то и любая ее подпоследовательность сходится к тому же пределу а. Доказательство. Для произвольной подпоследовательности {xt>} справедливо неравенство к„ > п. Поэтому, если для любого числа е>0 выбрать (существующий в силу сходимости последовательности {х„} к пределу а) номер N, обеспечивающий справедливость неравен- ства |хя - а |< е для всех п > N, то для всех n>N тем более будет спра- ведливо неравенство |х^ -а|<е, устанавливающее сходимость подпос- ледовательности {х^} к пределу а. Введем теперь фундаментальное понятие предельной т о ч - к и последовательности. Определение 1. Точка х бесконечной прямой (-оо, +оо) называется предельной точкой последовательности {х„}, если в любой е-окрестности точки х лежит бесконечно много элементов этой по- следовательности. Определение 2. Точка х бесконечной прямой (-<», +оо) называется предельной точкой последовательности {хя}, если из этой последовательности можно выделить подпоследовательность, сходя- щуюся к пределу х. Убедимся в том, что определения 1 и 2 эквивалентны. 1. Пусть в любой е-окрестности точки х лежит бесконечно много элементов последовательности {хл}. Рассмотрим совокупность s-окрестностей точки х, для которых число е последовательно равно 1, 1 1 1 2’ з’ п ' 163
В первой из этих окрестностей выберем элемент последовательно- сти с некоторым номером к\, во второй из этих окрестностей выбе- рем элемент хкг с номером кг, большим к\, в третьей из этих окрестно- стей выберем элемент xki с номером ку, большим кг, и т. д. Этот процесс можно продолжать неограниченно, так как в любой е-окрестности точки х лежит бесконечно много элементов последова- тельности {х„}. В результате мы получим подпоследовательность х^, хк , ..., хк , ... последовательности {х„}, сходящуюся к пределу х в силу 2 " 1 того, что |xt — х|<—. ' п 2. Предположим, что из последовательности {хл} можно выделить подпоследовательность {xt>}, сходящуюся к пределу х. Тогда по опре- делению сходимости в любой е-окрестности точки х лежит бесконечно много элементов подпоследовательности (все, начиная с некоторого номера). Так как каждый элемент подпоследовательности является эле- ментом и всей последовательности, то в любой е-окрестности точки х лежит бесконечно много элементов и всей последовательности. Эквивалентность определений 1 и 2 установлена. Отметим, что предельную точку последовательности иногда назы- вают частичным пределом этой последовательности. Выясним сначала вопрос о наличии предельных точек у сходящей- ся последовательности. Теорема 12. Всякая сходящаяся последовательность имеет толь- ко одну предельную точку, совпадающую с ее пределом. Доказательство. Предел х сходящейся последовательности является ее предельной точкой в силу того, что в любой е-окрестности х лежит бесконечно много элементов этой последовательности. Других предельных точек эта последовательность не имеет, ибо в силу теоре- мы 11 из нее нельзя выделить подпоследовательность, сходящуюся к пределу, отличному от х. Докажем теперь следующее замечательное утверждение. Теорема 13 (теорема Больцано-Вейерштрасса). Любая ограни- ченная последовательность имеет хотя бы одну предельную точку, т. е. из любой ограниченной последовательности {хл} можно выделить сходящуюся подпоследовательность. Доказательство. Так как последовательность {х„} ограни- чена, то существует сегмент [ао, ^о]> содержащий все ее элементы хп. Разделим сегмент, [а0> &о] на две равные половины и учтем, что хотя бы одна из этих половин содержит бесконечно много элементов хп. Обозначим через [ab Z>i] ту половину сегмента [ао> &о]> которая содер- жит бесконечно много элементов хп, и выберем в качестве первого 164
элемента подпоследовательности один из этих элементов . Разделим далее сегмент [аь на две равные половины и обозначим через [а2, Ьг] ту из этих половин, которая содержит бесконечно много эле- ментов хп. В качестве второго элемента подпоследовательности возь- мем лежащий на сегменте [а2, 62] элемент xk с номером к2, большим к\. Разделим далее сегмент [а2, Ь2] на две равные половины и обозна- чим через [а3, Z>3] ту из этих половин, которая содержит бесконечно много элементов хп. В качестве третьего элемента подпоследователь- ности возьмем лежащий на сегменте [а3, Z>3] элемент хк} с номером £3, большим к2. Продолжая эти рассуждения далее, мы построим бесконечную по- следовательность сегментов {[а„, 6Л]}, (п = 1, 2, ...) таких, что каждый сегмент [а„, />я] содержит все последующие сегменты и элемент хк вы- деляемой нами подпоследовательности {xt>}. . ’ Так как каждый сегмент [ап,5п] содержит следующий сегмент [an+i,6„+i], то последовательность левых концов сегментов {ая} не убывает, а последовательность правых концов сегментов {Ь„} не воз- растает, причем обе эти последовательности принадлежат основному сегменту [а0, М и потому ограничены. По теореме 10 обе последовате- льности {ап} и {&„} сходятся к некоторым пределам, которые мы обо- значим через Х| и х2 соответственно. Но тогда по теореме 7 разность этих последовательностей {Ьп-ап} сходится к пределу х2-хь и поско- льку по построению Ьп-ап = (Ьо - ао)/2", то последовательность {Ь„ - ап} является бесконечно малой и ее предел х2 -xt равен нулю, т. е. xi=x2. Из сходимости последовательностей {ая} и {Z>„} к общему пре- делу х = Xi = х2 и из того, что каждый элемент подпоследовательности х^ лежит на сегменте [а„, Ьп] и потому удовлетворяет неравенствам а„ < xt> < b„, на основании теоремы 9 получим, что выделенная нами подпоследовательность {х^ } сходится к этому общему пределу х. Тео- рема доказана. 3.2. Предельные точки множества Понятие предельной точки и теорема Больцано-Вейерштрасса о ее существовании тривиально переносятся со случая последовательности на случай произвольного числового множества, содержащего бесконечное число элементов. Единственное, на что следует обратить внимание, — это то обстоя- тельство, что два различных элемента числового множества {х} (в от- личие от двух различных элементов последовательности) не могут быть равными вещественными числами. Определение 1. Точка х бесконечной прямой (-оо, оо) называется пР сдельной точкой содержащего бесконечное число элемен- 165
шов множества {х}, если в любой г-окрестности точки х лежит бес- конечное число элементов этого множества. Определение 2. Точка х бесконечной прямой (-оо, оо) называется предельной точкой содержащего бесконечное число элемен- тов множества {х}, если из элементов этого множества можно вы- делить последовательность, сходящуюся к пределу х. I Напомним, что множество {х} называется ограниченным, если существуют два вещественных числа т и Л/, обеспечивающие справедливость неравенства т < х < М для всех элементов х этого | множества. Теорема 13* (Больцано-Вейерштрасса). Любое содержащее бес- ' конечное число элементов ограниченное множество {х} имеет хотя f бы одну предельную точку, т. е. из элементов этого множества можно выделить сходящуюся последовательность. Доказательство эквивалентности определений 1 и 2 и теоремы 13* дословно повторяет рассуждения предыдущего раздела с заменой сло- ва «последовательность» на слово «множество». Множество {х} называется замкнутым, если оно содержит все свои предельные точки. Примером замкнутого множества является сегмент [а, 6]. § 4. Верхний и нижний пределы последовательности Ограниченная последовательность может иметь сколько угодно предельных точек, причем единственную предельную точку (как мы увидим ниже) имеет только сходящаяся последовательность. Если по- следовательность можно расслоить на т сходящихся последовательно- стей, имеющих не совпадающие между собой пределы хь х2, ..., xw, то эта последовательность имеет т предельных точек xj, х2, ..., хт. Примером последовательности, имеющей бесконечное число предельных точек, может служить последовательность, содер- жащая^ качестве своих элементов все рациональные числа из интер- вала (0,1). Чтобы построить такую последовательность, заметим, что , все рациональные числа из интервала (0,1) могут быть представлены - положительными правильными рациональными дробями вида у ко- п торых и > 2, 0 <т<п. Все такие дроби разобьем на группы: в первую группу включим дроби со знаменателем п = 2 (таковой является одна дробь -), во вторую группу включим дроби со знаменателем п = 3 (та- 2 1 2 ковыми являются две дроби: - и -), ..., в и-ю группу включим дроби 166 I
со знаменателем и + 1 (таковыми являются и дробей: ----, =--, п + 1 и + 1 и + 1 Составим теперь последовательность, выписав подряд сначала е 1 „ й 1 2 дробь - из первой группы, за ней дроби -, - из второй группы, за 1 2 3 ними дроби —, —, — из третьей группы и т. д. Построенная нами после- 4 4 4 довательность будет содержать все рациональные числа из интервала (0,1)'. Предельными точками построенной нами последовательности бу- дут все вещественные числа из сегмента [0,1] (подчеркнем: не из интервала (0,1), а из сегмента [0,1]), ибо в любой е-окрестности каждого вещественного числа из сегмента [0,1] лежит бесконечно много рациональных чисел из интервала (0, 1). Итак, мы убедились, что множество всех предельных точек ограниченной после- довательности может не только иметь бесконечное число элементов, но и состоять из всех точек целого сегмента. Естественно возникает вопрос о существовании у множества всех предельных точек ограниченной последовательности наибольше- го и наименьшего элементов. Определение 1. Наибольшая предельная точка последовательно- сти {х„} называется в ерх ним пределом этой последователь- ности и обозначается limx„ (над символом lim ставится черта), л-но Определение 2. Наименьшая предельная точка последовательно- сти {х„} называется нижним пределом этой последователь- ности и обозначается limx, (под символом lim ставится черта). Вопрос о существовании у ограниченной последовательности наи- большей и наименьшей предельных точек требует обоснования, ибо не У всякого ограниченного множества чисел, имеющего бесконечное число элементов, существуют наибольший и наименьший элементы (например, у множества всех рациональных чисел из интервала (0,1) не существует ни наибольшего, ни наименьшего элементов). 1 Числа, представимые сократимыми рациональными дробями, будут входить в ЭТУ последовательность с повторениями. Если бы мы захотели, чтобы каждое Рациональное число из интервала (0,1) входило в нашу последовательность один и только один раз, мы должны были бы выбросить из всех групп сократимые рациональные дроби. 167
Справедливо следующее утверждение. Теорема 14. У всякой ограниченной последовательности {хл} су- ществуют верхний предел х и нижний предел х, причем для любого числа е > 0 все элементы этой последовательности начиная с некото- рого номера1 лежат на интервале (х - е, х + е). Доказательство. Пусть, как и в теореме 13, [а0,^о] — сег- мент, содержащий все элементы последовательности {х„}. Будем при- держиваться схемы доказательства теоремы 13 со следующим измене- нием: если при переходе от сегмента [ап, М к его половине обе поло- вины сегмента [ап, Ьп] содержат бесконечно много элементов последо- вательности, то мы обозначим через [a„+i, 6„+i] не любую из этих по- ловин (как это делалось при доказательстве теоремы 13), а обязательно правую (соответственно л е в у ю) из этих половин. При таком по- строении последовательности сегментов {[a„, Z>„]} правее правого кон- ца Ьп (соответственно левее левого конца ап) каждого из сегментов [ап, Ьп] будет лежать не более чем конечное число элементов последо- вательности. Рассуждения теоремы 13 обеспечат нам существование предельной точки х (соответственно предельной точки х), к которой сходятся по- следовательности обоих концов сегментов [а„, 6„]. Заметим, что для любого числа е > 0 может существовать не более чем конечное число элементов последовательности {хл}, удовлетворя- ющих условию хл > х + е (соответственно условию х„ < х - е), ибо для любого числа е > 0 правые (соответственно левые) концы всех сегментов [ап, />л] начиная с некоторого номера лежат в Е-окрестности точки х (соответственно точки х). Отсюда следует, что для любого числа е > 0 все элементы последо- вательности {хл} начиная с некоторого номера лежат в интервале (х-е,х+е). Остается доказать, что х является наибольшей, ах — наименьшей предельной точкой последовательности. Проведем доказательство то- лько для х (ибо для х оно проводится аналогично). Достаточно дока- зать, что любое число х', большее х, не является предельной точкой последовательности. Так как х'>х, то разность х'-х является положи- тельным числом, кдторое мы обозначим через 2е. Из равенства х'-х =2е вытекает, что х +е = х'-е, и поскольку правее х +£ может ле- жать не более чем конечное число элементов последовательности, то и в Е-окрестности (х' - е, х' + е) точки х' их может лежать не более чем ‘Зависящего, конечно, от числа е>0. 168
' конечное число, а это означает, что х' не является предельной точкой последовательности {хя}. Теорема доказана. Простым следствием теоремы 14 является следующее утвержде- ние. Теорема 15. Если ограниченная последовательность {хя} имеет единственную предельную точку х, то эта последовательность схо- дится, и число х является ее пределом. ' Доказательство. Так как х является единственной предель- ной точкой, то верхний предел х и нижний предел х совпадают с х, и по теореме 14 для любого числа е > 0 все элементы последовательно- сти {хя} начиная с некоторого номера лежат на интервале (х-е,х +е), совпадающем с s-окрестностью (х-е, х + е) точки х. Это и означает, что последовательность {х„} сходится к пределу х. § 5. Критерий Коши сходимости последовательности Установим критерий сходимости произвольной последовательно- сти {хя}, позволяющий сделать заключение о ее сходимости лишь по величинам ее элементов х„ и не использующий величины ее предпо- лагаемого предела. > Определение. Последовательность {хя} называется фунда- ментальной, если для любого положительного числа £ найдется номер N, обеспечивающий справедливость неравенства |х„ — Х_|<Е I Птр П1 для всех номеров п, удовлетворяющих условию n>N, и всех натураль- ных чисел р. Установим два свойства произвольной фундаментальной последо- вательности. > Свойство 1. Любая фундаментальная последовательность {хя} является ограниченной. Действительно, из определения фундаментальной последовательно- сти вытекает, что для некоторого числа в>0 (например, для числа е = 1) найдется номер N, обеспечивающий для всех р = 1, 2, 3, ... спра- ведливость неравенства Ix^ -xw|<£ и эквивалентных ему неравенств Xw — Е < XN^ < XN + Е. Последние неравенства означают, что все элементы хя с номерами п> удовлетворяющими условию n>N, лежат на интервале (xn-e,xn +е). Поэтому, если мы обозначим через М наибольшее из (*+1) чисел |х(|, |х2|, ..., |хдм|, |хя-б|, |хя+е|, то элементы х„ с о 169
всеми номерами п будут удовлетворять неравенству |хя| < М, что и означает ограниченность последовательности {*„}. Свойство 2. Для любого числа е > 0 каждый элемент хп фун- даментальной последовательности {хя} с достаточно большим номе- ром п содержит в своей Е-окрестности (х„ -е,хя + е) все последующие элементы хя+ь хя+2, хя+з, ... этой последовательности. Действительно, по определению фундаментальной последователь- ности для любого числа е > 0 найдется номер N, обеспечивающий для всех номеров п, удовлетворяющих условию п >N, и всех р = 1, 2, 3, ... справедливость неравенств х„ -Е<хтр<х„ +е, которые и означают, что для любого номера п, удовлетворяющего условию n>N, все элементы хя+], хя+2, хя+з, ... лежат в Е-окрестности элемента хя. Докажем теперь следующую важнейшую теорему. Теорема 16 (критерий Коши сходимости числовой последовате- льности). Для того чтобы последовательность {хя} была сходящейся, необходимо и достаточно, чтобы она была фундаментальной. Доказательство. 1. Необходимость. Пусть последователь- ность {хя} сходится к некоторому пределу х. Докажем, что эта после- довательность является фундаментальной. Фиксируем произвольное положительное число е. Так как последовательность {хя} сходится к g пределу х, то для положительного числа - найдется номер N, обеспе- чивающий справедливость неравенства |х.-х|<| <719> для всех номеров п, удовлетворяющих условию n>N. Если п — любой номер, удовлетворяющий условию п > N, ар — любое натуральное число, то номер п +р и подавно удовлетворяет условию n+p>N. Поэтому для любого номера и, удовлетворяющего условию п > N, и любого натурального числа р тем более будет спра- ведливо неравенство <7-20>. Из неравенств (7.19) и (7.20) и из того, что модуль суммы двух чи- сел не превосходит суммы модулей этих чисел, получим, что 1^ + -х| + |хя-х|<е 170
для всех номеров п, удовлетворяющих условию п > N, и всех натураль- ных чисел р. Необходимость доказана. 2. Достаточность. Пусть {х„} — фундаментальная последователь- ность. Докажем, что она сходится к некоторому пределу х. Так как в силу свойства 1 последовательность {*„} ограничена, то по теореме Больцано-Вейерштрасса (см. теорему 13) из нее можно выделить под- последовательность {х^ }, т = 1, 2, 3, ..., сходящуюся к некоторому пределу х. Докажем, что к этому же пределу х сходится и вся фунда- ментальная последовательность {х„}. Фиксируем произвольное положительное число е. Из сходимости подпоследовательности {хл } к пределу х вытекает, что все элементы х. с достаточно большими номерами кт лежат в ^-окрестности точки х. В то же время в силу свойства 2 фундаментальной последователь- ности номер кт можно фиксировать столь большим, что элемент xk будет содержать в своей е-окрестности (х*_- е,х^ + е) все элементы х„ основной фундаментальной последовательности {х„} с номерами п, 66- льшими кт. Итак, существует достаточно большой номер кт такой, что все эле- менты хп основной фундаментальной последовательности с номерами л, удовлетворяющими условию п > кт, содержатся в е-окрестности эле- мента Xj_, а сам элемент xt_ содержится, в е-окрестности числа х. От- сюда следует, что все элементы х„ основной фундаментальной после- довательности с номерами п, удовлетворяющими условию п>кт, со- держатся в 2е-окрестности числа х. В силу произвольности числа е > О это означает, что вся основная фундаментальная последовательность сходится к пределу х. 1 Достаточность и вся теорема 16 доказаны.
Глава 8 Функция и ее предел Перейдем теперь к изучению более сложной формы операции пре- дельного перехода, основанной на понятии предела функции. Но прежде всего уточним сами понятия переменной величины и функции. § 1. Понятия переменной величины и функции Начнем с уточнения понятия переменной величины. Рассмотрение реальных физических переменных величин приводит нас к выводу, что эти величины не всегда могут принимать произволь- ные значения. Так, скорость материальной точки не может быть боль- ше 3 • 1О10 см/с (т. е. скорости света в вакууме), а температура тела не может быть меньше -273° С. Отвлекаясь от конкретных физических свойств, наблюдаемых в природе переменных величин, мы приходим к понятию матема- тической переменной величины, характеризуемой то- лько численными значениями, которые она может принимать (заме- ним, что понятие переменной величины относится к числу начальных математических понятий). Множество {х} всех значений, которые может принимать данная переменная величина х, называется областью изменения данной переменной величины. Переменная величина считается задан- ной, если задана область ее изменения. В дальнейшем, как правило, мы будем обозначать переменные вели- чины малыми латинскими буквами х, у, t, а области изменения этих переменных величин — соответственно символами {х}, {у}, {/}, ... Перейдем теперь к уточнению понятия функции. Пусть задана переменная величина х, имеющая областью измене- ния некоторое множество {х}. Если каждому значению переменной х из множества {х} ставит- ся в соответствие по известному закону некоторое число у, то гово- рят, что на множестве {х} задана функция у-у(х) или y=f(x). При этом переменная х называется аргументом или н е з а - . висимой переменной, множество {х} называется о б л а - • стью задания функции, а то число у, которое соответствует г данному значению х, называется частным значением фун- j кции в точке х. Совокупность всех частных значений образует вполне определенное множество {у}, которое называют либо о б л а - 172
стью изменения функции, либо м н о ж е с т в о м всех значе- ний функции. В обозначении у =f(x) букву f часто называют характери- стикой функции. Для обозначения аргумента, функции и ее характеристики могут употребляться различные символы. Приведем несколько примеров функций. 1. у = у9-х2. Эта функция задана на сегменте -3<х<3 (при этом выражение под знаком корня является неотрицатель- ным), а множеством всех ее значений явля- ется сегмент 0< у<3 (рис. 8.1). 2. Так называемая функция Ди- рихле определяется следующим образом: y = D(x) = О, если х - иррациональное число, 1, если* - рациональное число. (8-1) Эта функция задана на бесконечной прямой -оо<х<+а>, а множество всех ее значений состоит из двух точек 0 и 1. И 3- 1°--------- +1, еслих>0, (8.2) y=sgnx = < 0, еслих = 0, 0[ х -1, еслих<0. — Ф-1 (Термин «sgn» происходит от латинского слова «signum» — знак). Читается: «у равно Рис. 8.2 сигнум х». Эта функция задана на всей бес- конечной прямой -оо<х<+<ю, а множество всех ее значений состоит из трех точек у = -1,у = 0иу=1 (рис. 8.2). Часто закон, устанавливающий соответствие между множеством всех значений аргумента и множеством всех значений функции, зада- ется посредством формул. Такой способ задания называется анали- тическим. При этом следует подчеркнуть, что функция может задаваться раз- ными формулами на разных участках области своего задания. Напри- мер, -х, прих<0, х2, прих>0 173
задана аналитическим способом на всей бесконечной прямой -оо<х<+<» (рис. 8.3). Весьма распространенным способом задания функции является так называемый табличный способ, заключающийся в задании таблицы отдельных значений аргумента и соответствующих им значе- ний функции. При таком способе задания можно приближенно вычис- лить не содержащиеся в таблице значения функции, отвечающие промежуточным значе- ниям аргумента. Для этого применяется метод интерполяции, заключающийся в замене фун- кции между ее соседними табличными значе- ниями какой-либо функцией простой природы (например, линейной или квадратичной). При- мером табличного способа задания функции может служить расписание движения поезда, Рис. 8.3 которое определяет местоположение поезда в отдельные моменты времени. Интерполяция позволяет приближенно определить местоположение поезда в любой промежуточный момент времени. В практике физических измерений весьма распространенным явля- ется еще один способ задания функции — так называемый графи- ческий способ, при котором соответствие между аргументом и функцией задается посредством графика (снимаемого, например, на осциллографе). § 2. Предел функции по Гейне и по Коши Пусть функция y=f(x) определена на некотором бесконечном мно- жестве {х}, и пусть а — точка бесконечной прямой (-оо, +оо), быть мо- жет, и не принадлежащая множеству {х}, но обладающая тем свойст- вом, что в любой 5-окрестности точки а имеются точки множества {х}, отличные от а (т. е. являющаяся предельной точкой множест- ва {*}). Например, множеством {х} может служить интервал (а, Ь), в этом случае точка а, являясь граничной точкой интервала, ему не принадле- жит, но в любой 8-окрестности точки а содержатся точки указанного интервала. Другим примером множества {х}, на котором задана функция /(х), может служить множество всех рациональных чисел, принадлежащих интервалу {а -5, а+ 5) с выкинутой точкой а. 174
Заметим, кстати, что при любом 8 > 0 интервал (а - 8, а + 8), из ко- торого выкинута точка а, принято называть проколотой 5-окрестностью точки а. Определение 1 (предела функции по Гейне). Число b называется пределом ф у н к ц и и у =f(x} в точкеа (или при х —> я), если для любой последовательности значений аргумента х\, х2, ..., хп, сходящейся к а и состоящей из чисел хп, отличных от а, соответст- вующая последовательность значений функции f(x\\ f(x2), f(xn), ... сходится к числу Ь. Определение 1* (предела функции по Коши). Число b называет- ся пределом функции у =f(х) в точке а (или при х —> а), если для любого положительного числа е найдется отвечаю- щее ему положительное число 8 такое', что для всех значений аргу- мента х, удовлетворяющих условию 0< |х - а|< 8, справедливо неравен- ство |/(x)-Z>|<£. (8.3) Для обозначения предельного значения функции у =f(x) в точке а используют следующую символику: lim f(x)-b или f(x)~*b при х -» а. Прежде чем доказывать эквивалентность определений 1 и 1*, сде- лаем несколько замечаний, разъясняющих смысл этих определений. Замечание 1. Подчеркнем важность фигурирующего в опре- делении 1 требования, обязывающего элементы последовательности значений аргумента хп быть отличными от а, и аналогичного требова- ния в определении 1*, обязывающего брать значения аргумента х, удовлетворяющие условию 0< |х - а|, т. е. отличные от а. Это требова- ние вызвано уже тем, что функция у =f(x) может быть не определена в точке а. Отсутствие этого требования сделало бы невозможным ис- пользование предела функции для определения производной, посколь- ку производная f'(a) функции f(x) в точке а представляет собой пре- дел при х->а следующей функции: х-а Очевидно, что эта функция F(x) не определена в точке а, и это вы- звано существом дела. 'Так как 5 зависит от е, то иногда пишут 5 = 5(е). 175
Замечание 2. Особо подчеркнем, что фигурирующее в опре- делении 1* условие 0<|х-а|<8 эквивалентно соотношениям а - 5 < х < а + 5, х * а, т. е. означает, что х принадлежит проколотой 8-окрестности точки а. Аналогично фигурирующее в определении 1 * неравенство (8.3) эквивалентно неравенствам b-&<f(x)< b + e, т. е. означает, что f(x) принадлежит е-окрестности Ь. Замечание 3. Отметим, что функция f(x) может иметь в точ-' ке а только один предел. В самом деле, для определения предела фун- кции по Гейне это вытекает из единственности предела последователь- ности {f(xn)}, а для определения предела функции по Коши это выте- кает из устанавливаемой ниже эквивалентности этого предела пределу функции по Гейне. Докажем теперь следующую важную теорему. Теорема 1. Определения 1 и 1* предела функции по Гейне и по Коши являются эквивалентными. Доказательство. 1. Пусть сначала число b является преде- лом функции у -f{x) в точке а по Коши. Докажем, что это же число b является пределом функции у =f(x) в точке а и по Гейне. Пусть {х„} — любая сходящаяся к а последовательность значений аргумента, все элементы которой отличны от а. Требуется доказать, что соответству- ющая последовательность значений функции {/(хп)} сходится к Ь. Фиксируем произвольное положительное число е и по нему поло- жительное число 5, которое в силу определения предела функции по Коши гарантирует справедливость неравенства (8.3) для всех значений х, для которых 0<|х-а|<5. В силу сходимости последовательности {х„} к а для указанного по- ложительного числа 5 найдется номер N такой, что при всех п> N справедливо неравенство |х„ - а|< 5. Поскольку х„ Ф а для всех номеров л, то при всех п> N справедливы неравенства 0<|хп -а|<5, и, стало быть, в силу определения предела функции по Коши при всех п > N справедливо неравенство |/(х„)-/>|<£. Это и означает, что последова- тельность {f(xn)} сходится к числу Ь. 2. Пусть теперь число b является пределом функции у =f(x) в точ- ке а по Гейне. Докажем, что это же число b является пределом функ- ции у =f(x) в точке а и по Коши. Предположим, что это не так. Тогда для некоторого положительного числа е и для сколь угодно малого положительного числа 5 найдется хотя бы одно значение аргумента х такое, что 0< |х - а|< 3, но |/(х) - 6| > е. 176
Таким образом, мы может взять последовательность 8„ =— (и = 1, п 2, ...) и утверждать, что для каждого ее элемента 8„ =- найдется хотя п бы одно значение аргумента хп такое, что 0< |х„ - а|< 1 / п, но |/(х„) - Z>| > £. (8;4) Левое из неравенств (8.4) означает, что последовательность {х„} сходится к а и состоит из чисел, отличных от а. Но в таком случае со- гласно определению предела по Гейне соответствующая последовате- льность значений функции {/(хя)} обязана сходиться к числу Ь, а это- му противоречит правое из неравенств (8.4), справедливое для всех номеров п. Полученное противоречие доказывает теорему. Приведем примеры функций, имеющих и не имеющих предела в точке а. 1. Функция /(x) = c = const имеет равный с предел в каждой точке а бесконечной прямой. В самом деле, для любого значения аргумента х разность /(х) - с равна нулю, и поэтому |/(х) - с|< е для любого е > О и для всех значений аргумента (в данном случае для любого £ > 0 в определении предела по Коши можно брать в качестве б любое поло- жительное число). 2. Функция /(х)=х в любой точке'а бесконечной прямой имеет предел, равный а. В самом деле, для этой функции последовательно- сти значений аргумента и соответствующих значений функции тожде- ственны, и поэтому если последовательность {х„} сходится к а, то и последовательность {/"(х„)} также сходится к а. 3. Функция Дирихле D (х), определяемая равенством (8.1), не име- ет предела ни в одной точке а бесконечной прямой. Это вытекает из того, что для сходящейся к а последовательности рациональ- ных значений аргумента предел последовательности соответствую- щих значений функции равен единице, в то время как для сходящейся к а последовательности иррациональных значений аргумента предел последовательности соответствующих значений функции равен нулю. Введем теперь понятие одностороннего (т. е. правого или левого) предела функции в данной точке а. Для этого нам прежде всего следует уточнить характер того множества {х}, на кото- ром задана функция /(х). Потребуем теперь, чтобы это множество {х} Для любого 8 > О имело хотя бы один элемент, принадлежащий интер- валу {а, а + 8) (соответственно интервалу (а-5, а)). 177
Определение 2 (правого (соответственно левого) предела функ- ции по Гейне). Число b называется правым пределом (соот- ветственно левым пределом) функции у =f (х) в точке а, если для любой последовательности значений аргумента {*„}, сходящейся к а и состоящей из чисел, больших а (соответственно меньших а), со- ответствующая последовательность значений {/(хл)} сходится к числу Ь. Определение 2* (правого (соответственно левого) предела фун- кции по Коши). Число Ь называется правым пределом (со- ответственно левым пределом) функции у =f (х) в точке а, если для любого положительного числа £ найдется отвечающее ему положительное число 8 такое, что для всех значений аргумента х, удовлетворяющих условию а<х<а+Ъ (соответственно условию а-5<х<а), справедливо неравенство (8.3). Для обозначения правого (соответственно левого) предела функции f(x) в точке а используют следующую символику: lim f(x) = b (соответственно lim f(x) = b) х-»<нО л->д-0 или более краткую. символику f(a + 0) = b (соответственно f(a - 0) = b). В полной аналогии с теоремой 1 доказывается эквивалентность определений 2 и 2*: следует лишь во всех проведенных при доказате- льстве этой теоремы рассуждениях брать значения аргумента х и эле- менты последовательности {хя} большими числа а (соответственнее ме- ньшими числа а). В качестве примера рассмотрим определяемую равенством (8.2) функцию f (х) =sgnx. Эта функция имеет в точке а = 0 как правый, так и левый пределы, причем sgn(0 + 0) = +l, sgn(0-0) = -l. В самом деле, для любой сходящейся к а = 0 последовательности {хп}, состоящей из чисел, бблыпих нуля, соответствующая последовательность {sgnx„} сходится к +1, а для любой сходящейся к а = 0 последовательности {хя}, состоящей из чисел, меньших нуля, соответствующая последова- тельность {sgnxn} сходится к -1. Из проведенных рассуждений вытекает, что у рассматриваемой функции y = sgnx не существует в точке а = 0 предела. Итак, функция y=sgnx не имеет в точке а = 0 предела, но имеет в этой точке правый предел, равный +1, и левый предел, равный -1. Тот факт, что правый и левый пределы этой функции не равны друг другу, не является случайным, ибо справедливо следующее утвержде- ние: если функция f (х) имеет в точке а как правый, так и левый 178
пределы, и если эти односторонние пределы равны одному и тому же числу Ь, то эта функция имеет в точке а предел, равный Ьх Для доказательства этого утверждения достаточно воспользоваться определениями 1* и 2* и учесть, что если неравенство (8.3) справедли- во для всех значений аргумента х, удовлетворяющих условиям а<х< а +8 и а -8<х< а, то неравенство (8.3) справедливо и для всех значений аргумента х, удовлетворяющих условию 0<|х-а|<8. Сформулируем теперь понятие предела функции при х -»оо. Для введения этого понятия следует потребовать, чтобы мно- жество {х}, на котором задана функция у =f(x), для любого 8 > 0 име- ло хотя бы один элемент, лежащий вне сегмента [-8, +8]. Определение 3 (предела функции при х->оо по Гейне). Число b называется пределом функции y=f(x) п р и х->оо, если для любой бесконечно большой последовательности значений аргумента {хл} соответствующая последовательность значений функции {^(х^)} сходится к числу Ь. ч Определение 3* (предела функции при х -> оо по Коши). Число Ь называется пределом функции y=f(x) пр и x—tco, если для любого положительного числа г найдется отвечающее ему положи- тельное число 8 такое, что для всех значений аргумента х, удовлет- воряющих условию |х|> 8, справедливо неравенство (8.3). Для обозначения предела функции у =/(х) при х-»оо используют следующий символ lim/(x) = Z>. х-но В полной аналогии с теоремой 1 доказывается эквивалентность определений 3 и 3*. Следует лишь в рассуждениях, использованных при доказательстве этой теоремы, всюду заменить сходящуюся после- довательность значений аргумента {х„} бесконечно большой последо- вательностью значений аргумента {хя}, а неравенство 0< |х - а|< 5 заме- нить неравенством |х|>5. Примером функции, имеющей предел при х -> оо, может служить функция f(x) = - (х * 0). В самом деле, для любой бесконечно боль- X шой последовательности значений аргумента {х„} соответствующая по- следовательность значений функции /(хп) = — (в силу теоремы 4 гл. 7) _ Хп 1 Очевидно, справедливо и обратное утверждение: если функция f (х) имеет в точке а равный b предел, то как правый, так и левый пределы/(х) в точке а существуют, и оба равны Ь. 179
является бесконечно малой, т. е. имеет своим пределом число b = 0. В силу определения 3 lim- = 0. Сформулируем, наконец, понятие предела функции при стремлениихк бесконечности определенного знака. Для введения такого понятия потребуем, чтобы функция y=f(x} была задана на таком множестве {х}, которое для любого 8 > 0 имеет хотя бы один элемент, лежащий правее 8 (соответственно ле- вее -8). Определение 4 (предела функции при х->4-со (соответственно при х -> -оо) по Гейне). Число b называется пределом ф у н к - ц и и y-f(x} п р и х —> +оо (соответственно при х —> -оо), если для лю- бой бесконечно большой последовательности значений аргумента {хл}, все элементы которой положительны (соответственно отрицатель- ны}, соответствующая последовательность значений функции {/(хл)} сходится к числу Ь. Определение 4* (предела функции при х -> 4-оо (соответственно при х -> -оо) по Коши). Число b называется пределом ф у н к- ции у~ f(x} пр и х —> 4-оо (соответственно при х —> -оо), если для лю- бого положительного числа е найдется отвечающее ему положительное число 8 такое, что для всех значений аргумента х, удовлетворяющих условию х>8 (соответственно х<-8), справедливо неравенство (8.3). Для обозначения введенных понятий используется следующая сим- волика: lim f(x} = b (соответственно lim f (х) = b}. Х-ЖО X—>— Эквивалентность определений 4 и 4* доказывается по схеме доказа- тельства теоремы 1; следует только во всех рассуждениях заменить сходящуюся последовательность значений аргумента {х„} на бесконечно большую последовательность значений аргумента {хп}, состоящую из положительных (соответственно из отрицательных) чисел, а неравенство 0<|х-а|<5 заменить неравенством х>5 (соответственно х<-8). Замечание 4. Отметим, что изученное нами в гл. 7 понятие предела числовой последовательности {х„} можно рассматривать как частный случай предела функции при х->+а>. В самом деле, если' взять в качестве множества {х} множество всех натуральных чисел 1,2, ..., и, ..., а в качестве функции /(х), заданной на этом множестве, ' ту функцию, которая каждому значению аргумента п ставит в соответ- ствие и-й член последовательности х„, то определение 4* предела та- . 180
кой функции при х -> -ко в точности совпадет с определением предела числовой последовательности {*„}. § 3. Критерий Коши существования предела функции Ради определенности рассмотрим подробно случай предела функ- ции y=f{x) в точке а, введенного определениями 1 и 1*. Определение. .5уде7И говорит ь, что функция у =f(x) удовлет- воряет в точке а условию Коши, если для любого поло- жительного числа е найдется отвечающее ему положительное число 5 такое, что для любых двух значений аргумента х' и х", удовлетворя- ющих условиям 0< |х'-а|< 5, 0< |х"-а|< 5, (8.5) справедливо неравенство |/(х')-/(х")|<8. (8.6) Теорема 2 (критерий Коши существования предела функции в точке а). Для того чтобы функция у =f (х) имела в точке а конечный предел, необходимо и достаточно, чтобы функция у =f (г) удовлетво- ряла в точке а условию Коши. Доказательство. 1. Необходимость. Пусть существует конечный предел lim f (х) = b. Фиксируем произвольное положительное число в. В силу х->а определения 1* предела функции по Коши для положительного числа е/2 найдется положительное число 5 такое, что, каковы бы ни были два значения аргумента х' и х", удовлетворяющие условиям 0< |х'-а|< 5, 0<|х"-а|< 5, для соответствующих значений функции спра- ведливы неравенства |/(х-) - й|< е / 2, |/(х") - 4< е / 2. (8.7) Так как модуль суммы двух величин не превосходит суммы их мо- дулей, то в силу неравенств (8.7) получим |/0О-Ж)| =|[/(х*) - 6] + [6-Ж)]< |/(х') - Й|+|Ж) - й|< 8, а это и означает, что функция y=f(x) удовлетворяет в точке а усло- вию Коши. 2. Достаточность. Пусть функция f(x) удовлетворяет в точ- ке а условию Коши. Требуется доказать, что функция f(x) имеет в точке а предел. Пусть {х„} — произвольная последовательность значений ар- гумента, сходящаяся к а и состоящая из чисел, отличных от а. В силу определения 1 предела по Гейне достаточно доказать, что соответствую- 181
щая последовательность значений функции {f(x„)} сходится к некото- рому числу Ь, и что это число b одно и то же для всех сходящихся к а последовательностей {х„}, состоящих из чисел, отличных от а. Докажем сначала, что для каждой сходящейся к а последователь- ности {х„} значений аргумента, отличных от а, соответствующая по- следовательность значений функции {/(хя)} сходится к некоторому пределу. Фиксируем произвольное положительное число £ и по нему отвечающее ему, согласно условию Коши, положительное число 5. В силу сходимости последовательности {хя} к а и в силу условия х„*а •для этого 5>0 найдется номер N такой-, что 0<|хя-а|<5 при всех n>N. Если теперь р — любое натуральное число (р = 1, 2, 3, ...), то тем более 0< [х^ - а|< 5 при всех n>N (ибо если п > N, то и подавно п + р > N). Таким образом, при всех п > N и для любого натурального р спра- ведливы два неравенства: 0<|хяф -а|<5» 0<K-fll<8- Из этих двух неравенств и из условия Коши вытекает, что при всех п > N и для любого натурального р а это означает фундаментальность последовательности {/"(хя)}. В силу критерия Коши сходимости числовой последовательности (см. теорему . 16 гл. 7) последовательность {f (хя)} сходится к некоторому числу Ь. Остается доказать, что для любых двух сходящихся к а последова- J тельностей значений аргумента {хя} и {х'}, все элементы которых от- ? личны от а, соответствующие последовательности значений функции {f (х„)} и {f (хя)} сходятся к одному и тому же пределу. Предположим, | что последовательности {/"(хя)} и {/"(х')} сходятся к пределам Ь и b’ j соответственно. Рассмотрим новую последовательность значений аргу- у мента xi, х{, хг, х2, х3, х'}, ..., х„, хя, ..., также сходящуюся к а и состоя- е щую из чисел, отличных от а. В силу доказанного выше соответствую- • щая последовательность значений функции/(xi), f(x{),f(xj), f(x2), ..., < f(x^, f (хя), ... обязана сходиться к некоторому пределу Ь". Но тогда в, силу теоремы 11 из § 3 гл. 7 и любая подпоследовательность этой по- следовательности обязана сходиться к тому же самому пределу Ь". ? Стало быть, как подпоследовательность нечетных элементов /(xi), -g /(х2), ...» /(х„), ..., так и подпоследовательность четных элементов 182
/(хг)’ —» ЖХ — °бе сходятся к Ь". Отсюда вытекает, что b — b' = b". Теорема полностью доказана. | Аналогично формулируется условие Коши и доказывается крите- рий Коши и для случаев правого (соответственно левого) предела в точке а, предела при х -» оо и предела при х -> -ко (соответственно при При формулировке условия Коши достаточно в приведенном выше определении заменить условия (8.5) для случая правого (соответствен- но левого) предела в точке а условиями а<х’< а +5, а<х"< а +5 (соответственно а-8<х'< а, а-5<х"<а), для случая предела при х->оо — условиями |х'|>8, |х"[>8 и, наконец, для случая предела при х->+оо (соответственно при х->-оо) — условиями х' > 8, х" > 8 (соответственно х' < -8, х" < -8). Соответствующие критерии Коши доказываются по схеме доказа- тельства теоремы 2; следует только во всех рассуждениях понимать под последовательностями значений аргумента {х'} и {х"} в случае правого (соответственно левого) предела в точке а последовательно- сти, сходящиеся к а и состоящие из чисел, бблыпих а (соответственно меньших а), в случае предела при х -> оо — бесконечно большие по- следовательности и, наконец, в случае предела при х -> -ко (соответст- венно при х -> -оо) — бесконечно большие последовательности, состо- ящие из положительных (соответственно из отрицательных) чисел. § 4. Арифметические операции над функциями, имеющими предел Теорема 3. Пусть две функции /(х) и g(x) заданы на одном и том же множестве {х} и имеют в точке а пределы, соответственно рав- ные b и с. Тогда функции f (х) + g(x), /(х) - g(x), f (х) • g(x) и —— име- g(x) ют в точке а пределы, соответственно равные Ь + с, b-с, Ь- с и — с (в случае частного нужно дополнительно требовать, чтобы с было отлично от нуля). Доказательство. Пусть {х„} — произвольная сходящаяся к а последовательность значений аргумента, все элементы которой от- Личны от а. В силу определеления 1 предела по Гейне соответствую- 183
щие последовательности значений функций {/"(хя)} и {g(x„)} сходятся к пределам b и с соответственно. Но тогда в силу теоремы 7 гл. 7 по- следовательности {/(x„)+g(x„)}, {f(xn)-g(xn)}, {f(x„)g(x„)} и /{хЛ , . , , b _ < сходятся к пределам b + c, b-c, b-си — соответственно. Это .gfo) J с последнее в силу произвольности последовательности значений аргу- мента {х„}, сходящейся к а, и в силу определения 1 предела по Гейне означает, что функции f (х) + g(x), f (х) - g(x), f (х) • g(x) и J имеют в g(x) точке а пределы, соответственно равные b + с, b - с, b • с и —. Теорема с доказана. Доказательство соответствующей теоремы для случаев правого (со- ответственно левого) предела в точке а, предела при х -> оо и предела при х -» -ко (соответственно при х -» -оо) проводится по той же схеме. Все отличие состоит в том, что в качестве последовательности значе- ний аргумента {х„} следует взять в случае правого (соответственно ле- вого) предела в точке а последовательность, сходящуюся к а и состоя- щую из чисел, больших а (соответственно меньших а), в случае преде- ла при х -> оо — бесконечно большую последовательность и, наконец, в случае предела при х -> -ко (соответственно при х —> -оо) — беско- нечно большую последовательность, состоящую из положительных (соответственно из отрицательных) чисел. Рассмотрим примеры применения теоремы 3. В § 2 мы убедились в том, что для любой точки а бесконечной прямой limx = а. Используя - *-»а теорему 3, мы можем утверждать, что limx2 =limx limx = а • а = а2, х~>а х-*а и, вообще, для любого номера и limx" =а". х->а Пусть теперь Pn(x) = b0+Ьхх + Ь2х2+... + Ьпх", где Ьо, Ь\, Ьп.\, Ьп*0 — некоторые постоянные числа. Такая функция Рп (х) называет- ся многочленом степени п. В силу той же теоремы 3 limP„(x) = lim[Z>0 +Z>1x + ... + Z>„x"] = Z>0 +b{a +... + b„an =P„(a) x-M x*+a ддя любой точки а бесконечной прямой. Итак, многочлен Рп (х) имеет предел в любой точке а бесконечной прямой, и этот предел равен частному значению Рп (а) этого много- члена в точке а. Пусть, Наконец, Рп (х) й Qm (х) “ два Произвольных многочлена 184
Р (х) степеней пит соответственно. Частное J?(x) = --л -- принято назы- Qm(x) вать рациональной дробью. В силу теоремы 3 для случая частного lim R(x) = = ^^- = R(a) ™Qa(x) lim0 (x) Qm(a) x->a в любой точке а, не являющейся корнем многочлена Qm (х). Таким об- разом, рациональная дробь имеет предел в каждой точке а бесконеч- ной прямой, не являющейся корнем ее знаменателя, и этот предел ра- вен частному значению этой дроби в указанной точке а. § 5. Бесконечно малые и бесконечно большие функции Ради определенности будем рассматривать предел функции в точке а. Функция а (х) называется бесконечно м ал о й в точке а, если предел этой функции в точке а существует и равен нулю. Примером бесконечно малой в точке а функции может служить функция а (х) = (х - а)", где п — любое целое положительное число. В самом деле, в конце предыдущего параграфа мы установили, что многочлен (х - а)п имеет предел в каждой точке а, причем этот предел равен частному значению этого многочлена в точке х = а, т. е. равен нулю. Заметим, что если функция /(х) имеет предел в точке а, равный числу Ь, то функция a(x) =f(x)-b является бесконечно малой в точ- ке а. Это вытекает из того, что пределы каждой из функций /(х) и g(x) = Ь в точке а равны числу Ь, и из теоремы 3 для случая разности lim[/(x)-g(x)] = 0. ° Сформулированное утверждение приводит нас к следующему специальному представлению для функции/(х), име- ющей равный b предел в точке а: /(x) = Z> + a(x), (8.8) где а(х) — некоторая бесконечно малая в точке а функция. Представление (8.8) весьма удобно в различных приложениях тео- рии пределов. Введем теперь понятие бесконечно большой в данной точке а справа (соответственно слева) функции. Функция А(х) называется бесконечно большой в точке а справа (соответственно слева) функцией, если для любой сходящейся к а последовательности {х„} значений аргумента, все элементы которой 185
больше а (соответственно меньше а), соответствующая последователь- ность значений функции {А(хп)} является бесконечно большой после- довательностью, все элементы которой начиная с некоторого номера либо положительны, либо отрицательны. , Для бесконечно больших в точке а справа (соответственно слева) функций используется следующая символика: lim А(х) = +<х> (соответственно lim Л(х) = +оо) ИЛИ х->а+О х->а-0 lim А(х) = -оо (соответственно lim А(х) = -оо). х-инО х->а-0 Иногда употребляют более лаконичную символику: А(а + 0) = +оо (соответственно J(a - 0) = +оо) А (а + 0) = -оо (соответственно А (а - 0) = -оо). Остановимся на методике сравнения двух бесконечно малых в дан- ной точке а функций. Пусть а (х) и Р(х) — две функции, заданные для одних и тех же значений аргумента и обе являющиеся бесконечно ма- лыми в точке а. 1. Говорят, что а(х) является в точке а бесконечно малой более высокого порядка, чем Р(х) (имеет в точке аболее вы- сокий порядок малости, чем Р(х)), если ИтНИ=0. <8” **а Р(х) 2. Говорят, что а(х) и Р(х) являются в точке а бесконечно малыми одного порядка (имеют в точке а одинаковый поря- док малости), если предел, стоящий в левой части (8.9), равен конечному числу, отличному от нуля. 3. Говорят, что а(х) и Р(х) являются в точке аэквивалент- ными бесконечно малыми, если предел, стоящий в левой части (8.9), равен единице. Для обозначения того, что а (х) является в данной точке бесконеч- но малой более высокого порядка, чем Р(х), используют следующую запись: а=о(Р) (читается: «а равно о малому от р»). Итак, символ о(Р) обозначает любую бесконечно малую в данной точке а функцию, имеющую в этой точке более высокий порядок ма- лости, чем бесконечно малая в той же точке функция Р(х). Из этого определения символа «о малое» вытекают следующие его свойства:, 1) о(Р) + о(р) = о(р), о(Р) - о(Р) = о(Р); 2) если у = о(Р), то о(Р) ± о(у) = о(Р); 186
3) если аир — любые-две бесконечно малые в данной точке а функции, то а-р = о(а) и а«р = о(Р). Аналогично сравниваются две бесконечно большие в данной точке а справа (или слева) функции. Пусть А(х) и В(х) определены для одних и тех же значений аргу- мента и для определенности lim Л(х) = 4-оо, lim В (х) = +оо. х->ачС х->а+0 1. Говорят, что А(х) имеет в точке а справа более высокий порядок роста, чем В(х), если функция является бесконеч- но большой в точке а справа. 2. Говорят, что А(х) и В(х) имеют в точке а справа одинако- вый порядок роста, если предел функции ——- при х-»а4-0 В(х) равен конечному числу, отличному от нуля. Приведем примеры сравнения бесконечно малых и бесконечно бо- льших функций. 1. Функции а(х)=х4 -х6 и Р(х) = 7х4 4-х5 являются в точке х = 0 бесконечно малыми одного порядка, ибо ,.. а(х) .. х4 -х6 .. 1-х2 1 пт — - = пт — - = пт-------= —. Р(х) *-»° 7х4 4-х5 х->0 7 4-х 7 2. Функции а (х) = (х - З)4 (х - 2) и Р(х) = (х - З)4 являются в точке х = 3 эквивалентными бесконечно малыми, ибо lim х-»3 ₽(*) = lim х—>3 (х-3)4(х-2) (х-3)4 = lim(x -2) = 1. х->3 9 + х 1ч 3. Функции А(х) =--и В(х) = — являются бесконечно болыпи- 2х 2х ми одинакового порядка роста в точке х = 0 как справа, так и слева, ибо V i lim —— = lim(9 4- х) = 9. В(х) Аналогично определяются и сравниваются функции, бесконечно малые или бесконечно большие при х -> оо, а также при х -> 4-оо (соот- ветственно при х->-оо). 187
Глава 9 Непрерывность функции В этой главе всесторонне изучается одно из важнейших понятий математического анализа — понятие непрерывности функции. § 1. Основные определения Пусть точка а принадлежит области задания функции /(х) и любая 8-окрестность точки а содержит отличные от а точки области задания этой функции. Формальное определение непрерывности функции в точке а. Функцияf(х) называется непрерывной в точке а, если эта функция имеет в точке а предел и этот предел равен ее частному значению f(a) в этой точке. 4 Привлечем сформулированные в § 2 гл. 8 определения 1 и 1* пре- дела функции в точке а по Гейне и по Коши и учтем, что теперь функ- ция определена и в самой точке а и имеет в этой точке значение f (а), равное ее пределу. Поэтому в определении 1 предела по Гейне теперь нет необходимости исключать из последовательности {хя} значения аргумента хП9 равные а, а в определении 1* предела по Коши нет необ- ходимости исключать значения аргумента х, равные а. Тем самым мы приходим к следующим определениям. Определение 1 (непрерывности в точке а по Гейне). Функция /(х) называется непрерывной в точке а, если для любой сходящейся к пределу а последовательности {хя} значений ее аргумен- та соответствующая последовательность значений функции {/*(хя)} сходится к пределу f(a). Определение 1* (непрерывности в точке а по Коши). Функция /(х) называется н е пр ер ы в н о й в точке а, если для любого положительного числа е найдется отвечающее ему положительное число 8, обеспечивающее справедливость неравенства lf(x)-/(a)|<£ для всех значений аргумента х, удовлетворяющих условию |х - а\ < 8. В силу теоремы 1 из § 2 гл. 8 определения непрерывности в точке а по Гейне и по Коши эквивалентны. Символически условие непрерывности функции /(х) в точке а вы- ражается равенством lim/(х) = f (а), которое с учетом того, что limx = a, может быть переписано в виде lim/(x)=/(limx), 188
показывающем, что для непрерывной в точке а функции символ пре- дела lim и символ характеристики функции f можно менять местами. Перейдем к определению односторонней непрерывности функции/(х) в точке а (т. е. непрерывности в точке а или только спра- ва, или только слева). При этом мы должны потребовать, чтобы область задания функции f(x) содержала точку а и для любого 8 > 0 имела хотя бы один эле- мент, лежащий на интервале (а, а+ 8) (соответственно на интервале (а -8, а)). Формальное определение непрерывности функции в точке а справа (соответственно слева). Функция f(x) называется непре- рывной в точке а справа (соответственно слева), если эта функция имеет в точке а правый (соответственно левый) предел и этот предел равен ее частному значению f (а) в этой точке. Привлекая сформулированные в § 2 гл. 8 определения 2 и 2* пра- вого и левого пределов функции в точке а по Гейне и по Коши, мы придем к следующим определениям. Определение 2 (непрерывности в точке а справа (соответствен- но слева) по Гейне). Функцияf(x) называется непрерывной в точке а справа (соответственно слева), если для любой сходящейся к пределу а последовательности {хй} значений ее аргумента, удовлетворяющих условию хп> а (соответственно условию хп < а), соответствующая последовательность значений фун- кции {f(xn)} сходится к пределу f(a). Определение 2* (непрерывности в точке а справа (соответст- венно слева) по Коши). Функция f(х) называется непрерыв- ной в точке а справа (соответственно слева), если для любого положительного числа £ найдется отвечающее ему положительное число 8, обеспечивающее справедливость неравенства \f(x)-f (а)| < £ для всех значений аргумента х, удовлетворяющих усло- вию а <х< а + 8 (соответственно условию а-5<х<а). Эквивалентность определений 2 и 2* вытекает из эквивалентности определений правого (соответственно левого) предела функции в точ- ке а по Гейне и по Коши. Тот факт, что функция f(x) непрерывна в точке а справа (соответ- ственно слева), символически записывают так: lim f(x) =f (а) или бо- лее кратко /(а + 0)=/(а) (соответственно lim f(x)=f(a) или более кратко /.(а - 0) = /(а)). м<"° 189
Определение 3. Точки, в которых функция f(x) не обладает свой- ством непрерывности, называются точками разрыва этой функции. Классификация точек разрыва функции будет дана в § 8 этой главы. Определение 4. Функция/(х) называется непрерывной на множестве {х}, если она непрерывна в каждой точке этого множества1. Особо выделим понятие непрерывности функции на сегменте. Определение 5. Функцияf(x) называется непрерывной на сегменте[а,Ь], если она непрерывна в каждой внутренней точке этого сегмента и, кроме того, непрерывна справа в точке а и непре- рывна слева в точке Ь. Утверждение. Функция/(х), непрерывная в точке а и спра- ва, и слева, является непрерывной в этой точке. Это утверждение вытекает из доказанного в § 2 гл. 8 утверждения о том, что если функция имеет в данной точке а равные одному и тому же ч и с л у b правый и левый пределы, то она имеет в этой точке предел, равный этому же числу Ь. Примеры. 1°. Функция /(х) = х^, где п — любое натуральное число, непрерыв- на в любой точке а бесконечной прямой, ибо в § 4 гл. 8 установлено, что эта функция имеет предел в каждой точке а, равный ее частному значению f(a) = an в этой точке. р (х) 2°. Рациональная дробь 7?(х) = - , в которой Рп(х) и Qm(x) — произвольные многочлены степеней п и т соответственно, непрерывна в любой точке а бесконечной прямой, не являющейся корнем многочле- на Qm(x), ибо в § 4 гл. 8 установлено, что в каждой такой точке эта ра- циональная дробь имеет предел, равный ее частному значению в этой точке. § 2. Локальные свойства непрерывных функций Прежде всего введем понятия ограниченности сверху, снизу или с' обеих сторон функции /(х) на произвольном множестве {х}. Фактиче- ски эти понятия эквивалентны ограниченности сверху, снизу или с обеих сторон множества всех значений /(х) этой функции, отвечающих значениям аргумента х, принадлежащим множеству {х}. 1 Под множеством {х} можно понимать интервал, полупрямую или всю бесконечную прямую. 190
Определение 1. Функция f(x) называется ограниченной сверху (соответственно снизу) на множестве {х}, если существует вещественное число М (соответственно т), обеспе- чивающее справедливость неравенства f(x)<M (соответственно f(x)>m) для всех значений аргумента х из множества {х}. Определение 2. Функцияf(х) называется ограниченной с обеих сторон или просто ограниченной на множестве {х}, если она ограничена на этом множестве и сверху, и снизу, т. е. если найдутся вещественные числа М и т, обеспечивающие справедли- вость неравенств m<f(x)<M для всех значений аргумента х из мно- жества {х}. В определениях 1 и 2 число т называется нижней гранью, а число М— в ерхней гранью функции f(x) на множестве {х}. Далее заметим, что так как неравенство |f(x) -/(а)| < £ эквивалент- но неравенствам f(a)-t<f(x)<f(a)+t, (9.1) а неравенство |х - а| < 8 эквивалентно неравенствам а-5<х<а+5, (9.2) то сформулированное в § 1 определение 1* непрерывности функции /(х) в точке а по Коши можно переформулировать следующим обра- зом: функция f(x) называется непрерывной в точке а, если для любого положительного числа £ найдется отвечающее ему поло- жительное число 8, обеспечивающее справедливость неравенств (9.1) для всех значений аргумента х, удовлетворяющих неравенствам (9.2). Непосредственно из сформулированного определения вытекает следующее утверждение. Теорема 1 (о локальной ограниченности функции, непрерыв- ной в данной точке). Если функция f(x) определена в некоторой окре- стности точки а и непрерывна в точке а, то найдется такое поло- жительное число 8, что эта функция ограничена в Ъ-окрестности (9.2) точки а. Доказательство. Фиксировав некоторое число £>0, мы получим из условия непрерывности функции f(x) в точке а, что для всех х из 8-окрестности (9.2) точки а значения функции f (х) удовлет- воряют неравенствам (9.1), т. е. для всех х из 8-окрестности (9.2) точки л в качестве верхней грани функции /(х) можно взять число М = f (а) + £, а в качестве нижней грани — число т = f(a) - £. Теорема Доказана. 191
Замечание 1. Утверждение теоремы 1 об ограниченности функции f(x) в 5-окрестности (9.2) точки а остается справедливым и в случае, если требование непрерывности функции /(х) в точке а заме- нить требованием существования у функции /(х) в точке а конечного предела b (при этом предполагается, что функция /(х) либо не задана в самой точке а, либо имеет в ней конечное значение / Иллюстрацией к теореме 1 слу- /\ [ in / жит рис-9 L / \ !|\ / Теорема 2 (об устойчивости зна- / •<\JJ \_х ка непрерывной в данной точке I_______А"""?’ А________функции). Если функция f (х) опреде- I а-8 а а+д лена в некоторой окрестности точ- I ки а, непрерывна в точке а и ее зна- I чение f{a) в этой точке положите- ' льно {соответственно отрицатель- ч Рис. 9.1 но), то найдется такое положите- льное число 5, что функция f{x) по- ложительна {соответственно отрицательна) всюду в Ъ-окрестности (9.2) точки а. ' Доказательство. Достаточно заметить, что |f(a)| > 0 и, взяв |/(а)| в определении непрерывности число 8 равным учесть, что для 2 всех х из 5-окрестности (9.2) точки а, выбранной по этому е, будут справедливы неравенства (ч |/(а)|) ч |/(а)П и что числа f(a) - ' и f(a) + имеют тот же знак, что и I 2 J \ 2 ) число /(а). Иллюстрацией к теореме 2 является рис. 9.2. Теорема, аналогичная теореме 2, спра- ведлива и для функции, которая является непрерывной в точке а т о л ь к о спра- в а или только слева. Договоримся при любом 5>0 называть Рис. 9.2 полусегмент [а, а + 5) п р а в о й 5-п о л у - окрестностью точки а, а полусегмент (а-8, а] левой 5-полуокрестностью точки а. 192
Теорема 3. Если функция f (х) определена в какой-либо правой (со- ответственно левой) полуокрестности точки а, непрерывна в точке а справа (соответственно слева) и ее значение f(a) в этой точке от- лично от нуля, то найдется такое положительное число 8, что функ- ция f(x) всюду в правой (соответственно в левой) 5-полуокрестности точки а имеет тот* же знак, что и в точке а. Доказательство этой теоремы дословно повторяет доказательство теоремы 2 с заменой термина «8-окрестность точки а» термином «пра- вая (соответственно левая) 8-полуокрестность точки а». Докажем теперь^ следующее часто используемое утверждение. Теорема 4 (об арифметических операциях над непрерывными в данной точке функциями). Если две функции f (х) и g(x) определены в некоторой окрестности точки а и обе непрерывны в точке а, то каждая из функций [/(х)+g(x)l [f (X)-g(x)l [/(х)g(x)] и (9-3) g(x) / /(X) A непрерывна в точке а (в случае частного ------ нужно дополнительно ' (\ предполагать, что g(a) 0). Доказательство. Так как непрерывные в точке а функции Дх) и g(x) имеют в точке а пределы, соответственно равные /(а) и g(a), то в силу теоремы 3 из § 4 гл. 8 функции (9.3) имеют в этой точ- ке пределы, соответственно равные [f (а) + g(a)J [/(a)-g(a)l [/(a)-g(a)] и Так как указанные пределы равны частным значе- g(«) ниям функций (9.3) в точке а, то теорема доказана. Замечание 2. Поскольку теоремы 1—4 относятся к свойствам функций, непрерывных только в одной точке а и заданных только в малой окрестности этой точки, то эти теоремы называют локаль- ными свойствами непрерывных функций. § 3. Прохождение функции, непрерывной на сегменте, через любое промежуточное значение Доказываемые в этом параграфе две теоремы относятся уже не к локальным, а к глобальным свойствам функций, непре- рывных на некотором сегменте. Еще три теоремы, относящиеся к глобальным свойствам непрерывных на сегменте функций, будут уста- новлены в § 9 настоящей главы. 193
Теорема 5 (о прохождении непрерывной на сегменте функции через нуль при разных знаках ее значений на концах сегмента). Если функция f(x) непрерывна на сегменте [a, Z>] и ее значения на кон- цах этого сегмента f(a) и f(b) являются числами разных знаков, то внутри сегмента [a, Z>] найдется такая точка с, значение функции в которой равно нулю. Доказательство1. Не ограничивая общности, можно счи- тать, что f (а) < 0, f(b) > 0. Обозначим через {х} множество всех значе- ний х из сегмента [а, Ь], для которых f(x) < 0. Это множество не явля- ется пустым (ему, например, принадлежит точка х = а) и ограничено сверху (например, числом Ь). В силу теоремы 1 из гл. 1 у множества {х} существует точная верхняя грань, которую мы обозначим через с. Заметим, что с является внутренней точкой сегмента [а, 6], ибо из условий f(a) < 0, f(b) > 0, из непрерывности функции /(х) в точке а справа, и в точке Ь слева и из теоремы 3 вытекает, что сущест- вует правая 5-полуокрестность точки а, в пределах которой /(х) < 0, и левая 5-полуокрестность точки Ь, в пределах которой /(х)>0. Докажем, что f (с) = 0. Действительно, если бы f (с) не равнялось нулю, то по теореме 2 нашлась бы 5-окрестность (с-5<х<с + 5) точ- ки с, в пределах которой функция /(х) имела бы определенный знак, что невозможно, поскольку по определению точной верхней грани найдется хотя бы одно значение х из полусегмента с - 5 < х < с, для ко- торого /(х)<0, а для любого значения х из интервала с<х<с + 5 справедливо неравенство /(х)>0. Теорема доказана. Теорема 6 (прохождение функции, непрерывной на сегменте, через любое промежуточное значение). Пусть функция f(x) непре- рывна на сегменте [a, £>], причем f(a) = a, f(b) = 0. Тогда для любого числа у, заключенного между а.и$,на сегменте [а, 6] найдется точка с такая, что f (с) = у. Доказательство. В доказательстве нуждается лишь случай • а * р (ибо при а = 0 справедливо равенство у = а = 0 и в качестве с можно взять точку а или точку Ь). Не требует доказательства и случай, когда у совпадает с одним из чисел а или 0 (ибо при этом в качестве с также можно взять либо а, либо Ь). 'Выдающийся физик академик Л.Д. Ландау говорил одному из авторов? настоящей книги, что на физическом уровне строгости теорему 5 можно обосновать так: поскольку графиком непрерывной функции является нигде не рвущийся шнур>- лежащий на плоскости Оду, то из условия, что один конец этого шнура находится ниже?, оси Ох, а другой его конец — выше оси Ох, вытекает, что этот шнур обязательно? пересечет ось Ох в некоторой точке. Конечно, приведенное рассуждение являете*? хорошей иллюстрацией, но оно не отвечает требованиям математической строгости. 194
Не ограничивая общности, бу- ................... дем считать, что а < 0, и пусть у — I любое число, удовлетворяющее не- ! равенствам а<у<0. Рассмотрим Y i функцию <р(х)=/(х)-у. Эта функ- / ! ! ция непрерывна на сегменте [а, 6] / ! ! (как разность двух непрерывных фун- / ! ! кдий) и принимает на концах этого « —f ! ! сегмента значения разных знаков________i_____!_________! <р(а) = /(а) - у = а - у < О, ° с b * <р(д) = /(6)-у =0-у>О. Рис. 9.3 По теореме 5 внутри сегмента [а, />] найдется точка с такая, что ср(с) =/(с) - у = О, т. е. f (с) = у. Тео- рема доказана. Иллюстрацией к теореме 6 является рис. 9.3. § 4. Свойства монотонных функций 4.1. Понятия монотонной и строго монотонной функций Определение 1. Функция/(х) называется неубывающей (со- ответственно невозрастающей) на множестве {х}, если для любых двух точек xi и х2 из этого множества, связанных условием xi < Хг, справедливо неравенство f (xi) f (хг) (соответственно f(xt)>f(x2)). Неубывающие и невозрастающие на данном множестве {*} чфунк- ции называются нестрого монотонными или просто мо- нотонными на этом множестве. Определение 2. Функция /(х) называется возрастающей (соответственно убывающей) на множестве {*}, если для любых двух точек Х\ и х2 из этого множества, связанных условием < %2> справедливо неравенство f(xi)<f(x2) (соответственно f(x\)>f(xij)- Возрастающие и убывающие на данном множестве {*} функции называются строго монотонными на этом множестве. Легко проверить, что 1) функция /(х)=х3 является возрастающей (т. е. строго монотонной) на всей бесконечной прямой -оо<х<+оо; 2) функция f(x) = хп, где п — любое натуральное число, является воз- растающей (т. е. строго монотонной) на полупрямой х > 0; 3) функция1 /(*) = sgnx является неубывающей на всей бесконечной прямой “^°<х<+оо. 1 Напомним, что введенная в § 1 гл. 8 функция sgn х равна -1 при* < 0, равна нулю при х = О и равна +1 при х > 0. 195
4.2. Понятие обратной функции Пусть функция у =f(x) определена на сегменте а<х<Ь, а Множе- ством ее значений является сегмент [а, р]. Пусть, кроме того, каждому у из сегмента [а, Р] отвечает только одно значение х из сегмента [а, 6], для которого f(x) -у. Тогда на сегменте [а, Р] определена функ- ция, которая каждому у из сегмента [а, Р] ставит в соответствие то значение х из сегмента [а, 6], для которого f(x) =у. Эта функция обо- значается символом x=f~x(y) и называется обратной для функции у~/\х). Так, для рассматриваемой на сегменте 0 < х < 2 функции у = х2 множеством ее значений является сегмент 0 <у < 4 и на этом сегменте определена обратная к ней функция x = jy. В проведенных выше рассуждениях вместо сегментов [а, 6] и [а, Р] можно было бы рассматривать интервалы (а, Ь) и (а, Р) или случай, | когда один или оба эти интервала превращаются в открытую полупря- | мую или всю бесконечную прямую. | Отметим, наконец, что если х ~f~x(y) — обратная для у =f (х) фун- | кция, то, очевидно, функция y-f(x) является обратной для функции i х=/“|(у). Поэтому функции у =f(x) и х =f~x(y) называются в з а и м - । но обратными. ' 4.3. Условие существования обратной функции для строго t монотонной функции Теорема 7. Пусть функция у =f(x) возрастает (соответственно убывает) на сегменте [а, Ь] и пусть a =f(a), Р =f(b). Тогда, если множеством всех значений функции у =f (х) является сегмент [а, Р] (соответственно сегмент [Р, а]), то на этом сегменте, определена обратная для y=f(x) функция x=f~x(y), которая также возрастает (соответственно убывает) на указанном сегменте. Доказательство. Ограничимся проведением рассуждений для возрастающей на сегменте [а, 6] функции f(x) (ибо для убываю- щей функции они проводятся аналогично). Убедимся в том, что функция у =f (х) устанавливает взаимно одно-' значное соответствие между сегментами [а, 6] и [а, р]. Действительно, то, что каждому х из сегмента [а, Ь] отвечает только одно значение у из сегмента [а, Р], следует из самого понятия функции у =f(x), а то, что каждому у из сегмента [а, Р] отвечает только однохиз сег-' мента [а, 6], вытекает из возрастания функции у =f(x). Итак, сущест- вование обратной функции обосновано. 196
Убедимся теперь в том, что обратная функция х = fx(y) возрастает на сегменте [а, Р]. Пусть yi и у2 — любые два числа из сегмента [а, р], удовлетворяющие условию у1 < у2. Тогда х( =/"‘(у1) < х2 = fl(yz), ибо из противоположного неравенства Xi > х2 и из возрастания функции y=f(x) вытекало бы, что yi >у2, а это противоречит условию yi <у2. Теорема доказана. 4.4. Существование односторонних пределов у любой нестрого монотонной функции Теорема 8. Если функция /(хуне убывает или не возрастает на сегменте [а, 6], то у нее существуют правый и левый пределы в лю- бой внутренней точке сегмента [а, 6] и, кроме того, существуют правый предел в точке а и левый предел в точке Ь. Доказательство. Достаточно доказать два утверж- дения: 1) о существовании у функции/(х) правого предела в любой точке с, удовлетворяющей неравенствам а<с<Ь; 2) о существовании у функции f (х) левого предела в любой точке с, удовлетворяющей не- равенствам а<с<Ь. Мы ограничимся доказательством только утверждения 1, ибо утверждение 2 доказывается аналогично. Кроме того, мы будем проводить все рассуждения только для неу- бывающей функции /(х), ибо для невозрастающей функции /(х) они проводятся аналогично. Итак, пусть функция f (х) не убывает на сегменте [a, Z>] и с — лю- бая точка, удовлетворяющая неравенствам а<с<Ь. Докажем, что функция /(х) имеет правый предел /(с + 0) в точке с. Рассмотрим множество {/"(х)} всех значений /(х) этой функции, от- вечающих значениям аргумента х из полусегмента с<х<Ь. Так как с < Ь, то это множество не является пустым. Кроме того, это множество ограничено снизу и его нижней гранью является число /(с) (поскольку из неубывания функции вытекает, что /(с) </(х) для всех х из полусег- мента с<х£Ь). По теореме 1 из гл. 1 у множества {/"(х)} существует точная нижняя грань, которую мы обозначим через у. Докажем, что число у и является правым пределом /(с + 0) функ- ции /(х) в точке с. Так как у является одной из нижних граней множества {/'(х)}, то для всех х из полусегмента с < х < 6 справедливо неравенство у£/(х). (9.4) 197
Далее, так как нижняя грань у является т о ч н о й, то для произво- льного положительного числа е найдется хотя бы одно значение xQ из полусегмента c<xQ<b, для которого справедливо неравенство f(x0)<7+E. Поскольку Хо>с, то найдется положительное число 5 такое, что х0 = с + 5, и потому неравенство f(xa )< у + е может быть переписано в виде f(c + $)<y +е. ‘ Из последнего неравенства и из неубывания функции f(x) вытека- ет, что для всех х из интервала с < х < с + 8 справедливо неравенство /(х)£/(с + 8)<у +£. _ (9.5) Из сопоставления неравенств (9.4) и (9.5) вытекает, что для произ- вольного положительного числа е найдется отвечающее ему положите- льное число 8 такое, что для всех х из интервалу с < х < с + 8 будут справедливы неравенства у</(х)<у+£, а потому и неравенство |/(х)-у|<в. В силу определения 2* из § 2 гл. 8 это и означает, что число у является правым пределом функции /(х) в точке с. Теорема доказана. Замечание. Теорема 8 тем более справедлива для строго мо- нотонной (т. е. возрастающей или убывающей) функции. 4.5. Необходимое и достаточное условие непрерывности на сегменте строго монотонной функции Теорема 9. Пусть функция у =f(x) возрастает (соответственно убывает) на сегменте [a, Z>] и пусть a =f(a), 0 =f(b). Тогда, для того чтобы функцияy-f(x) являлась непрерывной на сегменте [a, Z>], необ- ходимо и достаточно, чтобы любое число у из сегмента [а, 0] (соот- ветственно из сегмента [0, а]) являлось значенйем этой функции в некоторой точке с сегмента [а, 6]. Доказательство. Все рассуждения проведем для возраста- ющей на сегменте [а, 6] функции, ибо для убывающей на сегменте - [a, Z>] функции они проводятся аналогично. 1 .Необходимость. Требуется доказать, что если f(x) возра- стает и непрерывна на сегменте [а, Ь] и a =f(a), 0 =f (b), то любое число у из сегмента [а, 0] является значением этой функции в некото- рой точке с сегмента [а, 6], но это сразу вытекает из доказанной в § 3 - теоремы 6 (даже без предположения о возрастании функции у =f(x)). 2 . Достаточность. Требуется доказать, что если a-f(a), 0 = f(J)), функция f(x) возрастает на сегменте [а, Ь] и любое число у из сегмента [а, 0] является значением этой функции в некоторой точке 198
сегмента [а, £>], то функция /(х) непрерывна на сегменте [а, 6]. Доста- точно доказать, что функция f(x) 1) непрерывна справа в любой точке с, удовлетворяющей неравенствам а<с<Ь, и 2) непрерывна слева в любой точке с, удовлетворяющей неравенствам а < с < Ь. Мы ограни- чимся только доказательством утверждения 1, ибо утверждение 2 до- казывается аналогично. Предположим противное, т. е. предположим, что функция f(x) не является непрерывной справа в некоторой точке с, удовлетворяющей неравенствам а<с<Ь. Тогда существующий в этой точке в силу тео- ремы 8 правый предел/(с+0) н е равен з н а ч е н и ю f(c). Меньше /(с) этот правый предел/(с+ 0) быть не может, ибо зна- чение f (с) является одной из нижних граней, а правый предел у =/(с + 0) является точной нижней гранью введенного при доказате- льстве теоремы 8 множества {/"(х)} всех значений функции /(х) из по- лусегмента с<х<Ь. Таким образом, f(c) <f(c + 0) и интервал (f(c), f(c + Q)) имеет положительную длину. Так как из возрастания функции /(х) вытекает, что а=/(а)</(х)</(с) для всех х из сегмента а^х<с, а из того, что у=/(с + 0) является точной нижней гранью множества {/"(х)}, вытека- ет, что /(с + 0) </(х) </(/?) = р для всех х из полусегмента с < х < Ь, то все вещественные числа из принадлежащего сегменту [а, Р] интервала положительной длины (f(c),/(с + 0)) не являются значениями функ- ции /(х), что противоречит тому, что любое число из сегмента [а, р] является значением этой функции. Полученное противоречие доказы- вает ошибочность предположения о том, что функция /(х) не является непрерывной справа в точке с, и завершает доказательство теоремы 9. 4.6. Условие существования для данной функции строго монотонной и непрерывной обратной функции Теорема 10. Пусть функция у -f(x) возрастает (соответственно убывает) и непрерывна на сегменте [а,6] и пусть a.=f(a), $=f(b). Тогда на сегменте [а, Р] (соответственно на сегменте [Р, а]) опреде- лена обратная для y=f(x) функция x=fl(y), которая возрастает (со- ответственно убывает) и непрерывна на указанном сегменте. Кратко можно сказать, что из строгой монотонности и непрерыв- ности на сегменте [a, Z>] данной функции вытекают существование, строгая монотонность и непрерывность на соответствующем сегменте обратной функции. Доказательство. Проведем его для возрастающей функ- ции, ибо для убывающей функции оно проводится аналогично. • Так как функция y=f(x) возрастает и непрерывна на сегменте 199
[a, Z>], то в силу необходимости из теоремы 9 множеством всех значе- ний этой функции является сегмент [а, 0]. Но тогда теорема 7 обеспе- чивает существование на этом сегменте возрастающей обратной функ- ции х =_Л’(у), которая является непрерывной на этом сегменте в силу достаточности из теоремы 9 и в силу того, что множеством всех ее значений является сегмент [а, 6]. Теорема доказана. § 5. Сложная функция и ее непрерывность Предположим, что на некотором множестве {/} задана функция х = ср(<) и что множество {х} является множеством ее значений. Тогда, если на множестве {х} задана функция у=/(х), то говорят, что на множестве {/} задана сложная функция у=/[ф(0]> характери- стику которой можно обозначить и одной буквой F, т. е. можно запи- сать, что у=/[ф(0] = -^’(0- Эту сложную функцию записывают и в виде у = /(х), где х = ф(/) и называют суперпозицией функций ф и / При этом пере- менную х иногда называют промежуточным аргумен- том. Так, определенная на бесконечной прямой -oo<z<oo функция у = (I - 2)2 является суперпозицией определенной на бесконечной пря- мой -<х> < t < оо линейной функции х = t - 2, множеством значений кото- рой является бесконечная прямая -оо < х < оо, и определенной на этой бесконечной прямой функции у = х2. Мы определили сложную функцию, являющуюся суперпозицией двух функций. Ясно, что, применяя те же рассуждения, можно после- довательно определить сложную функцию, являющуюся суперпози- цией любого конечного числа функций. Докажем следующее утверждение. Теорема 11. Если функция х = ф(?) непрерывна в точке t = a, а фун- кция y=f(x) непрерывна в точке b = ф(а), то сложная функция у=/[ф(О] = ^’Ю непрерывна в точке t = a. Доказательство. Для произвольной сходящейся к пределу а последовательности {<„} значений аргумента сложной функ- ции у=/[ф(0] = -^(0 в СИЛУ определения 1 из § 1 непрерывности по Гейне и в силу непрерывности функции х = ф(/) в точке а, соответству- ющая последовательность значений функции хп = ф(<„) сходится к пре-' делу b = <p(a). , Так как последовательность {х„} является последовательностью значений аргумента непрерывной в точке b = ф(а) функцииy=f (х), то в силу того же определения 1 из § 1 непрерывности по Гейне соответ- ' 200
ствующая последовательность значений функции уп = f = F(t„) сходится к значению f(b)= /[<p(a)] = F(a), т. е. сходится к частному значению сложной функции в точке а. В силу того же определения 1 из § 1 непрерывности по Гейне это и означает, что сложная функция непрерывна в точке а. Теорема доказана. § б. Простейшие элементарные функции Простейшими элементарными обычно называют следующие функции: у = ха (где а — постоянное вещественное число), у = (?, y = logaX (где 0<а*1), y = sinx, y=cosx, y = tgx, y = ctgx, у = arcsin x, у = arccos x, у = arctg x, у = arcctg x. Представление об этих функциях и об их графиках читатель имеет из курса элементарной математики. Наша основная цель — выяснение вопросов об определении и о непрерывности всех простейших элементарных функций во всех точ- ках областей их задания и отыскание участков их монотонности. Строгое математическое выяснение этих вопросов не является про- стым, и мы вынуждены будем приводить некоторые утверждения без доказательства (отсылая любознательного читателя к соответствующей литературе). Мы начнем наше изложение с выяснения определения и свойств' показательной функции у = ас (где 0 < а Ф 1) и сразу же столкнемся с вопросом о том, как определить любую вещественную степень х про- извольного вещественного числа а. 6.1. Рациональные степени положительных вещественных чисел Возведение любого вещественного числа х в целую положитель- ную степень п определяется как «-кратное умножение числа х самого на себя, т. е. для целых положительных п степенная функция у = х" определена для всех вещественных значений х. Более того, мы уже знаем, что эта функция непрерывна в любой точке х (см. пример 1° из § 1) и возрастает на полупрямой 0<х<+оо (см. разд. 4.1). Поэтому Для любого сколь угодно большого положительного числа N для функ- ции у = х" выполнены на сегменте 0 < х < N условия теоремы 10 и со- гласно этой теоремё для указанной функции существует на сегменте 0^у^№ возрастающая и непрерывная обратная функция, которую мы обозначим символом х = у1/л. Так как число N можно выбрать как угодно большим, то и число можно считать как угодно большим, а это означает, что функция х =уУп определена, возрастает и непрерывна на всей полупрямой 0<_у<со. Меняя для этой функции обозначение аргумента у на х, а обозначение функции х на у, мы получим степен- 201
ную функцию y = xVn, определенную, возрастающую и непрерывную на полупрямой 0<х<+оо. Определив теперь для любого вещественного числа а > 0 число ах,п как значение функции у = хх1п в точке х = а, мы можем определить и любую рациональную степень г числа а. Именно, если г = —, где тип — целые положительные числа, то п т мы положим ar = a" =(aVnУ и договоримся, кроме того, что а°= 1, -г Г1 Y а = — • / Нетрудно убедиться в справедливости следующих двух свойств любых рациональных степеней п и г2 положительного вещественного числа d аг' аГг =аг'^, (аГ| У = аг'г', (9.6) учитывая, что эти свойства справедливы для случая, когда и г2 явля- ются целыми числами. Убедимся, например, в справедливости первого /п ГТ т\ т2 т1 • П2 свойства (9.6). Полагая г, =—, г2= — и учитывая, что г\= —!—-, «I П2 П1’П2 т2-п. „ ,п „ г2 =——- и что свойства (9.6) справедливы для целых чисел, получим «Г«г а =а^Т1 = аг,+Г1 В заключение убедимся в том, что при произвольном веществен- ном а> 1 и произвольном рациональном г> 0 справедливо неравенство аг >1. ' (9.7) Действительно, если при г = — было бы справедливо противопо- п ложное неравенство аг = а” <1, то, перемножая почленно п таких не- равенств, мы получили бы неравенство ат <1, противоречащее нера- венству ат >1, получаемому посредством перемножения т неравенств вида а> 1. 202
6.2. Показательная функция Из рассуждений предыдущего раздела вытекает, что если а — по- ложительное вещественное число, то функция у = ах определена для всех рациональных х и все ее значения положительны. Убедимся в том, что при а > 1 эта функция, определенная на мно- жестве {х} всех рациональных чисел х, возрастает на этом множестве. Действительно, если Х] и х2 — любые два рациональ- ных числа, удовлетворяющих условию Xi < х2, то в силу первого ра- венства (9.6) aX1 -ах> = ах> •(аХ1~х‘ -1). Так как а> 1 и X] -х2>0, то в силу неравенства (9.7) аХ1~х> >1, а из последнего неравенства и из поло- жительности значения ах' вытекает, что аХ1 -ах> >0, т. е. аХг >ах>. Итак, доказано, что при а > 1 определенная на множестве {х} всех рациональных чисел х функция у = ах возрастает на этом множестве. Используя этот факт, перейдем к определению функции у = ах на множестве всех вещественных чисел х. Пусть а — произвольное вещественное число, удовлетворяющее неравенству а>1. Фиксируем произвольное вещественное число х и рассмотрим всевозможные рациональные числа аир, удовлетворяю- щие неравенствам а<х<р. (9.8) Определим с? как вещественное число у, удовлетворяющее нера- венствам аа<у<а*. (9.9) Оказывается, такое вещественное число у существует, и притом то- лько одно. Доказательство единственности такого числа у мы опуска- ем, отсылая читателя к п. 2 § 5 гл. 4 книги В. А. Ильина и Э. Г. Позня- ка «Основы математического анализа» (Т. 1. М.: Физматлит, 2001). Для доказательства существования такого числа у фиксируем про- извольное рациональное число р, удовлетворяющее правому неравен- ству (9.8), и рассмотрим множество значений функции аа для всех ра- циональных чисел а, удовлетворяющих левому неравенству (9.8). Так как показательная функция, определенная на множестве всех рациона- льных чисел, возрастает на этом множестве и а<Р, то а“<а₽. Это означает, что множество всех значений (а’} ограничено сверху и чис- ло ар является верхней гранью этого множества. По теореме 1 из гл. 1 У этого множества существует точная верхняя грань, которую мы обо- значим через у. Остается заметить, что у удовлетворяет неравенствам (9.9): левому — как точная верхняя грань множества {а*}, а правому 203
— вследствие того, что а₽ является одной из верхних граней, а у — точной (т. е. наименьшей) верхней гранью этого множества. Весьма просто доказывается, что определенная нами функция у = ах при а > 1 возрастает на всей бесконечной прямой. Действитель- но, если Xi и Х2 — два любых вещественных числа, удовлетворяющих условию xi < Х2, то, как нам известно из гл. 1, найдутся два рациональ- ных числа Р] и аг таких, что X|<Pi<a2<X2. Так как в силу нера- венств (9.9) а”' < a₽l, а“: < а*1, а в силу возрастания функции у = ах на множестве всех рациональных чисел ар‘ <а°’-, то ах> <а\ Итак, при а > 1 определенная на множестве всех вещественных чи- сел х функция у = ах возрастает на всей бесконечной прямой. Обращаясь к доказательству непрерывности определенной нами функции у-ах в любой вещественной точке х, заметим^ что в силу единственности числа у, удовлетворяющего неравенствам (9.9), для любого вещественного числа £ > 0 найдутся рациональные числа аир, удовлетворяющие неравенствам (9.8), для которых ар-аа<г. (9.10) Так как все элементы произвольной сходящейся к числу х последовательности вещественных чисел {х„} начиная с некоторого (зависящего от числа е) номера лежат в содержащем точку х интервале (a, Р), то в силу уже доказанного возрастания при a > 1 функции у = ах будут справедливы неравенства аа< ах" < ар, аа< ах < ар. Из этих неравенств и из (9.10) следует, что все элементы х„ начиная с не- которого номера удовлетворяют неравенству |ax“ -ах|<£, что и озна- чает непрерывность функции у = ах в точке х. Завершая рассмотрение свойств определенной нами при a > 1 фун- кции 7 = ах, установим еще три свойства: 1) все значения функции у = ах положительны; 2) limax=+oo, limax=0; (9.11) 3) для любых вещественных х\ и х2 справедливы соотношения ах> aX1 = ax,+Xl, (aX| )х’ = ax,x’. (9.12) Свойство 1 вытекает из положительности значений функции у = ах на множестве всех рациональных значений аргумента и из левого не- равенства (9.9). Для доказательства свойства 2 заметим, что так как а>1, то а=1 + 5, где 5>0, так что а" =(1 + 5)">1 + 5-п. Следовательно, lima" =+оо и потому вследствие возрастания показательной функции Л-ЮО 204
limax = +oo. Далее, так как а‘л =—, то lima"" =0 и потому lim ах =0. jr-H-x д" П->Х х-»~х Так как соотношения (9.12) уже установлены нами для рациональ- ных значений xj и хг (см. равенства (9.6)), то, рассматривая последова- тельности {<} и {х"} рациональных чисел, сходящиеся к веществен- ным числам Xi и Х2 соответственно, записывая соотношения (9.6) для rt =х' и г2 =х" и переходя к пределу при п -> оо, мы установим соотно- шения (9.12) для вещественных чисел Х| и Хг. Для определения показательной функции у = ах при 0 < а < 1 и вы- яснения ее свойств заметим, что если 0 < a < 1, то a = —, где b > 1. Поэ- b тому при 0 < а < 1 естественно определить функцию у = ах из равенст- ва cf = b~x. Подытожим теперь свойства определенной нами на множестве всех вещественных х показательной функции у = ах при любом О < а Ф 1. 1°. При любом 0 < а * 1 все значения показательной функции у = ах положительны, причем при а>1 справедливы соотношения (9.11), а при 0 < a < 1 (вследствие того, что a = — = b~' и b > 1) справедливы со- b отношения limax=0, limax=+oo. (9.11*) Х-Н-оо Х-+-О0 2°. При любом 0 < a# 1 функция у = ах непрерывна в любой точке х бесконечной прямой -оо<х<оо. 3°. Функция у = ах возрастает при а>\ и убывает при 0 < а < 1 на всей бесконечной прямой -оо<х<оо. 4°. При любом 0 < а * 1 для любых вещественных чисел Х\ и х^ справедливы соотношения (9.12). Графики функции у = ах при а > 1 и при 0 < а < 1 изображены на рис. 9.4 и 9.5. 205
В заключение заметим, что первое соотношение (9.12) может быть положено в основу функционального определения функции у = ах. Можно доказать, что существует единственная функция f(x), опреде- ленная на всей бесконечной прямой и такая, что 1) f(xx +х2) = =/(*i) + /(x2) для всех вещественных х, и ху, 2) /(0) = 1, /(1) = а; 3)/(х) непрерывна при х = 0. Такой функцией и является функция </. 6.3. Логарифмическая функция Так как на произвольном сегменте с < х < d бесконечной прямой (-оо, +оо) функция y=f(x) = c? непрерывна и возрастает при а > 1 (убывает при 0 < а < 1), то в силу теоремы 10 для этой функции существует на сегменте, ограниченном точками ас и ad, обратная функ- ция х =/-1(у), которая на этом последнем сегменте непрерывна и воз- растает при а > 1 (убывает при 0 < а < 1). Эта функция называется логарифмической и обозначается символом х = 1о&у. Поскольку левый конец сегмента с мы можем неограниченно при- ближать к -<ю, а правый конец d неограниченно приближать к +оо, то в силу соотношений (9.11) и (9.11*) функция х= logay будет определена и непрерывна на всей открытой полупрямой 0 < у < +оо и будет на этой полупрямой возрастать при а > 1 (убывать при 0 < а < 1). Меняя для этой функции обозначение аргумента у на х, а обозначение функции х на у, мы получим логарифмическую функцию у = logo х, которая опре- делена и непрерывна на открытой полупрямой 0<х<+оо и на этой полупрямой возрастает при а > 1 (убывает при 0 < а < 1). Из свойства (9.11) показательной функции вытекает, что при а> 1 справедливы со- - отношения lim log„ х = -оо, lim logo х = -ко. Кроме того, из первого свойства (9.12) показательной функции вы- текает, что для любых положительных xi и х2 справедливо равенство log„(xt -х2) = loga x, + log„ x2. Графики логарифмической функции для а > 1 и 0 < а < 1 изображе- ны на рис. 9.6 и 9.7. 206
В заключение заметим, что в математике особую роль играет лога* рифмическая функция logax, у которой а - е, где е равно рассмотрен* • Г 1Y ному в разд. 2.3 гл. 7 пределу e = hm 1 + — . п J Для такой логарифмической функции используется обозначение 1пх, а соответствующие логарифмы называются натуральными- 6.4. Степенная функция с любым вещественным показателем Пусть a — произвольное фиксированное вещественное число, а некоторое вещественное число, ради определенности большее едини- цы. Определим на открытой полупрямой 0<х<+со общую степеннуК» функцию у = ха с помощью соотношения у=^ = (вы.»)«=а«и,х> т. е. как сложную функцию вида у = аи, где u = alogax Так как а> 1, то функция logax возрастает на открытой полупря- мой 0<х<+оо и потому функция « = alog0x возрастает при а>0 # убывает при a < 0 на этой полупрямой. Отсюда и из того, что функций у = а “ возрастает на всей прямой -оо < и < +оо, вытекает, что степенная функция у = х“ возрастает при a > 0 и убываем при a < 0 на полупря' мой 0<х<+оо. Далее, из того, что функция и = а loga х непрерывна в каждой точ- ке х полупрямой 0 < х < +оо, а функция у = а и непрерывна в каждой точке и бесконечной прямой -оо < и < оо, и из теоремы 11 о непрерыв- ности сложной функции вытекает, что степенная функция у = ха не' прерывна в каждой точке х полупрямой 0 < х < +оо. Убедимся теперь в том, что при а>0 степенная функция у = х‘* имеет равный нулю правый предел в точке х = 0. Действительно, ecnrf {хл} — любая сходящаяся к нулю последовательность положитель- ных чисел, то при a > 0 последовательность ип = a loga хп (в силу резу- льтатов предыдущего раздела) является бесконечно большой последо- вательностью, состоящей из отрицательных чисел, и потому последо- вательность у„=аи" является бесконечно малой. Таким образом, при a > 0 степенная функция у = х“, если ее поло' Жить равной нулю в точке х = 0, является непрерывной и в точке х = 0 справа. Отметим, что если a < 0, то значения степенной функции у = х* при приближении ее аргумента х к нулю справа неограниченно возрас- тают. 207
Замечание. Если показатель а степенной функции у = ха явля- ется положительным рациональным числом в и - т да а=—, знаменатель п которого является не- fl четным числом, то степенную функцию у = ха можно опреде- лить на всей бесконечной прямой -оо < х < +оо, полагая ее для х < 0 рав- нои |х| , если a =— и т — четное число, и равной -|х| , если a =— и п п т — нечетное число. На рис. 9.8—9.11 изображены графики функции у = ха для различ- ных значений а. Рис. 9.10 Рис. 9.11 6.5. Тригонометрические функции Тригонометрические функции у = sin х и у = cos х были введены из наглядных геометрических соображений в курсе элементарной матема- тики и там же были выяснены их свойства. Укажем основные ) if F 208 i
три свойства этих функций, следствиями которых являются все остальные их свойства. 1°. Для любых вещественных х', х" и х справедливы равенства: 2°. sin(x' +х") = sinx' -cosx" + sinx" -cosx', cos(x' +x") = cosx' - cosx" - sinx' - sinx", sin2x + cos2x = L 71 7t sin 0 = 0, cosO= 1, sin— = 1, cos —=0. 2 2 71 3°. Для любого x из интервала 0< х< - справедливы неравенства (9.13) (9-14) (9.15) (9.16) (9.17) у sin хо -sm х Q Рис. 9.12 0<sinx<x. Из наглядных геометрических со- ображений функции cosx и sinx мож- но определить, например, так. Рас- смотрим окружность радиуса единица с центром в начале координат О и на ней точку А (1,0) (см. рис. 9.12). Назо- вем косинусом (соответственно ’ синусом) любого вещественного числа х абсциссу (соответственно ор- динату) точки М, полученной поворо- том точки А вокруг центра О на вы- раженный в радианах угол х. Напомним, что определенная на всей прямой функция f(x) называется: 1) ч е т н о й, если f(-x) =f(x) для любого х; 2) нечетной, если f (-х) = —f(x) для любого х; 3) периодической функцией периода Т, если f(x + Т) =f (х) для любого х. Из данного нами определения функций cos х и sin х сразу же выте- кает, что cos х является ч е т н о й, a sin х — нечетной функциями и что обе эти функции являются п е р и о д и ч е с к и м и функ- циями периода 2л. Тривиально проверяется справедливость ра- венств (9.15) и (9.16). Мы опустим известную из курса элементарной математики проверку справедливости равенств (9.13) и (9.14) и остано- вимся только на установлении неравенств (9.17). cosix 1 Л(1, 0) х 209
Вместо (9.17) мы установим несколько более общие неравенства л • sinx (9 18) 0<S1I1X<X<-----, ' cosx справедливые для всех х из интервала ^0,^. Снова рассмотрим окружность радиуса единица с центром в нача- ле координат О и на ней точку А с координатами (1,0) и точку М с координатами (cos х, sin х), считая, что х лежит в интервале I 0, 1 (см. рис. 9.13). Проведем через точку А прямую, параллельную оси Оу, и обозначим через В точку пересечения этой прямой с прямой ОМ. Кроме того, обозначим проекции точки М на оси Ох и Оу соответственно через Мх и Му. Вычислим площади треугольника ОМА, сектора ОМА и треугольника ОБА и учтем, что треугольник ОМА содержится в секторе ОМА, а сектор ОМА содержится в треугольнике ОБА. Так как площадь любого треу- гольника равна половине произведения длин его сторон на синус угла между ними и так как |ОЛ| = \ОМ\ = 1, то площадь треугольника ОМА равна -sinx. Площадь сектора ОМА в силу того, что IOAI = IOM} = 1, 2 равна -х. Для нахождения площади треугольника ОБА заметим, что 2 этот треугольник подобен треугольнику ОММХ и потому | ЛВ|_ |М,М|_ _ sinx [ОА[ IOMXI jOMx[ cosx’ откуда вытекает, что | Л2?| = S1?x, а площадь треугольника ОБА равна . -cosx -|ОЛ|-ЮВ| = -- 8*пх. Итак, мы получаем, что -sinx< -х< -• s*nx и с - 2 2 cosx 2 ч 2 2 cosx , I учетом того, что sinx > 0 для всех х из интервала 0, — L мы приходим . к 2 у : к неравенствам (9.18). | 210 |
С помощью неравенств (9.17) докажем, что функция sinx непре- рывна в точке х = 0. Прежде всего заметим, что из неравенств (9.17) и из того, что при <х<0 справедливы равенства |sinx| = -sinx, |х| = - х, вытекает, что неравенства ' 0< |sinx|< |х| (9.19) будут справедливы и при 0<х<^, и при ~<х<0. Поэтому для любой состоящей из чисел, отличных от нуля, и схо- дящейся к пределу х = 0 последовательности значений аргумента {хл} в силу (9.19) начиная с некоторого номера п будут справедливы нера- венства 0< |sinх„|< |х„|, из которых следует, что соответствующая по- следовательность значений функции {sinxj также сходится к нулю (т. е. сходится к частному значению функции sinx в точке х = 0). Непрерыв- ность функции sinx в точке х = 0 установлена. Далее, так как cosx = 71-sin2 х, функция и = sinx непрерывна в точке х = 0, а функция 71-и2 непрерывна в точке и = 0, то по теореме 11 (о непрерывности сложной функции) функция cosx непрерывна в точке х = 0, т. е. lim cos Дх =cos 0 = 1. Дх->0 Докажем теперь, что функции sinx u cosx.непрерывны в любой точке х бесконечной прямой -оо<х<+оо. Фиксируем произвольную точку х и положим в (9.13) и (9.14) х'=х, х" = Ьх. При этом получим равенства: sin(x + Дх) = sinx • cos Дх + cosx • sin Дх, (9.20) cos(x + Дх) = cos х • cos Дх - sin x • sin Дх. (9.21) В силу уже доказанной непрерывности функций sinx и cosx в точ- ке х = 0 справедливы соотношения lim sin Дх = 0, lim cos Дх = 1. Перехо- Дг->0 ’ z£r-+O дя в равенствах (9.20) и (9.21) к пределу приДх—> 0 и используя ука- занные соотношения, мы получим, что lim sin(x + Дх) = sin х, lim cos(x + Дх) = cos х. Д»-»0 Дг->0 Непрерывность функций sinx и cosx в произвольной точке х доказана. Непосредственно из определения cosx и sinx как абсциссы и орди- наты вращающейся по единичной окружности точки М просматрива- ются участки возрастания и убывания этих функций: при любом к=0, ±1, ±2, ... функция sinx возрастает на сегменте 211
7С Л Л Л 2£л—, 2Лл + — и убывает на сегменте + 1)л—, (2£ + 1)л + — , 2 2 2 2 пг__ я пу__ . л 2' 2. а функция cos х возрастает на сегменте [(2£ - 1)л; 2£л] и убывает на сегменте [1кк> (2& + 1)л]. Графики функций у = sinx и >> = cosx изображены на рис. 9.14 и 9.15. y=sin х Рис. 9.15 Рис. 9.14 371 2 J = tgx Рис. 9.16 и Замечание. Сформулированные в начале настоящего раздела свойства 1°, 2° и 3° могут быть положены в основу функционального определения функций sin х и cos х. Можно доказать, что суще- ствует, и притом единственная, пара определенных на всей бесконечной пря- мой функций, первую из которых мы обозначим символом sinx, а вторую — символом cosx, удовлетворяющих усло- виям 1°, 2° и 3°. Доказатель- ство можно найти в допол- нении к гл. 4 Э. Г. Позняка «Основы -71 y=ctg X Рис. 9.17 книги В. А. Ильина математического анализа» (Т. 1. М.: Физмат- лит, 2001). К тригонометрическим функциям относят л ' sinx х cosx ~ также функции tgx =------ и ctgx =----. В cosx sinx силу теоремы 4 функция tgx непрерывна в любой точке, в которой cos х Ф 0 (т. е. в лю- бой точке области определения), а функция ctgx непрерывна в любой точке, в которой sinx5* 0 (т. е. в любой точки области опреде- 212
ления). Легко проверить, что при любом к = 0, ±1, +2, ... функция tgx возрастает на интервале 2Н+^, а ФУнкЧия ctgx убывает на интервале ((к-1)п, кп). Графики функций у = tg х и у = ctg х изображены на рис. 9.16 и 9.17. 6.6. Обратные тригонометрические функции Обратные тригонометрические функции известны читателю из кур- са элементарной математики. Наша основная цель — установление не- прерывности и монотонности этих функций. Так как функция у = sin х непрерывна и возрастает на сегменте — < х < — и имеет множеством своих значении сегмент -I < у < I, то 2 2 на этом последнем сегменте определена обратная функция x = arcsiny, которая в силу теоремы Ю непрерывна и возрастает на этом сегменте -I <у < I. Меняя для этой обратной функции обозначение аргумента^ на х, а обозначение функции х на у, мы придем к функции у = arcsin х, Рис. 9.18 Рис. 9.19 непрерывной и возрас- тающей на сегменте -1<х<1. Аналогично уста- навливается, что 1) фун- кция у = arccos х, об- ратная к непрерывной и убывающей на сег- менте 0 < у < л функ- ции х = cos у, является непрерывной и убыва- ющей на сегменте —1 < х < 1; 2) функция y = arctgx, обратная к непрерывной и возрас- 213
тающей на интервале —< у< — функции х = tgy, является непрерыв- ной и возрастающей на бесконечной прямой -оо < х < +оо; 3) функция y = arcctgx, обратная к непрерывной и убывающей на интервале 0< у< л функции х = ctgy, является непрерывной и убывающей на бес- конечной прямой -оо<х<+оо. Графики обратных тригонометрических функций изображены на рис. 9.18—9.21. 6.7. Гиперболические функции В приложениях нередко встречаются четыре функции shx, chx, thx и cthx, определяемые равенствами „X ~~Х I ~~х ~х I ~~х , е -е , е + е . е -е е +е sh х =------, ch х =------, th х =----, cth x =------ (9.22) 2 0 । -X ’ „x -x ' 2 e +e e —e x гиперболическим к о с и - ---------------------- нусом, гиперболическим -1 y-thx тангенсом и гиперболи- Рис. 9.24--ческим котангенсом. В силу теоремы 4 функции shx, chx и thx определены и непрерывны на всей бесконечной прямой -оо <х < +оо, а функция cthx определена и непрерывна всюду на бесконечной пря- мой, за исключением точки х = 0. Графики гиперболических функций изображены на рис. 9.22—9.25. 6.8. Класс элементарных функций К классу элементарных функций относят любую функцию, полученную из рассмотренных в этом параграфе простей- ших элементарных функций посредством конечного числа операций 214
сложения, вычитания, умножения и деления и конечного числа супер- позиций. Из установленного в настоящем параграфе свойства непрерывно- сти простейших элементарных функций в каждой точке областей их определения и из теорем 4 и 11 вытекает, что любая элементарная функция непрерывна в каждой точке области ее определения. § 7. Первый и второй замечательные пределы ~ В этом параграфе будут установлены два предела, которые приня- то называть замечательными и которые будут использованы в следующей главе для вычисления производных функций у = sin х и y=log„ х. 7.1. Функциональный аналог теоремы 9 из главы 7 Как и в § 2 гл. 8, будем называть проколотой 5-окрестно- стью точки а интервал (а-8, а+ 8), из которого выкинута точка а. Теорема 12. Если в некоторой проколотой Ъ-окрестности точки а заданы три функции f (х), h(x) и g(x), две из которых f(x) и g(x) име- ют в точке а общий предел Ь, и если всюду в указанной проколотой Ъ-окрестности точки а справедливы неравенства f(x) < h(x) < g(x), (9.23) то и функция h(x) имеет в точке а предел, равный Ь. Доказательство. Пусть {х„} — произвольная схо- дящаяся к пределу а последовательность значений аргумента, все эле- менты которой отличны от а. Тогда, с одной стороны, в силу опреде- ления предела функции по Гейне обе последовательности соответству- ющих значений функции {/’(*„)} и {g(x„)} сходятся к пределу Ь, а с другой стороны, в силу неравенства (9.23) для всех номеров п справед- ливы неравенства f(xn) < h(xn) < g(xn). Теорема 9 из гл. 7 позволяет утверждать, что последовательность {Л(х„)} также сходится к пределу Ь, а это в силу определения предела функции по Гейне и произвольности последовательности значений ар- гумента {х„} и означает, что функция h(x) имеет в точке а предел, рав- ный Ь. Теорема доказана. 7.2. Первый замечательный предел Теорема 13. Предел функции h(x) = в точке х = О существует . и равен единице. х Доказательство. Поделив установленные в разд. 6.5 и справедливые для всех х из интервала 0<х< — неравенства (9.18) на 215
положительное всюду в этом интервале число sin х, мы получим нера- венства sinx cosx л я также справедливые для всех х из интервала 0<х< —. Для обратных величин, очевидно, справедливы обратные неравен- ства sinx , cosx<-----<1, х л Я также справедливые для всех х из интервала 0<х<—. Заметим, что из справедливости неравенств (9.24) при 0< (9.24) л х< - вы- 2 текает их справедливость и при —^<х<0, ибо при замене х на -х все , sinx - три функции cosx, ----- и 1 не меняют своих значении. X Таким образом, неравенства (9.24) справедливы для всех х из ин- Л Л ~ тервала —< х< —, за исключением точки х = 0, т. е. справедливы всю- 2 2 ду в проколотой --окрестности точки х = 0. Так как, кроме того, обе < 2 функции /(x) = cosx и g(x)=l имеют в точке х = 0 равный единице предел, то по теореме 12 функция п(х) =----- также имеет в точке х х = 0 равный единице предел. Теорема доказана. 7.3. Второй замечательный предел В разд. 2.3 гл. 7 мы доказали существование предела последовате- ► и обозначили этот предел через е. льности \ п J Теорема 14. Предел функции /(х) = (1+х)1/х в точке х = 0 сущест- вует и равен е. Доказательство. Достаточно доказать, что как правый, так и левый пределы функции /(x) = (l+x)Vx в точке х = 0 существуют и оба равны е. 1°. Докажем сначала, что правый предел указанной функции в точ- ке х = 0 существует и равен е. 216
В силу определения правого предела по Коши (см. определение 2* из § 2 гл. 8) достаточно доказать, что для любого положительного чис- ла £ найдется отвечающее ему положительное число 5, обеспечиваю- щее справедливость неравенства IQ+x/'-eKe (9.25) для всех х из интервала 0 < х < 8. Фиксируем произвольное число £ > 0 и рассмотрим две последова- тельности {ал} и {/>„} с членами Обе эти последовательности сходятся к пределу е, ибо ✓ 1 Vя* 1 + — / V / X / х /X V п+1) , (, 1Y (. П ' .. С 1 > .. f. П . а = --------—,bn= I 1 + —I • 1 + — , liml 1 +-l = hmll + —1 = 1 1 £ \ п) \ п) "-’’х п +1) "•’’х п) п и в силу разд. 2.3 гл. 7 , j Г 1Y lim Id-----= liml 1 + — -е. "->“1 п + 1) "-*4 п) Поэтому для фиксированного нами произвольного числа £ > 0 най- дутся номера N\ и N2 такие, что | ая - е|< £ для всех номеров п, удовлет- воряющих условию п> Nx, и [£>„ -е|<Е для всех номеров п, удовлетво- ряющих условию п > 2Vr Обозначив через N наибольший из номеров М и мы получим, что для всех номеров п, удовлетворяю- щих условию п> N, будут справедливы оба неравенства |ал-е|<Е, |6я-е|<Е. (9.26) Достаточно доказать, что если положить 8 = —, то для любого х из N интервала 0<х<8=— будет справедливо неравенство (9.25). Фиксируем произвольное число х из интервала 0< х< — и 217
(9.27) (9.28) заметим, что для этого числа х найдется номер п, удовлетворяющий условию п > N и такой, что1 1 1 ------<Х<—. 1 + п-п Из неравенств (9.27) вытекают неравенства 1 + —— <1+х<1+- и n<i<n + l, п + 1 п х а из (9.28) в свою очередь вытекают неравенства / 1 \л / f [1 +---1 < (1+х)|/ж<| 1 + - 1 , V п + 1 J \ п J которые можно переписать в виде att < (1+x)Vx < b„, а потому и в виде ап - е< (1 + x)Vx - е< Ь„ - е. (9.29) Из (9.26) и (9.29) окончательно вытекает, что для произвольного . Гл 1 1 фиксированного нами в интервале I 0, — I числа х справедливо нера- венство (9.25). Доказательство существования равного е правого пре- дела завершено. 2°. Докажем теперь, что и левый предел функции /(х) = (1 + х)1/х в точке х = 0 существует и равен е. В силу определения левого предела функции по Гейне (см. опреде- ление 2 из § 2 гл. 8) достаточно, взяв произвольную бесконеч- но малую последовательность отрицательных чисел {хл}, дока- зать сходимость к пределу е соответствующей последовательности значений функции /(хя) = (1 + хя)’/х<*. Рассматривая последовательность {хл} начиная с того номера п, с которого |хл| < 1, положим уп =-—, так что хп =— 1 + х„ 1 + Л При этом {уп} будет являться бесконечно малой последовательно- стью п о л о жите л ьных чисел и У„ 1 у" _( 1 /(х„) = (1+хя)^ = (1 + K)V>- •(! + ?„)• ' « ( 1 1 Ибо объединение полусегментов -------, — , \л+1 п_ удовлетворяющих условию n>N, содержит все точки интервала I 0, — I. взятых для всех номеров и, (- О к ’’ n)' 218
Так как lim(l + у„) = 1 и в силу уже доказанного существования рав- ного е правого предела lim(l + у )Vy" =е, то и предел последовательно- п-*х> сти /(хл) = (1+х„)|/ж“ существует и равен е. Теорема доказана. Следствие из теоремы 14. Предел при t -»оо функции ( 1Y /(Z)=l 1 + -I существует и равен е. В силу. определения предела функции при 7-»оо по Гейне (см. определение 3 из § 2 гл. 8) достаточно, взяв произвольную бесконечно большую последовательность значений аргумента {/л}, до- казать сходимость к пределу е соответствующей последовательности ( 1 Y* значений функции f (t„) = 1 + — . Рассматривая последовательность {?„} начиная с того номера п, с которого |<„ | > 1, положим х„ = —, так что t„ =—. В силу теоремы 4 из t„ х„ разд. 1.3 гл. 7 последовательность {хл} является бесконечно малой, 1 + — I = (1+Хл)1"''. ifl ) Поэтому в силу теоремы 14 существует равный числу е предел: Нт/(Гл) = Нт(1 + хл)^ л-хю л-хю = е. § 8. Классификация точек разрыва функции Принято подразделять все точки разрыва функции на т р и типа. 1°. Точкаа называется точкой устранимого разр ы - в а функции f(pc)9 если предел этой функции в точке а существует, но не равен ее частному значению f(a) в этой точке. Так, функция/(х), равная при х * 0 и равная любому отлично- х му от единицы числу b при х = 0, имеет в точке х = О устрани- мый разрыв, ибо в силу теоремы 13 у этой функции существует в точке х = 0 предел, который равен единице и не равен ее частному зна- чению в этой точке. ' Если функция /(х) имеет устранимый разрыве точке а, то для устранения этого разрыва достаточно изменить значение функ- ции/(х) только в одной точке а, положив его равным ее пределу в этой точке. 219
2°. Точка а называется точкой разрыва первого р о - д а функции f (х), если функция f (х) имеет в этой точке конечные, но не равные друг другу правый и левый пределы. Разрыв первого рода можно образно назвать конечным скачком в данной точке. Так, функция f (х), равная и при х^О и равная любому числу b при х = 0, имеет в точке х = 0 с sinx sinx разрыв первого рода, ибо ----------------=----- при х > О, . И X sinx sinx ч ----=------при х < 0 и в силу теоремы 13 функция f (х) имеет в точ- |х| X ке х = 0 правый предел, равный +1, и левый предел, равный -1. 3°. Точка а называется точкой разрыва второго р о - д а функции f (х), если хотя бы один из двух односторонних пределов функции f (х) в этой точке либо не существует, либо является беско- нечным. Так, функция/(х), равная sin— при х*0 и равная любому числу b х при х = 0, имеет в точке х=0разрыв второго рода, ибо у нее не существует в этой точке ни правого, ни левого пределов. Дейст- вительно, чтобы убедиться в том, что у функции /(х) не существует в точке х = 0 правого предела, достаточно взять две бесконечно малые последовательности положительных чисел {х'} и {х"} с членами , 1 и 1 хп = —, х" =----и заметить, что соответствующие последователь- ™ — +2пп 2 (ТС । ности значений функции /(х') = sin(nn) и f (х") = sinl - + 2лп I сходятся к пределам 0 и 1 соответственно. Аналогично доказывается, что у этой функции не существует в точке х = 0 левого предела. В качестве второго примера рассмотрим уже изученную в разд. 5.4 гл. 6 функцию у=—. Для этой функции точка х = 0 является точкой х разрыва второго рода, ибо lim — = -оо, lim — = +оо. Можно образно Г .. х->0-0 х х сказать, что эта функция имеет в точке х = 0 бесконечный скачок. 220
Замечание. В силу доказанной в разд. 4.4 теоремы 8 моно- тонная на сегменте [а, 6] функция f (х) может иметь на этом сег- менте только точки разрыва первого рода. § 9. Три глобальных свойства непрерывных на сегменте функций К доказанным в § 3 теоремам 5 и 6 добавим еще три глобальных свойства непрерывных на сегменте функций. 9.1. Первая теорема Вейерштрасса Теорема 15. Если функция f(x) непрерывна на сегменте [a, Z>], то она ограничена на этом сегменте. Доказательство. Требуется доказать, что функция /(х) ограничена на сегменте [а, 6] и сверху, и снизу. Мы проведем доказа- тельство только ограниченности сверху, ибо ограниченность снизу до- казывается аналогично. Доказательство проведем от противного, т. е. предположим, что функция /(х) не является ограниченной сверху на сегменте [а, 6]. Тог- да для любого натурального п (п = 1, 2, ...) на сегменте [а, Ь] най- дется хотя бы одна точка хп такая, что f(x„) > п. Таким образом, на сег- менте [а, Ь] существует последовательность значений аргумента {х„}, для которой соответствующая последовательность значений функции {/(х,,)} является бесконечно большой. Так как состоящая из точек сег- мента [а, 6] последовательность {х„} ограничена, то по теореме Боль- цано-Вейерштрасса (см. теорему 13 из разд. 3.1 гл. 7) из нее можно выделить подпоследовательность {xk }, п = 1, 2,..., сходящуюся к неко- торой точке с, причем в силу следствия 1 из теоремы 8, доказанной в разд. 1.4 гл. 7, эта точка с принадлежит сегменту [a, Z>], т. е. является либо внутренней, либо граничной точкой этого сегмента. Так как по условию функция f(x) является непрерывной на сегменте [а, 6], то она непрерывна в точке с либо с двух сторон, либо справа, либо слева. Во всех трех случаях в силу определения непрерывности по Гейне после- довательность значений функции {f(xk )} обязана сходиться к пределу f (с), что противоречит тому, что эта последовательность, будучи выде- лена из бесконечно большой последовательности {/’(хл)}, сама являет- ся бесконечно большой. Полученное противоречие завершает доказа- тельство теоремы. Замечание. Пример функции f (х) = —, непрерывной на интер- х вале 0 <х< 1 или на полусегменте 0 <х< 1, показывает, что из непре- 221
рывности функции на интервале или полусегменте не вытекает ее ограниченность на этом интервале или полусегменте. 9.2. Вторая теорема Вейерштрасса В силу теоремы 15 множество {/"(х)} всех значений непрерывной на сегменте [a, Z>] функции f (х) ограничено и сверху, и снизу. Поэтому по теореме 1 из гл. 1 у этого множества существуют точная верхняя грань М и точная нижняя грань т. Числа М и т принято называть со- ответственно точной верхней и точной нижней гранями ф у н к ц и и/(х) н а с е г м е н т е [а, £>] и обозначать символами М = sup /(х), т = inf f(x). [a.i] Естественно возникает вопрос: являются ли для функции /(х), не- прерывной на сегменте [а, Ь], эти точные грани достижимыми, т. е. су- ществуют ли для этой функции на сегменте [а, /?] такие точки xi и х2, что /(х1) = Л/, f(x2) = ml Положительный ответ на этот вопрос дает вторая теорема Вейерштрасса. I Теорема 16. Если функция /(х) непрерывна на сегменте [a, Z>], то среди ее значений на этом сегменте имеются значения, равные ее точной верхней грани М и ее точной нижней грани т (т. е. на сегмен- те [а, 6] существуют такие точки xi и х2, что /(х2) = ти). Доказательство. Существование точной верхней грани М и точной нижней грани т вытекает из теоремы 15, и нам нужно дока- зать только их достижимость. Проведем доказательство достижимости только точной верхней грани, ибо достижимость точной нижней грани доказывается аналогично. Предположим, что точная верхняя грань М не достигается, т. е. предположим, что для всех точек х сегмента [а, Ь] справедливо нера- венство f(x)<M. Тогда функция [М-/(х)] непрерывна и строго поло- жительна на сегменте [а, 6] и по теореме 4 (для случая частного) фун- кция F(x) =-------будет также непрерывна на этом сегменте. Тогда М-/(х) по теореме 15 эта функция F(x) ограничена сверху на сегменте [а, Ь], т. е. найдется число А > 0 такое, что для всех х из сегмента [a, Z>] спра- ведливо неравенство------< А, из которого вытекает, что для всех Л/-/(х) х из сегмента [a, Z>] справедливо неравенство /(х) < Л/ - —, противоре- А чащее тому, что число М является точной (т. е. наименьшей), верхней гранью функции /(х) на сегменте [a, Z>]. Полученное противо- 222 л •t-
речие доказывает ошибочность предположения о том, что точная верх- няя грань не достигается. Теорема доказана. Замечание 1. Для функции, непрерывной на интервале или полусегменте, утверждение о достижении точной верхней и точной „нижней граней .несправедливо (эти грани у указанной функции могут даже не существовать). Замечание 2. После того как доказано, что непрерывная на сегменте [а, 6] функция /(х) достигает на этом сегменте своих точной верхней и точной нижней граней, мы можем назвать точную верхнюю грань Л/максимальным значением, а точную нижнюю грань т м и н и м а л ь н ы м з н а ч е н и е м функции/(х) на сег- менте [a, Z>], а теорему 16 переформулировать так: у непрерывной на сегменте [а, Ь] функции f (х) существуют на этом сегменте максима- льное и минимальное значения. Замечание 3. Функции, не являющиеся непрерывными на сегменте [а, 6], могут также достигать своих точной верхней и точной нижней граней на этом сегменте. Так, введенная в § 1 гл. 8 функция Дирихле О(х), равная нулю в любой иррациональной точке х и равная единице в любой рациональной точке х, разрывна в любой точке про- извольного сегмента [а, 6], но достигает своей точной верхней грани М= 1 в любой рациональной точке этого сегмента и своей точной нижней грани т = 0 в любой иррациональной точке этого сегмента. 9.3. Теорема Кантора о равномерной непрерывности Введем понятие равномерной непрерывности функ- ции Дх) на множестве {х}, в каждой точке которого эта. функция не- прерывна. Определение 1. Функция f (х) называется равномерно н е - прерывной на множестве {х}, если для любого положительного числа £ найдется отвечающее ему положительное число 8, обеспечи- вающее справедливость неравенства |/(x')-/(x*)|<£ ' (9.30) для любых двух точек х' и х" множества {х}, удовлетворяющих усло- вию |х'-х"|<8. Конечно, из равномерной непрерывности функции Дх) на множе- стве {х} вытекает непрерывность этой функции в каждой точке хо этого множества. Действительно, если в определении 1 взять в качестве х' произво- льную фиксированную точку хо множества {х}, а в качестве х" — лю- бую текущую точку х этого множества, то мы придем к определению непрерывности по Коши функции Дх) в точке хо. 223
Заметим теперь, что непрерывная в каждой точке х множества {х} функция /(х) может не являться равномерно непрерывной на этом множестве. Так, непрерывная в силу теоремы 11 в каждой точке х интервала 0<х<1 функция /(x) = sin— не является равномерно непрерывной на х этом интервале, ибо на этом интервале существуют две последователь- ности точек {х'} и {х"} с членами х' , х* =—-—, для которых 2лл л , - —+2лл 2 |х' -х"| = —а |/(х')-/(х'')| = 1 (для всех номеров л), так что 4л(-^+2лл] при е = неравенству (9.30) нельзя удовлетворить при |х' -х"|< 5 с как угодно малым 5>0. Оказывается, в приведенном нами примере не случайно рассматри- вается не сегмент, а интервал, ибо справедлива следующая замечатель- ная теорема, принадлежащая Кантору. Теорема 17. Если функция /(х) непрерывна на сегменте [a, Z>], то она и равномерно непрерывна на этом сегменте. Доказательство. Предположим, что непрерывная на сег- менте [а,Ь} функция /(х) не является равномерно непрерывной на этом сегменте. Тогда для некоторого е>0 и для как угодно малого 5 > 0 на сегменте [а, £>] найдутся такие две точки х' и х", что | х' - х"|< 5, а | f(x') - f (х")| > е. Поэтому, выбрав бесконечно малую по- следовательность 5„ =— (л = 1, 2, ...), мы получим, что для указанного л е > 0 и для любого номера л на сегменте [a, Z>] найдутся такие точки х' и х”, что 1< -<|<-> а |/«)-Ж)|>е. (931) л Так как состоящая из точек сегмента [а, £>] последовательность {х'} ограничена, то по теореме Больцано-Вейерштрасса (см. теорему 13 из разд. 3.1 гл. 7) из нее можно выделить подпоследовательность {х^},' л = 1, 2, ..., сходящуюся к некоторой точке с, причем в силу следствия 1 из теоремы 8, доказанной в разд. 1.4 гл. 7, эта точка с принадлежит сегменту [a, Z>], т. е. является либо внутренней, либо граничной точкой этого сегмента. В силу левого неравенства (9.31) к этой же точке с 224
сходится и соответствующая подпоследовательность {х£}. Так как по условию функция f(x) непрерывна на сегменте [а, 6], то она непрерывна в точке с либо с двух сторон, либо справа, либо слева. Во всех трех случаях в силу определения непрерывности по Гейне обе подпоследова- тельности {/(х^)} и {f (х"к)} обязаны сходиться к пределу /(с), а пото- му их разность {/*(х[ )- f(x[ )} обязана быть бесконечно малой после- довательностью, а это противоречит правому неравенству (9.31), спра- ведливому для всех номеров и, а потому и для всех номеров кп. Полу- ченное противоречие завершает доказательство теоремы. Определение 2. Назовем колебанием на сегменте [C)d\ любой ограниченной на этом сегменте функции /(х) разность ($ = М-т между точной верхней гранью М и точной нижней гранью т функции /(х) на этом сегменте. Определение 2 позволяет нам следующим образом перефразиро- вать теорему Кантора 17: если функция /(х) непрерывна на сегменте [а, Ь], то для любого положительного числа г найдется отвечающее ему положительное число 5 такое, что колебание со функции /(х) на любом содержащемся в [а, й] сегменте, имеющем длину, меньшую 5, удовлетворяет неравенству со < £. Замечание. Анализ доказательства теорем 15, 16 и 17 показы- вает, что утверждения этих теорем останутся справедливыми, если в их формулировках заменить сегмент [а, Ь] любым ограниченным и замкнутым1 множеством {х}. Такое множество принято называть компактом. 1 Напомним, что множество называется замкнутым, если оно содержит все свои предельные точки (см. разд. 3.2 гл. 7).
Глава 10 Основы дифференциального исчисления § 1. Производная. Ее физическая и геометрическая интерпретации 1.1. Приращение аргумента и функции. Разностная форма условия непрерывности Пусть функция у =f(x) определена на некотором интервале (а, Ь). Фиксируем любое значение х из указанного интервала и зададим аргу- менту в точке х произвольное приращение Дх такое, что значение х + Дх также принадлежит интервалу (а, Ь). Приращением функции y=f(x) в точке х, соответствующим приращению а р г у м е Н'Т а Лх, назовем число Ду =/(х + Дх)-/(х). (10.1) Имеет место следующее утверждение — так называемая разно- стная форма условия непрерывности: функция y-f(x) непрерывна в трчке х, если приращение Ду этой функции, в точке х, соответствующее приращению аргумента Ах, является бес- конечно малым при Дх —> 0, т. е. если 1ппДу=1ш1[/(х + Дх)-/(х)] = 0. (10.2) Дх->0 Дх->0 Действительно, по определению, функция у =f(x) непрерывна в точке х, если существует предел lim f(x + Дх) = f (х). (10.3). В силу § 5 гл. 8 существование предела (10.3) эквивалентно тому, что функция [f(x + Дх) -/(х)] аргумента Дх является бесконечно малой при Дх->0, что и означает выполнение условия (10.2). 1.2. Определение производной Сохраним для функции у-f(x) предположения и обозначения, сформулированные в начале предыдущего раздела. Считая, что Дх * 0, рассмотрим в данной фиксированной точке х отношение приращения Ду функции в этой точке к соответствующему приращению аргумента Дх Ду = /(х + Дх)-/(х) Дх Дх 226
Отношение (10.4) будем называть разностным отноше- ние м (в данной точке х). Поскольку значение х мы считаем фиксиро- ванным, разностное отношение (10.4) представляет собой функцию ар- гумента Дх. Эта функция определена для всех значений аргумента Дх, принадлежащих некоторой достаточно малой окрестности точки Дх = 0, за исключением самой точки Дх = 0. Таким образом, мы имеем право рассматривать вопрос о существовании предела указанной функ? ции при Дх->0. Определение. Производной функции y=f(x) в данной фик- сированной точке х называется предел при Дх —> 0 разностного отно- шения (10.4) (при условии, что этот предел существует). Производную функции у =f(x) в точке х будем обозначать симво- лом у' (х) или f’(x). Итак, по определению, . .. Ду .. /(х + Дх)-/(х) f (х) = lim— = hm—--------—(10 5) to-Н) Дх to->0 Дх \ • ) Отметим, что если функция у = f(x) определена и имеет производ- ную для всех х из интервала (а, Ь), то эта производная будет представ- лять собой функцию переменной х, также определенную на интервале (а, Ь). 1.3. Производная с физической и геометрической точек зрения Предположим, что функция y-f(x) описывает закон движения ма- териальной точки по прямой линии (т. е. зависимость от х пути у, пройденного точкой от начала отсчета за время х). Тогда разностное отношение (10.4) определяет среднюю скорость точки за промежуток времени от х до х + Дх. В таком случае производная /'(х), т. е. предел разностного отношения (10.4) при Дх->0, определяет мгновен- ную скорость точки в момент времени х. Итак, производная функции, описывающей закон движения, определяет мгновенную ско- рость точки. Разумеется, физические приложения понятия производной исполь- зуются не только в механике, но и в других разделах физики, касаться которых мы не будем. Перейдем к выяснению геометрического смысла производной. Рас- смотрим график функции у = /(х), определенной и непрерывной на ин- тервале (а, Ь). Фиксируем произвольную точку х интервала (а, Ь) и рассмотрим приращение Дх * 0 аргумента х, настолько малое, что число х + Дх так- принадлежит интервалу (а, Ь). Пусть МкР — точки графика функ- 227
ции y=f(x), абсциссы которых соответственно равны х и х+Дх (рис. 10.1). Координаты точек М и Р, очевидно, будут иметь вид М (х, /(х)), Р (х + Дх, /(х + Дх)). Прямую, проходящую через точки М и Р графика функции У =J\X), будем называть секущей. Поскольку точку М мы предпо- лагаем фиксированной, то угол наклона каждой секущей МР к оси Ох будет функцией аргумента Дх (ибо значение Ех однозначно определяет точку Р графика функции у = /(х)). Обозначим указанный угол накло- на секущей МР к оси Ох символом ср (Дх). Определение. Если существует предельное положение секущей МР при стремлении точки Р графика функции к точке М (или, что то же самое, при стремлении Ах к нулю), то это предельное положе- ние называется касательнойк графику функции у =f (х) в дан- ной фиксированной точке М этого графика. Из этого определения следует, что для существования касательной к графику функции у =f (х) в точке М достаточно, чтобы существовал предел lim <р(Дх) = <р0, причем указанный предел <р0 равен углу наклона Дх->0 касательной к оси Ох. Докажем следующее утверждение. Если функция у -f(x) имеет в данной фиксированной точке х про- изводную, то существует касательная к. графику функции y=f(x) в точке М(х, /(*)), причем угловой коэффициент этой касательной (т. е. тангенс угла наклона ее к оси Ох) равен производной f'(x). Опустим из точек М и Р перпендикуляры на ось абс- цисс. Проведем через точку >М прямую, параллельную оси абсцисс, и обозначим через N точку пересечения этой пря- мой с перпендикуляром, опу- щенным из Р на ось абсцисс (см. рис. 10.1). Из треугольни- ка MNP очевидно, что 18Ф(д,)=^:-Д£±^Дй. Дх Дх Таким образом: ср (Дх) = arctg —. Дх (10.6) 228
Убедимся в том, что существует предел правой (а стало быть, и ле- вой) части выражения (10.6) при Дх-> 0. Действительно, в силу суще-. ствования производной f'{x) существует предел lim —= Г{х). Отсюда д«-»о д и из непрерывности функции arctg и для всех значений и следует, что существует предел правой части (10.6), равный arctg f' (х). Итак, мы доказали, что существует предел I lim <р( Дх) = arctg /' (х). Дх->0 Но это и означает, что существует предельное положение секущей, т. е. существует касательная к графику функции в точке М{х, /(х)), причем угол наклона <ро этой касательной к оси Ох равен ф0 = arctg/'(х). Следовательно, угловой коэффициент указанной касательной tg ф0 равен f'{x). / Утверждение доказано. 1.4. Правая и левая производные В полной аналогии с понятиями правого и левого пределов вводят- ся понятия правой и левой производных функции у =f{x) (в данной точке х). Определение. Правой (соответственно левой) произ- водной функции у =f{x) в данной фиксированной точке х называ- ется правый {соответственно левый) предел разностного отношения (10.4) в точке Дх = 0 {при условии, что этот предел существует). Правую (соответственно левую) производную функции y=f{x) в точке х обычно обозначают символом f'(x + 0) (соответственно Г(х-0)). Если функция у- f{x) имеет в точке х производную, то она имеет в этой точке правую и левую производные, совпадающие между со- бой. Если функция у-f{x) имеет в точке х и правую, и левую произ- водные и если указанные производные совпадают между собой, то функция у =f{x) имеет в точке х производную. (Это утверждение вы- текает из соответствующего утверждения для правого и левого преде- лов функций — см. § 2 гл. 8.) Заметим, что существуют функции, име- ющие в данной точке х и правую, и левую производные, но не имею- щие производной в этой точке, например: 229
Эта функция имеет в точке х = 0 правую производную, равную lim — = 1, и левую производную, равную hm --= -1, но не имеет Дх->0+0 Ду Дг->0-0 Ду в точке х = 0 производной. § 2. Понятие дифференцируемости функции 2.1. Определение дифференцируемости функции Пусть снова функция у =/(х) определена на некотором интервале (а, Ь), символом х обозначено некоторое фиксированное значение ар- гумента из указанного интервала, а символом Дх — любое прираще- ние аргумента такое, что значение аргумента х + Дх также принадле- жит (а, Ь). Определение. Функция y=f(x) называется диф ф ер енци-. ру ем о й в данной точке х, если приращение Ду этой функции в точке х, соответствующее, приращению аргумента Ах, может быть представлено в виде Ду = Л • Дх + а • Дх, (10.7) где А — некоторое число, не зависящее от Ах, а а. — функция аргу- мента Ах, являющаяся бесконечно малой при Дх —> 0. Так как произведение двух бесконечно малых функций а Дх явля- ется бесконечно малой более высокого порядка, чем Дх (см. § 5 гл. 8), т. е. а-Дх = о(Дх), то формулу (10.7) можно переписать в виде Ду = ААх + о(Дх). Теорема 1. Для того чтобы функция y=f(x) являлась дифферен- цируемой в данной точке х, необходимо и достаточно, чтобы она имела в этой точке конечную производную. Доказательство. 1. Необходимость. Пусть функция у =/(х) дифференцируема в данной точке х, т. е. ее приращение Ду в этой точке представимо в виде (10.7). Предположив, что Дх^О, и поделив (10.7) на Ах, получим ДУ'хх (10.8) — = л+а, 4 7 Дх откуда вытекает существование производной, т. е. предела lim — = А. Д*“>0 Дх 2. Достаточность. Пусть функция у =/(х) имеет в данной точке х конечную произ- водную, т. е. существует предел 230
lim —=/'(x). (1°’9) МДс В силу определения предела функция а =— -f'(x) аргумента Ьх Ьх является бесконечно малой при Дх —> О, т. е. Ду =/'(х) • Дх + а • Дх, (10.10) где lima =0. Дх-»0 Представление (10.10) совпадает с представлением (10.7), если обозначить через А не зависящее от Дх число Тем самым доказа- но, что функция y=f(x) дифференцируема в точке х. Доказанная теорема позволяет нам в дальнейшем отождествлять понятие дифференцируемости функции в данной точке с понятием су- ществования у функции в данной точке производной. Операцию нахождения производной в дальнейшем договоримся называть дифференцированием. 2.2. Связь между понятиями дифференцируемости и непрерывности функции Теорема 2. Если функция у =f (х) дифференцируема в данной точ- ке х, то она и непрерывна в этой точке. Доказательство. Так как функция y=f(x) дифференцируе- ма в точке х, то ее приращение в этой точке может быть представлено в виде (10.7), откуда вытекает, что lim Ду=0, т. е. функция у =/(х) не- прерывна в точке х в силу разностной формы условия непрерывности (см. разд. 1.1). Теорема доказана. Заметим, что утверждение, обратное теореме 2, неверно, т. е. из непрерывности функции в данной точке не следует ее дифференцируе- мость в этой точке (примером может служить функция у = |х|, непре- рывная, но не дифференцируемая в точке х = 0). 2.3. Понятие дифференциала функции Пусть функция у =/(х) дифференцируема в точке х, т. е. ее прира- щение в этой точке может быть записано в виде выражения (10.7), представляющего собой сумму двух слагаемых: первое из этих слагае- мых А • Лх при А Ф 0 — это функция приращения аргумента Дх, ли- н е й н а я и однородная относительно Дх; это слагаемое пред- ставляет собой при Дх -» 0 бесконечно малую такого же порядка, что и Дх; второе слагаемое a • Дх является при Дх -» 0 бесконечно малой более высокого порядка, чем Дх, так как отношение 231
-----= а стремится к нулю при Дх->0. Таким образом, при А*0 Дх . - первое слагаемое А • Дх является главной частью приращения дифференцируемой функции. Эту главную часть приращения называ- ют д и ф ф е р е н ц и а л о м ф у н к ц и и в точке х, соответствую- щим приращению аргумента Дх. Итак, в случае А* О дифференциалом функции у -f (х) в данной точке х, соответствующим приращению аргумента Дх, называют главную линейную относительно Дх часть приращения этой функции в точке х. Дифференциал функции обозначается симво- лом dy. Если для приращения функции Ду справедливо представление (10.7), то дифференциал этой функции, по определению, равен dy = A-txx. (10.11) В случае А = 0 дифференциал функции также определяется форму- лой (10.11), т. е. считают, что в этом случае он равен нулю. Учитывая теорему 1, формулу (10.11) можно переписать в виде Ау=/'(х)Дх. (10.12) Подчеркнем, что дифференциал функции dy в данной, точке х, во- обще говоря, не равен приращению функции Ду в этой точке. Рассмотрим график функции у =f(x) (рис. 10.2). Пусть точка М на кривой у =f(x) соответствует значе- нию аргумента х, точка Р на той же кривой соответствует значению ар- гумента х + Дх, MS—касательная к кривой у =f(x) в точке М. Пусть, далее, прямая MN параллельна Ох, прямая PN параллельна Оу, . Q — точка пересечения касательной MS с прямой PN. Тогда приращение функции Ду равно величине отрезка NP. В то же время из прямоугольно- го треугольника MQN и из формулы (10.12) ясно, что дифференциал функции dy равен величине отрезка NQ, ибо величина отрезка MN равна Дх, а тангенс угла A.QMN равен Очевидно, что величины отрезков NP и NQ, вообще говоря, раз- личны. Установим выражение для дифференциала функции у =f (х), аргу- мент х которой является независимой переменной. 232
Под дифференциалом dx независимой переменной х можно пони- мать любое (не зависящее от х) число. Договоримся в дальнейшем брать это число равным приращению Дх независимой переменной, что позволяет нам переписать формулу (10.12) в виде (10.13) Ниже будет доказано, что формула (10.13) остается справедливой и в случае, когда аргумент х не является независимой переменной, а сам представляет собой дифференцируемую функцию новой переменной. § 3. Дифференцирование сложной функции и обратной функции 3.1. Дифференцирование сложной функции Установим правило, позволяющее найти производную сложной функции у = /[ср (/)] в точке t при условии, что известны производные составляющих ее функций х = ф (/) и у =f(x) в точках t и х = ф (0 со- ответственно. Теорема 3. Пусть функция х = ф (0 дифференцируема в точке t, а функция у-f(x) дифференцируема в соответствующей точке х = ф (0. Тогда сложная функция у =/[ф (0] дифференцируема в ука- занной точке t, причем для ее производной в этой точке справедлива формула {f [ф (')]}' =/'(*) Ф'(0 =/' [ф (0]ф'(0. (10.14) Доказательство. Придадим аргументу функции х = ср(t) в данной точке t произвольное отличное от нуля приращение АЛ Этому приращению отвечает приращение Дх = ср (/ + Д?) - Ф (0 функции х = ср (/), причем указанное приращение Дх может обращаться в нуль. Приращению Дх в свою очередь отвечает приращение Ду =/(x + zXx)-/(x) функции у=/(х) в соответствующей точке х = <р (/). Поскольку функция у =f(x) по условию дифференцируема в указанной точке х = ср (Г), то ее приращение Ду в этой точке может быть представлено в виде Ду = /'(х) Дх + а(Дх) • Дх, (10.15) где а(Дх) имеет при Дх -> 0 предел, равный нулю. (Представление (10.15) остается справедливым и при Дх = 0.) Поделив (10.15) на Д?^0, получим АУ=/.(х).^+а(Дх).^. (1ОЛ6) At Lt Lt 233 !
Докажем, что правая (а стало быть, и левая) часть (10.16) имеет предел при Д?->0, причем этот предел равен величине, стоящей в правой части (10.14). Этим самым будут доказаны дифференцируе- мость сложной функции и формула (10.14) для ее производной.! Из дифференцируемости функции у = <р (?) в точке t вытекает, что Дг отношение — имеет предел при Д? -> 0, равный ф' (?). Остается дока- зать, что функция а (Дх) имеет предел при Д? -» 0, равный нулю, но это сразу вытекает из того, что а(Дх) -> 0 при Дх -> 0 и что Дх -> 0 при Д? —> 0 на основании разностной формы условия непрерывности дифференцируемой в точке t функции х = ср (?) (по теореме 2 диффе- ренцируемая в точке ? функция х = ср (?) является непрерывной в этой точке). Итак, вся правая часть (10.16) имеет предел при Д?-> 0, и этот предел равен величине, стоящей в правой части (10.14). Теорема доказана. Замечание 1. Теорема 3 последовательно переносится на сложную функцию, являющуюся суперпозицией трех и большего чис- ла функций. Так, для случая сложной функции, являющейся суперпо- зицией трех функций у = F [/~(ф (0)]> правило дифференцирования име- ет вид: {F у (Ф (0)]}'=ЛГ(Ф (0)] -Г(ф (0) • ф'(0, (10.17) причем формула (10.17) справедлива при условии, что функция х = Ф (?) дифференцируема в данной точке ?, функция и =/(х) диффе- ренцируема в соответствующей точке х = ср(?), а функция y=F(u) дифференцируема в соответствующей точке и =f(x) =/[ф (?)]. Замечание!. При доказательстве теоремы 3 мы рассматрива- ли сложную функцию y=f(x), где х = ф (?), т. е. обозначили символом х промежуточный аргумент. Чаще удобнее бывает обозначать симво- лом х окончательный аргумент, т. е. рассматривать сложную функцию вида у = /[ф (х)]. Для этой функции правило дифференцирования сложной функции принимает вид: {/[ф (*)]}' =/' [ф (*)] • ф'(х). (10.18) Формула (10.18) отличается от формулы (10.14) заменой аргумента t на х. 3.2. Дифференцирование обратной функции Теорема 4. Пусть функция y=f(x) возрастает (или убывает) и непрерывна в некоторой окрестности точки х. Пусть, кроме того, эта функция дифференцируема в указанной точке х, и ее производная 234
{Г(у)} в этой точке f'(x) отлична от нуля. Тогда в некоторой окрестности соответствующей точки y-f(x) определена обратная для у-f(x) функция х = f~'(y), причем указанная обратная функция дифференци- руема в соответствующей точке у =/(х) и для ее производной в этой точке справедлива формула 1 (10.19) /'«’ Доказательство. Так как функция у =/(х) строго монотон- на и непрерывна в некоторой окрестности данной точки х, то в силу теоремы 10 § 5 гл. 9 обратная функция х -f~x{y) определена, строго монотонна и непрерывна в некоторой окрестности соответствующей точки у =f(x). Придадим аргументу этой обратной функции в указанной точке у произвольное достаточно малое и отличное от нуля приращение Ду. Этому приращению Ду отвечает приращение Дх=/~'(у +Ду)-/~’(у) обратной функции в соответствующей точке у =f(x), причем в силу строгой монотонности обратной функции указанное приращение Дх отлично от нуля. Это дает нам право написать следующее тождество: Дх _ 1 Ду Ду (10.20) Дх Устремим в тождестве (10.20) приращение Ду к нулю. Тогда в силу разностной формы условия непрерывности обратной функции х = /"’(у) в соответствующей точке у =f(x) приращение этой функции Дх также стремится к нулю. Для завершения доказательства теоремы остается убедиться в том, что правая часть (10.20) имеет предел при Дх-»0, равный где х — данная точка, поскольку тем самым будет доказано, что тот же самый предел имеет и левая часть (10.20), т. е. будет доказано, что обратная функция имеет производную в соот- ветствующей точке у = /(х), и для этой производной справедливо ра- венство (10.19). Так как х =/ “’(у), Дх =/_| (у + Ду) -/"’(у), то х + Дх =/ "1 (у + Ду), т. е. у + Ду =/(х + Дх) и Ду =f (х + Дх) -у =f (х + Дх) -f (х). Следовательно, правая часть (10.20)'может быть переписана в виде 1 _ 1 Ау /(х + Дх)-/(х)’ Дх Дх 235
откуда в силу определения производной /'(х) и предположения f'(x)*0 сразу же вытекает, что предел при Дх->0 правой части (10.20) существует и равен \lf\x). Поскольку а + Р = —, Теорема доказана. Доказанная теорема имеет простой геомет- рический смысл. Пусть М—точка графика фун- кции у =f (х), отвечающая данному значению аргумента х (рис. 10.3). Очевидно, производная f'(x) равна тангенсу угла наклона а касатель- ной, проходящей через точку М, к оси Ох, а производная обратной функции {/'"’(у)}' в соот- ветствующей точке у =f(x) равна тангенсу угла наклона р той же самой касательной к оси Оу. то формула (10.19) означает, что tgP = ——. tga 3.3. Инвариантность формы первого дифференциала В этом разделе мы докажем, что установленное в разд. 2.3 и опре- деляемое формулой (10.13) представление для дифференциала функ- ции у =f(x) dy =f(x)dx является универсальным и остается справедливым не только в слу- чае, когда аргумент х является независимой переменной, но и в слу- чае, когда аргумент х сам является дифференцируемой функцией вида х = <р (/) некоторой независимой переменной t. Это свойство дифференциала функции называется инвариантностью его фор мы. Пусть аргумент х дифференцируемой функции у =f(x) сам являет- ся дифференцируемой функцией вида х = ф (/) некоторой независимой : переменной t. Тогда у можно рассматривать как сложную функцию вида у =/[ф («)] аргумента t. Поскольку этот аргумент t является неза- висимой переменной, то для указанной сложной функции у =/[ф(0]и: для функции х = ф (0 дифференциалы представимы в форме (10.13), т. е. в виде dy = {/'[ф (?)]} 'dt, dx = <p'(t)dt. (10.21)-, По правилу дифференцирования сложной функции (формула (10.14)): {/ЪР (0]}'=Г(х)-Ф'(0. I
Подставляя (10.14) в первую формулу (10.21), полупим: dy-f'{x) • cpXfyfr- (10.22) Сопоставляя (10.22) со вторым из равенств (10.21), окончательно получим для dy выражение dy - f'(x)dx, совпадающее с представлением (10.13). Инвариантность формы (10.13) первого дифференциала функции dy установлена. Замечание. Из универсальности представления (10.13) выте- кает другая эквивалентная формулировка свойства инвариантности формы первого дифференциала: производная дифференцируемой функ- ции у =f (х) равна отношению дифференциала этой функции dy к дифференциалу ее аргумента dx, т. е. определяется равенством /'(х) = ^ (10.23) dx как в случае, когда аргумент х является независимой переменной, так и в случае, когда аргумент х сам является дифференцируемой функ- цией вида х = <р (t) некоторой независимой переменной t. Отношение —, стоящее в правой части (10.23), может быть исполь- dx зовано для обозначения производной функции у =f{x) по аргументу х. § 4. Дифференцирование суммы, разности, произведения и частного функций Теорема 5. Если каждая из функций и{х) и v (х) дифференцируема в данной точке х, то сумма, разность, произведение и частное этих функций {частное при условии, что значение v (х) 0) также диффе- ренцируемы в этой точке, причем справедливы формулы’. (и(х) ± v(x)]' = ii (х) ± v' (х), х (и(х) • v(x)]' = ii (x)v(x) + m(x)v' (x), u(x) _ ii (x)v(x) - »(x)v' (x) (10.24) . v(x)_ v2(x) Доказательство. Рассмотрим отдельно случаи суммы (со- ответственно разности), произведения и частного. 237
1. Пусть Xх)= м(х) ± Xх)- Обозначим символами Ди, Ду и Ду при- ращения функций и(х), Xх) и Xх) в данной точке х, отвечающие при- ращению аргумента х. Тогда, очевидно, Ду = у(х + Д*) _Хх)= [«(х + ± v(x + А^] ” (Xх) ± Xх)]= = [и(х + Дх) - и(х)] ± [Xх + Д’с) - Xх)] = Д“ ± Ду- Таким образом, = + (10.25) Дх Дх Дх Пусть теперь Дх—> 0. Тогда в силу существования производных функций и(х) и Xх) в точке х существует предел правой части (10.25), равный и'(х) ± v'(x). Стало быть, при Дх -> 0 существует предел и ле- вой части (10.25), равный (по определению производной) у'(х), и мы приходим к требуемому равенству у'(х) = и'(х) ± v'(x). 2. Пусть теперь Xх)= Xх)' Xх)- Сохраняя за Ди, Ду и Ду тот же ч смысл, что и выше, получим, что Ду = Xх + Ах) ~ Xх)= Xх + Ах) • Xх + ^) “ Xх)' Xх)= = [и(х + Дх) • Xх + Ах) “ Xх + Д*) ’ Xх)] + [Xх + Ах) • v(x) - и(х) • v(x)]. (Мы прибавили и вычли слагаемое и(х + Дх) v(x).) Далее можно записать: (10.26) Ду = и(х + Дх) [Xх + Ах) - Xх)] + Xх) [Xх + Ах) “ Xх)] ~ = и(х + Дх)Ду + у(х)Ди. Таким образом, Ду , . ч Ду / ч Ди -Х=и(х + Дх)- —+ v(x)-—. Дх Дх Дх Пусть теперь Дх -> 0. Тогда в силу дифференцируемости функций . ч , , „ Ди Ду ! и(х) и v(x) в точке х существуют пределы отношении — и —, соответ- Дх Ьх ственно равные и'(х) и v'(x). Далее, из дифференцируемости в точке х • функции и(х) в силу теоремы 2 следует непрерывность функции и(х) в этой точке. Следовательно, существует предел lim и(х + Дх), равный z ч Лг->0 Xх)- Таким образом, существует предел правой части (10.26) при4 Дх -» 0, равный и(х) • v'(x) + v(x) • и'(х). Следовательно, при Дх -> 0 су- -• шествует предел и левой части (10.26), который, по определению про- I изводной, равен у'(х), и мы приходим к требуемой формуле у'(х) = и'(х) v(x) + и(х) v'(x). . i 5 238
3. Пусть, наконец, у(х) = ^1. Тогда, поскольку v(x) * 0, по теоре- Xх) ме 2 § 2 гл.~9 об устойчивости знака непрерывной в данной точке х функции v(x + Дх) Ф 0 для всех достаточно малых Дх, и мы можем за- писать, что Ду= у(х + Дх) - Xх) = + А*) - —— = у(х + Дх) v(x) _ и(х + Дх) • v(x) - v(x + Дх) • u(x) v(x)v(x + Дх) Добавляя и вычитая в числителе слагаемое w(x) • Xх). получим ра- венство д _ [»(х + Дх) • у(х) - »(х) • у(х)] - [у(х + Дх) • м(х) - м(х) • у(х)] _ у(х) • v(x + Дх) _ у(х)[ц(х + Дх) - и(х)] - и(х)[у(х + Дх) - у(х)] _ у(х)Дц - »(х)Ду у(х) • v(x + Дх) v(x)v(x + Дх) Таким образом, у(х)-— -и(х)- — ДУ _ Дх Дх (10.27) Дх v(x) • v(x + Дх) Пусть теперь Дх -> 0. В силу дифференцируемости (и вытекающей из нее непрерывности) функций и(х) и v(x) в точке х существуют пре- делы lim — = ii (х), lim — = v' (х), д*->° Дх Лх~>0 Дх lim v(x + Дх) = v(x). Дх->0 Таким образом, поскольку Xх) * 0, существует предел при Дх -> 0 правой части (10.27), равный у(х) • U (х) - и(х) • у' (х) у2(х) Следовательно, при Дх —> 0 существует предел и левой части (10.27), равный, по определению производной, у'(х), и мы получим требуемую формулу У'(х) = w’ (х) • v(x) - у' (х) • и(х) у2(х) 239
Теорема 5 полностью доказана. Следствие из теоремы 5. Если для функций и(х) и v(x) выполнены в данной точке х те же предположения, что и в теореме 5, то в этой точке х справедливы следующие соотношения для дифференциалов: ' d(u + v) = du±dv, < d(u • v) = vdu + udv, ( u\ vdu-udv (10.28) Для установления соотношений (10.28) достаточно умножить каж- дое из равенств (10.24) на dx и воспользоваться универсальным пред- ставлением (10.13) дифференциала произвольной функции у =/(х). § 5. Производные простейших элементарных функций В настоящем параграфе мы вычислим и систематизируем производ- ные простейших элементарных функций: показательной функции у = ах и логарифмической функции у = logo х, рассматриваемых для любого фиксированного значения а такого, что 0<а*1, степенной функции у = ха, где а — фиксированное вещественное число, четырех тригоно- метрических функций у = sin х, у = cos х, у = tg х и у = ctg х и четырех обратных тригонометрических функций y = arcsinx, y = arccosx, у = arctg х и у = arcctg х. 5.1. Производные тригонометрических функций 1°. Производная функции у = sin х. Так как для этой функции Ду = sin(x + Дх) - sin х = 2cos (х + -^ j • sin то при любом Дх#0 разностное отношение имеет вид . hx . / . xSin- Ду ( Дх 1 7 — =соя х + — ----- Ьх V 2 J Дх По определению производной (sin х)' = lim — = lim Дх—>0 /\у Дх—>0 . Дх sm — ___2_ Ьх (10.29) 2 240
(10.30) =cosx. В силу непрерывности функции у = cos х в любой точке х беско- нечной прямой hmcosl х +— д»-»о 2 Далее, в силу первого замечательного предела (см. разд. 7.2 гл. 9) Дг и элементарной замены переменной t - — (t -> 0 при Дх -> 0): . Дх sm — i- 2 i- sin Г , lim--------— = lim-----------= 1. Д»-»0 Дх »-»0 / . T (10.31) Из существования пределов (10.30) и (10.31) и из теоремы 3 § 4 гл. 8 о пределе произведения двух функций вытекают существование преде- ла в правой части (10.29) и равенство Итак, (sinx)'= lim< Дх->0 sin--- 2 ► =cosx. (sin х), = cosx (10.32) 2 для любой точки х бесконечной прямой. 2°. Производная функции у = cos х. Так как для любой точки х бесконечной прямой . Г л cos х = sin —х , U ) то по правилу дифференцирования сложной функции (см. разд. 3.1) и по формуле (10.32) (cos х)' = sin —-х I 2 = cost -х 1 • (-1) = -sinx. Итак, (cosx)'= - sinx (10.33) Для любой точки х бесконечной прямой. 3°. Производная функции у- tgx. Так1 как tgx= smx, то по пра- COSX вилу дифференцирования частного (см. § 4) и в силу соотношений (10.32) и (10.33) в любой точке х, в которой cosx^O, 241
(tgx)' = sinx cosx (sinx)*cosx - (cosx)*sinx _ cos2 x + sin2 x _ 1 cos2x cos2x cos2x Итак, (tgx)' =—^- = l + tg2x (10.34) cos x в любой точке хф — + пп, где л = 0, ±1, ±2, ... . 2 4°. Производная функции у = ctg х. Так как ctgx = —то в силу sinx правила дифференцирования частного и соотношений (10.32) и (10.33) в любой точке х, в которой sinx^O, f fcosx'l (cosx)'sinx-(sinx)'cosx -sin2x-cos2x -1 (ctg x) = --- = ---------=-------—-------= — VSinx J sin X sin X sin X Итак, (ctg x)' = --= - (1 +ctg2x) (10.35) sin x в любой точке x*nn, где л = 0, ±1, ±2, ... . 5.2. Производная логарифмической функции Пусть у = logoх, где 0<а*1, х>0 — фиксированная точка. Тогда для любого достаточно малого Дх*0 Ay _loga(x + Ax)-logax_ 1 lo£ + = Дх Дх Дх Л х ) Г lx. (< , Дх ) 1 . (1 , Дх = —— • loga 1 + — =--loge 1 + — • X Дх V X ) X V X ) По определению производной X п 1- Ду 1 к 1 Л AxV» (logax) = hm —= -hmlog„ 11 + — Дх-*0 Ду < Дх—>0 I I (10.36) В силу второго замечательного предела (см. разд. 7.3 гл. 9) и эле- | ментарной замены t = — (так как х > 0 фиксировано, то t = — —> 0 J х х S is при Ах -» 0) 242
lim Дх->0 = lim (1 + /) l->0 е. (10.37) Из существования предела (10.37) и из непрерывности функции у = loga х в точке х = е (см. разд. 6.3 гл. 9) вытекает, что предел правой 1 части (10.36) существует и равен — logoe. х Итак, (log. х)'-Ilog./ (10-38) X для любых 0 < а * 1 и х>0. В частности, при а = е (1пх)' = - для любого х>0. X 5.3. Производные показательной и обратных тригонометрических функций 1°. Производная функции у = ах (0 < а * 1). Так как функция у = ах, определенная на всей бесконечной прямой -оо<х<+со, явля- ется обратной для функции у = loga х, определенной на полупрямой 0 < у < +оо, и для функции у = loga х в окрестности любой точки у по- лупрямой 0 < у < +оо выполнены все условия теоремы 4, то в силу этой теоремы функция у = ах Дифференцируема в любой точке х = logay и для ее производной в этой точке справедлива формула (log, У)’ — logoe 1о^е’ У Из полученного равенства в силу элементарного соотношения -----= lna и соотношения у = ах окончательно получим bge е (ах)'= ах • 1п а (10.39) Для любой точки х бесконечной прямой. В частности, при а = е получим, что (6*)' = ^. 2° Производная функции у = arcsin х. Так как функция у = arcsin х, определенная на интервале -1 <х<+1, является обратной для функ- ции x = siny, определенной на интервале < у< +—, и для функции 243
F х = sin у в окрестности любой точки у интервала ——< у< +— выполне- ны все условия теоремы 4, то по этой теореме функция у = arcsin х дифференцируема в любой точке х = sin у и для ее производной в этой точке справедлива формула '' (arcsin х)' - —-— = —-— = 1 - (10.40) । (sin уУ cosy ^1 —sin2y Мы взяли перед корнем знак «+» в силу того, что cosy положите- я я лен всюду на интервале —< у< +—. 2 2 Учитывая, что sin у = х, мы окончательно получим из (10.40) что / • v 1 (arcsin х) = • -.. VI -х2 для всех х из интервала - 1 <х<+1. 3°. Производная функции у = arccos х. Так как функция у = arccos х, определенная на интервале - 1 <х<+1, является обратной для функ- ции x = cosy, определенной на интервале 0<у<л, и для функции x = cosy в окрестности любой точки у интервала 0<у<л выполнены все условия теоремы 4, то по этой теореме функция у = arccos х диф- ференцируема в любой точке x = cosy и для ее производной в этой точке справедлива формула (arccos х)' = —-— = —-— = —- -1— ' (Ю.41) (cosy)' -sin у -^/1-cos2 у Мы взяли перед корнем знак «-» в силу того, что sin у положителен всюду на интервале 0<у<я. Учитывая, что cosy = х, мы окончательно получим из (10.41), что , v 1 (arccos х) =—------ 71-х2 для всех х из интервала - 1 <х<+1. 4°. Производная функции у = arctg х. Так как функция у = arctg х, определенная на бесконечной прямой -оо<х<+оо, является обратной для функции x = tgу, определенной на интервале -—< у< +—, и для фун- 2 2 . - я я , кции х = tgy в окрестности каждой точки у интервала —< у< +— вы- 244
полнены все условия теоремы 4, то по этой теореме функция у = arctg х дифференцируема в каждой точке х = tgy и для ее производ- ной в этой точке справедлива формула 1 1 (arctg х) =--------=-------— =--------. (tgy)' 1 + tg у 1+х2 Итак, / ♦ v 1 (arctg х) = --- 1+х2 для любой точки х бесконечной прямой. 5°. Производная функции y = arcctgx. Так как функция y = arcctgx, определенная на бесконечной прямой -оо<х<+оо, явля- ется обратной для функции x = ctgy, определенной на интервале О < у < л, и для функции х = ctgy в окрестности каждой точки у интер- вала 0 < у < п выполнены все условия теоремы 4, то по этой теореме функция у = arcctgx дифференцируема в каждой точке x = ctgy и для ее производной в этой точке справедлива формула (ctgy)' - (l+ctg2y) 1 + х2 Итак, , t v 1 (arcctgx) = -------------------------- 1+х2 для любой точки х бесконечной прямой. 5.4. Производная степенной функции Пусть у = х“, где а — любое вещественное число, х — любая точка полупрямой 0 < х < +оо. Заметим, что степенную функцию у = х“ мож- но представить как суперпозицию логарифмической и показательной функций у =х“ = (alog,x)“ =aalog'x, где а — любое фиксированное число, превосходящее единицу. По правилу дифференцирования сложной функции у = а", где и = а • loga х, получим у' - (а")' • (а • logox)' = a“ • Ina - а • — loge e = aolog'x - а • —= X X = ха -а — =а -х0"1. х 245
Итак, окончательно (х“)' = а-х“ 1 для любого х>0. 5.5. Таблица производных простейших элементарных функций Соберем теперь в таблицу все вычисленные нами производные простейших элементарных функций. 1. (ха)' = а-ха-' (х>0). В частности, — =—(7х)' =—;=. х2 14х 2. (logax)' = — logoе (0<а*1, х>0). х В частности, (1пх)' = -. х 3. (а*)'= a*-In а (0<а?И). В частности, (er)' = et. 4. (sin х)' = cosx. 5. (cosx)'= - sinx. 1 ( л 6. (tgx), = —— = l + tg2x х* —+ Jtn, гдеп = 0, ±1, ... . cos x k 2 J -1 , 7. (ctgx)' = —— = -(1 + ctg x) (х^лп, где л = 0, ±1, ...). sin Л 8. (arcsin x)z = (-I<x<+1). VI-x2 9. (arccos x)' = —( -1 <x < +1). Vl-x2 10. (arctgx)' = ——. 1 + x2 11. (arcctgx)' = -—i-rr. 1+x2 Установленная нами таблица производных вместе с правилами ’ дифференцирования сложной функции, а также правилами дифферен- J. цирования суммы, разности, произведения и частного составляет вы- числительный аппарат той части математического анализа, которую принято называть дифференциальным исчислением. г Из приведенной таблицы производных и правил дифференцирова- ния суммы, разности, произведения, частного и сложной функции вы- ? текает следующий важный вывод: производная любой элементарной < К 246
функции представляет собой также элементарную функцию, т. е. операция дифференцирования не выводит нас из класса элементарных функций. 5.6. Таблица дифференциалов простейших элементарных функций В силу определения дифференциала функции таблица производных сразу же приводит нас к соответствующей таблице дифференциалов простейших элементарных функций. 1. d (ха) = а. • ха~1 • dx (х>0). В частности, d\ — | = -Д--с£с, cZ(7x) = —~tZx. UJ х2 2у[х 2. d (loga х) = — log0 е • dx (0 < а * 1, х > 0). х dx В частности, d (In х) = —. х 3. d (cf) = с? In а • dx (0<а?И). В частности, d (еЛ) = ev • dx. 4. d (sin x) = cos x • dx. 5. d (cos x) = - sin x • dx. 6. <Z(tgx) = —= (1 + tg2x)cfr (x*— + itn, n = 0, ±1, ... |. cos x 12 J 7. cZ (ctgx) =—y—= - (1 + ctg2 x)dx (x*nn, n = 0, ±1, ...). sin x dx 8. d(arcsinx) = (-l<x<+l). 9. d (arccos x) = (- 1 < x < +1). Vl-x2 10. J (arctg x) = . 1+x2 11. d (arcctg x) = — 1+x2 5.7. Использование дифференциала для установления приближенных формул * Хотя, как было показано выше, дифференциал dy функции у =/(х) не равен приращению Ду этой функции, однако с точностью до беско- нечно малой более высокого порядка, чем Дх, справедливо приближен- ное равенство Ду»</у. (10.42) 247
Относительная погрешность этого равенства становится сколь угодно малой при достаточно малом Дх. (Относительная погрешность равенства (10.42) определяется отношением ———. По определению Дх дифференциала Ду - dy - о (Дх).) Формула (10.42) позволяет приближенно заменить приращение Ду функции у=f(x) ее дифференциалом dy. Преимущество такой замены состоит в том, что дифференциал dy зависит от Дх линейно, в то время как приращение Ду, вообще говоря, представляет собой более слож- ную функцию от Дх. Из формулы (10.1) для приращения функции Ду и формулы (10.12) для дифференциала dy вытекает следующая форма приближенного ра- венства (10.42): или , /(х + Дх)-/(*)«/'(*)Дх f(x + Дх) »/(х) +/'(х)Дх. (10.43) Формула (10.43) позволяет приближенно заменить функцию f для значений аргумента, близких к х (т. е. для малых Ах), линейной функ- цией. В частности, из формулы (10.43) может быть получен ряд прибли- женных формул. Так, полагая f(x) = (1 +х)1/я, х = 0, получим, что. (1 + Дх)1/п«1+—. (10.44) п Полагая f (х) = sin х, х = 0, получим sinAx»Ax. (10.45) Полагая /(х) = 6е, х = 0, получим е^яН+Дх. „ (10.46) Полагая /(х) = In (1 +х), х = 0, получим In (1 + Дх) as Дх. (10.47) Каждое из равенств (10.44) — (10.47) справедливо с точностью до бесконечно малой более высокого порядка, чем Дх. 5.8. Логарифмическая производная. Производная степенно-показательной функции Пусть функция у = f(x) положительна и дифференцируема в дан- ной точке х. Тогда и сложная функция аргумента х вида w = lay, где у = /(х), в силу теоремы 3 будет также дифференцируема в указанной 248
точке х, причем для производной этой сложной функции по аргументу х будет справедлива формула [InЛ*)]' = (Inу)' -у' = ^ = (1048) У /(*) Выражение (10.48) принято называть логарифмической производной функции у = f(x) в данной точке х. Логарифмическая производная может быть использована для вы- числения производных некоторых функций, не являющихся простей- шими элементарными. В качестве примера вычислим производную так называемой сте- пенно-показательной функции, т.е. функции вида у = u(x)v(r\ где и(х) и v(x) — две функции, дифференцируемые в данной точке х, первая из которых и(х) строго положительна в этой точке. Тогда функция w= In у = v(x) • 1пи(х) будет дифференцируема в данной точке х, поскольку в силу теоремы 3 функция In и(х) диффе- ренцируема в точке х, и на основании теоремы о дифференцируемости произведения двух дифференцируемых функций можно утверждать дифференцируемость в данной точке х функции w = In у = v(x) • In u(x), причем в силу второй формулы (10.24) (Inу)' = v'(x) In u(x) + v(x) [In w(x)]' = v'(x) In u(x) + v(x) ——(Ю-49) и(х) Из (10.48) и (10.49) следует, что — = v'(x) • In w(x) + v(x) У u(x) Учитывая, что у = u(x)v(x), окончательно получим следующее выра- жение для производной степенно-показательной функции: [K(x)vWy=«(x),'w v' (х) In и(х) + v(x) (10.50) § 6. Производные и дифференциалы высших порядков 6.1. Понятие производной /i-го порядка Как уже отмечалось в § 1, производная f'(x) функции у=/(х), определенной и дифференцируемой на интервале (а, Ь), представляет собой функцию, также определенную на интервале (а, Ь). Может слу- читься, что эта функция /'(х) сама является дифференцируемой в не- которой точке х интервала (а, Ь), т. е. имеет в этой точке производ- 249
ную. Тогда указанную производную называют второй пр о и з - в о д н о й (или п р о и з в о д н о й второго п о р я д к а) функ- ции у =f(x) в точке х и обозначают символом/(2)(х) или у(2)(х) (иногда используют символы f"(x) или у"(х)). После того как введено понятие второй производной, можно по- следовательно ввести понятие третьей производной, затем четвертой производной и т., д. Если предположить, что нами уже введено поня- тие (л - 1)-й производной и что (л - 1)-я производная дифференцируе- ма в некоторой точке х интервала (а, Ь), т. е. имеет в этой точке произ- водную, то указанную производную называют п-й производ- ной (или производной л - го порядка) функции у =f(x) в точке х и обозначают символом /("\х) или у("\х). Таким образом, мы вводим понятие л-й производной индуктивно, переходя от первой производной к последующим. Соотношение, опре- деляющее л-ю производную, имеет вид уИ = ^п-1)у (10.51) Функцию, имеющую на данном множестве {х} конечную произ- водную порядка п, обычно называют «раз дифференцируе- мо й на данном множестве. Производные высших порядков нахоДят многочисленные применения в физике. Например, механический смысл второй производной заключается в следующем: если функция у =/(х) определяет закон движения материальной точки по прямой ли- нии, то первая производная, как мы уже знаем, дает мгновенную ско- рость движущейся точки в момент времени х, а вторая производная /(2)(х) равна скорости изменения скорости, т. е. ускорению дви- жущейся точки в момент времени х. Заметим, что методика вычисления производных высшего порядка' предполагает умение вычислять только производные первого порядка. В качестве примера вычислим л-е производные некоторых простейших элементарных функций. 6.2. л-е производные некоторых функций 1°. Вычислим л-ю производную степенной функции у = х“ (х > О, а —любое вещественное число). Последовательно дифференцируя, по- , лучим у' = аха-1, у(2) = а(а-1)х“’2, у(3) = а(а-1)(а-2)ха‘3, ... Отсюда легко уяснить общий закон (х“Уп) = а(а -1)(а -2)...(а -и + 1)ха’я. 250 J
Строгое доказательство этого закона легко проводится методом ин- дукции.т 2°. Вычислим л-ю производную показательной функции у = а* (О < а Ф 1). Последовательно дифференцируя, получим у' = d • In а, у(2) = о* • ln2a, у(3) = d • 1п3а, ... Общая формула, легко устанавливаемая по методу индукции, име- ет вид (аж)(я) = ^1п"а. В частности, (^)(п) = Л 3°. Вычислим л-ю производную функции у = sin х. Первую произ- „ , , . ( n 'l водную этой функции можно записать в виде у = cos х = sm I х + — I. Таким образом, дифференцирование функции у = sin х прибавляет к аргументу этой функции величину Отсюда получаем формулу (sin х)(л) = sin ^х + л . 4°. Совершенно аналогично устанавливается формула (cos х)(и) = cos ^х + п . б.З. Формула Лейбница для л-й производной произведения двух функций Следующее правило носит название формулы Лейбница: (и • v)w = им • v + C\ul^V+C*u(n-2)vm + +С3„и(п-\т +...+ u-v(n\ (10-52) Легко заметить, что формула Лейбница совпадает с формулой раз- ложения бинома (u + v)n, лишь вместо степеней и и v стоят производ- ные соответствующих порядков. Это сходство становится еще более полным, если вместо самих функций и и v писать соответственно и(0) и v(0) (т. е. если рассматривать саму функцию как производную нулевого порядка). Докажем формулу Лейбница по индукции. При л = 1 эта формула принимает вид (и • v)' = и' • v + и • v', что совпадает с установленным выше правилом дифференцирования произведения двух функций. Поэ- тому достаточно, предположив справедливость формулы (10.52) для 251
некоторого номера п, доказать ее справедливость для следующего но- мера (n + 1). Итак, пусть для некоторого номера п формула (10.52) вер- на. Продифференцируем эту формулу и объединим слагаемые, стоя- щие в правой части, следующим образом: (и • v)(n,1) = u(w° v + [С® и^'+С'и^ у' ] + +[су^Чсу--%и]+ „ (Мы воспользовались тем, что 1 = С ®.) Из § 3 гл. 1 известно, что" для любого номера к, не превосходящего п, справедлива формула ск„ +ск-' =Ск п П ЛН’ воспользовавшись которой, мы можем следующим образом переписать равенство (10.53): (и v)(wl) = u™v + C^v'^u^v^ +...+«• v™ Тем самым доказана справедливость формулы (10.52) для номера (п + 1). Вывод формулы Лейбница завершен. Пример. Вычислим n-ю производную функции у = х3ех. Воспо- льзуемся формулой Лейбница, положив в ней и = ех, v = х3. Тогда дЛЯ любого номера к, v’ = Зх2, v(2) = 6х, v(3) = 6, v(4) = v(5) =... = 0. Получим у(л) = (х3 + Зих2 + Зп (п - 1) х + п (л - 1) (п - 2)) ех. Рассмотренный пример показывает, что формула Лейбница особен- но эффективна в тех случаях, когда одна из перемножаемых функций имеет лишь конечное число отличных от нуля производных. 6.4. Дифференциалы высших порядков В рассуждениях данного раздела мы будем использовать для обо- значения дифференциала наряду с символом d также и символ 5 (т. е. при повторном взятии дифференциала вместо dxu dy будем писать 8х и 8у). Рассмотрим установленное выше выражение для первого диффе- ренциала дифференцируемой в данной точке х функции y=f(x): dy =f'(x) dx. (10.54) . Предположим, что правая часть (10.54) является функцией аргу- мента х, дифференцируемой в данной точке х. Для этого достаточно потребовать, чтобы функция у =f(x) была 2 раза дифференцируемой в данной точке х, а аргумент х являлся либо 252
независимой переменной, либо дважды дифференцируемой функцией некоторой независимой переменной t. При этих предположениях мы можем рассмотреть дифференциал 5 (dy) = 3 l/'Wrfr] от обеих частей равенства (10.54). Определение 1. Значение 3 (dy) дифференциала от первого диффе- ренциала (10.54), взятое при 5х = dx, называется вторым диф- ференциалом функции у =f(x) (в данной точке х) и обозначает- ся символом d2y. Итак, по определению1, d2y= {3 (Jy)}|&=rfx = {5 [f'(x)dx]} 1^. Дифференциал d"y любого порядка п вводится по индукции. Пред- положим, что уже введен дифференциал dn~xy порядка л-1 и что функция у = f(x) является п раз дифференцируемой в данной точке х, а ее аргумент х является либо независиомй переменной, либо л раз диф- ференцируемой функцией некоторой независимой переменной t. Определение 2. Значение §(dn~xy) дифференциала от (л-1)-го дифференциала dn~ly, взятое при 5x = dx, называется л - м д и ф - ференциалом функции у =f (г) (в данной точке х) и обозначает- ся символом dny. Итак, по определению, dny = {5 (</л-1у)}|&1Л. При вычислении второго и последующих дифференциалов следует существенно различать два случая: 1) когда аргумент х является независимой переменной, 2) когда аргумент х является соответствую- щее число раз дифференцируемой функцией некоторой независимой переменной t. В случае, когда х является независимой переменной, мы имеем право считать, что dx не зависит от х и для всех х равен од- ному и тому же приращению аргумента Ьх. При этом мы получим, что 8 (dx) = (dx)' • 8х = 0. Последнее соотношение и .правило дифференци- рования произведения двух функций позволяют нам записать следую- щую цепочку равенств: d2y = {8 (ф)}|ь=л = {8 У'(х)Л]}|^л = = {8 \f’(x))dx +f'(x) 8(Л)}|^ = {8 \f'(x)) = (10 55) = {Р\х) • 8х • Л}| =/(2)(х) • (dx)2. 1 Символ {...} 1^,^ означает, что в выражении, заключенном в фигурные скобки, следует положить равным dx. 253
Итак, в случае, когда аргумент х является независимой перемен- ной, для второго дифференциала функции у =f(x) справедливо пред- ставление d2y=f2\x)-(dx)2. (10.56) Совершенно аналогично по индукции легко убедиться в том, что в случае, когда аргумент х является независимой переменной, для п-го дифференциала л раз дифференцируемой функции у =f(x) справедли- во представление: <1пу=/(пХх)-(с1х)". Таким образом, для случая, когда аргумент х является независи- мой переменной, производная порядка п функции у =f(x) равна отно- . шению п-го дифференциала этой функции dny к п-й степени диффе- ренциала аргумента dx. Совсем другой вид имеют представления второго и последующих дифференциалов в случае, когда аргумент х является соответствующее число раз дифференцируемой функцией некоторой независимой пере- менной t. Установим выражение для второго дифференциала 2 раза диффе- ренцируемой в данной точке х функции у =f (х), аргумент х которой является 2 раза дифференцируемой функцией некоторой независимой переменной t. Повторяя рассуждения из цепочки (10.55), мы на этот раз получим, что = {/^(х) • 5х • dr}|+ {f\x). 5(Л)}|&=Л. В силу определения второго дифференциала функции у = х спра- ведливо равенство {5 = d2x, с помощью которого мы прихо- дим к представлению d2y = /(2)(х) • (dx)2 +f'(x) d2x. (10.569 Сравнивая представление (10.567) с представлением (10.56), мы убедимся в том, что (в отличие от первого дифференциала) второй дифференциал уже не обладает свойством инвариантности формы. Тем более не обладают свойством инвариантности формы последу- ющие дифференциалы. § 7. Дифференцирование функции, заданной параметрически Пусть х и у заданы как функции некоторого параметра t: х = <р(0, у = \|/(Z). Предположим, что <р(/) и \|/(<) имеют нужное число производ- ных по переменной t в рассматриваемой области изменения этой пере- менной. Кроме того, предположим, что функция х = <р(г) в окрестности 254
рассматриваемой точки имеет обратную функцию t = <p-I(x). Послед- нее предположение дает нам возможность рассматривать у как функ- цию аргумента х. Поставим задачу о вычислении производных у по аргументу х. Эти производные договоримся обозначать символами у?, у(х>\ ... В силу свойства инвариантности формы первого дифференциала мы можем записать, что /=—, dy=y'(f)dt, dx = ql(t)dt (10’57) dx (dy и dx мы берем в одной и той же точке t и для одного и того же dt). Из этих формул получим следующее выражение для первой произ- водной: v« = У'(0 (10.58) у- «<) Аналогично вычисляются производные высших порядков. Так, для вычисления второй производной уУ? достаточно представить ее в виде dx и воспользоваться формулой (10.58), третьей из формул (10.57) и пра- вилом дифференцирования частного. Пример. Вычислить первую и вторую производные функции, заданной параметрически: x = a(t-sint), y = a(l-cos t), — оо< t<<x>. Кривая, определяемая этими уравнениями, называется циклои- дой. Получим , asint t t . yx =---------= ctg - (t* 2nk, к — целое), a(l-cost) 2 “О"005') 4asin4- 2 255
§ 8. Производная векторной функции Если каждому значению переменной t из некоторого множества {/} ставится в соответствие по известному закону определенный вектор а, то говорят, что на множестве {/} задана векторная функция а = a(t). Так как каждый вектор а в заданной в пространстве декартовой прямоугольной системе координат однозначно определяется тремя ко- ординатами х, у и г, то задание векторной функции а = a(t) эквивален- тно заданию трех скалярных функций х = x(t), у = y(t) и z = z(t). Рис. 10.4 Зададим аргументу в точке Понятие векторной функции при- обретает особую наглядность при обращении к так называемому г о - д о г р а ф у (т. е. к геометрическому месту концов всех векторов а = a(t), приложенных к началу координат О). На рис. 10.4 кривая L представ- ляет собой годограф векторной фун- кции а = a(t). Введем понятие производ- ной векторной функции а = a(t) в | данной фиксированной точке t. t произвольное приращение и рассмотрим соответствующий вектор приращения Да = a(t + Д<) - a(f). —> На рис. 10.4 указанный вектор совпадает с МР. „ „ 1 Умножив указанный вектор на число —, мы получим новый век- тор ^=±.[а(г + Д/)-а(0], Д/ Д/ (10.59) коллинеарный прежнему. Этот вектор (10.59) является аналогом разно- стного отношения (10.4). Вектор (10.59), очевидно, представляет собой среднюю скорость изменения векторной функции на сегменте [/, / + Д/]. Производной векторной ф у н к ц и и а = a(t) в дан- ной фиксированной точке t называется предел при Д/ —> 0 вектора (10.59) (при условии, что этот предел существует). Для обозначения производной векторной функции а = a(t) исполь- Z/A ^4 зуют символы a (t) или —-. dt 256 J
Из геометрических соображений очевидно, что производная век- торной функции а = a(t) представляет собой вектор, касательный к го- дографу этой функции. Так как координаты разностного отношения (10.59) равны соответ- ственно x(t + St)-x(t) y(t + А0 - y(t) z(t + Af) - z(t) St St - St ’ то ясно, что координаты производной a'(f) равны производным x'(t), y'(t), z'(t). Таким образом, вычисление производных векторной функ- ции сводится к вычислению производных ее координат. Замечание. Так как векторная функция а = a(t) определяет за- кон движения материальной точки по кривой L, представляющей со- бой годограф этой функции, то производная a'(t) равна скорости дви- жения по указанной кривой.
Глава 11 Теоремы о дифференцируемых функциях и их приложения § 1. Возрастание (убывание) функции в точке. Локальный экстремум 1.1. Возрастание (убывание) функции в точке Будем говорить, что определенная в некоторой окрестности точ- ки Хо функция f(x) возрастает (соответственно убывает) в т о ч к е Хо, если существует такая достаточно малая окрест- ность точки Хо, в пределах которой /(х) >/(хо) при х > XQ,f(x) </(х0) при х<хо (соответственно /(х)</(х0) при х>хо, /(х)>/(хо) при х < Хо) . Функция /(х), график которой изображен на рис. 11.1, убывает в точке х0 и возрастает в точке х,. Теорема 1 (достаточное усло- вие возрастания или убывания дифференцируемой в данной точке функции). Если функция f(x) имеет производную в точке хо и Г(хй) > 0 (соответственно /'(хо)<О), то функция /(х) возрас- рис jj j тает (соответственно убывает) в точке xq. Доказательство. Ради определенности будем рассматри- вать случай f'(xo)>O (случай /'(хо)<О рассматривается совершенно аналогично). Так как по определению производная f'(x0) равна преде- лу при х -> хо разностного отношения f(x)-f(x0) (Ц.1) 9 то в малой окрестности точки хо разностное отношение (11.1) как угодно мало отличается от/'(*о), и так как/'(хо) >0, то в достаточно малой окрестности точки хо разностное отношение (11.1) положитель-* но. Это означает, что в указанной достаточно малой окрестности этой точки/(х)-/(х0)>0 при х-хо>О и/(х)-/(хо)<0 при Х-Хо<О, или, что то же самое,/(х)>/(хо) при х>хо и /(х) </(х0) при x<xq. Теорема доказана.
Замечание. Подчеркнем, что положительность (соответствен- но отрицательность) производной /'(х0) не является необходимым условием возрастания (соответственно убывания) функции f (х) в точке х0. В качестве примера укажем функцию /(х) =х3, которая возрастает в точке х = 0 и тем не менее имеет в этой точке производную/'(0) = 0. 1.2. Локальный экстремум функции Будем говорить, что определенная в некоторой окрестности точ- ки хо функция Дх) имеет в точке Хо л о к а л ъ ны й м а к симу м (соответственно локальный, минимум), если существует такая достаточно мцлая окрестность точки хо, в пределах которой значение Дхо) является наибольшим (соответственно наименьшим) среди всех значений f (x) этой функции. На рис. 11.1 изображена функция Дх), имеющая локальный макси- мум в точке с. Локальный максимум и локальный минимум объединяются общим названием локальный экстремум. Теорема 2 (необходимое условие локального экстремума диф- ференцируемой в данной точке функции). Если функция f (х) диффе- ренцируема в точке Хо и имеет в этой точке локальный экстремум, то /'(х0) = 0. Доказательство. Заметим, что функция Дх), имеющая в точке хо локальный экстремум, не может в этой точке хо ни возрастать, ни убывать. Следовательно, в силу теоремы 1 производная /'(хо) не может быть ни положительна, ни отрицательна, т. е. /'(хо) = 0. Теорема доказана. Теорема 2 имеет простой геометрический смысл: она утверждает, что если в точке кривой y=f (х), которой соответствует локальный эк- стремум функции /(х), существует касательная к графику функции У=/(х), то эта касательная параллельна оси Ох (см. рис. 11.1). § 2. Теоремы Ролля и Лагранжа и их следствия 2.1. Теорема Ролля Теорема 3 (теорема Ролля). Если функция Дх) непрерывна на сег- менте а<х<Ь и имеет производную во всех внутренних точках это- го сегмента и если, кроме того, f(a)=f (b), то внутри этого сегмен- та найдется точка производная /'(£) в которой равна нулю. Доказательство. Поскольку функция f (х) непрерывна на сегменте а х < Ь, то по доказанной в разд. 9.2 гл. 9 второй теореме 259
Вейерштрасса она достигает на этом сегменте своих максимального и минимального значений. Пусть сначала функция f(x) является постоянной на сегменте а<х<Ь, т. е. для всех х из этого сегмента f(x)=f(a)=f(b). В этом случае производная /'(£) равна нулю в любой точке сегмента а £ х < Ь. । Пусть теперь f (г) не является постоянной на сегменте а < х < Ь. Тогда хотя бы в одной внутренней точке х этого сегмента значение f(x) не равно f(a). Пусть ради определенности это значение удовлет- воряет условию f{x)>f{a). Тогда максимальное значение функции /(х) на сегменте а<х<Ь достигается в некоторой внутренней точке % этого сегмента, т. е. функция f(x) имеет в этой точке % локальный мак- симум, и f'(g) = 0 (по теореме 2). Теорема доказана. Теорема Ролля имеет простой геометриче- ский смысл: если крайние ординаты кривой у =f(x) равны, то, согласно теореме Ролля, на кривой y-f(x) найдется точка, в которой ка- сательная к кривой параллельна оси Ох (рис. 11.2). 2.2. Теорема Лагранжа Теорема 4 (теорема Лагранжа). Если функция f(x) непрерывна на сегменте а<х<Ь и имеет производную во всех внутренних точках этого сегмента, то внутри этого сегмента найдется точка % такая, что справедливо равенство f(b)-f(a)=f'(®(b-a),. (И.2) называемое формулой Лагранжа. Доказательство. Рассмотрим на сегменте а < х < b вспомо1- гательную функцию F (х) =/(х) -/(а) ~ ~ /(Д) (х ~ а) b-а (И.з; и заметим, что для этой функции выполнены на сегменте а < х < b все условия теоремы Ролля. Действительно, функция F(x) непрерывна на сегменте а < х < b (как разность непрерывной функции f (х) и линейной , функции) и имеет во всех внутренних точках этого сегмента производ- ную Ь-а 260
Из равенства (11.3) очевидно, что F(a) = F(b) = 0. В силу теоремы 3 внутри сегмента а < х < b найдется точка такая; что f(a)=Q. b-a Теорема доказана. Замечание. Подчеркнем, что в формуле (11.2) вовсе не обяза- тельно считать, что b > а. выяснения геометрического смысла теоремы Лагранжа заме- f(b) -f(a) ,, тим, что величина — является угловым коэффициентом секу- Ь-а щей, проходящей через точки А(а, f (а)) и B(b, f (b)) кривой у =f(x), а /'(£) является угловым коэффициентом каса- тельной к кривой у =f(x), проходящей через точку С(£, f (£)). Формула Лагранжа (11.2) означает, что между точками А и В найдется такая точка С, касательная в которой парал- лельна секущей АВ (рис. 11.3). 2.3. Постоянство функции, имеющей на интервале равную нулю производную Теорема 5. Если функция f(x) дифференцируема на интервале (а, Ь) и если всюду на этом интервале f'(x) = 0, то функция f(x) является постоянной на интервале (а, Ь). Доказательство. Пусть хо — некоторая фиксированная точ- ка интервала {а, Ь), а х — любая точка этого интервала. Поскольку сегмент, ограниченный точками х и х0, целиком принад- лежит интервалу (а, Ь), то функция f(x) дифференцируема (а стало быть, и непрерывна) всюду на этом сегменте. Это дает.нам право,при- менить к функции f (х) на указанном сегменте теорему Лагранжа, со- гласно которой внутри этого сегмента найдется точка £ такая, что, /(х)-/(х0) = (х-х0)/1й)- (11-4) По условию производная функции /(х) равна нулю всюду в интер- вале (а, Ь). Стало быть, /'(Q =0, и из формулы (11.4) мы получим, что /(х)=/(хо). (11-5) Равенство (11.5) утверждает, что значение функции /(х) в любой точке х интервала (а, Ь) равно ее значению в фиксированной точке хо. Это и означает, что функция/(х) постоянна всюду на интервале (а, Ь). Теорема доказана. 261
Теорема 5 имеет простой геометрический смысл:- если касательная в каждой точке некоторого участка кривой y=f(x) параллельна оси Ох, то указанный участок кривой у =f (х) представляет собой отрезок прямой, параллельной оси Ох. 2.4. Условия монотонности функции на интервале Теорема б. Для того чтобы дифференцируемая на интервале (а, Ь) функция f(x) не убывала (соответственно не возрастала) на этом интервале, необходимо и достаточно, чтобы производная этой функции была неотрицательной (соответственно неположительной) всюду на этом интервале. ' Доказательство. 1. Достаточность. Пусть f\x) > О (соответственно f'(x) < 0) всюду на интервале (а, Ь). Требуется дока- зать, что f(x) не убывает (соответственно не возрастает) на интервале (а, Ь). Пусть Xi и х2 — любые две точки интервала (а, Ь), удовлетворя- ющие условию Х| <х2. Функция Дх> дифференцируема (а стало быть, и непрерывна) всюду на сегменте [хь х2]. Поэтому к /(х) можно при- менить на сегменте [хь х2] теорему Лагранжа, в результате чего полу- чим, что /(x2)-/(x>) = (x2-xt)/'(^ (11-6) где Xi <£<х2. По условию/'(£) £ 0 (соответственно £ 0), х2 - Xi > 0. Поэтому правая часть формулы (11.6) неотрицательна (соответственно неполо- жительна), что и доказывает неубывание (соответственно невозраста- ние) /(х) на интервале (а, Ь). 2. Необходимость. Пусть f(х) дифференцируема на интер- вале {а, Ь) и не убывает (соответственно не возрастает) на этом интер- вале. Требуется доказать, что f'(x) > 0 (соответственно f'(x) £ 0) всй- ду на этом интервале. Так как /(х) не убывает (соответственно не воз- растает) на интервале (а, Ь), то эта функция не может убывать (соот- ветственно возрастать) ни в одной точке интервала (а, Ь). Следователь- но, в силу теоремы 1 производная /'(х) ни в одной точке интервала (а, Ь) не может быть отрицательной (соответственно положительной), что и требовалось доказать. Теорема 7. Для того чтобы функция f (х) возрастала (соответст- венно убывала) на интервале (а, Ь), достаточно, чтобы произ- водная f'(x) была положительной (соответственно отрицательной) всюду на этом интервале. Доказательство проводится по той же схеме, что и доказа- тельство достаточности в теореме 6. Пусть х, и х2 — любые две точки интервала (а, Ь), удовлетворяющие условию xi < х2. Записывая для сег- iX 262
мента [хь *2] формулу Лагранжа, получим равенство (11.6), но на этот раз в этом равенстве /'(£)> О (соответственно /,(^)<0). Вследствие этого левая часть формулы (11.6) положительна (соответственно отри- цательна), что и доказывает возрастание (соответственно убывание) f(x) на интервале (а, Ь). Замечание. Подчеркнем, что положительность (соответствен- но отрицательность) производной /'(х) на интервале (а, Ь) н е явля- ется необходимым условием возрастания (соответствен- но убывания) функции /(х) на интервале (а, Ь). Так, функция у =х3 возрастает на интервале (-1, 1), но производная этой функции /'(х)= Зх2 не является всюду положительной на этом интервале (она обращается в нуль в точке х = 0). § 3. Формула Коши Теорема 8 (теорема Коши). Если каждая из двух функций /(х) и g(x) непрерывна на сегменте [а, 6] и дифференцируема во всех внут- ренних точках этого сегмента, и если, кроме того, производная g'(x) отлична от нуля всюду внутри сегмента [а, Ь]9 то внутри этого сег- мента найдется точка £ такая, что справедлива формула f(b)-f{a)_f^) (11.7) g(b)-g(a) g*(O’ называемая формулой Коши. Доказательство. Прежде всего, докажем, что g(a)*g(b). Действительно, если бы это было не так, то для функции g(x) были бы выполнены на сегменте [a, Z>] все условия теоремы 3 (Ролля), и по этой теореме внутри сегмента [a, Z>] нашлась бы точка £ такая, что g'(£) = 0, а это противоречит условию доказываемой теоремы. Итак, g(a)*g(6), и мы имеем право рассмотреть следующую вспомогатель- ную функцию: F(x) =/(х)-f{a) - (g(x) - g(a)]. (11 ’8) g(b)-g(a) В силу требований, наложенных на функции /(х) и g(x), функция Г(х) непрерывна на сегменте [а, 6] и дифференцируема во всех внут- ренних точках этого сегмента. Кроме того, очевидно, что F(a) = F(b) = 0. Таким образом, для F(x) выполнены все условия теоре- мы 3 (Ролля), согласно которой внутри сегмента [a, Z>] найдется точка такая, что Г'(^) = 0. (И.9) 263
Имея в виду, что F\x)=f\x)-^^-—-g'(x), и используя ра- g(Z>) - g(a) венство (11.9), получим, что /' Й) - (Q=0- (1110) g(6)-g(a) Учитывая, что g'(£)*0, из равенства (11.10) получим формулу Коши (11.7). Теорема доказана. Замечание 1. Формула Лагранжа (11.2).является частным слу- чаем формулы Коши (11.7) при g(x) =х. . , > Замечание 2. В формуле (11.7) вовсе ц_е обязательно считать, что b > а. § 4. Раскрытие неопределенностей (правило Лопиталя) „ „0 4.1. Раскрытие неопределенностей вида — ч Г- Л, “ f(X) U. Будем говорить, что отношение двух функции — представляет я. «мо собой при х -> а неопределенность вида-, если lim f (х) = limg(x) =0. х-*а х->а Раскрыть эту неопределенность — значит вычислить предел г /(*) / ч lim 7 (при условии, что этот предел существует). ™ g(x) Следующая теорема дает правило для раскрытия неопределенно- стеи вида сводящее вычисление предела отношения двух функции к вычислению предела отношения их производных. , Теорема 9 (правило Лопиталя). Пусть две функции f(x) и g(x) определены и дифференцируемы всюду в некоторой окрестности тон- ки а, за исключением, быть может, самой точки а. Пусть, далее, lim f (х) = lim g(x) = 0 х->а х->а и производная g'(x) отлична от нуля всюду в указанной окрестности точки а. Тогда, если существует (конечный или бесконечный) предел* * 1 Отметим, что предел (11.11) может не существовать, тогда как предел отношения f(x\ функций lim- - • существует. Таким образом, правило Лопиталя «действует не всег- g(x) да». " . . .. 264
Н^, (ПИ) *** g’W д f(x) A J, то существует и предел lim < причем справедлива формула g(x) limAx)=lim£W (П-12) «а g(X) g’(X) Доказательство. Пусть {х„} — произвольная последовате- льность значений аргумента, сходящаяся к а и состоящая из чисел, от- личных от а. Будем рассматривать эту последовательность начиная с того номера п, с которого все хп принадлежат окрестности точки а, указанной в формулировке теоремы. Доопределим функции f(x) и g(x) в точке а, положив их равными нулю в этой точке. Тогда, очевидно, f(x) и g(x) будут непрерывны на всем сегменте, ограниченном точками а и х„, и дифференцируемы во всех внутренних точках этого сегмента. Таким образом, для f(x) и g(x) на этом сегменте выполнены все усло- вия теоремы 8 (Коши), согласно которой внутри этого сегмента най- дется точка такая, что /(хя)-/(а)_/’(^) (11.13) g(x„)-g(a) g'CL)’ Учитывая, что, по нашему доопределению, f(a) -g (а) = 0, мы мо- жем следующим образом переписать формулу (11.13): (11.14) gM Пусть теперь в формуле (11.14) п->оо. Тогда, очевидно, Е,„ ->а. Так как мы предположили существование предела (11.11), правая часть (11.14) при и-»оо обязана стремиться к этому пределу. Стало быть, существует предел при п -> оо и левой части (11.14). По опреде- f (х) лению предела функции по Гейне этот предел равен lim . Таким **• g(x) образом, в пределе при п -> оо равенство (11.14) переходит в равенство (11.12). Теорема доказана. Замечание 1. Если к условиям теоремы 9 добавить требова- ние непрерывности производных/'(х) и g (x) в точке а, то при условии £z(e)*0 формула (11.12) может быть переписана в виде 265
I (11.15) lim/жт gW g'(«) Замечание 2. Если производные/'(х) и g'(x) удовлетворяют тем же требованиям, что и сами функции/(х) и g(x), то правило Лопи- таля можно применять повторно (т. е. предел отношения первых про- изводных функций /(х) и g(x) можно заменить пределом отношения вторых производных этих функций). Мы получим при этом I* f(x) ,. Г(х) ,. /"(х) lim= hm 7 = hm — 3~а g(x) ™ g'(x) **> g"(x) Замечание 3. Теорема 9 легко переносится на случай, когда аргумент х стремится не к конечному, а к бесконечному пределу а = + оо или а = - оо. Ограничимся тем, что сформулируем теорему 9 для случая а = + оо. Пусть две функции f(x) и g(x) определены и диф- ференцируемы всюду на полупрямой с<х<<х>. Пусть, далее, lim f (х) = lim g(x) = 0 и производная g'(x) отлична от нуля на указан- Х-НОС X—же р Z Ч ной полупрямой. Тогда, если существует предел lim - - то сущест- гы "“^х) вует и предел lim - причем справедливо равенство g(x) Г /to r /’W lim = hm - ^gto ^g’W Пример. Следующий предел вычисляется двукратным примене- нием правила Лопиталя: .. x-sinx .. 1-cosx .. sinx 1 lim-----— = lim---— = lim-----= x->° x3 x->0 3x2 X~*Q 6x 6 , 00 ' 4.2. Раскрытие неопределенности вида — 00 f(x) ? Будем говорить, что отношение двух функций представляет g(x) оо i- собой при х-+ а неопределенность вида —, если* °о ' lim/(x) = limg(x) = oo. (11.16) / х-+а х-ьа ' Для раскрытия этой неопределенности, т. е. для вычисления преде- г /(х) ~ ла lim - 4 , справедливо утверждение, совершенно аналогичное теоре- £(*) 2 вместо оо можно брать +оо или -оо. 266
ме 9, а именно: если в формулировке теоремы 9 заменить требование lim/(x) = limg(x)=0 на условие (11.16), то теорема 9 останется спра- х->а х~^а ведливои . Пример, л-кратным применением правила Лопиталя вычисляет- ся предел . х" .. л-х"*' .. л(л-1)х"‘2 .. л! ’ lim — = hm------------= lim — -----------=... = hm — = 0. X-H-X gx X-HX gX X-H« gX X-H-X> g* § 5. Формула Тейлора Устанавливаемая в этом .параграфе формула является одной из основных формул математического анализа и имеет многочисленные приложения как в анализе, так и в смежных дисциплинах. Теорема 10 (теорема Тейлора). Если п—любой номер и функция f(x) имеет в некоторой окрестности О.(а) точки а производную поряд- ка (и + 1), то для любой точки х из окрестности П(а) найдутся такие лежащие между а и х точки и что справедливо равенство г. . Г, ч /'(а), Ч /<2)(а), ч2 /(х) =/(а) + (х - а) + J- А < (х-а)2+...+ +л^)(х_аГ+Лл+1(х)> п\ (11.17) в котором для Rn+\(x) справедливо любое из следующих двух представ- лений'. wx)=(x а)7-/~(л+1)^^ (11,18) (л + 1)! М*) = йг) (11.19) л! Равенство (11.17) называется ф ормулой Тейлора, стоящая в равенстве (11.17) величина A„+)(x) — остаточным членом, выражение (11.18) — остаточным членом в форме Лагранжа, а выражение (11.19) — остаточным членом в форме Коши. Доказательство. Обозначим стоящий в правой части фор- мулы (11.17) многочлен по степеням (х-а) через <р (х, а), т. е. положим 1 Доказательство см.: Ильин В. А., Позняк Э.Г. Основы математического анализа. • *• М.: Физматлит, 2001. 267
фСх, а) = f (а) + (х - а) + (х - а)2 +... + L St). (х _ ау, П' (11.20) и обозначим через Rn+i(x) разность Rn+i(x)=f(x)-<p(x, а). (11.21) Требуется доказать, что для J?„+i(x) справедливы представления (11.18) и (11.19). . Фиксируем в окрестности Г2(а) точки а произвольную отличную от а точку х и заменим в (11.20) точку а произвольной переменной точ- кой t из окрестности Q(a). При этом мы получим функцию ф(х0=Л0 + ^(1-О + ^(х-О!+...+^(х-()-. (11.22) Из (11.22) сразу вытекает, что <р(х, х)=/(х). (11.23) Кроме того, из (11.22) вытекает, что функция ср(х, t) имеет всюду в окрестности Г2(а) производную — <p(x, г) (и потому является в Q(a) не- dt прерывной функцией аргумента t). Дифференцируя по t равенство (11.22), получим, что dt 1! 1! 2! /(Л/а f(”+o (tx (11-24) +^—(x _ t)2 -... - У W. (X - ty-' + (x _ ty, 2! n! n! Все стоящие в правой части (11.24) члены, кроме последнего, вза- имно уничтожаются, и мы получим, что ' (»«)' dt п\ Рассмотрим теперь для всех t из окрестности Г2(а) точки а две функции' Vi(0=/W-<Pte 0-7—^тА+1(*)> (и-26) (х - а) ¥г(0 =/(*) - <Р & f) - • Ял+1 (х). (11-27) (х~а) - - 1^ 'Напомним, что точку х мы фиксировали отличной от точки а.
Убедимся в том, что для каждой из этих двух функций выполнены на сегменте, ограниченном точками а их, все условия теоремы 3 (Ролля). Действительно, из дифференцируемости по t в окрестности Q(a) функции <р(х, /) и из* равенств (11.26) и (11.27) вытекает, что каждая из функций ф1(0 и ф2(0 дифференцируема в Q(a), а потому дифференцируе- ма (и тем более непрерывна) на сегменте, ограниченном точками а и х. Далее, из равенств (11.26), (11.27) и (11.23) вытекает, что \|/](х)=0 и Фг(х) = О. Наконец, из равенств (11.26), (11.27) и (11.21) вытекает, что ф1(а) = 0 и \|/2(а) = 0. По теореме 3 (Ролля) для каждой из функций \|/>(0 и ¥г(0 найдутся такие лежащие между а и х точки и ^2, что V i(€i) = О, V 2fe) = О- Из равенств (11.26) и (11.25) заключаем, что п! (х-а) а из равенств (11.27) и (11.25) заключаем, что (429) и! х-а Полагая в равенстве (11.28) г = и используя равенство \|/{(£i) = 0> мы получим выражение остаточного члена в форме Лагранжа (11.18). Аналогично, полагая в равенстве (11.29) / = ^2 и используя равенство У2(^2) = 0, мы получим выражение остаточного члена в форме Коши (11.19). ; . . Теорема доказана. Замечание 1. Подчеркнем, что заключенные между а и х зна- чения и %2, стоящие в равенствах (11.18) и (11.19), являются, вооб- ще говоря, различными. Замечание!. В проведенных нами рассуждениях вместо функций (11.26) и (11.27) можно взять обобщающую их функцию . v(0 = /(*) - <р(*,0 - z(x~ % • (1130) (х-fl)" c произвольным положительным числом p. Функция (11.30) также будет удовлет- в°рять на сегменте, ограниченном точками а и х, всем условиям теоремы 3 (Ролля): Условиям у(а) = 0 и у(х) = 0 и требованию дифференцируемости в ‘ окрестности ^(а), а потому и на сегменте, ограниченном точками а и х. 269
По теореме 3 (Ролля) между а и х найдется точка 4 такая, что Из. ра- венств (11.30) и (11.25) получим, что _у(я,,)(А (x-tY’' 7 ,W(X-tr + р^-Л-R^x). л! (х-аУ (П.31) m г Х~а Так как с> заключено между а и .v, то дробь-удовлетворяет неравенствам 0<----<1. Последние неравенства, соотношение (11.31) и равенство \j/'(Q = O - приводят к следующему выражению для Ля+|(х): Выражение (11.32) называют остаточным членом в обобщен- ной форме Шлемильха — Роша. В заключение несколько преобразуем выражения (11.18) и (11.19) для остаточного члена 7?rt+i(x). Так как входящие в равенствах (11.18) и (11.19) значения £1 и £2 заключены между и х, то найдутся такие числа 0| и 02, каждое из ко- торых лежит на интервале (0, 1), что Й,-а) = 0,(х-а) и (£2-а) = 02(х-а). Из двух последних равенств вытекает, что =а+0](х-а), £2 =а+02(х-а). Вставляя эти значения и в равенствах (11.18) и (11.19), мы получим выражение для остаточного члена в форме Лагранжа в виде Лп+1(х) =(х~ДГ1/^1)[а+0,(х-а)] (1118Э (п + 1)! со значением 0Ь удовлетворяющим условию 0 < 0i < 1, и выражение для остаточного члена в форме Коши в виде1, (11”° л! со значением 02, удовлетворяющим условию 0 < 02 < 1. В дальнейшем мы установим оценки остаточных членов (11.18') и ' (11.19*), позволяющие вычислить погрешность, которую мы допуска- ем, приближенно заменяя функцию f(x) многочленом (11.20). ’Мы учитываем, что х-^2=х~а-&2(х-а)“(х-а)(1 -0г).
§ 6. Остаточный член в форме Пеано. Формула Маклорена 6.1. Остаточный член в форме Пеано В ряде теоретических задач требуется не найти величину погреш- ности, допускаемой при замене значения функции f(x) многочленом <р(х, а), определяемым равенством (11.20), а лишь оценить поря- док этой погрешности относительно малой разности (х - а). Для этой цели используется еще одна форма остаточного чле- на — так называемая форма Пеано, которую мы сейчас устано- вим. ( Потребуем1, чтобы функция f(x) имела в окрестности Q(a) точки а производную порядка п и чтобы эта производная /(п)(х) была непре- рывна в самой точке а. Тогда, применяя теорему 10 (Тейлора) не для номера (л + 1), а для номера л и записывая остаточный член в форме Дагранжа (11.18), мы получим /(х) =/(«) + (X - а) +... + £2^. (х - а)"-1 + £), 1! (л-1)! п\ (11.33) где 4 заключено между а и х. Так как производная /(п)(х) непрерывна в точке а и так как £ лежит между а и х, то /(и)й)=/(й)(л) + а(х-а), где а(х-а) стремится к нулю при х—>а. Вставляя последнее равенство в формулу (11.33) и замечая, что произведение (х - а)" • а(х - а) представляет собой бесконечно малую при х -> а величину более высокого порядка, чем (х - а)", которую мы в § 5 гл. 8 договорились обозначать символом о [(х - а)"], мы оконча- тельно получим формулу Тейлора с остаточным членом в форме Пеа- но в виде /(х)=Ла) + ^(х-а) + ... + ^^(х-а)''+0[(х-а)'’]. (11.34) 1! п! 1 На самом деле требования существования производной/(и)(х) не только в самой точке а, но и в ее окрестности и непрерывности производной/(л)(х) в точке а являются излишними. Вывод остаточного члена в форме Пеано без этих требований можно найти в п. 1 § 14 гл. 8 книги В. А. Ильина и Э. Г. Позняка «Основы математического анализа» (т. 1. М.: Физматлит, 2001). 271
6.2. Формула Маклорена Принято называть формулой Маклорена формулу Тей- лора (11.17) с центром в точке а = 0. Таким образом, формула Макло- рена дает представление функции в окрестности точки х = 0. Запишем формулу Маклорена для произвольной функции f(x) с остаточным членом в форме Лагранжа, Коши и Пеано1: /ы.т+тх+^+...+^-,к.м (11.35) 1! 2! п! где остаточный член имеет вид: 1) в форме Лагранжа М*)=г^/(я+,)(^) (О<0<1), (11.36) (п+1)! 2) в форме Коши Яя+1(х) = /(я+1)(0х) (0<в<1) (11,37) л! (0 в формулах (11.36) и (11.37) имеет, вообще говоря, различные зна- чения), 3) в форме Пеано Дп+1(х) = о(х"). (11.38) (Мы использовали формулы (11.18Э, (11.197) и (11.34).) § 7. Оценка остаточного члена. Разложение некоторых элементарных функций, Примеры применения формулы Маклорена 7.1. Оценка остаточного члена для произвольной функции Оценим для произвольной функции f(x) остаточный член в форму- ле Маклорена (11.35), взятый в форме Лагранжа (11.36). Предположим, что рассматриваемая нами функция f(x) обладает следующим свойством: существует такое вещественное число М, что для всех номеров п и для всех значений аргумента х из рассматривае- мой окрестности точки х = 0 справедливо неравенство у» ..... 1 При этом предполагается, что для остаточных членов в форме Лагранжа и Коши функция f(x) имеет производную порядка (л+ 1) в окрестности точки х = 0, а для остаточного члена в форме Пеано — производную порядка п в окрестности точки х = 0, непрерывную в самой точке х = 0. 272
If (я)(х)| £ Л/. . (11.39) Такую функцию будем называть функцией, совокупность всех про- изводных которой ограничена в окрестности точки х = 0. Из неравенства (11.39) вытекает, что y(n\Qx)\^M, (11.40) и поэтому из формулы (11.36) следует, что ^+1(х)| = J<l|/(-)(6x)|< (л + 1)! (п + 1)! Итак, мы получаем следующую универсальную оценку остаточно- го члена для функции, совокупность всех производных которой огра- ничена числом М в окрестности точки х = 0: (11.41) (п + 1)! Поскольку, как было показано в разд. 1.3 гл. 7, для любого х из 1хГ+* бесконечной прямой lim-1- - =0, выбирая достаточно большое п, мы можем сделать правую часть (11.41) как угодно малой. Это дает нам возможность применять формулу Маклорена для приближенного вы- числения функций, обладающих указанным свойством, с любой напе- ред заданной точностью. Приведем примеры функций, совокупность производных которых ограничена в окрестности точки х = 0. 1) /(х) = е*, fM(x) = Совокупность всех производных этой функции ограничен^ на любом; сегменте [-г, г] (с любым г > 0) числом М = Z. . 2) /(x) = cosx или /(х).= sinx., Совокупность всех производных каждой из этих функций ограничена всюду на бесконечной прямой числом М= 1. 7.2. Разложение по формуле Маклорена некоторых элементарных функций А./(х) = /. Поскольку /(я)(х) = ^>/(л)(0) = 1 Для любого п, формула Маклорена (11.35) имеет вид e*=l+£ + £i + ... + £.+fl (х), (Ц.42) 1! 2! п! где остаточный член, взятый в форме Лагранжа, равен 2?«+I(x)=7f-^e<u (0<8<1). (л+1)! 273
На любом сегменте [-г, +г] (с любым г>0), в силу того что |еОх| < ег, получим следующую оценку для остаточного члена: (п + 1)! (11.43) Б. f (х) = sin х. Поскольку /<л)(х) = sin I х + 1, /(л)(0) = sinf л^ j = О при четном п, л-1 (-1)2 при нечетном п, формула Маклорена (11.35) имеет вид х3 х5 X1 Sin X = X--+-------- 3! 5! 7! (11.44) . + (-1)2 -'+R„^x), л! где п — нечетное число, а остаточный член в форме Лагранжа ра- вен Ял+2(х) = — ---sinf 0х + п— + п I (0 < 0 < 1). (л+2)! V 2 J Очевидно, что на любом сегменте [-г, +г] (с любым г>0) для остаточного члена справедлива следующая оценка: i/г мк г”+2 (11Л5) В. /(х) = cos х. Поскольку /л)(х) = cos ^х + л J, Ил)„ч ( (о при нечетном и, f w(0) = cos л — I = \ 2) [(-l)"'2 при четном л, формула Маклорена (11.35) имеет вид 1 х2.*4 х& (11.46) cosx=l------+---------+ ... + (-1) — + Л„.,(х), 2! 4! 6! л! где л — четное число, а остаточный член в форме Лагранжа равен хи+2 ( л *) /?„+2(х) =-----COS 0Х + Л — + Я (0 < 0 < 1). (л+2)! V 2 J 274
1 На любом сегменте [-г, +г] (с любым г > 0) получаем для остаточ- ного члена оценку (11.45). Г. f(x) = In (1 + х). Поскольку при п > 1 /»)(*) = до)=О, /(">(0) = (-1)"'|(и-1)!, (1+х) формула Маклорена (11.35) имеет вид 1п(1 +х)=х-^-+^-4 + - + (-1Г‘ — +Лп+1(х). (11.47) 2 3 4 л Остаточный член на этот раз запишем и оценим и в форме Лагран- жа, и в форме Коши: (-П"х"+1 Яп+1(х) = (в Ф°Рме Лагранжа), (11.48) 7?п+|(х) = (-1)”хп+| (в Форме Коши), (11.49) Таким образом, при малых х г2 In (1 + х) = х - у + О(х3), где |О(х3)| -х3, а М— некоторая постоянная. Для значений х из сегмента [0, 1], исходя из остаточного члена в форме Лагранжа и переходя в формуле (11.48) к модулям, получим |Яя+1(х)|<-Ц. (11.50) п+1 Из оценки (11.50) вытекает, что 7?n+i(x) стремится к нулю при. п -> оо для всех х из сегмента 0 £х < 1. Для оценки функции 1п(1 +х) с отрицательными значениями аргу- мента х, принадлежащими сегменту -г < х < О при 0 < г < 1, будем ис- ходить из остаточного члена в форме Коши (11.49), переписав его в виде Wx) = (-l)"f-^M <П-51) Ц+OxJ 1 + 0х п 1-0 1 Принимая во внимание, что -----<1 для всех рассматриваемых 1+0х значений х, мы получим из (11.51) оценку 275
r"+' l^n+i(x)l <7—» 1-r (И.52) из которой (в силу того что 0<r< 1) вытекает стремление R„+i(x) к нулю при л —> оо для всех рассматриваемых значений х. 7.3. Примеры применения формулы Маклорена А. Вычисление числа е с любой точностью. ( 1Y Мы ввели число е в разд. 2.3 гл. 7 как предел lim 1 + — и там же „ I получили грубую оценку его значения: 2 < е <, 3. Теперь, воспользовавшись формулой Маклорена (11.42) и оценкой остаточного члена (11.43) и положив в (11.42) и (11.43) x = r= 1, мы получим, что для любого номера п , 1 1 е =1+—+— 1! 2! 1 в ..-Ц + Я„+1(1), где |Ля+|(1)|< < п\ (л + 1)! 3 (« + 1)'.’ Выбирая при этом номер п достаточно большим, мы можем вычис- лить е с любой интересующей нас точностью. Так, беря п = 400 и про- водя вычисления на ЭВМ, мы получим следующее значение числа е с 590 знаками после запятой: f 2,718281 828459 045235 360287 471352 662497 757247 093699 959574 966967 627724 076630 353547 594571 382178 525166 427427 466391 932003 059921 817413 596629 043572 900334 295260 595630 738132 328627 943490 763233 829880 753195 251019 011573 834187 930702 154089 149934 884167 509244 761460 668082 264800 168477 411853 742345.442437 107539 077744 992069 551702 761838 606261 331384 583000 752044 933826 560297 606737 113200 709328 709127 443747 047230 696977 209310 141692 836819 025515 108657 463772 111252 389784 425056 953696 770785 449969 967946 864454 905987 931636 889230 098793 127736 178215 424999 229576 351482 208269 895193 668033 182528 869398 496465 105820 939239 829488 793320 36... Б. Вычисление приближенных значений три- гонометрических функций. Еще из курса элементарной математики известно, что значения функций sinx и cosх для х, принадлежащих сегменту 0, — L 4_, определяют значения этих функций для всех х. Поэтому мы ограни- полностью 276
чимся вычислением приближенных значений sin х и cos х для х, при- надлежащих сегменту 0,- . L 4. Желая обеспечить точность 10"4, положим п = 5, г = “ в формуле Маклорена (11.44) и в оценке остаточного члена (11.45) и учтем, что при этом |Яп+2(х)| = |А7(х)|^ Ю'4 • 71 Таким образом, для всех х из сегмента 0,- с точностью до^ 10 справедлива приближенная формула х3 sin х ® х-- 6 + Х* . 120 формуле Маклорена (11.46) и в и учитывая, что при этом л г Л Аналогично, полагая п = 6, г = — в Л оценке остаточного члена (11.45) / \8 [ л | |Я«+2(*)| = |Лв(х)| < - "-< 10"5, мы получим, что для всех х из сегмента 8! 0, — с точностью до 10"5 справедлива следующая приближенная фор- 4J мула: 1 х2 х4 х6 cosx«l----+--------. 2 24 720 § 8. Участки монотонности функции. Отыскание точек экстремума 8.1. Отыскание участков монотонности функции и точек возможного экстремума В § 1 настоящей главы мы уже установили ряд условий, обеспечи- вающих возрастание, убывание, невозрастание и неубывание функции /(х) на произвольном интервале (a, Z>); и можем утверждать, что изуче- ние вопроса об участках монотонности дифференцируемой функции /(х) сводится к исследованию знака первой производной этой функ- ции. 277
В качестве примера рассмотрим функцию f (х) = х3 - Зх2 - 4. Поско- льку f'(x) = 3х2 -6х = Зх(х-2), то, очевидно,/'(х): положительна при -оо<х<0, отрицательна при 0 < х <2, положительна при 2 <х < +<ю. Таким образом,/(х) возрастает на полупря- мых (-со, 0) и (2, +оо) и убывает на интервале (0,2) (рис. 11.4). В § 1 настоящей главы мы ввели понятие локального экстремума функции /(х) и устано- вили необходимое условие наличия у дифферен- цируемой функции /(х) в данной точке локаль- ного экстремума, заключающееся в том, что производная f'(x) в этой точке должна быть, рав- на нулю*. Заметим, что, поскольку данное усло- вие является лишь необходимым, требуется установить достаточные условия наличия экст- ремума, к чему мы и переходим. 8.2. Первое достаточное условие экстремума Теорема 11. Пусть точка с является точкой возможного экстре- мума функции f (х) и пусть функция f(x) дифференцируема всюду в не- которой окрестности точки с. Тогда, если в пределах указанной окре- стности производная f'(x) положительна (соответственно отрица- тельна) слева от точки с и отрицательна (соответственно положи- тельна) справа от точки с, то функция f (х) имеет в точке с локаль- ный максимум (соответственно локальный минимум). Если же произ- водная f'(x) имеет один и тот же знак слева и справа от точки с, то экстремума в точке с нет. Доказательство. 1. Пусть сначала производная f'(x) в пре- делах рассматриваемой окрестности положительна (соответственно от- рицательна) слева от с и отрицательна (соответственно положительна) справа от с. Требуется доказать, что значение /(с) является наиболь- шим (соответственно наименьшим) среди всех значений f(x) в рас- сматриваемой окрестности. Обозначим через хо любое значение аргу- мента из рассматриваемой окрестности, отличное от с. Достаточно до- казать, что f (с) -f (х0) > 0 (соответственно f(c)-f (х0) <0). (11.53) 1 Иногда корни уравнения f'(x) = 0 называют стационарны ми точками. Мы будем называть эти корни точками возможного экстремума. 1 278
Функция /(х) дифференцируема (а стало быть, и непрерывна) на сегменте, ограниченном точками с и xq. Применяя к /(х) по этому сег- менту теорему 4 (Лагранжа), получим /(с)-/(хо)=/^)(с-хо), (11.54) где £ — некоторое значение аргумента, лежащее между с и xq. Поско- льку производная /'(£) положительна (соответственно отрицательна) при хо < с и отрицательна (соответственно положительна) при хо > с, правая часть (11.54) положительна (соответственно отрицательна), что и требовалось доказать. 2. Пусть теперь производная /'(х) имеет один и тот же знак слева и справа от с. Обозначая, как и выше, через хо любое значение аргумен- та из рассматриваемой окрестности, отличное от с, и повторяя прове- денные выше рассуждения, мы докажем теперь, что правая часть (11.54) имеет разные знаки при х0 < с и при х0 > с. Это доказывает от- сутствие экстремума в точке с. Вытекающее из теоремы 11 правило можно кратко сформули- ровать так: 1) если при переходе через данную точку возможного эк- стремума с производная f\x) меняет знак с плюса на минус (соот- ветственно с минуса на плюс), то функция f (х) имеет в точке с лока- льный максимум (соответственно локальный минимум); 2) если же при переходе через данную точку возможного экстремума с производ- ная f'(x) не меняет знака, то экстремума в точке с нет. Пример. Найти экстремальные значения функции /(х) =х3- 3x2-4, уже исследованной в разд. 8.1 (см. рис. 11.4). Так как /'(х) = Зх2-6х = Зх(х-2), то функция /(х) имеет две точки воз- можного экстремума: х\ = 0 и х2 = 2. Поскольку знак f'(x) слева и спра- ва от этих точек легко выясняется, то при помощи теоремы 11 прихо- дим к выводу: /(х) имеет максимум в точке 0 и минимум в точке 2: /тах=/(0)=-4, /mi„=/(2) = -8. 8.3. Второе достаточное условие экстремума В случае, когда исследование знака первой производной слева и справа от точки возможного экстремума затруднено, целесообразно использовать второе достаточное условие экстремума, предполагаю- щее существование в точке возможного экстремума отличной от нуля конечной второй производной /(2)(х). Теорема 12. Пусть функция /(х) имеет в данной точке с возмож- ного экстремума конечную вторую производную. Тогда функция /(х) имеет в точке с локальный максимум, если f$\c) <0, и локальный ми- нимум, если /(2)(с)>0. 279
Доказательство. Из условия /(2)(с)<0(соответственно /(2)(с) > 0) и из теоремы 1 вытекает, что функция /'(х) убывает (соот- ветственно’ возрастает) в точке с. Поскольку по условию f'(c) -О,- то найдется такая окрестность точки с, в пределах которой /'(х) положи- тельна (соответственно отрицательна) слева от с и отрицательна (соот- ветственно положительна) справа от с. Но тогда по предыдущей теоре- ме /(х) имеет в точке с максимум (соответственно минимум). Возвращаясь к примеру из разд. 8.2 и учитывая, что /(2)(х) = 6х - 6, /(2)(0) = -6 < 0, /(2)(2) = 6 > 0, мы получим, что функция /(х) имеет1 ло- кальный максимум при х = 0 и локальный минимум при х = 2. ' -f: 8.4. Экстремум функции, не дифференцируемой в данной точке.. . Общая схема отыскания экстремумов В этом разделе мы изучим вопрос о наличии в точке с экстремума у функции, которая не дифференцируема в точке с, но дифференциру- ема в некоторой окрестности, лежащей слева и справа от с. Теорема 13. Пусть функция f(x) дифференцируема всюду в нёко- торой окрестности точки с, за исключением, быть может, самой точки с, и непрерывна в точке с. Тогда, если в пределах указанной окрестности производная f'(x) положительна (соответственно от- рицательна) слева от точки с и отрицательна (соответственно по- ложительна) справа от точки с, то функция f (х) имеет в точке с ло- кальный максимум (соответственно локальный минимум). Если же производная f'(x) имеет один и тот же знак слева и справа от точки, с, то экстремума в точке с нет. , , Доказательство в точности совпадает с доказательством теоремы 11. Только применимость к функции /(х) по сегменту, огра- ниченному точками с и х0, теоремы Лагранжа устанавливается следую- щим образом: по условию функция /(х) дифференцируема (а стало быть, и непрерывна) всюду на указанном сегменте, за исключением точки с, и, кроме того, непрерывна в точке с. Тем самым /(х) непре- рывна всюду на замкнутом сегменте, ограниченном точками с и хо, и дифференцируема во всех внутренних точках этого сегмента. Пример. Найти точки экстремума функции f (х) = |х|. Эта функ- ция дифференцируема на всей бесконечной прямой, кроме точки х = 0, и непрерывна в точке х = 0, причем производная /'(х) = 1 при х > 0 и /'(х) = -1 при х<0. Теорема 11 к этой функции неприменима, а согласно теореме 13 она имеет минимум при х = 0 (рис. 11.5). Переходим к общей схеме отыскания точек локального экстрему- ма. Предположим, что функция /(х) непрерывна на интервале (а, Ь) и 280
ее производная /'(*) существует и непре- рывна на этом интервале всюду, кроме конечного’числа точек. Кроме того, предположим, что произ- водная f'(x) обращается в нуль на интер- вале,(а, Ь) лишь в конечном числе точек. Таким образом, на интервале (а, Ь) имеет- ся лишь конечное число точек, в которых х с Рис. 11.5 производная f (х) не существует или об- ращается в нуль. Обозначим эти точки символами хь xi, ..., хп (a<xi<X2< ... <xn<b). В силу сделанных предположений производ- ная f‘(x) сохраняет постоянный знак на каждом из интервалов (a, xi), (хь хг), ..., (х„, Ь). Стало быть, вдпрос о наличии экстремума в каждой из точек xi, ха, ..., хп может быть решен (утвердительно или отрицате- льно) при помощи теоремы 13. § 9. Направление выпуклости графика функции Предположим, что функция /(х) дифференцируема в любой точке интервала (а, Ь). Тогда, как установлено в разд. 1.3 гл. 10, существует касательная к графику функции у=/(х), проходящая через любую точку М(х, /(х)) этого графика (а < х < Ь), причем эта касательная не параллельна оси Оу. Определение. Будем говорить, что график функции у =f(x) име- ет на интервале (а, Ь) выпуклость, направленную вниз (соответственно вверх), если график этой функ- ции в пределах указанного интервала лежит не ниже (соответствен- но не выше) любой своей касательной. Замечание 1. Термин «график лежит не ниже (соответственно не выше) своей касательной» имеет смысл, ибо касательная не парал- лельна оси Оу. На рис. 11.6 изображен график функции, имеющий на интервале (а, Ь) выпуклость, направленную вниз, а на рис. 11.7 — график функ- ции, имеющий выпуклость, направленную вверх. 281
Теорема 14. Если функция у =f(x) имеет на интервале (а, Ь) ко- нечную вторую производную и если эта производная неотрицательна (соответственно неположительна) всюду на этом интервале, то гра- фик функции у =f(x) имеет на интервале (а, Ь) выпуклость, направ- ленную вниз (соответственно вверх). Доказательство. Для определенности рассмотрим случай, когда вторая производная /2(х) > 0 всюду на (а, Ь). Обозначим через с любую точку интервала (а, Ь) (рис. 11.8). Требуется доказать, что график функции у =f(x) в пределах ин- тервала (а, Ь) лежит не ниже касате- льной, проходящей через точку М (с, Запишем уравнение ука- занной касательной, обозначая ее те- кущую ординату через У. Поскольку угловой коэффициент указанной ка- сательной равен f'(c\ ее уравнение согласно разд. 3.5 гл. 6 имеет-вид Г-/(с)=/'(с)(х-с). (11.55) Разложим функцию f (х) в окрестности точки с по формуле Тейло- ра, беря в этой формуле п = 1. В силу § 5 получим равенство в котором остаточный член взят в форме Лагранжа, £ заключено меж- ду с и х. Поскольку по условию /(х) имеет вторую производную на интервале (а, Ь), формула (11.56) справедлива для любого х из интер- вала (а, Ь) (см. § 5). Сопоставляя (11.55) и (11.56), получим, что для всех х из интерва- ла (а, Ь) у-У=^(2^(х-с)2. (11.57) Поскольку вторая производная по условию больше или равна нулю всюду на (а, Ь), то правая часть (11.57) неотрицательна, т. е. для всех х из (а, Ь) справедливо неравенство y-Y>0, или y^Y. Последнее неравенство доказывает, что график функции у =f(x) всюду в пределах интервала (а, Ь) лежит не ниже касательной (11.55). Аналогично доказывается теорема для случая /2(х) < 0. Замечание!. Если /2(х) s 0 всюду на интервале (а, Ь), то, как легко убедиться, y=f(x) — линейная функция, т. е. график ее есть 282
прямая линия. В этом случае направление выпуклости можно считать произвольным. Теорема 15. Пусть вторая производная функции y-f{x) непрвг- рывна и положительна (соответственно отрицательна) в точке с. Тогда существует такая окрестность точки-с, в пределах которой график функции у =f(x) имеет выпуклость, направленную вниз (соот- ветственно вверх). Доказательство. По теореме 2 § 2 гл. 9 об устойчивости знака непрерывной функции найдется такая окрестность точки с, в пределах которой вторая производная /(2)(х) положительна (соответст- венно отрицательна). По предыдущей теореме график функции у -f(x) имеет в пределах этой окрестности выпуклость, направленную вниз (соответственно вверх). Таким образом, направление выпуклости графика дважды диффе- ренцируемой функции полностью характеризуется знаком второй про- изводной этой функции. В качестве примера изучим направление выпуклости графика фун- кции у = х3 - Зх2 - 4, уже рассматривавшейся нами в § 8. Из вида вто- рой производной/(2)(х) = 6х - 6 = 6 (х-1) вытекает, что эта производ- ная отрицательна при х< 1 и положительна при х> 1. Таким образом, выпуклость графика функции у = х3 - Зх2 - 4 направлена вверх на полу- прямой (-оо, 1) и вниз на полупрямой (1, +оо). §10 . Точки перегиба графика функции 10.1. Определение точки перегиба. Необходимое условие перегиба Пусть а, b и с — некоторые три числа, связанные неравенствами а < с < Ъ. Пусть функция у =f(x) дифференцируема на йнтервале (а, Ь), т. е. существует касательная к графику этой функции во всех точках, абсциссы которых принадлежат интервалу (а, Ь). Предположим, что график функции у =/(х) имеет определенное направление выпуклости на каждом из интервалов (а, с) и (с, Ь). Рис. 11.9 Определение. Точка М(с, /(c)) графика функции y=f(x) называ- ется точкой перегиба этого графика, если существует та- кая окрестность точки с оси абс- цисс, в пределах которой график функции у =f (х) слева и справа от с имеет разные направления вы- пуклости. На рис. 11.9 изображен график Функции, имеющей перегиб в точ- ке М (с, /(c)). 283
Теорема 16 (необходимое условие перегиба графика функции, имеющей непрерывную вторую производную). Если график функ- ции у —f (х) имеет перегиб в точке М (с, f(c)) и если функция f (х) имеет в точке с непрерывную вторую производную, то f(2\c) = 0. Доказательство. Предположим противное, т. е. предполо- жим, что /(2)(с)*0. Тогда в силу теоремы 15 найдется окрестность точки с, в пределах которой график функции у =f(x) (и слева, и справа от с) имеет определенное направление выпуклости, а это противоречит наличию перегиба графика функции в точке Л/(с,/(c)). Полученное противоречие доказывает теорему. 10.2. Первое достаточное условие перегиба Теорема 17. Пусть функция у -f (х) имеет вторую производную в некоторой окрестности точки с и /(2)(с) = 0. Тогда, если в пределах указанной окрестности вторая производная f(1\x) имеет разные зна- ки слева и справа от с, то график этой функции имеет перегиб в точке М(с, f{c)). Доказательство. Заметим, во-первых, что график функций y=f(x) имеет касательную в точке М (с, / (с)), ибо из условий теоремы вытекает существование конечной производной f'(c). Далее, из того, что /2>(х) слева и справа от с имеет разные знаки, и из теоремы 14 за- ключаем, что направление выпуклости слева и справа от с является различным. Теорема доказана. В качестве примера изучим вопрос о наличии точек перегиба у графика неоднократно рассматривавшейся нами функции у = х3 - Зх2 - 4 (рис. 11.4). Поскольку/(2)(х) = 6 (х- 1), то единственное значение аргумента, для которого возможен перегиб, это х= 1. Этому значению аргумента соответствует точка графика М (1, -6). Так как f\x) имеет разные знаки при х> 1 и при х< 1, то точка Л/(1, -6) яв- ляется точкой перегиба графика рассматриваемой функции. 10.3. Второе достаточное условие перегиба Теорема 18. Если функция у =f(x) имеет в точке с конечную тре- тью производную и удовлетворяет в этой точке условиям f^ic) = 0, /(3)(с) Ф 0, то график этой функции имеет перегиб в точке М (с, /(с)). Доказательство. Из условия /(3)(с) * 0 и из теоремы 1 вы- текает, что функция /(2)(х) либо возрастает, либо убывает в точке с. - Так как /(2)(с) = 0, то и в том, и в другом случае найдется такая окре- стность точки с, в пределах которой /<2)(х) имеет разные знаки слева и справа от с. Но тогда по предыдущей теореме график функции у =f(x) имеет перегиб в точке М(с, /(с)). 284
Возвращаясь к примеру из предыдущего раздела, покажем, что во- прос о наличии перегиба у графика функции у = х3 - Зх2 - 4 может быть решен и при помощи теоремы 18. Действительно,/(3)(х) = 6 * О, следо- вательно, точка М (1, -6) является точкой перегиба согласно теореме 18. §11 . Асимптоты графика функции Определение 1. Говорят, что прямая х = а является верти- кальной асимптотой графика функции у =f (х), если хотя бы один из пределов lim j (х) или hm f (х) х^а+О х->а-0 равен +оо или -со. Пример. График функции у = — х имеет вертикальную асимптоту х = О, ибо lim — = +оо, lim — = -со (рис. х->0+0 % х—>0-0 % 11.10) . Пусть, далее, функция y=f(x) определена для сколь угодно больших значений аргумента (ради определен- ности будем рассматривать сколь угодно большие значения положите- льного знака). Определение 2. Говорят, что прямая Y = kx+b (11.58) является наклонной асимптотой графика функции y=f(x) при х-»+оо, если функция f(x) представима в виде f(x) = kx + b + а(х), (И .59) где lima(x)=0. Х-++Х Теорема 19. Для того чтобы график функции y=f(x) имел при х-»+оо наклонную асимптоту (11.58), необходимо и достаточно, чтобы существовали два предела lim = k и lim[/(х) -kx] = b. Х-++ОС д- х-н-ос (11.60) Доказательство. 1. Необходимость. Пусть график Функции y=f(x) имеет при х = +оо асимптоту (11.58), т. е. для /(х) справедливо представление (11.59). Тогда 285
г f(x) v kx + b + ct(x) hm = lim-----------------------— Х-++Х % Х-»+Х £ .. , , b , а(х) = hm к + - + — **** >х х к, lim[/(x) - Лх] = lim[6+а (х)] = Ь. 2. Достаточность. Пусть существуют пределы (11.60). Тог- да второй из этих пределов дает право утверждать, что разность j\x)-kx-b является бесконечно малой при х->+оо. Обозначив эту бесконечно малую через а(х), получим для /(х) представления (11.59). Теоре- ма доказана.' Замечание. Аналогично опре- деляется наклонная асимптота и дока- зывается теорема 19 и для случая Пример. График функции у - Э+ X * 1 =-------=2х -1 +------ имеет наклон- х + 1 х + 1 ную асимптоту Y = 2х - 1 и при х —> +оо и при х —> —оо, и, кроме того, имеет вертикальную асимптоту х = -1 (рис. 11.11). Действительно, г f(x) ' «• 2х2 +х о lim^-^ = lim----------=2,. х-й® х *-*ь°х(х + 1) lim[/(x)-2x] = lim -1ч—— = X-Xfcx дг—fcta X 4“ 1 !im /(х) = +о°; lim /(x) = -oo. w v li Л «ы» к—1 А 1 х + 1 § 12. Схема исследования графика функции В этом параграфе мы изложим схему, по которой целесообразно исследовать график функции, и приведем пример, иллюстрирующий эту схему. Итак, целесообразно провести следующие исследования: 1. Уточнить область задания функции. 2. Выяснить вопрос о существовании асимптот (вертикальных и наклонных). 3. Найти области возрастания и убывания функции и точки экстре- мума. 4. Найти области сохранения направления выпуклости и точки пе- региба. 286
5. Найти точки пересечения графика функции с осью Ох. По полученным данным легко строится эскиз графика функции. В качестве примера построим график функции _ 2х3-5х2+14х-6 (11.61) Будем следовать изложенной выше схеме. 1. Поскольку функция (11.61) представляет собой рациональную дробь, то она определена и непрерывна всюду на бесконечной прямой, кроме точки х = 0, в которой обращается в нуль ее знаменатель. 2. Выясним вопрос о существовании асимптот. Очевидно, что .. 2х3-5х2+14х-6 lim---------------- х—>0 ± о ~ поэтому график функции имеет вертикальную асимптоту х = 0. Далее, из существования пределов .. f(x) .. 2х3-5х2 + 14х-6 .. х х2 х3 1 hm = hm----------------------= hm-------—----— = -, д» Х-4±Х 3 х-ч±х 4 2 1- Г/-/ ч *1 1- 2х3-5х2+14х-6-2х3 .. 5+х х2 5 hm /(х)-- =1нп---------------------= hm —— = — х->±х 2 4^2 х-*±х 4 4 вытекает, что и при х -> +<», и при х -> -оо график функции имеет на- х 5 клонную асимптоту 3. Для нахождения областей возрастания и убывания функции (11.61) вычислим ее первую производную ,_х3 -7х + 6 _ (х-1)(х-2)(х + 3) У 2х3 2х3 Имея в виду, кроме того, что сама функция и первая производная не существуют при х = 0, мы получим следующие области сохранения знака у': Область значений х -оо<х<-3 -3<х<0 0<х< 1 1<х<2 2<х<+оо Знаку 4- — 4- — + Поведение .Функции возрастает убывает возрастает убывает возрастает 287
Из приведенной таблицы очевидно, что функция имеет следующие точки экстремума: 1) максимум при х = -3, причем /(-3) = -49/12, 2) максимум при х=1, причем /(1) = 5/4, 3) минимум при х = 2, причем /(2) = 9/8. 4. Для нахождения областей сохранения направления выпуклости вычислим вторую производную „«,2iz2=_L_____U . У 4 4 Имея в виду, что сама функция и ее производные не существуют в точке х = 0, мы получим следующие области сохранения знака у(2): Область значений х —оо <х < 0 л 9 0<х<- 7 9 - < X < +00 7 Знак р(2) — — + Направление выпуклости графика вверх вверх вниз Из приведенной таблицы очевидно, что график функции имеет пе- региб в точке (9/7,/(9/7)). Легко подсчитать, что /(9/7) = 913/756. 288
5. Остается найти точки пересечения графика с осью Ох, Эти точ- ки соответствуют вещественным корням уравнения 2х3-5х2 + 14х-6 = 0. Легко видеть, что 2х3 - 5х2 + 14х - 6 = 2| х - - | (х2 - 2х + 6). Поско- I 2) льку квадратный трехчлен (х2 - 2х V 6) имеет комплексные корни, то рассматриваемое уравнение имеет только один вещественный корень х = ^, так что график функции пересекает ось Ох в точке (1/2, 0). По полученным данным строим эскиз графика рассматриваемой функции (рис. 11.12). § 13. Глобальные максимум и минимум функции на сегменте. Краевой экстремум 13.1. Отыскание максимального и минимального значений функции, определенной на сегменте Рассмотрим функцию у =/(х), определенную на сегменте [а, 6] и непрерывную на нем. Поставим задачу об отыскании глобальных мак- симума и. минимума, или, другими словами, об отыскании максималь- ного и минимального значений /(х) на сегменте [а, Ь]. Подчеркнем, что в силу второй теоремы Вейерштрасса (см. теорему 16 гл. 9) непре- рывная на сегменте [а, />] функция /(х) обязана достигать в некоторой точке сегмента [а, Ь} своего глобального максимума (соответственно минимума). Ради определенности остановимся на отыскании максима- льного значения /(х) на сегменте [а, />]. Максимальное значение f(x) может достигаться либо во внутрен- ней точке хо сегмента [а, />] (тогда оно совпадает с одним из локаль- ных максимумов функции /(х)) (рис. 11.13) либо на одном из концов сегмента [а, 6] (рис. 11.14). Отсюда ясно, что для нахождения макси- мального значения функции /(х) на сегменте [a, fe] нужно сравнить между собой значения /(х) во всех точках локального максимума и в 289
граничных точках сегмента а и Ь. Наибольшее из этих значений- и бу- дет максимальным значением f(x) на сегменте [а, />]. Аналогично на- ходится и минимальное значение f(x) на сегменте [а, 6]. Если желательно избежать исследования точек возможного экстре- мума, то можно просто сравнить между собой значения f(x) во всех точках возможного экстремума и в граничных точках а и Ь. Наиболь- шее (соответственно наименьшее) йз этих значений, очевидно, и будет максимальным (соответственно минимальным) значением функции Дх) на сегменте [а, 6]. Отметим, что если Дх) имеет на сегменте [а, 6] лишь одну точку локального максимума (соответственно одну точку локального мини- мума), то без сравнения значения Дх) в этой точке с Да) и f(b) можно утверждать, что это значение является максимальным (соответственно минимальным) значением Дх) на сегменте [a, Z>] (рис. 11.15). Анало- гично решается вопрос об отыскании мак- симального (соответственно минимально- го) значения функции Дх) на интервале, полупрямой и бесконечной прямой (при условии, что это значение существует). В случае, когда дифференцируемая функция Дх) вовсе не имеет на сегменте [a, Z>] (полупрямой а < х < +оо) точек возможного экстремума, эта функция Дх) является монотонной на этом сегменте (полупрямой) и ее максимальное и минимальное значения достигаются на концах : этого сегмента (одно из этих значений достигается на конце х = а этой полупрямой). 13.2. Краевой экстремум Пусть функция Дх) определена на некотором сегменте [а, 6]. Бу- дем говорить, что эта функция имеет в граничной точке b этого сег- мента краевой максимум (соответственно крае- вой минимум), если найдется левая полуокрестность точки Ь, в пределах которой значение f (b) является наибольшим (соответственно наименьшим) среди всех других значений этой функции. Аналогично определяются краевой максимум и краевой минимум в граничной точке а сегмента [а, 6]. Краевой максимум и краевой минимум объединяются общим на- званием краевой экстремум. Имеет место следующее достаточное условие крае- вого экстремума: для того чтобы функция у =f(x) имела в точке b сегмента [а, 6] краевой максимум (соответственно краевой 290
минимум), достаточно, чтобы эта функция имела в точке Ь положи- тельную (соответственно отрицательную) левую производную. (До- казательство совершенно аналогично доказательству теоремы 1 насто- ящей главы.) Из указанного достаточного условия краевого экстрему- ма непосредственно вытекает следующее необходимое усло- вие краевого экстремума функции, имеющей в точке Ь левую производную: для того чтобы функция у =f(x\ обладающая в точке Ь левой производной, имела в этой точке краевой максимум (со- ответственно краевой минимум), необходимо, чтобы указанная про- изводная была неотрицательной (соответственно неположительной). Аналогично, для того чтобы функция у =f (х), обладающая в точке а правой производной, имела в этой точке краевой максимум (соответственно краевой минимум), необходимо, чтобы указанная производная была неположительной (соответственно неотрицате- г льной).
Глава 12 Неопределенный интеграл В этой главе будет рассмотрена задача о восстановлении функции F(x) по известной производной F'(x) этой функции. К ней приводят такие важные задачи механики, как задача об определении закона дви- жения материальной точки по заданной скорости этой точки и задача об' определении закона движения и скорости материальной точки по заданному ускорению этой точки. § 1. Понятия первообразной функции и неопределенного интеграла 1.1. Понятие первообразной функции Определение. Функция F(x) называется первообразной функцией (или просто первообразной) функции f(x) на интервале (а, Ь), если в любой точке х интервала (а, Ь) функция F(x) дифференцируема и имеет производную F'(x), равную f(x). В этом определении интервал (а, Ь) может быть заменен на всю бесконечную прямую (-<», оо) либо на одну из открытых полупрямых (а, +°о) или (-<», Ь). Так, функция F(x) = arcsin х является первообразной функции f (г) = — на интервале (-1, 1), ибо всюду на этом интервале Vl-x2 (arcsinх)' = * ; функция F(x) = sinx является первообразной фун- Vl-x2 кции f (х) = cos х на бесконечной прямой (- оо, оо), ибо в любой точке х бесконечной прямой (sin х)'= cos х; функция F(x) = lnx является пер- вообразной функции f(x) = — на открытой полупрямой (0, оо), ибо в х любой точке х этой полупрямой (1пх)'=—. х Если функция F(x) является первообразной функции /(х) на интер- вале (а, Ь), то, очевидно, и функция F(x) + С, где С — любая постоян-- ная, также является первообразной функции /(х) на интервале (а, Ь). Естественно возникает вопрос о том, как связаны между собой различ- ные первообразные одной и той же функции /(х). Ответ на этот вопрос дает следующая теорема.
Теорема 1. Если F\(x) и /^(х) — любые две первообразные функции f(x) на интервале (а, Ь), то всюду на этом интервале Fi(x) - F2(x) = С, где С — некоторая постоянная. Доказательство. Положим Ф(х) = F\(x) - F2(x). Так как каждая из функций F\(x) и F2(x) имеет в каждой точке х интервала (а, Ь) производную, равную Дх), то в силу теоремы. 5 из гл. 10 и функ- ция Ф(х) имеет в каждой точке х интервала (а, Ь) производную, при- чем Ф' (х) = F((x) - F2'(x) = Дх)-Дх)=0 (всюду на этом интервале). В силу теоремы 5 из главы 11 функция Ф(х), имеющая равную нулю производную на интервале (а, Ь), является постоянной всюду на этом интервале. Теорема доказана. Следствие из теоремы 1. Если функция F(x) является одной из первообразных функции Дх) на интервале (а, Ь), то любая перво- образная Ф (х) функции Дх) на этом интервале имеет вид Ф (х) = = F(x) + С, где С — некоторая постоянная. 1.2. Неопределенный интеграл Определение. Совокупность всех первообразных функции Дх) на интервале (а, Ь) называется неопределенным интегра- лом от функции Дх) (на этом интервале) и обозначается символом \f(x)dx. (12.1) В обозначении (12.1) знак | называется знаком интегра- ла, выражениеf(x)dx — подынтегральным выражени- ем, а сама функция Дх) — подынтегральной функцией. Если функция F (х) является одной из первообразных функции f (х) на интервале (а, Ь), то (в силу следствия из теоремы 1) J f(x)dx = F(x) + С, (12.2) где С — произвольная постоянная. Так, [ - - dx = arcsin х + С на интервале -1 < х < 1, ибо функция J 71-х2 F (х) = arcsin х является одной из первообразных функции f (х) = А. _ VI-X2 на этом интервале; |cosxc/x = sinx + C на всей бесконечной прямой ~ °о < х < оо, ибо функция F (х) = sin х является одной из первообраз- ных функции Дх) = cos х на бесконечной прямой. Подчеркнем, что если первообразная функции Дх) на интервале (а, Ь) (а стало быть, и неопределенный интеграл от этой функции) 293
существует, то в формуле (12.1), подынтегральное выражение f(x)dx равно дифференциалу dF любой из первообразных F(x) функцииf (х). Это следует из того, что по определению первообразной F'(x)=/(x) на интервале (а, Ь) и потому dF = F'(x)dx = f(x}dx. Вопрос о существовании у функции f (х) первообразной и неопре- деленного интеграла будет решен в § 4 следующей главы: там будет доказано, что у любой непрерывной на интервале (а, Ь) функции f (х) существует на этом интервале первообразная (а потому и неопреде- ленный интеграл). В заключение' заметим, что операцию нахождения первообразной или неопределенного интеграла от функции f (х) принято называть интегрированием этой функции. 1.3. Основные свойства неопределенного интеграла Следующие два свойства непосредственно вытекают из определе- ния: 1°. d^f(x)dx=f(x)dx. 2°. pF(x)=F(x) + C. Свойство 1° означает, что знаки d и j взаимно сокращаются, если знак дифференциала d стоит перед знаком интеграла |. Свойство 2° означает, что знаки | nd взаимно сокращаются и в случае, когда знак интеграла | стоит перед знаком дифференциала d, но в этом случае к F(x) следует добавить произвольную постоянную С. Для установления свойства 1° достаточно взять дифференциал от обеих частей равенства (12.2) и учесть, что d[F(x) + C] = dF(x) = = F'(x)dx = f(x)dx. Для установления свойства 2° достаточно в левой части (12.2) вос- пользоваться равенством dF(x) = f (x)dx. Следующие два свойства называются линейными свойст- вами неопределенного интеграла: 3°. J [/(*) ± g(x)]dx = J f(x)dx ± J g(x)dx. 4°.| [Я/(x)](Zx = f (x)dx, если А — постоянная. Подчеркнем, что равенство в формулах 3° и 4° носит условный ха- рактер: его следует понимать как равенство левой и правой частей с точностью до произвольного постоянного слагаемого (это понятно, по- скольку каждый из интегралов, стоящих в 3° и 4°, определен с точно- стью до произвольного постоянного слагаемого). 294
Так как две первообразные одной и той же функции могут отличав ться только на постоянную, то для обоснования свойства 3° достаточно доказать, что если F (х) — первообразная функции /(х), a G (х) — пер- вообразная функции g(x), то функция (F(x)±G(x)] является первооб- разной функции [/(x)±g(x)J но это сразу вытекает из равенства (F(x) ±<7(х)Г = F'(x) ± G'(x) =/(х) ±g(x). Свойство 4° доказывается аналогично с использованием равенства [ЯГ(х)]' = AF'(x) = Af (х). 1.4. Таблица основных неопределенных интегралов В разд. 5.5 гл. 10 мы привели таблицу производных простейших элементарных функций. Опираясь на понятие неопределенного интеграла, мы можем утвер- ждать, что каждая формула этой таблицы, устанавливающая, что та или иная функция F(x) имеет производную, равную f (х), приводит нас к соответствующей формуле интегрального исчисления \f(x)dx = F(x) + C. Таким путем мы приходим к следующей таблице неопределенных интегралов. l°.JOc/x = C. 2°.jldx = x+C. 3°.fxadx = —— + С (при а * -1). 1 а +1 4°.[ —= 1п|х|+С (х*0). J X 5°.\axdx = — + C (при 0<а*1), [exdx = ех + С. 1 In а 1 6°.|sinx<fx = -cosx+ С. ( 7°.| cos xdx = sinx + С. go f _ ((i + ig2x)dx = tgx+ C (x*- + nn, где n = 0, ±1,...). Jcos2x J 2 9°.[—^—= [(l+ctg2x)</x = -ctgx + C (x*nn, n = 0, ±1,...). J sin x J mo f dx f arcsinx + C, 10 • J /---T = arccos x + C (-1< x <1). 295
2 dx arctg x + C -arcctgx+C = lnx + 7x2 ±1 +C (|x|>l в случае знака «-»). 1 + х 1-х 12°.[—= 7x2±l 13°.[—=-ln Jl-x1 2 Сделаем замечания в отношении формул 4°, 12° и 13°. Формула 4° справедлива для любого интервала, не содержащего точки х = 0. Дей- ствительно, если х>0, то из формулы (1пх)'= — заключаем, что х Г — = 1пх + С, а если х < 0, то из формулы [1п(-х)]' = - заключаем, что J х х Г — = 1п(—х) + С. Тем самым формула 4° справедлива для любого х 0. J х Формулы 12° и 13° занимают в таблице исключительное положе- ние, ибо они не имеют аналогов в таблице производных, однако для проверки справедливости этих формул достаточно убедиться в том, что производные выражений, стоящих в их правых частях, совпадают с соответствующими подынтегральными функциями. J3 следующем параграфе мы дополним таблицу неопределенных ^интегралов основными методами интегрирования. Здесь же сделаем важное замечание. В разд. 6.8 гл. 9 мы ввели по- нятие элементарной функции, а в разд. 5.5 гл. 10 установили, ^о про- изводная любой элементарной функции является также элементарной функцией, т.е. установили, что операция дифференцирования не выво- дит нас из класса элементарных функций. Оказывается, в отличие от операции дифференцирования, операция интегрирования уже выводит нас из класса элементарных функций. Укажем несколько элементарных функций /(х), первообразные F(x) которых часто встречаются в приложениях и не являются элемен- тарными функциями. [2 Первообразную Ф(х) функции f (х) = J- е 2 , обращающуюся в Ул нуль при х = 0, принято называть функцией Лапласа. Эта не- элементарная функция, как мы увидим в гл. 19, играет фундаменталь- ную роль в теории вероятностей. _ - 1 х 1 cosx r , x 1 sinx Первообразные функции /(x) = -—• —— и /2(х) = —=• -j—, У2л /х У2л Ух определенные для положительных значений х и стремящиеся к нулю 296
при х -» 0, принято называть интегралами Френеля и обо- значать символами С(х) и S(x) соответственно. Эти две неэлементар- ные функции широко используются в оптике. Первообразную функции f (х) = —, определенную при х > 0 и 1пх стремящуюся к нулю при х -> 0, называют интегральным ло- гарифмом и обозначают символом li х. Первообразную функции /(х) = 51Н£> обращающуюся в при х 2 х = 0, называют интегральным синусоми обозначают сим- волом si х. Все указанные неэлементарные функции ввиду их важности для приложений изучены с такой же полнотой, как и простейшие элемен- тарные функции (для них составлены таблицы их значений и вычерче- ны графики). Следует подчеркнуть условность понятий элементарной и неэле- ментарной функций. § 2. Основные методы интегрирования 2.1. Интегрирование заменой переменной (подстановкой) Замена переменной является одним из самых эффективных мето- дов интегрирования. Этот метод основан на следующем утверж- дении. Если функция t = ф (г) определена и дифференцируема на множе- стве {х}, представляющем собой интервал, открытую полупрямую или бесконечную прямую, и {t} является множеством значенцй этой функции и если функция g(t) имеет на множестве {t} первообразную, равную G(t), т.е. j g(t)dt = G(t) + C, (12.3) то функция й[ф(х)] • ф'(х) имеет на множестве {х} первообразную, равную б[ф(х)], т. е. на множестве {х} J g[<pW] • <$'(x)dx = <7[ф(х)] + С. Справедливость этого утверждения сразу вытекает из правила диф- и из того, что по определению первообразной G'(0 = #(0- ’См. разд. 3.1 гл. 10. 297
Предположим теперь, что требуется вычислить неопределенный интеграл (12.1). В ряде случаев удается выбрать в качестве новой пе- ременной такую дифференцируемую функцию / = <р (х), что справед- ливо равенство /(x) = g[(p(x)]-cp'(x), причем интеграл (12.3) от функ- ции g(t) легко вычисляется. Тогда доказанное утверждение позволяет нам написать для неопределенного интеграла (12.1) следующее выра- жение: J/(x)<Zx = G[<p(x)]+C. Указанный прием вычисления неопределенного интеграла (12.1) и называется интегрированием путем замены пере- менной. Конечно, такой прием применим не ко всякому интегралу, и даже если указанный прием оказывается применимым, выбор правильной замены переменной в значительной мере определяется искусством вы- числителя. Приведем несколько примеров, иллюстрирующих метод замены переменной. 1°. Вычислить неопределенный интеграл jcos5xd!r. Сделав замену t = 5х, dt = 5dx, получим, что ( cos 5xdx = - f cos t dt = - sin t + C = - sin 5x + C. J 5J 5 5 2°. Вычислить неопределенный интеграл j(3x-7)1999 dx. Конечно, расписывая подынтегральную функцию (Зх- 7)1999 по формуле бинома Ньютона (см. § 3 гл. 1), мы можем свести вычисля- емый интеграл к сумме двух тысяч табличных неопределенных ин- тегралов, но несравненно проще сделать замену переменной t = Зх - 7, dt = 3 dx, в результате которой мы получим, что 1 ± 2000 /о „ 2000 f (Зх - 7)19”<& = 1 [ = --+ С = >3 7)— + С. J 3J 6000 6000 о о г» г (arctg х)" , 3 . Вычислить неопределенный интеграл -—-=-^—ах. J 1+х Сделав замену Z = arctgx, dt-—^—^dx, получим, что 1(агс.е,)”АЧ|„гй = ^+с=(а,е.ехГ,;е J 1 + х2 J 100 100 4°. Вычислить неопределенный интеграл | еяпх -cosxdx. С помощью замены t = sinx, dt = cosx dx получим, что J esinx • cosx • dx = J e'dt = e' + С = еяпх + C. 298 -
'' 5°. При а > 0 вычислить неопределенный интеграл J —-- Для вычисления оказывается удобной так называемая трйгоно- х dt метрическая подстановка x = a-tg/, / = arctg —, dx = a——, a cos21 с помощью которой мы получим, что г dx г 1 dt If. J(a2+x2)3/2 3 [a2(l + tg2/)]3/2 cos2/ a2JC°S< = ^sinf + C=A.--7ML=r + C=-L--z=^== + C. ' a a ^/1 + tg2/ a yja2 +x2 6°. При a > 0 вычислить на интервале - a < x < а неопределенный f dx интеграл J Сделав тригонометрическую подстановку x x-a&mt, t = arcsin—, dx = a-cost-dt, получим, что a r dx _lrJ/_l „_ J (a2 -x2)3/2 a1 ’cos2/ a2 =4 +c=~4 ~ix- =+c- a Vl-sin2/ a у/a1 -x2 l 2.2. Метод интегрирования по частям Вторым эффективным методом интегрирования является метод ин-, тегрирования по частям^ основанный на следующем утвержде- нии. Если функции и(х) и v(x) дифференцируемы на множестве {х}, представляющем собой интервал, открытую полупрямую или беско- нечную прямую, и если функция v(x) и’(х) имеет на этом множестве {х} первообразную, то и функция и(х) v'(x) имеет на этом множест- ве первообразную, причем | u(x)v'(x)dx = и(х) • v(x) -1 v(x) • u'(x)dx. (12.4) Сразу же заметим, что определение дифференциала функции и свойство инвариантности его формы (см. разд. 2.3 и разд. 3.3 гл. 10) позволяют переписать равенство (12.4) в виде dv = и(х) • v(x) - fv-du. (12.5) 299
Для доказательства сформулированного утверждения воспользуем-- ся установленной в § 4 гл. 10 формулой для производной произведе- ния двух дифференцируемых функций (и(х) • v(x)]' = и(х) v'(x) + v(x) • ы'(х). (12.6) Умножим равенство (12.6) на dr и возьмем неопределенный интег- рал от обеих частей полученного при этом равенства. Так как по усло- вию существует неопределенный интеграл j v(x)w'(x)«tc и так как в силу свойства 2° из разд. 1.3 справедливо равенство j [м(х) • v(x)]'dx = и(х) v(x) + С, то существует и неопределенный интег- рал j u(x)v'(x)dx и справедливо равенство (12.4) или (12.5). Формула (12.5) сводит вычисление неопределенного интеграла j udv к вычислению неопределенного интеграла j v • du. В ряде конкрет- ных случаев последний неопределенный интеграл легко вычисляется. Отыскание значения неопределенного интеграла jи-dv посредст- вом использования формулы (12.5) и называется интегрирова- нием по частям. Заметим, что при проведении интегрирования по частям удобно пользоваться таблицей дифференциалов, выписан- ной в разд. 5.6 гл. 10. Приведем примеры, иллюстрирующие применение метода интегри- рования по частям. 1°. Считая, что п #-1, вычислим неопределенный интеграл 7 = |х" -Inxdx. Полагая w = lnx,c/v = x" - dx, применяя формулу (12.5) и dx хл+| учитывая, что du-— ,v =----, получим, что х п + 1 х"+| 1 t хл+| 1 1=-----1пх----— •Гхлп!х = ---(1пх----—) + С. п + 1 п + 1 J и+1 п + 1 2°. Вычислим неопределенный интеграл I = |х- arctg x-tZr. Полагая и = arctgx, dv = xdx, применяя формулу (12.5) и учитывая, что , dx х2 au = ---,v =—, получим, что т х2 t 1 г х2 х2 1 г[(1+х2)-1] , I = — arctg х — ——-dx - — arctg х — ———+—чах = 2 6 2Jl+x2 2 6 2J 1+x2 x2 . If, lr dx x2+l x x „ = — arctgx— ar + - ------ =-----arctgx — +C. 2 2J 2Jl+x2 2 2 300
3°. Вычислим неопределенный интеграл / = jx2 cosxd!r. Сначала применим формулу (12.5), полагая и = х2, dv = cosxdx. Учитывая, что du = 2х dx, v = sin x, получим, что /=х2 •sinx-2jxsinxdr. Для вы- числения последнего неопределенного интеграла еще раз применим формулу (12.5), полагая на этот раз и = х, dv = sinx Л. Учитывая, что при этом du = dx, v = - cosx, получим, что I =х2 - sinx +2х- cosx- 2jcosxdx = (х2 -2)sinx +2х- cosx + С. Таким образом, неопределенный интеграл I = jx2 -cosxdx вычис- лен нами посредством двукратного интегрирования до частям. Легко понять, что неопределенный интеграл / = Тх" -cosxtZr, в котором п — любое целое положительное число, может быть вычислен по аналогич- ной схеме посредством п-кратного интегрирования по частям. 4°. Для произвольных постоянных и отличных от нуля чисел а и Ъ вычислим неопределенный интеграл I = j еах cos bx dx. Сначала приме- ним формулу (12.5), полагая и = еах,dv =cosbxdx. Учитывая, что при , м . sin Ах Т е™ sin bx а г м , этом du = ае dx, v = —-—, получим, что I =-------— J е • sm bx dx. К последнему неопределенному интегралу еще раз применим фор- мулу интегрирования по частям (12.5), полагая на этот раз ах j • j j т/ _ f ах j COS Ьх и = е , dv = sinbxdx. Учитывая, что при этом du- ае -dx,v =--—, получим, что т е"-sin Ах а ах , а2 т 1=----------+ — е -cos Ах----I. b Ь2 Ь2 Таким образом, посредством двукратного интегрирования неопре- деленного интеграла I по частям мы получим для I указанное выше линейное уравнение, из которого вытекает, что г а • cos Ах + А • sin Ах а2+Ь2 Практика показывает, что значительная часть неопределенных ин- тегралов, берущихся посредством интегрирования по частям, может быть разбита на т р и г р у п п ы. 1. Кпервой группе относятся интегралы, подынтегральная Функция которых содержит в качестве множителя одну из функций 1нх, arcsin х, arccos х, arctg х, (arctg х)2, (arccos х)2,.? — при условии, 301
что оставшаяся часть подынтегральной функции представляет собой производную известной нам функции (см. рассмотренные выше при- меры 1° и 2°). Для вычисления интегралов первой группы следует применить формулу (12.5), полагая в ней и(х) равной одной из перечисленных функций. / 2. Ко второй группе относятся интегралы вида j (ах + Ь)" cos(cx)dx, j (ах + Ь)" sin(cx)dr, | (ах + bye^dx, в которых а, b и с — некоторые постоянные числа, а и — целое положительное чис- ло (см. рассмотренный выше пример 3°). Интегралы второй группы вычисляются путем л-кратного применения формулы интегрирования по частям (12.5), причем в качестве и(х) каждый раз следует брать (ах+Ь) в соответствующей степени. После каждого интегрирования по частям эта степень будет понижаться на единицу. 3. К третьей группе относятся интегралы вида j е“ cos bxdx, j е“ sin bxdx, | sin(ln x)dx, J cos(lnx)ctc с постоянными а и b (см. рассмотренный выше пример 4°). Обозначая любой из указан- ных интегралов через I, путем двукратного интегрирования по частям мы получаем линейное уравнение для определения I. Конечно, указанные три группы не исчерпывают всех без исключе- ния неопределенных интегралов, берущихся посредством интегрирова- ния по частям. Вычислим посредством интегрирования по частям следующий не входящий ни в одну из указанных трех групп неопределенный интег- рал1: К = f dt <12;7> Х >(t2+a2y’ в котором а — некоторое постоянное число, X = 1, 2, 3, ... Сначала заметим, что при X = 1 неопределенный интеграл Ki вы- числяется элементарно dt t2 +а2 \а ) 1 i Z-. —= — arctg — + С. tY а а - +1 а ) 'Для более удобного использования этого интеграла в следующем параграфе мы будем обозначать переменную под его знаком не через х, а через t. 302
Для вычисления этого интеграла при X = 2, 3, ... установим для него так называемую рекуррентную формулу, сводящую вопрос о вычислении к вычислению Xx-i- Для любого X > 2 справедливо равенство К -Ч a2dt - 1 fK'2+g2)~'2U Х a21(t2+a2)k а2} (t2+a2)x _1 [ dt 1г 2tdt _ 1 1 е d(t2+a2) a2 J (Г2 + a2)vi 2а2 (Г2+а2)х а2 Х'1 2а2' (Г2+а2)х - Для вычисления последнего интеграла применим формулу интег- /п , j d(t2+a2) рирования по частям (12.5), полагая и = t; dv = —\-—Учитывая, (Г2+а2)х что при этом du = dt, v----------------—, получим, что (X-1)(/2 +а2/-’ К. = Д К. . + —----Д----—------Д-----К. .. а2 2а2(Х-1)(Г2+а2)х" 2а2(Х-1) Из последнего равенства вытекает следующая рекуррент- ная формула, справедливая для любого X > 2: К —_________1+ 2k—Ъ & (12.8) Х 2а2(Х-1)(Г2+а2)хч а2(2Х-2) х'‘‘ Так как неопределенный интеграл К\ нами уже вычислен, то, пола- гая в формуле (12.8) X = 2, мы вычислим с помощью этой формулы К2. Зная К2 и полагая в формуле (12.8) X = 3, мы вычислим с помощью этой формулы К2, и т. д. Таким путем мы вычислим Кх с любым номе- ром X через элементарные функции. § 3. Классы функций, интегрируемых в элементарных функциях Хотя, как мы уже отметили в конце § 1, неопределенный интеграл от элементарной функции может не выражаться через элементарные функции, все же существуют широкие классы функций, неопределен- ные интегралы от которых выражаются через элементарные функции. Изучению этих классов и будет посвящен настоящий параграф. Важ- нейшим из этих классов является класс рациональных дробей, пред- ставляющих собой отношение двух алгебраических многочленов. Поэ- тому рассмотрению вопроса об интегрируемости рациональных дробей в элементарных функциях должно предшествовать изложение некото- рьк сведений из теории алгебраических многочленов. 303
3.1. Краткие сведения из теории алгебраических многочленов Будем использовать краткие сведения о комплексных числах, изло- женные в § 5 гл. 2. Алгебраическим многочленом степени п на- : зывается функция Qn(z) вида Qn(z) = + C|Z + c2z +...+cnz , (12.9) у которой z = х + iy — переменное комплексное число, a cq, с\, с^ ..., сп — постоянные комплексные числа, последнее из которых сп отлично от нуля. Числа со, сь ст, ..., сп называют коэффициентами много- члена (12.9). ; Комплексное число а называется корнем алгебраического мно- гочлена Qn(z)t если для комплексного числа Qn(a) справедливо равен- ство 2„(a) = 0. Установим следующее утверждение 1: если комплексное' число а является корнем алгебраического многочлена ненулевой степе- ни Qn(z), то для Qn(z) справедливо представление 2„(z) = (z-a).a_1(2)> (12.10) в котором S.-i(z) — некоторый алгебраический многочлен степени п- 1, причем коэффициент при z"-1 у многочлена Q„.x(z) совпадает с коэффициентом при zn у многочлена Qn(z). Доказательство. Так как комплексное число а является • корнем многочлена Qn(z), то Qn(a) = 0, т. е. О = со +сха + сга1 + ... + спап. (12.11) Вычитая почленно равенство (12.11) из равенства (12.9), получим, . что 6.(z) = c1(z-a)+.c2(z2-a2) + ... + cn(z'’-a") = (z-a)6n_I(z), - где Q„-t(z) = ci + cz(z + <з) + •••.+ cn(z"~l + az"'2 + а2г”~3+...+а"~1), т. е.J Qn-i(z) — алгебраический многочлен степени п - 1, у которого коэф- фициент при zn~x равен сй. Основная теорема алгебры утверждает, что любой алгебраический многочлен Qn(z) степени п > 1 имеет хотя бы один комплексный ко- рень а. С помощью этой теоремы и утверждения 1 устанавливается следу-. ющий результат. Утверждение 2. Любой алгебраический многочлен (12.9) степени п > 1 имеет ровно п комплексных корней аъ ...» ап и с по- мощью этих1 корней представляется в виде 304
£(z) = c„(z - а,) • (z - а2) •... • (z - ап). (12.12) Доказательство. Так как п > 1, то по основной теореме алгебры у многочлена Q„(z) существует хотя бы один комплексный корень ai, так что в силу утверждения 1 справедливо представление 6„(z) = (z-a1)-2„_,(z), (12.131) в котором Qn-i(z) — многочлен степени п - 1 с коэффициентом при z""’ равным с„. Если п > 2, то по основной теореме алгебры многочлен Qn-i(z) имеет хотя бы один комплексный корень а2, так что в силу утвержде- ния 1 справедливо представление 6«-i(z) = (z-«2)-6B-2(z), (12.132) в котором Qn-2(z)— многочлен степени и - 2 с коэффициентом при z”’2, равным сп. При п, удовлетворяющем условиям п > 3, п.> 4, ..., повторяя ука- занные рассуждения, мы получим представления: 2я-2(2) = (2-дз)-бя-з(Д (12.133) Sn-3(Z) = (Z-«4)-S«-4(Z), (12.134) 6,(z) = (z-a„)-60(z). (12.13”) В этих представлениях Qn_3 (z), Q„_4 (z), ...,Qa (z) — многочлены сте- пеней n - 3, n - 4,...» О соответственно, у каждого из которых коэффи- циент при старшей степени z равен с„. Отсюда следует, что в (12.13") многочлен нулевой степени Qq(z) просто равен коэффициенту с„. Из равенств (12.131) — (12.13"), с уче- том того что Qo(z) = сп, и вытекает представление (12.12). Утверждение 2 доказано. Отдельные корни а1г а2, ап алгебраического многочлена Qn(z) степени п могут совпадать между собой. Обозначим через h\, h2, ..., hm— различные корни многочлена 2„(z) степени л. Тогда в силу (12.12) для этого многочлена справедливо представление Q„(z) = c„(z-hi)a' -(z-^r ...•(z-Am)°’, (12.14) в котором оц + а2 + ... + am = л и каждое из целых чисел аь а2,..., ат не меньше единицы. Если для многочлена Qn(z) справедливо представление (12.14), в котором Ль h2, ..., hm являются различными (не совпадающими между 305
собой) комплексными числами, то говорят, что число h\ явля- ется корнем 0„(z) кратности cci, число hi я в л я- ется корнем 2„(z) кратности аг, ..., чис- ло hm является корнем Q„(z) кратно- сти а,„. 3.2. Разложение алгебраического многочлена с вещественными коэффициентами на произведение неприводимых вещественных множителей В дальнейшем мы будем иметь дело с многочленами от перемен- ной, принимающей только вещественные значения. Поэтому эту переменную мы будем обозначать буквой х, а не z. Кроме того, в дальнейшем все коэффициенты со, С|, .... с,„ много- члена Q„(x) = c0 + ctx + c2x2+... + спх" будут считаться вещественны- ми числами. Для такого многочлена представление (12.14) записывается в виде 2„(х) = сп(х-/1|)а' -(х-^Г •...•(х-й,„Г", (12.14') причем среди корней й(, h2, hm такого многочлена могут быть как ' вещественные, так и комплексные корни. Оказывается, что если комплексное число а = и + iv является кор- нем многочлена Qn(x) с вещественными коэффициентами кратности ; к, то и сопряженное комплексное число а = и - iv является корнем : многочлена Qn(x) той же кратности 1. * Доказательство этого утверждения см.: Ильин В. А., Позняк Э. Г. . Основы математического анализа. М.: Физматлит, 2001. Т. 1. С. 217—219. Будем.предполагать, что многочлен с вещественными коэффициен- тами Qn(x) имеет вещественные числа Ь\, Ьъ ...,&* корнями кратностей . pi, Рг, Р* соответственно и комплексно сопряженные пары чисел ai и ai, ai и а2, аг и аг корнями кратностей Х2, ...»К соответствен- но. Тогда для этого многочлена представление вида (12.14') записыва- ется следующим образом: QXx) = c„(x-b^(x-brf' -...-(х-Ь^ -(х-я,/1 (х-я,/1 х х(х —я2)Х1 -(x-fl2)Xj •... • (х - яг )Хг -(х-яг)4. (12.15)^ Для любого s, равного 1, 2, ..., г, произведение (х-я,)х’ •(х-я1)х* ; преобразуется в вещественное выражение (х2 + psx + qs )х’, в котором > ps = -2us, qs = и2 + v2. Действительно, 1 I 306
(х - as )’•' • (х - as )'•’ = [(х - us - ivs )-(x-us + ivs )]’• = = [(* “ ”, )2 + Г = I*1 ~ 2u,x + (и2 + v2)]?' = (x2 + psx + qs У'. Произведя в представлении (12.15) указанное преобразование для каждой пары (х-а,)'’’ -(х-а^)'', отвечающей каждому 5 = 1, 2, г, мы придадим представлению (12.15) следующий вид: Qntx) = c„(x-b^ (х-62)₽г •...•(x-6i)₽‘ х (12.16) х(х2 +р|х + <71)Л| -(х2 + ppc + qj'1 -... (х + ргх + дгУ'. Таким образом, всякий многочлен Qn(x) с вещественными коэффи- циентами представляется в виде произведения неприводимых вещест- венных множителей вида (12.16), причем множители, отвечающие ве- щественным корням, имеют вид двучленов в степенях, равных крат- ностям этих корней, а множители, отвечающие парам комплексно сопряженных корней, имеют вид квадратных трехчленов в степенях, равных кратностям этих пар корней. 3.3. Разложение правильной рациональной дроби с вещественными коэффициентами на сумму простейших дробей Рациональной дробью с вещественными к о - ж ж Р(х) эффициентами называется отношение двух алгебраиче- ских многочленов с вещественными коэффициентами. Если при этом степень многочлена Р(х) меньше степени многочле- на Q(x), то рациональная дробь —-— называется правильной. Q(x) Мы установим, что любую правильную рациональную дробь с ве- щественными коэффициентами можно представить в виде конечной суммы простейших дробей следующих четырех типов: В x-b’ --------- при 6 = 2, 3,..., (»-*>)’ Mx + N Mx + N , о , (12.17) —------------, —------------------- при X = 2, 3,..., 4 ' х + рх + q (х + px + q)' в которых В, b, М, N, р и q — постоянные вещественные числа, (к2 + рх + q) — квадратный трехчлен, имеющий комплексно сопря- женные корни. Так как каждая из четырех простейших дробей (12.17), как мы убе- димся ниже, интегрируема в элементарных функциях, то тем самым 307
мы установим, что любая правильная рациональная дробь с вещест- ? венными коэффициентами интегрируема в элементарных функциях. Справедливо следующее замечательное утверждение. Р(х\ Теорема 2. Если < — произвольная правильная рациональная дробь с вещественными коэффициентами, знаменатель Q(x)=Q,t(x), которой разлагается на произведение неприводимых множителей (12.16), то найдутся такие вещественные постоянные В^В^.^В^ (1=1,2,...,к),МУ,N<’>,М™,N?,^)(5 = 1,2,...,г), часть из . Л А Л которых может быть равна нулю, что рациональная дробь —> < представима в виде суммы дробей «[(*-*/) (х-b,)2 (х-М₽'] (1218) M^x + Ny t M^x + Ny t r M^x + Ny & (x2+psx + qs) (x2+psx + qs)2 (x2 + psx + qs)y'’ Теорема 2 доказывается посредством последовательного примене- ния по каждому вещественному корню с учетом его кратности и по каждой паре комплексно сопряженных корней с учетом их кратности следующих двух лемм. р(х\ Лемма 1. Если & ' — правильная рациональная дробь с вещест- , венными коэффициентами, знаменатель Q(x) которой'имеет вещест- венное число b корнем кратности р, т. е. 2(х) = (х - Z>)₽ • ф(х), где ф(Ь)*0, (12.19) то для этой дроби справедливо представление Р(х) = В + \|/(х) (12.20) ем (x-6)₽ (x-z>)M-<p(x)’ R в котором В — постоянное вещественное число, равное ——, к — це- Ф(6) лое число, удовлетворяющее условию k > 1, а \|/(х) — некоторый мно- гочлен с вещественными коэффициентами такой, что последняя ра~: 308
циональная дробь, стоящая в правойчасти (12.20), является1 правиль- ной. ' Р(х) Лемма 2. Если — правильная рациональная дробь с вещест- венными коэффициентами, знаменатель Q(x) которой имеет комплек- сные числа a = u + iv и а = и~ iv корнями кратности X, т. е. £>(х) = (х2 + рх + q)'~ • <р(х), где <p(a)*0, <p(a)*0, р = -2и, q = u2+v2, то для этой дроби справедливо представление Р(х) _ Mx + N f у(х)___________________ (12.21) 2(х) (х2 + рх + qY (х2 + рх + q)2~k <р(х) ’ в котором М и N — постоянные вещественные числа, определяемые из уравнения Р(а) - (Ma+N) • ф(а) = 0, к — целое число, удовлетворяю- щее условию к > 1, а ф (х) — некоторый многочлен с вещественными коэффициентами такой, что последняя рациональная дробь, стоящая, в правой части (12.21), является, правильной. Доказательство леммы 1. Положив В рас- <р(£>) Р(х) в ГТ R смотрим разность Приводя эту разность к общему зна- менателю и используя равенство (12.19), мы получим, что Р(х) _ В = Р(х)-В-<р(х) = Ф(х) (12.22)' 2(х) (x-h)₽ (x-Z>)₽-<р(х) (х-6)0-ф(х)’ где через Ф(х) обозначен многочлен с рациональными коэффициента- ми вида Ф(х) = Р(х) - Вф(х). Так как Ф(Ь) = Р(6) - Вф(6) = Р(Ь) - • ф(6) = 0, то вещественное <Р(6) число Ь является корнем многочлена Ф(х) некоторой кратности k > 1, т.е. Ф(х) = (х-/>)* -ф(х), где \|/(6) * 0. (12.23) Вставляя (12.23) в (12.22), мы и получим представление (12.20), а тот факт; что последняя рациональная дробь в правой части (12.20) яв- ляется правильной, вытекает из того, что она является разностью двух правильных рациональных дробей. Лемма 1 доказана. Мы предлагаем читателю самому провести аналогичное доказате- льство леммы 2 (или прочитать в кн.: Ильин В. А., Позняк Э. Г. Осно- вы математического анализа. М.: Физматлит, 2001. Т. 1. С. 220—221). 309
3.4. Интегрируемость рациональной дроби с вещественными | коэффициентами в элементарных функциях ! „ й Р(х) „ i Так как рациональная дробь , не являющаяся правильной, по- £ средством деления многочлена Р(х) на многочлен Q(x) «столбиком» Р(х) Р (х) может быть представлена в виде суммы v 7 =А(х)+ 14 7 многочле- б(х) Q(x) лг \ “ й Р\(х) на А(х) и правильной рациональной дроби ——- и так как многочлен 2(х) А(х) интегрируем в элементарных функциях, то проблема интегрируе- мости в элементарных функциях любой рациональной дроби сводится к интегрируемости в, элементарных функциях правильной рациональной дроби. В силу теоремы 2 правильная рациональная дробь с вещественны- ' мй! коэффициентами может быть разложена на сумму (12.18) простей- ших дробей четырех типов (12.17). Поэтому достаточно убедиться j в том, что каждая из четырех простейших дробей (12.17) интегрируема' в элементарных функциях. Интегрируемость в элементарных функциях первой и второй из простейших дробей (12.17) тривиально устанавливается с помощью за- мены t = х - b, dt = dx. Сделав эту замену, мы получим, что dx = В • [у- =В ln|/| + С =В ln|x-d| + С, [ - 'g—-dx = B- ( — ------ + С = -^------?---+ С. V J(x-f>)₽ J/₽ р-1 Л1 p-l(x-Z>)₽’' Для выражения в элементарных функциях интеграла от третьей из простейших дробей (12.17) представим квадратный трехчлен j^+px+q 2 о2 в виде х2 + px + q =(х + -^)2 + (q -~-) и> учитывая, что q > 0, по- ложим a = JqПосле этого, сделав замену t = x +—,dt = dx, полу;/ V 4 2 чим, что ^x2+px + q t2+a2 2^t2+a2 310
+(N _MP\ ,f =M. f ) + (N -MP) .1 f UJ 1 2 ' h2+a2 2 J t2+a2 k 2 ah t\2 - +1 ) M . ,л , 2x ,2N - Mp t _ M, . 2 . . = — ln(t + a ) +----arctg— +C = — ln(x + px + q) + 2 2a a 2 x+P 2N-Mp t 2 +—, arctg , + C. Г „2 I „2 o L_£_ Lp Остается убедиться в том, что и четвертый интеграл (12.17) берет- ся в элементарных функциях. I О2" Используя то же обозначение a = Jq—-£— и делая ту же замену V 4 р t=x + —, мы получим, что .. х, Mt + (N-—) г Mx + N , t v 2 , M t 2tdt —:--------dx = -----z---, ,z dt = —------— + J (x +px + qY J (t2+a2) 2 +a ) I 2 ) 1 (t2+a2? 2 J (t2+a2? 2 х где Кк — рассмотренный в разд. 2.2 интеграл (12.7), который, как ' было установлено в конце § 2, вычисляется через элементарные функ- ции. Так как интеграл f +д2) _______________1_______+С=- ——-__________________+С ht2+a2/ (X-l)(t2 +а2)2-' (1 -1)(х2 +px + q? также вычисляется в элементарных функциях, то мы окончательно обосновали следующий результат. Теорема 3. Любая рациональная дробь с вещественными коэффи- циентами интегрируема в элементарных функциях. Приведем примеры отыскания разложения рациональной дроби на сУмму простейших дробей и ее интегрирования. 311
1°. Разложим на сумму простейших дробей и проинтегрируем ра- циональную дробь 2х3 + 4х2 +х+2 (х-1)2-(х2+х + 1)‘ Так как квадратный трехчлен х2 + х + 1 имеет комплексные корни, то согласно теореме 2 разложение следует искать в виде 2х3+4х2+х+2 = В, В2 Mx + N (12.24) (х-1)2(х2+х + 1) х -1 (х-1)2 х2+х + 1‘ Приводя равенство (12.24) к общему знаменателю, получим, что 2х3+4х2+х+2 _2?,(х3-1) + В2(х2+х + 1) + (Л/х + М)(х2-2х + 1) (х-1)2(х2+х + 1) (х-1)2-(х2+х + 1) Сравнивая в числителях равенства (12.25) коэффициенты при х°, х1, х2 и х3, мы получим линейную систему четырех уравнений для опреде- ления Si, Вг, Л/ и М Bi + Л/ = 2, В2 + W - 2Л/ = 4, 52 + М - 2W = 1, -В\ + Вг + N = 2, из которой находим, что В\ =2, 52 = 3, М = О, N = 1, так что 2х3 +4х2 +х+2 = 2 3 1 (х-1)2-(х2+х + 1) х-1 (х-1)2 х2+х + 1 Таким образом, г 2х3+4х2+х+2 , dx ,r dx r dx J (x-l)2(x2 +x + l) Jx-1 (x-1)2 •'x2+x + l =21nlx-l|—— + -^= arctg + C. x-1 V3 V3 2°. Разложим на сумму простейших дробей и проинтегрируем ра- циональную дробь Зх4 +2х3 +3х2 -1 (х-2)(х2+1)2 Так как (х2 + 1) имеет комплексные корни, то согласно теореме 2 разложение следует искать в виде Зх4+2х3+3х2-1 _ В Mtx + Nt M2x + N2 (12.26) (х-2)(х2+1)2 х-2 х2+1 (х2+1)2 312
Приводя равенство (12.26) к общему знаменателю и после этого сравнивая в числителях коэффициенты при х°, х1, х2, х3 и х4, мы полу- чим линейную систему пяти уравнений для определения В, М\, N\, Мг и Л^2, из которой найдем, что В = 3, М\ = 0, Ni = 2, М2 = 1 и Ni = 0. Таким образом, Зх4 +2х3+Зх2-1 = 3 + 2 х (х-2)-(х2+1)2 х-2 х2+1 (х2+1)2’ и потому гЗх4+2х3+3х2-1 , -г dx „г dx t xdx J (x-2)-(x2+1)2 Jx-2 J x2+l J(x2+1)2 = 3 Inlx - 2| + 2arctg x-7-+ C. 1 2(x2+1) 3.5. Другие классы функций, интегрируемых в элементарных функциях Для описания еще трех классов функций, допускающих интегриро- вание в элементарных функциях, введем понятия многочлена и рацио- нальной дроби от двух аргументов. Многочленом от двух аргументов х и у с те- пе н и п назовем выражение вида Рп(х,у) - аю + а10х + а01у + а2(>х2 + + ацху+ + аогу2 + ... + апОх" + а^рх^'у + ... + а0„уп, в котором аоо» аю, аоп — произвольные постоянные вещественные числа такие, что из чисел а„о, a(„-i)i, .... ао„ хотя бы одно отлично от нуля. Рациональной дробью от двух аргументов х . F„(x, у) - и у назовем отношение R(x, у)= ———— любого многочлена от двух Qm(x,y) аргументов Рп(х,у) произвольной степени п к любому многочлену от двух аргументов Qm(x,y) произвольной степени т. Если R\(t) и Л2(Г) — любые две рациональные дроби от одной пере- менной t, а Л(х,_у) — любая рациональная дробь от двух аргументов х и у, то выражение 7? [7?, (/), R2 (<)], получающееся путем подстановки в 7?(х,у) на место х и у значений х = Ri(t) и у = T?2(Z), очевидно, будет являться рациональной дробью от одной переменной t, и поскольку произведение двух рациональных дробей также является рациональной Дробью, то будет являться рациональной дробью от одной перемен- ной t и выражение вида 313
я[ад,я2(')] -ад. (12.27),I в котором R(x,y) — любая рациональная дррбь от двух аргументов х yt a R2(t) и 7?з(0 —любые три рациональные дроби от одной ne-k ременной t. f Используя этот факт, опишем еще три класса функций, допускаю-| щих интегрирование в элементарных функциях. ( А. Интегрирование тригонометрических в ы ражений. Пусть R(x,y) — произвольная рациональная дробь от двух аргумен-IB тов х и у. Убедимся в интегрируемости в элементарных функциях лю- бой функции вида R (sinx, cosx), (12.28): для чего сделаем так называемую универсальную т р и г о - , ♦ х ч неметрическую подстановку / = tg—. При этом п , , 2Л x = 2arctgr, ах =--, 1 + Z2 . X sin- 1 9 sin х = 2 sin—cos — = 2-— cos2 — = 2tg —-=--, 2 2 x 2 . 2. ?x l + <2 cos— 1 + tg — 2 2 cosx = 2cos2 —-1=2--------1 =--- = -— 2 1 + tg2* 1 + tg2* 1 + ' 2 2 и потому неопределенный интеграл от функции вида (12.28) J 7?(sinx,cosx)dr = J Я 2t 1-/2> 1 + Г2 ’ 1 + /2 , 14+2 превращается в берущийся в элементарных функциях интеграл от ра- циональной дроби (12.27), у которой Л,(0 = 2t 1 + Г2 /?2(0 1-<2 14+2’ 2 1 + t2 Б. Интегрирование дробно-линейных ирра- циональностей. Пусть снова R(x,y) — произвольная рациональная дробь от двух ар- 314
гументов х и у. Убедимся в интегрируемости в элементарных функци- да любой функции ВИДЯ J faTb} (12.29) 7? х »--- I V ex + d J • , у которой а, Ь, с и d — постоянные вещественные числа, удовлетворя- ющие условию ad - be Ф 0, а п — любое целое положительное число, функция вида (12.29) называется дробно-линейной ирр^, циональностью. ! Для ее интегрирования сделаем подстановку [ах + Ь п „ ax + b dt”-b , (ad - Ьс)пГ~'^ ycx + d cx + d a-ctn (a-ct”)2 неопределенный интеграл от функции вида (12.29) г ( lax + b'], г ( dt“-b .-1 (ad-beynt"^ , J vcx + <Zj J \a-ct" ) (a-ct”Y превращается в берущийся в элементарных функциях интеграл от ра- циональной дроби (12.27), у.которой = R2(t) = t, А3(0 = --~—-у-' a — ct (a —ct ) В. Интегрирование квадратичных иррацио- нальностей. Снова предположив, что R(x,y) является рациональной дробью от двух аргументов х и у, убедимся в интегрируемости в элементарных функциях любой функции вида R(x9 Vox2 + 6х + с), (12.30) у которой ах2+ Ьх + с — произвольный квадратный трехчлен, не име- ющий совпадающих вещественных корней1 и имеющий в случае, ког- да его корни являются комплексными, коэффициент а, удовлетворяю- щий условию а > 0. Функция вида4(12.30) называется квадратичной ирра- циональностью. Так как квадратный трехчлен ах2 + Ьх + с не имеет совпадающих вещественных корней, то возможны два случая: 1) этот трехчлен име- ’Если бы указанный квадратный трехчлен имел совпадающие вещественные корни X! = х2, то было бы справедливо равенство ах2 + Ьх + с = a(x-xj)2, и функция (12.30) являлась бы рациональной дробью. 315
ет комплексные корни (и в силу того, что а > 0, является для всех х положительным); 2) этот трехчлен имеет два несовпадающих вещест- венных корня X] и Х2 (и потому представляется в виде ах2 + Ьх + с = = а (х—Х|) (х — х2)). Убедимся в том, что в случае 1 неопределенный интеграл от функ- ции (12.30) переходит в интеграл от рациональной дроби с помощью так называемой п е р в о й подстановки Эйлера • t = 7ах2 +&с + с + х 4а. Действительно, возводя в квадрат равенство 4 ах2 +bx + c = t-xja, мы Получим, что bx + c = t2 -24а tx, так что t2 — с I 2 7 _ t24a-c4a -fat2 + bt + c4a x = —p=---, vox +bx + c = t-----=----=------=--------, 2-Jat + b 2-Jat + b 2-Jat + b , „ Vaf2 + bt + c4a , ax=2------7=------at, Q,4at + b)2 и потому неопределенный интеграл от функции (12.30) | R (х, Vox2 +bx + c)dx = t2 — с 4at2 + bt + c4c4 ^4at2 + bt + c4a & ^24at + b 24at + b Q4~at + b)2 превращается в берущийся в элементарных функциях интеграл от ра- циональной дроби (12.27), у которой 24а t + b 24а t + b (24а t +р)2 Убедимся, наконец, в том, что в случае 2 неопределенный интег- рал от функции (12.30) переходит в интеграл от рациональной дроби с помощью так называемой в т о р о й подстановки Эйле- ра t_^Jax2 +bx + c х-х. ’ ! в которой Х| — один из двух не равных друг другу вещественных кор- ней квадратного трехчлена. 316
Действительно, возводя в квадрат равенство Vах1 + Ьх + с = t(x - х,) и сокращая получающееся при этом равенство на (х - х(), мы найдем, что а(х - х2) = t2(x - Х|), так что -ах, + x,t2 I а(х.-х,)/ , 2а(х, -x.)t , X =---?--—, у ах + Ьх + с = -Ц-----2—, dx = —V-----dt, t2-a t2-a (t2-a)2 и потому неопределенный интеграл от функции (12.30) г I—i ~ , г п\ -ах, + хЛ2 а(х. -x,)t\la(x, -x,)t . I R(x,\ax +bx + c)dx=\ 7? ---*--— -----------------------— —V--r-dt J J I, t2-a t2-a ) (t2-a)2 превращается в берущийся в элементарных функциях интеграл от ра- циональной дроби (12.27), у которой j?(f) = ~flX^+V2> Л,(/) = £^^2£> R (?) = 2fl^-^.)< Г-a t-a (Г2-a)2 В качестве упражнения читателю предлагается с помощью соответ- ствующей подстановки свести к рациональной дроби и затем вычис- лить следующие интегралы: г dx , с ЛЧ г ll + x dx (при любом а > 0), J-, J 1 + acosx------------------------------J \1-х 1-х г dx г dx х + л/х2 +х + 1 1 + Vl-x-2x2
Глава 13 Определенный интеграл § 1. Понятие определенного интеграла и достаточные условия его существования 1.1. Понятие интегральной суммы и ее предела Пусть функция /(х) определена и ограничена на сегменте [а, 6]. Напомним, что функция f(x) называется ограниченной на сег- менте [а, Ь], если существует постоянное число М> 0 такое, что |/(х)|< М для всех х из сегмента [а, 6]. Рассмотрим конечное число точек хь х2, ..., xI(-i, лежащих внутри сегмента [а, 6] и удовлетворяющих условию а<х\<Х2< ...<х„^<Ь. Удобно положить а =х0, Ь = хп и рассматривать точки а = х0, х\, х2,..., x„-i, х„ = Ь, удовлетворяющие условию а=х0<х1<х2<...<хп^<хп=Ь. (13.1) Точки, удовлетворяющие неравенствам (13.1), производят р а з би- ение сегмента [а, Ь] на п частичных сегментов [х0, *1], [Х|, х2], ..., [хя.ь х„]. Длину к-го частичного сегмента [х*_ь **], равную х*-х*_ь обозна- чим символом Дхк, т. е. положим Дх* = х^-хц, и возьмем на каждом сегменте [х*_ь х*] произвольную точку так что хАЧ < £>к < хк. Составим для рассматриваемого произвольного разбиения (13.1) сегмента [а, 6] следующую сумму: а=а(хх.,^) = £/^)-Дхг (13<2) ы Сумма (13.2), зависящая от выбора точек Хк разбиения (13.1) и от выбора точек на частичных сегментах [хм, xj, что и отмечено в за- писи а(хк,^к), называется интегральной суммой для ф у н к ци и/(х) н а сегменте [а, 6], отвечающей данному разби- ению (13.1) сегмента [а, 6] и данному выбору точек на частичных сегментах [х*_ь х*]. Так как число л частичных сегментов [х*_|, xj конечно, то найдется ' частичный сегмент с наибольшей длиной, т. е. существует число d, равное максимуму из л чисел Дхь Дх2, ..., Дх„: , d = max{Axt, Дх2.Дх„}. 318
Определение 1. Число I называется пределом интегра- льных сумм (13.2) при стремлении к нулю наибо- льшей длины d частичных сегментов, если для про- извольного числа 8 > О найдется отвечающее ему положительное чис- ло 5 (е) такое, что при единственном условии d<8 (г) (независимо от выбора точек на частичных сегментах [хА-ь л>]) справедливо нера- венство |а -/|< 8. Определение 2. Функция /(х) называется интегрируемой на с е г м е н т е [а, Ь], если для этой функции существует на сег- менте [а, Ь] конечный предел I ее интегральных сумм (13.2) при стремлении к нулю наибольшей длины d частичных сегментов. При этом указанный предел I называется определенным интег- ралом от ф у нкц и и f(x) п о с е г м е н т у [а, Ь] и обознача- ется символом ь $f(x)dx. а (13.3) В этом обозначении функция f (х) называется подынтегра- льной функцией, число а — нижним пределом интег- рирования, а число b — верхним пределом интегрирования. Букву х в обозначении аргумента подынтегральной функции и симво- ла dx можно заменить любой другой буквой, т. е. определенный интег- ь рал (13.3) может быть записан и в виде и т- Д- а а Замечание. Мы заранее требовали, чтобы функцияf(х) явля- лась ограниченной на сегменте [а, 6]. На самом деле, легко убедиться в том, что требование ограничен- ности функции f (х) на сегменте [a, й] является необходимым условием ее интегрируемости на этом сегменте (т. е. является необходимым условием существования у интегральных сумм (13.2) ко- нечного предела I при стремлении к нулю наибольшей длины d час- тичных сегментов). Действительно, предположим, что функция /(х) не является ограниченной на сегменте [а, 6]. Фиксируем произвольное как угодно большое число А > 0 и рас- смотрим произвольное разбиение (13.1) сегмента [а, 6] (с как угодно малыми час- тичными сегментами). Так как функция /(х) не ограничена на сегменте [а, Л>], то она не ограничена хотя бы на одном частичном сегменте разбиения (13.1). Пусть это будет частичный сегмент [хх-_ь xj. Фиксируем в рассматриваемом произволь- ном разбиении (13.1) точки ..., ...» (все, кроме ^), а точку по- льзуясь неограниченностью функции /(х) на частичном сегменте [х*_ь выберем так, чтобы выполнялось неравенство |/Й^-Дх* > A + |/(U-Ax.+ - + + /(^,)-Дхм + ... + /йл)Дх„|. 319
Последнее неравенство позволяет утверждать, что для произвольного рассмат- риваемого нами разбиения (13.1) сегмента [а, 6] (с как угодно малыми частичными сегментами) |о| = |№)Дг» + [/й)Дх|+...+/(^.,)Дх*.| + /(^|)Дхм+...+/(^)Дх„ ]| * :> |/(^)|Дг4 -|/(^)Дх1+...+№.|)ДгЬ1 + /йм)Дхм+...+Л^)Дх„| * А, что и доказывает, что у интегральных сумм (13.2) не существует конечного преде- ла при стремлении, к нулю наибольшей длины d частичных сегментов. 1.2. Верхние и нижние суммы и их свойства Так как по условию функция f(x) ограничена на сегменте [а, 6], то она ограничена и на любом частичном сегменте [x^i, х*] разбиения (13.1). Поэтому по теореме 1 из главы 1 у функции f(x) существуют на любом частичном сегменте [хЛ_ь х*] точная верхняя грань, которую мы обозначим символом Л/*, и точная нижняя грань, которую мы обозна- чим символом т/с. Составим для произвольного разбиения (13.1) сегмента [а, £>] две суммы S = (13.4) ы л = £Х-Дх*. (13.5) ы Сумма (13.4) называется верхней суммой, отвечающей раз- биению (13.1), а сумма (13.5) — нижней суммой, отвечающей этому разбиению. Заметим, что в отличие от интегральной суммы (13.2), которая за- висит не только от выбора точек х* разбиения (13.1), но и от выбора точек на частичных сегментах [х*_ь xj, верхняя сумма 5 и нижняя сумма 5 зависят только от выбора точек х* разбиения (13.1). Установим несколько свойств верхних и нижних сумм. Свойство 1. Для любого фиксированного разбиения (13.1) при любом выборе точек %* на частичных сегментах [х*_1, хл] интеграль- ная сумма (13.2), верхняя сумма (13.4) и нижняя сумма (13.5) связаны неравенствами s<a<.S. (13.6) В частности, для любого фиксированного разбиения (13.1) s <s. (13.69 Действительно, при любом положении точки на частичном сег- менте [xt_i, хл] справедливы неравенства тк<ДЫ<Мк. 320
Умножая эти неравенства на положительное число Дх* и после это- го суммируя их по всем к, равным 1, 2, п, мы и получим неравен- ства (13.6).' Свойство 2. Для любого фиксированного разбиения (13.1) и для любого числа в > О точки %* на частичных сегментах [х*_ь х*] можно выбрать так, что отвечающая этому выбору точек ^* интег- ральная сумма (13.2) и верхняя сумма (13.4) будут связаны неравенст- вом S-a<s. ' , (13.7) Для любого фиксированного разбиения (13.1) и любого числа е > 0 точ- ки £* на частичных сегментах можно выбрать и так, что отвечаю- щая этому выбору точек £* интегральная сумма (13.2) и нижняя сум- ма s будут связаны неравенством <з-з<е. (13.79 Замечание к свойству 2. Разности 5 -ст и ст -s, стоя- щие в левых частях неравенств (13.7) и (13.Т), в силу свойства [не- отрицательны. Проведем доказательство только первого утверждения свойства 2, ибо второе утверждение доказывается аналогично. Так как число М* является точной верхней гранью функции /(х) на частичном сег- менте [х*_ь х*], то для любого числа е > 0 на этом частичном сегменте найдется точка £* такая, что f(^k)>Mk —. Умножая это неравен- Ь- а ство на положительное число Дх* и после этого суммируя его по всем к, равным 1, 2, ..., п, мы получим неравенство a>S -е, эквивалентное неравенству (13.7). Будем называть измельчением разбиения (13.1) то разбие- ние, которое возникает при добавлении к разбиению (13.1) нескольких •новых точек разбиения. Свойство 3. При измельчении разбиения верхняя сумма не воз- растает, а нижняя сумма не убывает. Достаточно рассмотреть случай добавления одной новой точки разбиения, ибо добавление нескольких новых точек можно произвести последовательно. ' Проведем рассуждения только для верхних сумм, ибо для нижних сумм они проводятся аналогично. Пусть новая точка разбиения лежит на частичном сегменте [х*-ь х*] и разбивает этот сегмент на два частичных сегмента [х*_ь £] и К» хк]. 321
Тогда верхняя сумма S' измельчения будет отличаться от верхней суммы 5 исходного разбиения (13.1) только тем, что одно слагаемое Mk • Ах* в сумме S заменится в сумме S' двумя слагаемыми + (1з.8) в которых через М'к обозначена точная верхняя грань функции f (х) на сегменте [х*.|, £], а через М" обозначена точная верхняя грань /(х) на сегменте [^, х*]. Так как точная верхняя грань функции на подмноже- стве не превосходит точную верхнюю грань на всем множестве, то справедливы неравенства М'к S Мк, М"к < Мк. В силу этих неравенств сумма (13.8) меньше или равна ЧД + Мк(хк -£) = Мк(хк -хЬ|) = МкАхк, что и завершает обоснование неравенства S'<S. Свойство 4. Нижняя сумма s и верхняя сумма S двух произво- льных и, вообще говоря, различных разбиений связаны неравенством s<S. Для случая двух совпадающих разбиений это неравенство нами уже доказано (см. свойство 1, неравенство (13.6')). Рассмотрим два различных разбиения, одно из которых задается точками (13.1), а вто- рое — точками ' a=x'Q<x\< ...<x'm_x<x'm=b, (13.1') Среди точек разбиений (13.1) и (13.1') могут быть и совпадающие точки. Добавив к точкам разбиения (13.1) все недостающие точки раз- биения (13.1'), мы получим разбиение, являющееся измельчением как разбиения (13.1), так и разбиения (13.1'). Обозначив через S" и s" соот- ветственно верхнюю и нижнюю суммы этого измельчения, через S и j— соответственно верхнюю и нижнюю суммы разбиения (13.1), а через S' и s' — соответственно верхнюю и нижнюю суммы разбиения (13.1'), мы получим, что в силу свойств 1 и 3 справедливы неравенства s<.^<S"<S\ s’<:s” <$"<$, которые и означают, что нижняя сумма s разбиения (13.1) не превос— ходит верхнюю сумму S' разбиения (13. Г), а нижняя сумма s' разбие- ния (13.Г) не превосходит верхнюю сумму S разбиения (13.1). Следствие из свойства 4. Множество {£} всех верх- них сумм, отвечающих всевозможным разбиениям сегмента, [a, Z>],
ограничено снизу (в качестве нижней грани этого множества можно взять любую нижнюю сумму). Множество {.у} всех нижних сумм, от- вечающих всевозможным разбиениям сегмента [a, й], ограничено сверху (в качестве верхней грани этого множества можно взять любую верхнюю сумму). Из этого следствия и из теоремы 1 главы 1 вытекает, что сущест- вует точная нижняя грань множества {5} всех верхних сумм, которую мы обозначим символом I и назовем верхним интегралом Дарбу, и существует точная верхняя грань множества {5} всех нижних сумм, которую мы обозначим символом 7 и назовем нижним интегралом Дарбу. Свойство 5. Верхний и нижний интегралы Дарбу связаны не- равенством 1_<1. Доказательство справедливости этого неравенства проведем от противного. Предположим, что это неравенство несправедливо, т. е. I_>I. Тогда разность 1_-1 является положительным числом, которое мы обозначим через е, дак что 7 -1 = е и потому /-£=/+£ (13.9) " 2 2 По определению I как точной нижней грани множества {£} всех верхних сумм для положительного числа | найдется такое разбиение сегмента [a, Z>], верхняя сумма S которого удовлетворяет неравенству 2 Аналогично по определению 7 как точной верхней грани мно- , . е жества {5} всех нижних сумм для положительного числа - найдется такое разбиение сегмента [а, 6], нижняя сумма s которого удовлетво? ряет неравенству ,>/-« («•") “ 2 Сопоставляя неравенства (13.10) и (13.11) с равенством (13.9), мы получим неравенство s>S, противоречащее свойству 4°. Полученное противоречие доказывает справедливость неравенства / < I. Следствие из свойства 5. Для верхней суммы S и ниж- ней суммы s произвольного разбиения сегмента [а, Ь] справедливы не- равенства s<L<I^S. (13.12) 323
1.3. Необходимое и достаточное условие существования определенного интеграла Теорема 1. Для того чтобы для функции f(x) из некоторого клас- са существовал определенный интеграл по сегменту [а, 6], необходи- мо и достаточно, чтобы для любого числа е > 0 существовало отве- чающее ему число 8 (е) > 0, обеспечивающее справедливость неравен- . ства S — s< г (13.13) для верхней суммы S и нижней суммы s любого разбиения сегмента [а, 6], у которого наибольшая длина d частичных сегментов удовлет- воряет условию J < 8 (е). Доказательство. 1. Необходимость. Пусть функ- ция f(x) интегрируема по сегменту [а, Ь], т. е. для этой функции суще- ствует предел I ее интегральных сумм (13.2) при стремлении к нулю наибольшей длины d частичных сегментов разбиения сегмента [а, 6]. Фиксируем произвольное число е > 0. В силу определения предела интегральных сумм (см. определение 2 из разд. 1.1) найдется отвечаю- щее этому £ число 8 (е) > 0, обеспечивающее справедливость неравен- ства 4 для любого разбиения сегмента [a, Z>], у которого наибольшая длина d частичных сегментов меньше числа 5 (е) (при произвольном выборе точек на частичных сегментах [х,ы, xj). При этом в силу свойства 2° для этого же числа е > 0 можно взять в качестве точек такие точки ^'к, что будет справедливо неравенство <1315) 4 и такие точки Ц, что будет справедливо неравенство ' (13Л6>' 4 Так как неравенство (13.14) справедливо при произвольном выборе точек на частичных сегментах, то, взяв в качестве этих точек снача- ла точки ^'к, а затем точки мы получим неравенства |а(х*Л:)-/|<| (13Л4'} 324
Заметим теперь, что поскольку S - s = [S - ст(х,Л'*)] + [с (хк, -/] + [/-а(хк, ^)] + [ст(хо - 4 и модуль суммы четырех слагаемых не превосходит суммы модулей этих слагаемых, то справедливо неравенство1 S - 5 < [S - ст(хЛ., ^.)] + \а(хк, -/| +|ст(х*Л;) -1\ + [ст(х,, -4 Используя в правой части последнего неравенства оценки (13.15), (13.16) и (13.14'), мы получим, что для произвольного фиксированного нами е>0 и для любого разбиения сегмента [a, £>], у которого наибо- льшая длина d частичных сегментов меньше числа 8 (е), справедливо неравенство S-5 <е. Необходимость доказана. • • 2. Достаточность. Предположим, что для любого числа е > 0 существует отвечающее ему число 8 (е) > 0, обеспечивающее справедливость неравенства (13.13) для верхней суммы S и нижней суммы s произвольного разбиения сегмента [а, Ь], у которого наиболь- шая длина d частичных сегментов меньше числа 8 (е). Из неравенств (13.12) и (13.13) вытекает, что для любого числа е>0 справедливы неравенства 0 <7 -7<е, а из последних неравенств и из произвольности числа е>0 вытекает, что I -1 = 0, т.е. 1=1. Обозначим общее значение интегралов Дарбу I и / через I и дока- жем, что это число I и является пределом интегральных сумм (13.2) при стремлении к нулю наибольшей длины d частичных сегментов, т. е. является определенным интегралом от функции/(х) по сегменту [а, Ь]. Заметим, что для любого разбиения сегмента [a, Z>] в. силу свой- ства 1° справедливо неравенство (13.6), а в силу следствия из свойств^' 5° справедливо неравенство (13.12), которое в соединении с равенст- вом I = !_ = ! приводит к неравенствам ' s<I<S. , (13.17) Сопоставляя неравенства (13.17) с неравенствами (13.6), мы получим, что для любого разбиения сегмента [а, 6] оба числа ст и I лежат на сегменте [у, $], а отсюда следует, что для любого разбиения сег- мента [a, Z>] |ст -/| < S - s. (13.18) Из сопоставления неравенств (13.18) и (13.13) вытекает, что для любого числа в > 0 существует отвечающее ему число 8 (е) > 0, обес- 1 Так как разности [5 -o(xt, Jjj)] и [ofo, £j)-s] неотрицательны, то мы не пишем знака модуля у этих разностей. 325
печивающее справедливость неравенства |а -7|< е для любого:разбие- ния сегмента [a, 6], у которого наибольшая длина d частичных сегмен- тов меньше числа 5 (е). Это и означает, что число I является пределом интегральных сумм с при стремлении к нулю наибольшей длины d ча- стичных сегментов. Достаточность и вся теорема 1 доказаны. Замечание 1 к теореме 1. Непосредственно из теоремы 1 вытекает, что если значения интегрируемой на сегменте [а, 6] функ- ции f(x) изменить в конечном числе р точек хр х2, ..., х$ этого сегмен- та, положив их равными каким угодно числам /(Xj),/(x2), —,/(*,,)> то функция f(x) останется интегрируемой на сегменте [а, 6] и значение интеграла от нее не изменится. Это вытекает из того, что при такой замене в сумме S-s = ^Mk -тк)Дхк изменятся только слагаемые (Мк -тк)Дхк по не более чем р частичным сегментам, содержащим точки х,, х2, хр, а сумма всех этих слагаемых не превосходит числа (М-т)- d-р (где М и т — точные грани f(x) на сегменте [a, b\, d — длина наибольше- го частичного сегмента) и для любого числа £ > 0 может быть сделана g меньше числа - выбором достаточно малого 5 (е). 2 Замечание 2 к теореме 1. Более глубокий анализ, кото- рый мы опускаем, позволяет утверждать, что необходимым и доста- точным условием интегрируемости функции f (х) на сегменте [a, Z>] яв- ляется требование справедливости неравенства (13.13) хотя бы для одного разбиения сегмента [а, 6]. § 2. Интегрируемость непрерывных, монотонных и кусочно непрерывных функций 2.1. Интегрируемость непрерывных функций Теорема 2. Если функция f(x) непрерывна на сегменте [a, Z>], то она интегрируема на этом сегменте. Доказательство. Так как функцияf(x) непрерывна на сег- менте [а, Ь], то по теореме Кантора (см. теорему 17 из разд. 9.3 гл. i9) она и равномерно непрерывна на этом сегменте. Это означает, что для любого числа £ > 0 найдется отвечающее ему число 8 (в) > О такое, что - колебание функции f(x) на любом содержащемся в [a, Z>] сегмен- те длины, меньшей 8(e), будет меньше числа s/(Z>-a). Рассмотрим произвольное разбиение (13.1) сегмента [а, 6], у кото- рого наибольшая длина d частичного сегмента меньше указанного чис- 326
ла 5(e). Тогда для любого к= 1, 2, ..., и колебание Мк-Шк функции у(х) на частичном сегменте [х^_ь х*] удовлетворяет условию1 МЛ(13.19) Ь-а С помощью неравенства (13.19) оценим для указанного разбиения (13.1) разность 5-s: S-s=^Mk-Exk-imk-hxlc=^(Mk-mk)^xk<—^—-'^^xk=E. 4=1 4=1 4=1 (О —a) i=| В силу теоремы 1 полученная оценка S-s<e завершает доказате- льство теоремы 2. 2.2. Интегрируемость монотонных функций Теорема 3. Если функция /(х) определена и не убывает или не воз- растает на сегменте [а, Ь], то она интегрируема на этом сегменте. Доказательство. Проведем рассуждения для неубывающей функции, ибо для невозрастающей функции они проводятся аналогич- но. Если функция/(х) не убывает на сегменте [а, 6], то на любом час- тичном сегменте [Х4-1, **] разбиения (13.1) точная нижняя грань тк бу- дет достигаться на левом конце x*_i этого сегмента, а точная верхняя грань Мк — на правом его конце х*. Поэтому будут справедливы соотношения /(а) = /и1 < Л/, = т2 < М2 = т3 < М3 =т4 < ... = тп < Мп = f (Ь), из которых вытекает равенство £(Mt-mJ=/(6)-/(a). (1320) 4=1 Исключим тривиальный случай когда неубывающая функция /(х) тождественно равна постоянной /(а) и ее интегрируе- мость очевидна. Если же f(a) <f(b), то для любого числа е>0 и произвольного разбиения сегмента [а, 6], у которого наибольшая длина d частичных 1 Здесь Мк и тк обозначают соответственно точную верхнюю и точную нижнюю грани f(x) на частичном сегменте [х>_|, х*]. 327
сегментов меньше числа--------------, в силу (13.20) будет справедли- 3 во неравенство S -5 = £(Мк -тк) Лхк< —— • £(Мк -тк')=г, *=i *=i которое в силу теоремы 1 устанавливает интегрируемость /(х). 2.3. Интегрируемость кусочно непрерывных функций Функцияf(х) называется кусочно непрерывной на сег- менте [а, 6], если она непрерывна во всех внутренних точках сегмента [а, 6], за исключением, быть может, конечного числа точек хр х2, ..., хр, в каждой из которых она имеет конечное значение f(xk) и конечные левый и правый пределы f(xk -0) и f(xk + 0), и если, кроме того, су- ществуют конечный правый предел f(a + 0) и конечный левый предел Л*-о). Докажем, что любая кусочно непрерывная на сегменте [а, й] функ- ция /(х) интегрируема на этом сегменте. Так как кусочно непрерывная на сегменте [а, Ь] функция /(х) ограничена на этом сегменте, то у нее существуют на сегменте [а, 6] точная верхняя грань Мн точная нижняя грань т. Фиксируем произвольное число е > 0 и подвергнем весь сегмент [а, &] доста- точно мелкому разбиению (13.1) на частичные сегменты [х*-ь xj. Для этого разбие-. « ния оценим разность 5-5 между верхней и нижней суммами, равную 5-5 = = -тк)-Дхк (в этой разности Мк и тк — точная верхняя и точная нижняя *=i •. ' грани функции /(х) на частичном сегменте [х*-ь xj). Сначала оценим сумму ^(Мк-тк)- Ьхк по частичным сегментам [xjm, xj, н е *=i I содержащим точек хр х2,..., хр. На дбъединении всех таких сегментов, со- I ставляющем разбиение и каждого из (р + 1) отрезков [a, xj, [хр х2], ..., [хр, Ь], на которых функция f (х) непрерывна, для фиксированного нами е > 0 в силу теоремы Кантора (см. теорему 17 из разд. 9.3 гл.9) найдется число 51(e) > 0 такое, что при условии, что наибольшая длина d частичных сегментов меньше 5>(е>, разность Мк-Шк не превзойдет числа —-—. Поэтому при d< 5i(e) сумма ^(Мк -тк) Лхк 2(Ь-а) по всем частичным сегментам разбиения (13.1), не содержащим точек хр х2, ...» хр, ~ е не превзойдет числа —. 2 Сумма ^(Мк-тк) по всем частичным сегментам разбиения (13.1), содер- жащим т о ч к и X], х2, ..., хр (в силу того, что длина всех этих сегментов мень- ше числа d(p + 1), а разность Мк -Шк не превосходит М- пг)9 будет меньше е . б числа — при d <------------- 2 г 2(А/-/л)(р+1) 328
Если обозначить через 5(e) наименьшее из двух чисел---------------- и 2(Л/-ш)(р+ 1) 5i(e), то при d< 5(e) мы получим неравенство S-s < е, устанавливающее в силу те- оремы 1 интегрируемость функции /(х) на сегменте [а, 5]. § 3. Свойства определенного интеграла Г. Примем как соглашение, что }/(*)<& =0 а (13.21) и что для любой интегрируемой на сегменте [а, 6] функции f(x) Ь а (13.22) 2°. Линейное свойство. Если каждая из двух функций /(х) и S (х) интегрируема на сегменте [а, 6] и а и р — произвольные вещественные числа, то и функция [а -/(х) + р • g (х)] интегрируема на сегменте [а, Ь], причем ь ь ь J[а -/(х) + р-g(x)]dx = а • J f(x)dx + Р • Jg(x)dx. а а а (13.23) Справедливость этого свойства вытекает из того, что для произво- льного разбиения (13.1) сегмента [a, Z>] и произвольного выбора точек на частичных сегментах [хм, х*] справедливо равенство =<* +₽-&(UA. Ы к=\ ы в силу которого из существования предела при стремлении к нулю наибольшей длины d частичных сегментов у каждой из сумм £/£л)Дх* и вытекает существование предела при стрем- Ь1 ы лении d к нулю у суммы ^[а • /(£*) + Р-£(£*)]Дх* и равенство (13.23) *=i Для указанных пределов. В частности, из линейного свойства (13.23) вытекают следующие Утверждения: а) при а= 1, р = 1 мы получим, что из интегрируемости на сег- менте [а, Ь] каждой из функций /(х) и g (х) вытекает интегрируе- 329
мость на этом сегменте их суммы \f(x) + g(x)] и справедливость ра- венства ь ь ь }[/(*)+ £(*)]<& = J f(x)dx +1 g(x)dx\ а а а б) при а= 1, Р = -1 мы получим, что из интегрируемости на сег- менте [а, Ь] каждой из функций f(x) и g(x) вытекает интегрируе- мость на этом сегменте их разности [/(x)-g(x)] и справедливость равенства ь ь ь а а а в) при произвольном вещественном а и при р = 0 мы получим, что из интегрируемости на сегменте [а, 6] функции f(x) вытекает интег- рируемость на этом сегменте функции [а • /(х)] и справедливость ра- венства ъ ь J [а • f(x)]dx = а J f(x)dx. а а 3°. Интегрируемость произведения двух ин- тегрируемых функций. Если каждая из функций f(x) и g(x) интегрируема на сегменте [а, 6], то и их произведение [/(x)-g(x)] является интегрируемой на этом сегменте функцией. Так как справедливо равенство 4/(x)-g(x) = [f(x) + g(x)]2- -[f(x)-g(x)]2, и так как сумма [f(x)+g(x)] и разность [f(x)-g(x)] интегрируемых на сегменте [а, 6] функций / (х) и g (х) также являются (в силу свойства 2°) интегрируемыми на этом сегменте функциями, то достаточно доказать, что квадрат F\x) интегрируемой на сегменте [a, Z>] функции F (х) является интегрируемой на этом сегменте функ- цией. , Так как интегрируемая на сегменте [а, 6] функция F(x) ограниче- на, то у нее существуют на этом сегменте точная верхняя грань М-н точная нижняя грань т. Сначала рассмотрим случай т > 0, т. е. случай неотрицате- льной на сегменте [а, Ь] функции F (х). Для произвольного разбиения сегмента [а, Ь] обозначим символами А4 и тк точную верхнюю и точную нижнюю грани функции F(x) на частичном сегменте [хЛ_ь х*]. Тогда точная верхняя и точная нижняя грани функции /^(х) на этом сегменте будут равны и т* и, поско- льку Mk<Mn тк<,М (для всех k = 1, 2, ..., п) и справедливо равенство 330
Ml - ml = (ЛД - mk) • (Mk + mt), то для всех к - 1, 2.n справедливо неравенство Ml - ml < 2M (Mk - тк). Умножая последнее неравенство на положительное число Дх4. и по- сле этого суммируя его по всем к, равным 1, 2, п, мы получим не- равенство S' - s' < 2М (S - з), в котором S и з — верхняя и нижняя сум- мы функции F (х), a S' и s' — верхняя и нижняя суммы функции F^(x) для рассматриваемого произвольного разбиения сегмента [а, 6]. Так как функция F (х) интегрируема на сегменте [а, Ь], до в силу теоремы 1 (условия необходимости) для любого числа а>О найдется отвечающее ему число 8 (а) > 0, обеспечивающее справедли- g вость неравенства S-s<-для любого разбиения сегмента [а, 8], У 2М которого наибольшая длина d частичных сегментов меньше числа 8 (а). Для любого такого разбиения в силу соотношения S' - s’<2М (S - з) будет справедливо неравенство S'-s'<&, которое в силу теоремы 1 (условия достаточности) доказывает интегри- руемость функции F2(x) на сегменте [а, 6]. Итак, для неотрица- тельной интегрируемой функции F(x) интегрируемость функции F2(x) доказана. Если же интегрируемая на сегменте [а, 8] функция F(x) н е яв- ляется неотрицательной на этом сегменте и число т < О является ее точной нижней гранью на этом сегменте, то, поскольку функция [F(x) +1 т |] неотрицательна и (в силу свойства 2°) интегриру- ема на сегменте [а, 8], то по доказанному выше функция [F(x) +| т|f интегрируема на этом сегменте. > Из интегрируемости этой функции, из равенства Гг(х) = [Г(х)+| т |f - 2| т | • F (х) -1 т |2 и из интегрируемости на сегмен- те [а, 6] каждой из функций 2| th|-F(x) и |w|2 вытекает интегрируе- мость на этом сегменте функции /^(х). 4°. Свойство аддитивности. Если а <с<Ь и функция /(х) интегрируема на каждом из сегментов* \а, с], [с, Ь] и [а, Ь], то J/(x)dx + J/(x)tZx = J/(x)dx. (13.24) аса 1 На самом деле требование интегрируемости/(х) на всех трех сегментах [а, с], [с, &] и {а, 6] является излишним, ибо можно доказать, что из интегрируемости /(х) на сегментах [а, с] и [с, Ь] вытекает ее интегрируемость на сегменте [a, S], и, наоборот, из интегрируемости/(х) на сегменте [а, 6] вытекает ее интегрируемость на каждом из сегментов [а, с] и [с, &]. - 331
Для обоснования этого свойства подвергнем сегмент [а, 6] произ- вольному разбиению (13.1), включая точку с в число точек разбиения. Тогда это разбиение (13.1) включает разбиения каждого из сегментов [а, с] и [с, Ь] и, обозначая символами а [а, с], а [с, Ь] и а [а, Ь] интег- ральные суммы, относящиеся к сегментам [а, с], [с, 6] и [а, 6] соответ- ственно, мы получим, что а [а, с] + а [с, 6] = а [а, Ь]. (13.25) Так как при стремлении к нулю наибольшей длины d частичных сегментов'суммы а [а, с], а [с, i] и а [а, Ь] сколь угодно близко при- t t , с b 6 ближаются к значениям | f (x)dx, J f (x)dx и (x)dx соответственно, a > с a то из равенства (13.25) вытекает справедливость соотношения (13.24). Отметим, что, используя соглашение (13.22), легко убедиться в том, что равенство (13.24) остается справедливым и в случае, когда точка с лежит за пределами сегмента [а, &], т. е. в случаях а < b < с и с <а<Ъ. 5°. Если функция f(x) интегрируема на сегменте [а, Ь] и н е о т - р и цательна на этом сегменте, то >)^о. ' <13-26> Действительно, все интегральные суммы функции /(х), отвечаю- щие любому разбиению сегмента [а, 6], неотрицательны. Поэтому и предел этих интегральных сумм, т. е. интеграл, стоящий в левой части (13.26), неотрицателен. 6°. Если каждая из функций /(х) и g (х) интегрируема на сегменте [а, £] и если в каждой точке х этого сегмента справедливо неравен- ство /(x)>g(x), то \f(x)dx>\g(x)dx. (13.27) ‘ 1 а а Действительно, рассмотрим новую функцию F(x)=f (х) - g (х) и заметим, что эта функция Г(х)неотрицательнав каждой точ- ке х сегмента и интегрируема на этом сегменте как разность двух ин- тегрируемых функций (в силу следствия б из линейного свойства 2°). Поэтому в силу свойства 5° ъ jF(x)^>0. а (13.28) 332
Так как в силу следствия б из линейного свойства 2° I j F(x)dx = J/(x)dx - j g(x)dx, о a a то неравенство (13.28) можно переписать в виде ь ь [f(x)dx- fg(x)dx>0, а а эквивалентном неравенству (13.27). 7°. Формула среднего значения. Если функция f (х) ограничена и интегрируема на сегмёнте [а, 6], а символы Мит обо- значают соответственно ее точную верхнюю и точную нижнюю гра- ни на этом сегменте, то найдется число ц, удовлетворяющее нера- । венствам т<\х<М и обеспечивающее справедливость равенства \f(x)dx = p(b-a), ' (13’29) а i называемого формулой среднего зн а ч е н и я. Для обоснования этой формулы заметим, что для всех х из сегмен- та [а, Ь] справедливы неравенства т < Из этих йеравенств и из того, что как функция f (х), так и постоян- ные т и М интегрируемы на сегменте [а, 6], получим, используя свой- j ство 6°, ЧТО1 jmdx< jf(x)dx<[Mdx. (1330) а а а b b b Ь Так как J mdx = m^dx = m(b - a), J Mdx - dx - M(b - а), то неравен- a a a a ства (13.30), поделенные на (b-а), можно переписать в виде —j/(x)dx<M. (13'31) । Если мы теперь обозначим через ц число, равное (1332) а [ то в силу (13.31) это число ц удовлетворяет неравенствам т < ц <М и после умножения равенства (13.32) на (Ь-а) обеспечивает справедли- вость формулы (13.29). 333 ««ьс
8°. Формула среднего значения для непре- рывной функции. Если функцияf(х) непрерывна на сегменте [a, й], то на этом сегменте найдется точка £ такая, что справедли- во равенство \f{x}dx=f(^(b-a\ (1333) также называемое формулой среднего значения. Действительно, в силу теоремы 2 непрерывная на сегменте [a, £>] функция f(x) интегрируема на этом сегменте, и в силу свойства 7° для нее справедливо равенство.(13.29), в котором т^р<М. Остается за- метить, что в силу второй теоремы Вейерштрасса (см. теорему 16 из разд. 9.2 гл. 9) для непрерывной на сегменте [а, 6] функции /(х) най- дутся такие точки х\ и хг, что f (xi) = m,f (хг) = М, т. е. найдутся точки Xi и Х2, в которых функция /(х) достигает своих точной нижней и точ- ной верхней граней, а в силу теоремы 6 из § 3 гл. 9) функция f (х), не- прерывная на сегменте, ограниченном точками Х| и хг, принимает на этом сегменте все значения, лежащие между т =/(xj) и A/=/(x2), т. е. на этом сегменте найдется точка £ такая, что ц =/(£), и формула (13.29) переходит в (13.33). В качестве дополнительного материала сформулируем еще одно свойство определенного интеграла. » 9°. Если функция f(x) интегрируема на сегменте [а, Ь], то и функция. |/(х) | интегрируема на этом сегменте, причем справедливо неравенство \f(X)dx <13-34) а а Главная трудность при обосновании этого свойства — это доказательство ин- тегрируемости на сегменте [а, 6] функции I f (х) I. Для проведения этого доказате- льства следует воспользоваться тем, что в силу теоремы 1 существование для лю- бого £>0 числа 5(е)>0, обеспечивающего справедливость неравенства S-s<z для любого разбиения сегмента [а, &] с наибольшей длиной d частичного сегмента, меньшей 5(е), является не только достаточным, но и необходимым услови- ем интегрируемости функции. Подвергая сегмент [а, Ь] произвольному разбиению (13.1) и обозначая точную верхнюю и точную нижнюю грани функции /(х) на частичном сегменте [хы, хл] соответственно через Л4 и т^ а точную верхнюю и точную нижнюю грани функ- ции l/(x) I на том же сегменте соответственно через и m'ki мы без труда убе- димся в том, что М'к - т'к < Мк - /и*. Из последнего неравенства вытекает, что для любого разбиения (13.1) сегмента [а, &] верхняя сумма S и нижняя сумма 5 функции /(х) и верхняя сумма S' и нижняя сумма s' функции |/(х) I связаны неравенством S' -s' <S-s, 334
что и позволяет утверждать, что интегрируемость на сегменте [a, Z?] функции f(x) влечет за собой интегрируемость на том же сегменте функции 1/(х) |. После того как интегрируемость функции |/(х) I на сегменте [а, Ь] установле- на, для доказательства справедливости неравенства (13.34) достаточно заметить, что для каждой точки х сегмента [а, &] справедливы неравенства - |/(х) I </(х) < |/(х) I, которые в силу свойства 6° обеспечивают справедливость не- ь ь ь равенств -J|/(х)|Лс < J f(x)dx < J|/(x)|dr, эквивалентных (13.34). а а а Заметим в заключение, что из интегрируемости функции |/(х) | на сегменте [а, Ь] не вытекает, вообще говоря, интегрируемость функции f(x) на этом сегмен- те. Так, определенная и ограниченная на сегменте [0, 1] функция Дирихле {1, если х - иррациональное число, -1, если х -рациональное число не интегрируема на сегменте [0, 1], ибо при сколь угодно малой длине частичных сегментов разбиения сегмента [0, 1] все точки в интегральной сумме с можно взять как иррациональными (при этом интегральная сумма а будет равна 1), так и рациональными (при этом интегральная сумма о будет равна -1), а это означает, что предела интегральных сумм а при стремлении к нулю наибольшей длины d частичных сегментов не существует. Вместе с тем функция |/(х) I 1 интегрируе- ма на сегменте [0, 1]. § 4. Существование первообразной у любой непрерывной функции В дальнейшем нам придется рассматривать определенный интег- рал, у которого верхний предел интегрирования является пере- менной величиной х. Поэтому аргумент подынтегральной функции и дифференциала, стоящих под знаком такого интеграла, мы будем обозначать не буквой х, а буквой /, т. е. будем рассматривать определенный интеграл вида № (13'35) Интеграл (13.35) принято называть интегралом с пере- менным верхним пределом. Теорема 4. Если функция f(x) определена и непрерывна на интер- вале а <х<Ь, а с — любая фиксированная точка этого интервала, то функция F (г), определяемая интегралом с переменным верхним преде- лом (13.35), т. е. функция (13'36’ С является первообразной функции /(х) на этом интервале. 335
Доказательство. Достаточно доказать, что функция (13.36) имеет производную в любой точке х интервала (а, Ь), и эта производ- ная равна /(х). Зададим аргументу функции F (х) в точке х произвольное отличное от нуля приращение Дх, взяв его настолько малым, чтобы точка х + Дх лежала на интервале (а, Ь). Тогда F(x + Дх) - F(x) =7/(0Л - j f(t)dt. (13,37) Первый интеграл в правой части (13.37) в силу свойства аддитив- ности 4° можно представить в виде Х+Дх X Х+Дх /1 'у л f/(^=f/w^+( } Подставляя (13.38) в (13.37), получим, что г(х+дх)-г(х)= f/G)dt (13’39) Так как функция f (х) непрерывна на интервале (а, Ь), то она непре- рывна и на сегменте, ограниченном точками х и х + Дх. Поэтому по формуле среднего значения для непрерывной функции (см. формулу (13.33) из свойства 8° § 3) между х и х + Дх найдется точка £ такая, что хчДх f f(t)dt = /£)[(х + Дх) - х] = /£) • Дх, X и потому равенство (13.39) принимает вид F (х + Дх) - F (х) =/(£) • Дх, из которого после деления на Дх получим равенство F(x + Ax)-F(x)_^) (13.40) Дх \ ' Пусть теперь в (13.40) приращение Дх стремится к нулю. Тогда в силу того, что точка £ заключена между х и х + Дх и функция f (х) не- прерывна в точке х, правая часть (13.40) имеет предел при Дх->0, равный /(х). Следовательно, и левая часть (13.40) имеет равный /(х) предел при Дх —> 0. Но предел при Дх —> 0 левой части (13.40) (в слу- чае, если он существует) по определению производной равен F'(x). Итак, мы доказали, что в любой точке х интервала (а, Ь) производ- ная F'(x) существует и равна /(х). Теорема доказана. 336
Следствие из теоремы 4. Если функция f(x) непрерывна на ин- тервале (а, Ь), то любая первообразная f (х) на этом интервале имеет вид х ]f№t+c, с где С — некоторая постоянная. Замечание к теореме 4. Если функция/(х) непрерывна не на интервале (а, Ь), а на сегменте [а, />], то в (13.35) и в (13.36) в качестве фиксированной точки с можно взять точку а, т. е. вместо (13.36) можно рассмотреть функцию F(x) = \j\t)dt. (13Л1) а Повторяя для этой функции рассуждения, проведенные при доказа- тельстве теоремы 4, мы докажем, что функция F (х), определяемая ра- венством (13.41), имеет двустороннюю производную F'(x) в любой внутренней точке х сегмента [а, 6], равную f(х), имеет правую производную F'(a + 0) в граничной точке а, равную f (а), и имеет ле- вую производную F'(b-0) в граничной точке Ь, равную f(b). Обоснование результатов настоящего раздела дано Коши. § 5. Основная формула интегрального исчисления В этом параграфе мы установим знаменитую формулу Нью- тона — Лейбница, позволяющую для любой непрерывной на сегменте [а, 6] функции /(х) свести вычисление определенного интег- рала от этой функции по указанному сегменту к вычислению разности значений любой первообразной этой функции в точках b и а. Теорема S. Если функция f(x) непрерывна на сегменте [а, 6] и Ф(х) — любая первообразная функции /(х) на этом сегменте, то j f (x)dx = Ф(Ь) - Ф(а). (1342) а Формула (13.42) называется формулой Ньютона — Лей- бница. Доказательство. Согласно замечанию к теореме 4 функция F (х), определяемая равенством (13.41), является первообразной функ- ции /(х) на сегменте [a, Z>], Отсюда следует, что любая первообраз- ная функции /(х) на этом сегменте имеет вид (13-43) а где С — некоторая постоянная. 337
Полагая в равенстве (13.43) сначала х = а, а затем х = b и используя соглашение (13.21), получим Ф(а) = j f(t)dt + С = С, 1 (13,44) а b b Ф(Ь) = ^ + С = j f(x)dx + C. <13-45) а а Вычитая (13.44) из (13.45), мы получим формулу Ньютона—Лейбница (13.42). Теорема доказана. Замечание к теореме 5. Разность Ф(Ь)-Ф(а) значений первообразной Ф(х) в точках х = b и х = а принято записывать в виде Такая запись позволяет переписать формулу Ньютона—Лейбница (13.42) в виде |/(х>&=ф(х)|:. • (13-42,) а В главе 12, посвященной неопределенному интегралу, были изуче- ны широкие классы функций, для которых могут быть вычислены пер- вообразные. Формула Ньютона—Лейбница позволяет вычислять опре- деленные интегралы от функций, принадлежащих этим классам. Приведем несколько примеров. 1) |cosxo!x = sinx|‘=sini-sina 2) f— = lnx||2 = ln2-lnl = 1п2 i х 3) = arct8x|o =7-0 = 7- 01 + х 1 4 4 Кроме того, формула Ньютона—Лейбница позволяет перенести на случай определенного интеграла два уже известных нам метода вычис- ления неопределенного интеграла — метод замены пере- менной и метод интегрирования по частям. Пусть выполнены следующие условия: 1) функция f(x) непрерывна на сегменте [а, 6]; 2) сегмент [a, й] является множеством значений некоторой функ- ции х = g(t), определенной на сегменте а < t < р и имеющей на этом сегменте непрерывную производную g'ffy 3) g(a) = a, g(P) = b. (13.46) 338
При выполнении этих условий справедлива следующая ф о р му- ла замены переменной: (13,47) а а Формула (13.47) показывает, что если вычислен интеграл в ее ле- вой части, то вычислен и интеграл в ее правой части, и наоборот. Обозначим через Ф(х) одну из первообразных функции /(х). Тогда в силу формулы Ньютона—Лейбница (13.42) )/(*>& = Ф(&)-Ф(а). С другой стороны, так как функции Ф(х) и х = g(t) дифференцируе- мы (первая — на сегменте а < х < Ь, а вторая — на сегменте а < ? < Р), то по правилу дифференцирования сложной функции (см. § 3 гл. 10) 4<IfeW] = <If(x) g,(0 при x = g(t). (13.48) at Поскольку Ф'(х)=/(х), то при x = g(f) равенство (13.48) может быть переписано в виде 4^(0]=/[g(0]g'(0, at а последнее равенство означает, что на сегменте а</<р функция Ф[#(/)] является первообразной функции /(g(<)] • S' и потому по формуле Ньютона—Лейбница с учетом соотношений (13.46) мы полу- чим, что ₽ }Лг(0]-г'(0Л = Ф[г(Р)]-Ф[г(а)]=ВД-Ф(а). (13.49) а ' Сопоставление равенств (13.42) и (13.49) завершает вывод форму- лы замены переменной (13.47). В качестве примера применим формулу (13.47) для вычисления интеграла [1пх«—. Положим /=1пх, так что х = е‘, dx = e'dt. Учитывая, что / = 0 при х = 1, 1 х * = 1п2 при х = 2, получим [1пх«—= \t-dt = ~/2|о2 =-1п22 I I * о 2'2 Перейдем к обоснованию формулы интегрирования по частям. Если каждая из функций и (х) и v (х) имеет на сегмен- 339
me [a, Z>] непрерывную производную, то справедлива следующая фор- мула интегрирования по частям: ь ь | u(x)v’ (x)dx = [u(x) • v(x)]| ьа - j v(x) • и' (x)dx. (13.50) a a Учитывая, что v' (x)dx = dv, d(x)dx = du, формулу (13.50) можно пе- реписать в эквивалентном виде р.Л.=[«г]|!-|гЛ (13-5О'> а а Для обоснования формулы (13.50) достаточно заметить, что функ- ция [и(х) v(x)] является на сегменте [а, />] первообразной непрерывной на этом сегменте функции (u(x)v' (х) + ii (x)v(x)], и записать формулу Ньютона—Лейбница ь J (u(x)v' (х) + d (x)v(x)]dx = [и(х) • v(x)]| ba. а 2 В качестве примера применения формулы (13.50) вычислим fx-ddx. Полагая и(х) = х, v(x) = /, dv = ddx, du = dx, получим 2 2 fxddx = [x-ex]|I2 - f^dx = 2e2 -e-е2 + e = e2. ii b В заключение заметим, что определенный интеграл J f (x)dx от не- а прерывной на сегменте [a, Z>] функции/(х) точно вычислить (в элемен- тарных функциях) удается далеко не всегда. Поэтому важную роль иг- рают методы приближенного вычисления определенного интеграла, позволяющие вычислить его с любой заданной точностью. Эти методы излагаются в § 7 данной главы. § 6. Геометрические и физические приложения определенного интеграла 6.1. Понятие площади плоской фигуры. Площадь криволинейной трапеции Прежде всего введем понятие площади произвольной плос- кой фигуры Q, под которой мы будем понимать часть плоскости, ограниченную замкнутой кривой линией L. При этом указанную кри- вую L обычно называют границей фигуры Q. 340
, Мы будем называть элементарными фигурами такие плоские фигуры, площади которых нам известны (например, из курса элементарной математики). Примером элементарных- фигур могут служить многоугольники (т. е. фигуры на плоскости, границами которых являются замкнутые ломаные линии). Так как каждый много- угольник можно представить в виде объединения конечного числа не имеющих общих внутренних точек треугольников, а площадь треуго- льника нам известна, то нам известна и площадь многоугольника. Другим примером элементарных фигур могут служить объедине- ния конечного числа не имеющих общих внутренних точек круговых секторов. Основными свойствами площади элементарной фигуры, которые должны быть перенесены и на площадь произвольной плоской фигу- ры, являются следующие два свойства: 1) свойство мо- нотонности, утверждающее, что площадь фигуры Qt, содержа- щейся в фигуре Qi, не превосходит площади фигуры Q2, и 2) с в о й - ство аддитивности, утверждающее, что площадь объедине- ния двух фигур Qi и Q2, не имеющих общих внутренних точек, равна сумме площадей этих фигур. Рассмотрим множество {$} площадей всех элементарных фигур, содержащихся в плоской фигуре Q, и множество {S} площадей всех элементарных фигур, содержащих фигуру Q. Множество {5} ограничено сверху (в качестве его верхней грани можно взять площадь S любой фиксированной элементарной фигуры, содержащей Q), а множество {5} ограничено снизу (в качестве егр нижней грани можно взять число нуль). Поэтому существуют точная верхняя грань Z множества {5} и точная нижняя грань I множества {$}. Опираясь на то, что обе эти грани являются точными, а также на то, что площадь 5 л ю б о й элементарной фигуры, содержащейся в Q, не превосходит площадь S л ю б о й элементарной фигуры, содержа- щей Q, и дословно повторяя рассуждения, проведенные при доказате- льстве свойства' 5° из разд. 1.2, мы докажем, что Плоская фигура Q называется квадрируемой (т. е. имею- щей площадь), если 1 = 1. При этом число 1 = 1_ = 1 называется пло- щадью плоской фигуры Q. Таким образом, для доказательства квадрируемости плоской фигу- ры Q достаточно доказать, что точная верхняя грань площадей {$} 341
всех элементарных фигур, содержащихся в Q, совпадает с точной ниж- ней гранью площадей {S} всех элементарных фигур, содержащих Q. ; Тем более достаточно доказать, что указанные точные грани совпа- дают не на всем множестве элементарных фигур, а лишь на некотором его подмножестве, ибо точная верхняя грань на подмножестве не бо- льше, чем на всем множестве, а точная нижняя грань на подмножестве не меньше, чем на всем множестве. Теперь мы переходим к классической задаче — к задаче о вычис- лении площади так называемой криволинейной трапе- ции, ставшей в свое время основополагающей для введения понятая определенйдгб интеграла. ' 'Кри в’дл ине иной тр а п е ц и е й (лежащей под графиком непрерывной и неотрицательной на сегменте [а, Ь] функции y-f (х)) называется плоская фигура Q, ограниченная графиком заданной на сегменте [a; Z>] непрерывной и неотрицательной функции f (х), ордина- тами, проведенными в точках а и Ь оси Ох, и отрезком оси Ох ыежру точками а и Ь. Рис. 13.1 Рис. 13.2 На рис. 13.1 и 13.2 криволинейная трапеция обведена жирной ли- нией.. Как и в разд. 1.1 и 1.2, подвергнем сегмент [а, 6] произвольному разбиению (13.1) на частичные сегменты [х*_], х*], к-1, 2, ..., п. . Заметам, что для произвольного разбиения (13.1) верхняя сумма S является площадью многоугольника, получающегося объеди- нением п не имеющих общих внутренних точек прямоугольников со сторонами, равными Мк и Дх*, к= 1, 2, ..., п. Этот многоугольник, за- штрихованный на рис. 13.1,‘ содержит криволинейную трапецию Q. Аналогично для любого разбиения (13.1) нижняя сумма 5 является площадью многоугольника, получающегося объединением п не имеющих общих внутренних точек прямоугольников со сторонами, равными ж* и Дх*, к= 1, 2,..., п. Этот многоугольник, заштрихованный на рис. 13.2, содержится в криволинейной трапеции Q. 342
Справедливо следующее утверждение. Теорема 6. Криволинейная трапеция Q, лежащая под графиком непрерывной и неотрицательной на сегменте [a, А] функции /(х), квадрируема, и ее площадь I равна ф*. (1351> Доказательство. Так как функция Дх) непрерывна на сег- менте [а, Ь], то в силу доказанного в теореме 2 для любого числа е > О существует отвечающее ему число 5 (е) > 0 такое, что для любого раз- биения (13.1) сегмента [a, />], у которого наибольшая длинах/ частич- ных сегментов меньше числа 5(e), справедливо неравенство S-s<e, а это в силу доказательства достаточности теоремы 1 устанавливает совпадение точной верхней грани I множества {$} с точной нижней гранью I множества {£} (т. е. квадрируемость криволинейной трапе- ции 0 и справедливость для ее площади/= / =1 равенства (13.51). Теорема доказана. В качестве приложения этой теоремы вычислим площадь, лежа- щую под заданной на сегменте [-/ у = Ах2 + Вх + D, проходящей через три точки (-А, у0), (0, yi) и (А, у2). Искомая площадь заштрихована на рис. 13.3. Заметим, кстати, что через указан-, ные три точки проходит только одна парабола у=Ах2 + Вх + D, вы- рождающаяся в прямую в случае, когда указанные три точки лежат на одной прямой. Это вытекает из того, что при подстановке координат указан- ных трех точек в уравнение параболы мы получим относительно А, В и D систему трех линейных уравнений Ah2-Bh+D = y0, 'D = yx, Ah1 +Bh+D = y2, имеющую единственное решение _Уо~2у1+у2 в_У2~Уо р_ (13.52) 2Л2 ’ 2h ’ r 343
В силу теоремы 6 и формулы Ньютона—Лейбница искомая пло- щадь I равна h » 4r3 Rr2 / = |(Лх2 +Bx + D)dx= ~+^-+Dx .2 " =^2Dh. - -* 3 Окончательно, подставляя значения А и D, вами (13.52), получим, что +4л + л)- определяемые равенст- (13.53) 6.2. Площадь криволинейного сектора Пусть кривая L задана в полярной системе координат уравнением г = г(ф) при а < ср < Р (см. рис. 13.4), причем функция г(ф) непрерывна и неотрицательна на сегменте [а, 0]. Плоскую фигуру Q, ограничен- ную кривой L и двумя лучами, составляющими с полярной осью углы аир, будем называть криволинейным сектором. Докажем, что криволинейный сек- тор Q квадрируем и имеет площадь I, равную Т (13.54) а Действительно, рассмотрим произво- льное разбиение сегмента [а, р] точками а = фо < ф| < ф2 < •< Фи-i < Ф„ =0 на частичные сегменты [ф^-ь <p*], k=l, 2, ..., п. Для каждого частичного сегмента [фл-i, фл] построим круговые сек- торы, радиусы которых равны максимальному значению Мк и минима- льному значению /и* функции г(ф) на этом частичном сегменте (см. рис. 13.4). В результате мы получим две веерообразные элементарные фигуры, площади Svls которых равны S =- £л/2Дфл, 5=^£т*2Афр 2 ы 2 ы где Дф4=ф4-ф4.,. Так как S и 5 являются соответственно верхней и нижней суммами для функции -г2(ф), непрерывной на сегменте [а, 0], и поскольку для 2 любого разбиения сегмента [а, 0] веерообразная фигура с площадью S содержит криволинейный сектор Q, а веерообразная фигура с площа- дью j содержится в Q, то, повторяя рассуждения, проведенные при до: 344
казательстве теоремы 6, мы установим, что криволинейный сектор Q квадрируем и его площадь / определяется равенством (13.54). В качестве приложения этой теоремы вычислим площадь так называемого трилистника, т. е. плоской фигуры, определяемой при положительной посто- янной а уравнением r = acos(3cp) (см. рис. 13.5). Из этого рисунка видно, что вся площадь I трилистника равна увеличенной в 6 раз площади части трилистника, за- штрихованной на рис. 13.5 и отвечающей изменению угла ср от 0 до —. В таком слу- чае из равенства (13.54) получим, что Рис. 13.5 1=6- 2 я/6 2 я/6 ГI — Jcos2(3<p)<Z<p = 6-— j - + 2 о о -cos(6<p) , ita2 aq> =-----. 4 6.3. Вычисление объема тела вращения В полной аналогии с понятиями квадрируемости плоской фигуры и ее площади вводятся понятия кубируемости ограниченного трехмерно- го тела Q и его объема. . Назовем элементарным такое тело, объем которого нам из- вестен (например, из курса элементарной математики). Примерами элементарных тел могут служить многогранники и объединения круго- вых цилиндров. Множество {5} объемов всех элементарных тел, содержащихся в теле Q, ограничено сверху (объемом S любого фиксированного эле- ментарного тела, содержащего Q), и потому у множества {5} сущест- вует точная верхняя грань, которую мы обозначим через I. Аналогич- но множество {£} объемов всех элементарных тел, содержащих тело Q, ограничено снизу (например, число нуль), и потому у множества {$} существует точная нижняя грань, которую мы обозначим через I. Так как / и I являются точными гранями соответствующих множеств и объем s любого элементарного тела, содержащегося в Q, не превосходит объема 5 любого элементарного тела, содержащего Q, то 1<1. Тело Q называется к у б и р_у ем ы м (т. е. имеющим объем), ес- ли 1^=1. При этом число 1=1_ = 1 называется объемом тела Q. Пусть криволинейная трапеция, лежащая под графиком непрерыв- ной и неотрицательной на сегменте а < х < b функции у =/(х), враща- 345
ется вокруг оси Ох. Докажем, что возникающее при этом тело враще- ния Q кубируемо и его объем I равен ь 1 =n^f2 (x)dx. а (13.55) Рис. 13.6 Рассмотрим произвольное разбиение (13.1) сегмента [а, 6] и обо- значим через Мк и /л* соответственно точную верхнюю и точную ниж- нюю грани функции f(x) на частичнрм сегменте [х*_ь xj, к= 1, 2,..., п. На каждом частичном сегменте [х*_ь xj построим два прямоуголь- ника с высотами Мк и тпк (см. рис. 13.6; на нем эти прямоугольники изображены только на одном сегменте [х*-ь xj). При этом на всей плоскости Оху мы получим две ступенчатые фигуры, одна из которых содержится в криволинейной трапеции, а другая ее содержит. При вра- щении криволинейной трапеции и этих двух ступенчатых фигур во- круг оси Ох мы получим тело вращения Q и два ступенчатых элемен- тарных тела, состоящих из объедине- ния круговых цилиндров, первое из которых содержит тело Q, а второе — в нем содержится. Объемы этих эле- ментарных тел соответственно равны .у=л-£Х-Дх4, S = n-^М2к-Ьхк. Л=1 А'=1 Так как эти объемы х и S являются соответственно нижней и верхней сум- мами разбиения (13.1) сегмента [а, Ь} для непрерывной на этом сегменте функции л-/2(х), то, дословно повторяя рассуж- дения, проведенные при доказательстве теоремы 6, мы установим совпадение точной верхней грани 1_ множества {х} с точной нижней гранью I множества {5} (т. е. кубируемость тела Q) и равенство (13.55) для его объема I. Применяя равенство (13.55) для вычисления объема тела, получен- ного вращением вокруг оси Ох криволинейной трапеции, лежащей под графиком синусоиды у = sinx на сегменте [0, я], получим sin2xo!x = -|[1 - 6.4. Длина дуги кривой Дуга кривой АВ называется спрямляемой (т. е. имеющей длину), если существует предел I, к которому стремится длина вписанной в эту дугу ломаной линии при стремлении к нулю cos(2x)]cZx = 1 = nJ 346
ее наибольшего звена. При этом указанный предел I называется длиной дуги АВ. Кривая называется гладкой, если она непрерывна и имеет в каждой своей точке касательную, непрерывно меняющую свое поло- жение при переходе от точки к точке. Если кривая является графиком функции у =/(х) на сегменте [а, Ь], т. е. задается уравнением y=f(x) при а<х<Ь, (13.56) то она называется гладкой при условии, что функция /(х) непре- рывна на сегменте [а, Ь] и имеет производную /'(х), непрерывную'на этом сегменте. ' Теорема 7. Если кривая» задаваемая уравнением (13.56), является гладкой» то она спрямляема и ее длина I определяется равенством l=b^l + [f'(x)]2dx. Доказательство. Впишем в рассматриваемую гладкую кривую ломаную МоМ\М2 ... М„, считая, что М0=А(а, Mn = B(b, f(b)) (см. рис. 13.7). Проектируя зве- нья ломаной Mk-iMk (при всех (13.57) Рис. 13.7 k = 1, 2, ..., п) на ось Ох, мы по- лучим разбиение (13.1) сегмента [а, 6] на частичные сегменты [x*_j, х*] (к= 1, 2, ..., и). При этом точка хк оси Ох является проекцией точки Мк, Ьхк — длина частичного сег- мента [xjt-i, х*]. Приращение Ду*=/(х*)-/(х*_1) функции y=f(x) на сегменте [xw, х*] может быть преобразовано с помощью теоремы, Лаг- ранжа (см. теорему 4 из разд. 2.2 гл. 11). По этой теореме на сегмерт,е [хм, х*] найдется точка такая, что ДЛ =/(^)-/(xt.,) = /^t.)(xt -xt.,)=/^*)Axt, и поскольку по теореме Пифагора длина |Л/4_]Л/4| звена ломаной равна /(AxJ2+(Д^)2, то \мк.хмк\== VwCdF • **к. 347
Отсюда следует; что длина всей ломаной равна а = £71 + [/‘(^)]2-ДХг (13-58) ы Сумма (13.58) является интегральной суммой для функции лД + ИЧ*)]2 на сегменте [а, 6], на котором эта функция непрерывна. По теореме 2 интегральная сумма (13.58) при стремлении к нулю наи- большей из длин zXxjt частичных сегментов стремится к интегралу, сто- ящему в правой части (13.57). Остается заметить, что поскольку Дх* является проекцией звена Мк_хМк ца, ось Ох, то при стремлении к нулю наибольшего из звеньев Мк_хМк тем более стремится к нулю наибольшая из длин Дх*. Теорема доказана. ( Введем понятие дифференциала дуги. Сохраняя предпо- ложения теоремы 7 и считая фиксированной точку A (a, f (а)), рассмот- рим на дуге АВ переменную точку М (х, /(х)). Длину участка AM дуги АВ обозначим через I (х) и заметим, что по формуле (13.57) l(x) = j^ + [f(t)]2dt. (13-59) а В правой части формулы (13.59) стоит интеграл с переменным вер- хним пределом от функции yjl + [f'(x)]2, являющейся непрерывной на сегменте [а> Ь]. В силу теоремы 4 и следствия из нее (см. § 4) функ- ция (13.59) имеет на сегменте [а, 6] производную* Г(х), равную ^1+ [/"« ' . Дифференциал функции (13.59) принято называть дифферен- циалом дуги. Так как дифференциал dl равен dl = l'(x}dx, мы приходим к равенству dl = ^ + \f(x)-\2dx, которое после внесения dx под знак корня и использования равенства dy=f\x)dx приводится к виду dl = ^(dx)2 +(dy)2. (13-60) 1В граничных точках сегмента [а, &] — одностороннюю производную Г(а + 0) или 348
Формула для дифференциала дуги (13,60) проиллюстрирована на рис. 13.8. Используем формулу для дифференциала дуги (13.60) для вычис- ления длины дуги кривой, заданной параметриче- ски, т. е. заданной уравнениями х = Ф(0, ,y=v(0 при Z, < t < t2. (13.61) При таком задании кривой предположение о том, что эта кривая является гладкой, приводит к требованию непрерывности производных <р' (/) и ф'(<) на сегменте [/ь В силу свойства инвариантности первого дифференциала dx = ф' (<) • dt, dy = ф' (/) • dt. Подставляя эти значения dx и dy в (13.60), мы получим следующую формулу для дифференциала дуги кривой, заданной параметрическими уравнениями (13.61): dl = л/[фШ +[ф'(0]2 • dt. (13.62) Интегрируя (13.62) по t в пределах от t\ до tz, мы получим следующее выражение для длины / дуги кривой,, за- данной параметрическими уравнениями (13.61): Рис. 13.8 /=р[ф'(0]2+[ф'Ю]2-Л (13.63) Наконец, рассмотрим к р и в у ю , заданную полярным уравнением Р = Р(ф) при а Ф < Р> (13.64) предполагая, конечно, что р(ф) и р' (ф) непрерывны на сегменте [а, р]. Так как в силу связи между декартовыми и полярными координа- тами х = рсовф, y = psinq>, то dx =совф-(/р-рэшф-с/ф </у = втф- ф+рсовфс/ф Возвышая последние равенства в квадрат, по- лучим: (dx)2 = cos2 ф-(с/р)2 -2р-созф-8тф й/р-4Йр + р2 - sin2 ф-(с7<р)2, (dy)2 =sin2 ф-(dp)2 +2р-со8ф 8тф-с/р с/ф + р2 -cos2 ф-(с?ф)2. Складывая последние два равенства почленно, получим, что (dx)2 + (dy)2 = (dp)2 + p2(d<p)2. 349
Из последнего равенства и из (13.60), мы получим следующее ра-А венство для дифференциала дуги dl кривой, заданной полярным урав- нением (13.64): ________________ . 4// = 7(4/р)2+р2(ф)(ф)2. Последнее равенство, с учетом того что — = р' (<р), можно переписать dtp в виде ______ Л = 7(Р'(Ф)]2 + [р(ф)]2 dtp. (13.65) Интегрируя (13.65) по <р в пределах от а до 0, мы получим следу- ющее выражение для д л и н ы / д у г и кр и.в о й , заданной полярным уравнением (13.64): ₽ /=|л/[р'(ф)]2+[р(Ф)]2^Ф а В качестве приложения изложенной теории вычислим длину дуги циклоиды, представляющей собой кривую, которую описывает точка окружности радиуса а, катящаяся без скольжения по прямой ли- нии. Эта кривая описывается параметрическими уравнениями x = a(r-sin/), y=a(l-cos/) при t ^2я . ‘ В силу равенства (13.63) длина циклоиды / равна 2я -------------- 2я / = a|7(l-cos02 +sin21 -dt =2ajsin-dt = -4a-cos- o о , 2 t 2n • = 8a. 2 o. В качестве второго примера вычислим длину дуги кривой, являю- щейся графиком функций1 y = ach—. Эту кривую принято называть а цепной линией, ибо она имеет форму тяжелой цепи, подвешен- ной за концы. . . / В силу равенства (13.57) длина дуги цепной линии, отвечающей значениям х из сегмента 0 < х < Ь, равна 1 I 7 \ ь ( \ (h\ [ ll + sh2 — <& = [chI — |cbc = ash — . oV \a) Jo {aj {aj 1 Напомним, что ch t = — [d + e* ], sh t = — [e' - e’ ], так что (ch t}' = sh t (cm. разд. 6.7 гл. 9). 2 2 350
6.5. Физические приложения определенного интеграла Пусть р(х) — линейная плотность неоднородного стержня, распо- ложенного на сегменте [а, /?] оси Ох. Рассмотрим произвольное разби- ение (13.1) сегмента [а, 6], выберем на каждом его частичном сегменте [х*-ь хд] произвольную точку и составим сумму по всем частичным сегментам ед. ы Так как эта сумма, являющаяся интегральной суммой для функции р(х) на сегменте [а, Ь], дает приближенное значение массы стержня, то точное значение этой массы будет равно пределу суммы (13.66) при стремлении к нулю наибольшей длины d частичных сегментов, т. е. будет равно интегралу ь J p(x)dx. а Второе классическое физическое приложение определенного интегра- ла — это вычисление работы по перемещению материальной точки из точки а оси Ох в точку b под действием параллельной оси Ох силы F(x). Отвечающая произвольному разбиению (13.1) сегмента [а, 6] ин- тегральная сумма <* = £/£*)• А** *=1 дает приближенное значение искомой работы, а предел этой интегра- льной суммы при стремлении к нулю наибольшей длины d частичных ь сегментов, т. е. интеграл ^F(x)dx, дает точное значение этой работы. а I § 7. Понятие о приближенных методах вычисления определенных интегралов Актуальность приближенных методов вычисления определенных I интегралов уже обоснована нами выше. Основная идея этих методов заключается в замене подынтеграль- 1 ной функции f (х) функцией более простой природы — многочленом, совпадающим с функцией /(х) в некоторых точках. Для уяснения этой идеи рассмотрим при маломЛ>0 интеграл J f(x)dx, (13.67) -Л 351
представляющий собой площадь «узкой» криволинейной трапеции, ле- жащей под графиком функции y-f(x) на малом сегменте [—й, Л] (см. рис. 13.9). Заменяя функцию /(х) на сегменте [-й, й] многочленом нулевой степени — константой f (0), мы придем к основной идее метода прямоугольников, заключающейся в замене интеграла (1.3.67) площадью 2й-/(0) прямоугольника, заштрихованного на рис. 13.10. Оказывается, для функции/(х), имеющей на сегменте [-й, й] не- прерывную вторую производную, ошибка, совершаемая при замене интеграла (13.67) указанной площадью, имеет порядок h3. Заменяя далее функцию /(х) на сегменте [~h, Л] многочленом пер- вой степени — линейной функцией у = кх + Ь, совпадающей с /(х) в точках -й и й, мы придем к основной идее метода трапеций, заключающейся в замене интеграла (13.67) площадью й[/(-й) + /(й)] прямолинейной трапеции, заштрихованной на рис. 13.11. Оказывается, для функции/(х), имеющей на сегменте [-й, й] не-' прерывную вторую производную, ошибка, совершаемая при замене интеграла (13.67) указанной площадью, имеет порядок й3. Наконец, заменяя функцию /(х) на сегменте [-й, й] многочленом второго порядка — параболой у=Ах2 +Bx + D, совпадающей с/(х) в точках —й, 0 и й, мы придем к основной идее метода парабол, заключающейся в замене интеграла (13.67) вычисленной в конце разд. 6.1 (см. формулу (13.53)) площадью — [/(-й) + 4/(0)+ /(й)], ле- 352
Оказывается, для функции /(х), имеющей на сегменте [-Л, Л] не- прерывную четвертую производную, ошибка, совершаемая при замене интеграла (13.67) указанной площадью, имеет порядок h5. Если требуется приближенно вычислить интеграл от функции f(x) не по малому сегменту [-Л, й], а по всему сегменту [а, А], т. е. интеграл - >)Л, (13'68) а то естественно разбить сегмент [а, 6] на достаточно большое число малых сегментов и к каждому из этих сегментов применить только что изложенные рассуждения. При этом мы и придем к методам прямоуго- льников, трапеций и парабол в их общем виде. Для реализации метода прямоугольников разобьем сегмент [а, 6] на и равных частей при помощи а = хо < х2 < х4 <... < = b и обозначим через X2*-i середину сегмента [х2*-2, х2к]. Метод прямоуго- льников заключается в замене интеграла (13.68) суммой — [/(х1)+/(х3)+/(х,)+...+/(х^1)] п площадей прямоугольников с высотами, соответственно равными \ b-а ' fwk-\)y И основаниями, равными х2к -х2к_2 =-(эти прямоугольни- п ки заштрихованы на рис. 13.13). Таким образом, формула пря- моугольников имеет вид }/(х)Л = -^.[/(х1)+/(х3) + ...+/(х2я_1)]+Л, (1369) а R — остаточный член, для которого при условии непрерывности на сегменте [а, 6] второй производной /(2\х) справедлива оценка |Я|<<^4.тах|/И(4 <13-70> 1 1 24-и I Для реализации метода трапеций разобьем сегмент [а, 6] на п равных частей при помощи точек а = хо < Xi < х2 < ... < х„ = b и за- меним интеграл (13.68) суммой ^{[/(х0)+/(х1)] + [/(х1)+/(х2)] + ... + [/(хя.1) + /(хл)]} = = A^[/(a)+/(6)+2g/(xt) 2n L *-1 J 353
площадей трапеций с основаниями, соответственно равными f(x^\) и f (хД и с высотами, равными хк - хк_х =-- (эти трапеции заштрихо- п ваны на рис. 13.14). Таким образом, формулатрапеций имеет вид где R — остаточный член, для которого при условии непрерывности на сегменте [а, Ь} второй производной /(2)(х) справедлива оценка /(а) + /(6)+2^/(х.) +/?, (13.71). *=i Для реализации метода парабол разобьем сегмент [а, 6] на п равных частей при помощи точек а = хо <х2 < хд <... < х2п = b и обо- значим через X2t-i середину сегмента [x2*-2» х2к]. Метод парабол заклю- чается в замене интеграла (13.68) суммой • {[/(Хо) + 4/(х,) + /(х2)] + [/(х2) + 4/(х3) + /(х4)] +... 6л '• - + lf(xln.2) + 4f(xM)+f(xb)]} = ^-х J 6п х(/(«)+/(*) +2$J/(x2i) + 4и/(хм)| I Jbl ьо J площадей фигур, заштрихованных на рис. 13.15 и представляющих со- бой сумму площадей криволинейных трапеций, лежащих под парабо- лами, проходящими через три точки графика функции y=f(x) с абс- циссами X2jt-2, *2*-1 И Х2к. 354
Таким образом, фю рмула парабол, или, как ее еще называ- ют, формула Симпсона, имеет вид 1^=^ /(а) +/(4) + ы м (13.73) где R — остаточный член, для которого при условии непрерывности на сегменте [a, Z>] четвертой производной /’4)(х) справедлива оценка |Я| < • max I/(4) (х)|. ,. , _ „ 1 1 2880-л4 [‘•'-1 г I (13.74) Вывод оценок (13.70), (13.72) и (13.74) для остаточных членов в фор- мулах (13.69), (13.71) и (13.73) можно найти в § 2 гл. 12 книги В. А. Ильина и Э. Г. Позняка «Основы математиче- ского анализа» (т. 1). Формулы (13.69), (13.71) и (13.73) весьма удобны для реализа- ции на ЭВМ. Рис. 13.15 § 8. Понятие о несобственных интегралах Введенное в этой главе понятие определенного интеграла существен- но использовало два требования: 1) требование конечности промежутка (сегмента [а, Ь]), по которому идет интегрирование; 2) требо- вание ограниченности интегрируемой функции/(х). Для распространения понятия интеграла на случай, когда указан- ные два требования не выполняются, необходим дополнительный пе- реход к пределу, и возникающий при этом переходе интеграл принято называть несобственным. Пусть сначала функция /(х) определена на полупрямой а<х<+оо и интегрируема по сегменту [а, 6] при любом b из полупрямой а < Ь< +оо. Тогда, если существует предел (13'75) то этот предел называется несобственным интегра- лом (первого рода) от функции f(x) по полупрямой а<х<+ахи обо- значается символом 355
При дополнительном предположении о непрерывности функции f(x) на полупрямой а<х<+<х> в силу теорем 4 и 5 функция f(x) при любом b > а имеет первообразную Ф(х) на сегменте [а, Ь] и для нее справедлива формула Ньютону—Лейбница |/(х)Л = Ф(6)-Ф(а), (13,76) л которая обеспечивает существование предела (13.75) всякий раз, когда существует предел lim Ф(6). (13.77) 6-н-оо Если предел (13.77) существует, то, переходя в равенстве (13.76) к пределу при Ь, стремящемся к +оо, мы получим следующее соотноше- ние: t f f(x)dx = lim Ф(6) - Ф(а). J Ь-нх (13.78) т-» ~ +г dx _ В качестве примера вычислим несобственный интеграл --. Так как функ- ’ V + * ция /(х) =—5-г непрерывна на полупрямой 0<х<+оо и имеет первообразную 1 + х . Ф(х) = arctgx, то в силу соотношения (13.78) 7 dx х L л я JT77=^arctgh-arctg0=? Пусть теперь функция /(х) не является ограниченной в окрестно- сти точки Ь, но при любом достаточно малом 5 > 0 является ограни- ченной и интегрируемой на сегменте [а, 6-5]. Тогда, если существует предел* ъ-ь (13.79) то этот предел называется несобственным интегралом (второго рода) от функции f(x) по сегменту [а, 6] и обозначается тем ь же символом \f(x)dx, что и обычный определенный интеграл. При дополнительном предположении о непрерывности функции f(x) на полусегменте а < х< b в силу теорем 4 и 5 на этом полусегмен- 1 Символ 6 -» 0 + 0 означает, что 6 стремится к нулю, оставаясь положительным. 356
те для функции/(х) существует первообразная Ф(х) и для любого до- статочно малого 8>0 справедлива формула Ньютона—Лейбница |/(х>& = Ф(6-8)-Ф(а), (13’80) а которая обеспечивает существование предела (13.79) всякий раз, когда существует предел НтФ(8-8). (13.81) Если предел (13.81) существует, то, переходя в равенстве (13.80) к пределу при 8 -> 0 + 0, мы получим соотношение J f(x)dx = lim Ф(6 - 8) - Ф(а). (13>82) а \ 1 , _ - Г «л _ В качестве примера вычислим несобственный интеграл I Так как функ- oVl-X ция f(x) = -г--- • непрерывна на полусегменте 0<х<1 и имеет первообразную а/1-х Ф(х) = -2>/1-х, то в силу соотношения (13.82) 1-7=—lim [-276]-(-2) = 2
Глава 14 Криволинейные интегралы § 1. Определения и физический смысл криволинейных интегралов Пусть на плоскости Оху задана спрямляемая кривая L = АВ без то- чек самопересечения и участков самоналегания, параметризуемая при помощи уравнений * = <Р(0» (14.1) у=\|/(0> a<t<b. Будем говорить, что произвольная заданная вдоль кривой L-AB функция F(x, у) непрерывна вдоль этой кривой, если для любого числа е > 0 существует число 5 (е) > 0 такое, что для лю- бых двух точек (хь yQ и (х2, у2) кривой L = AB, связанных условием д/(Х| -х2)2 +(У| - у2)2 < 8 (е), справедливо неравенство Я) ~Е(х2, у2)|< s. Фактически мы определим не непрерывность, а равномерную не- прерывность, но вдоль замкнутой ограниченной кривой эти понятия совпадают.- Предположим, что одна функция f (х, у) | две функции Р (х, у) и Q (х, у) определены и непрерывны вдоль кривой L = AB. Разобьем сегмент а < t < Ъ при помощи точек а = t0 < < ...< tn = b на n частичных сегментов [4_ь 4], к= 1, 2, ..., п. Каждому значению 4 соответствует на кривой L-АВ точка Мк(хк,у*)» где xt=<p(4), ук =ф(4)- .Поэтому указанному разбиению сегмента a<t<b отвечает разбиение кривой L = AB на частичные дуги МйМ{ М^М2, , .... М^М„ (рис. 14.1). 358
Выберем на каждой частичной У ‘ дуге Мк_{М к любую точку Nk(t>k,‘f\k)- Тогда существует значе- ние хк из сегмента [Zjt-i, 4] такое, что = ф(х а )> Па = V (т к )• Обозначим символом Д4 разность Д4 = 4~ 4-ь а ______ символом Д/д. — длину частичной ° дуги МкАМк. Составим Рис. 14.1 1 интегральную сумму q=£/(^n*)4 (14.2) *=1 две интегральные суммы <72=£р(^,Иа)(^.-^_1), (14.2') Аг=1 ®э=£е(^»П*)(Л-Л-1Х (14.2*) Ь=1 Назовем число I пределом интегральной суммы (^=1,2, 3) при стремлении к нулю длины наибольшей частичной дуги &1к, если для любого числа £ > О существует число 5 (е) > 0 такое, что при условии тъхЫк<Ъ(г) справедливо неравенство |о\ -/|<£. Определения. Если существует предел I суммы Ст1 при стремлении к нулю длины наибо- льшей частичной дуги Aik, то этот предел называется криволи- нейным интегралом пер- вого р о д а от функции f (х, у) по дуге L- АВи обозначается символом f f(x, y)dl или J f(x, y)dl. (14.3) .4B L Если существует предел суммы Стг (соответственно Стз) при стремле- нии к нулю длины наибольшей частич- ной дуги AJk, т° этот предел называется криволинейным интегралом второго р о - дай обозначается символом Jp(x, y)dx АВ (соответственно |б(х, y)dy). АВ Сумму ^Pdx+^Qdy называют об- АВ АВ щ им криволинейным ин- тегралом второго рода и обозначают символом \PdxAQdy. (14.3 Э АВ 359
Выясним физический смысл введенных интегралов. Криволинейный интеграл первого рода (14.3) дает массу нагруженной кривой £ = АВ при условии, что ли- нейная плотность распределения мас- сы вдоль кривой равна f (х, у). Общий криволинейный интеграл вто- рого рода (14.3 Э дает работу по пере- мещению материальной точки из Л в В вдоль кривой L под действием силы Г(х, у), имеющей компоненты Р (х,у) и2(х,у). Из определений криволинейных интегралов вытекает, что криволи- нейный интеграл первого рода не зависит от того, в каком направле- нии от А кВ или от В к А обходится кривая, а все криволинейные ин- тегралы второго рода при изменении направления обхода кривой ме- няют знак на противоположный. § 2. Существование криволинейных интегралов и сведение их к определенным интегралам Напомним, что кривая L называется гладкой, если функции <р (0 и \|/ (г) из параметризующих ее уравнений (14.1) имеют на сегмен- те а < t < b непрерывные производные первого порядка. Далее, кривая L называется кусочно гладкой, если она распадается на конечное число не имеющих общих внутренних точек участков, каждый из которых является гладкой кривой. Точка кривой L, отвечающая значению параметра t, для которого [ср' (?)]2 + [хр* (О]2 =0> называется особой. Если кривая L не имеет особых точек, то для всех t из сегмента [а, /?] функция [ф (Т)]2 + (т)]2 положительна, а потому в силу непрерывно- сти этой функции и второй теоремы Вейерштрасса (см. разд. 9.2 гл. 9) существует число 5 > 0 такое, что для всех t из сегмента [а, Ь] спра- ведливо неравенство (*) Теорема 1. Если L — гладкая кривая без особых точек, парамет- ризуемая при помощи уравнений (14.1), и если функции f^y) | Р(х,у)и2(х,у) непрерывны вдоль кривой L, то все определенные в § 1 криволинейные интегралы существуют, и для них справедливы следующие формулы, сводящие их к обычным определенным интегралам: 360
\f{x,y)dl= AB = J л ф(')> v (ОЪ/[фЧОГ+[уЧОГл= (14.4) JP(x, y)dx = |Р[<р(/)>Ч'(О]ф'(<)* =Л> лв ° (14.4Э f 2(x. y)dy= j2[<p(0, v(W = ЛВ ' (14.4") Доказательство. Существование определенных интегралов I\, h и h, стоящих в правых частях равенств (14.4), (14.4Э и (14.4") со- ответственно, не вызывает сомнений (ибо эти интегралы берутся от непрерывных на сегменте [а, 6] функций). Поэтому достаточно дока- зать, что эти три определенных интеграла являются пределами при max Д/4 —>0 введенных в § 1 интегральных сумм сть <т2 и ст? соответст- к венно. Мы ограничимся доказательством того, что lim о, = /.. lim ст, = /,. max Д/*-»0 max В силу свойства аддитивности определенные интегралы Д и /2 можно переписать в виде1: A = 2bl<P(').'l'(')]’< хл/[фХ')]2+[фХ')]2* <14-5) 4 = £Нф(').ф(')][фХ')]*- (14.5Э С другой стороны, поскольку (в силу формулы (13.63) разд. 6.4 гл. 13) tk Д'* = |7(фХ')]2+[фХ')]2*. '*-1 суммы G| и па можно переписать в виде ст1=^Лф(т*).ф(т*)]х *=1 х?л/[фХ')]2+[фХ')]2* (14-6) ст2 = £р[ф(т,), у(т,)] j <р’ (J )dt (14.6Э 1 Свойство аддитивности см. в ра^д. ЗА гл. 13. 361
Из (14.5) и (14.6) и из (14.5х) и (14.6х) вытекает, что <Wi=£ |{/[ф(т*),¥(т*)]- - А = £ j Иф(^ ), у(т* )]- -Лф(О, уЮВ^СфЧОГ+ЬиЧОГл -Р[<р(О,ф(О]}ф’(ОЛ- (14.7) (14.7х) Обозначим через / длину всей дуги L = АВ, а через М— точную верхнюю грань функции |f'(x)| на сегменте [а, 6]. Тогда в силу неравенства (*) Ч = )^(ОГ+Ьи’ЮМ5(Zt. -^), ч । поэтому тах(/;,.-?ы)—>0 при тахД/д. —>0. Фиксируем произвольное число е > 0. Так как (по теореме 11 из § 5 гл. 9 о непрерывности сложной функции) функция /1ф(О,у(О] I Р[Ч>(О,У(О]’ непрерывна по t на сегменте [a, Z>], то существует число 8 (в) > 0 такое, что при шах Д/Л< 8(e) модуль выражения, стоящего в фигурных скобках к в равенстве (14.7) | в равенстве (14.7х), удовлетворяет неравенству е М.(Ь-а) Но тогда из (14.7) и (14.7х) получим h -/.I }л/[Ф'(О]2+[у'(')]2Л= =у f л/[ф'(О]2 + [ф'(О]2Л = е 1g, -/,1 £----£ [|ф'(г ~jdt £ 12 21 М(Ь-а)^,Ц Г (при max Д/Л< 8(e)). Теорема доказана. Замечание 1. Утверждения теоремы 1 останутся верными, если потребовать, чтобы кривая L являлась не гладкой, а кусочно глад- 362
кой, а функции f Р и. Q не непрерывными, а кусочно непрерывными вдоль кривой L. Замечание 2. В случае замкнутой кривой L = AB (когда точ- ки Л и В совпадают), договариваются, что кривая всегда обходится в направлении «против часовой стрелки» (рис. 14.2). Это направление обхода называют положи- тельным. Замечание 3. Криволинейные йн- тегралы обладают теми же свойствами, что и обычные определенные интегралы, и доказательство этих свойств проводится в полной аналогии с § 3 гл. 13. Впрочем, при несколько более жестких предположе- ниях эти свойства сразу вытекают из ра- венств (14.4), (14.4Э и (14.4"). Рис. 14.3 § 3. Условие независимости криволинейного интеграла второго рода, от пути интегрирования Предположим, что две функции Р (х, у) й Q (х, у) определены и не- прерывны в плоской 'Области G и что в области G фиксированы две произвольные точки М\ (xb yi) и Мг (*2, Уг). Считая точку М\ началом пути, а точку М2 концом п у - т и, мы можем прийти из Mi в М2 по раз- личным кривым, соединяющим эти две точки и целиком лежащим в области G. Три таких кривых, помеченных симво- лами а, Р и у, изображены на рис. 14.3. Если криволинейный интеграл | Р(х, y)dx + б(х, y)dy (14.8) 4м, имеет одно и то же значение независимо от того, по какой гладкой, соединяющей точки М\ в М2 и целиком лежащей в обла- сти G кривой идет интегрирование, то говорят, что этот криволиней- ный интеграл не зависит от пути интегрирования. Справедливо следующее утверждение. Теорема 2. Если функции Р (х, у) и Q (х, у) непрерывны в области G и если в этой области существует такая дифференцируемая функ- 363
ция U (х, у), что подынтегральное выражение Р (х, y}dx + Q (х, y)dy > является полным дифференциалом этой функции, т. е. dU = Р(х, y)dx + Q(x, y)dy, , (14.9) то криволинейный интеграл (14.8) не зависит от пути интегрирова- ния. 1 Доказательство. Рассмотрим произвольную гладкую кри- вую, соединяющую две произвольные точки М\ (хь у0 и М2 (х2, у2), це- ликом лежащую в области G и параметризуемую при помощи уравне- ний х = <р («), у = V (0 при < t < t2 так, что точке А/| отвечает значение параметра tf, а точке Л/2 — значение параметра t2, т. е. X) = Ф<*,), .ц = V (<!), Х2 = ф(г2), уг = V (?2). (14.10) В силу условия (14.9) и дифференцируемости функций <р (<) и \|/ (/) на сегменте [f(, t2] Р(х, y)dx + Q(x, y)dy = dU (x, y) = dU[<p(f), у (<)]. i Из последнего соотношения с учетом равенства (14.10) получим |Р(х, y)dx + Q(x, y)dy='l dU[<p(t), у(<)] = цм2 ‘l = U[<t2),wO2)]-Ut<p(0,v(tl)]=V(x2, y2)~U(x„ y,). Таким образом, при любом пути интегрирования интеграл (14.8) зависит только от разности U(х2, у2) -U(xx, y}) = U(M2) -U(Мх) значе- ний функции U (х, у} в конце и начале пути. Теорема доказана. Следствие 1. Если выполнено условие (14.9) и путь интегрирова- ния является замкнутым контуром L, то $Р(х, y)dx + Q(x, y)dy=0 . L (кружок у знака интеграла символизирует замкнутость контура). Следствие 2. Если выполнено условие (14.9), то интеграл (14.8) за- писывают в виде (Х1»Уз) J Р(*> y)dx + g(x, y)dy и для этого интеграла оказывается справедлив аналог формулы Нью- тона—Лейбница 364
Так I = (х • У) '"'fax, y)dx+Q(x, y)dy = U(x2, y2)-U(xlt у). ' , (14.11) (5.6) Пример. Вычислим интеграл I - j ydx + xdy. (1.2) как ydx + xdy=d(x-у), то по формуле (14.11) (5.6) = 5-6-1-2=28. (1.2) Теорема 2 находит применение в физике. Предположим, что в об- ласти G определено силовое поле F, компонентами которого являются функции Р (х, у) и Q (х, у). Если в области G существует дифференци- руемая функция U (х, у) такая, что У) = — (х, У), Q(x> У) = — (х, у), дх ду то эту функцию U (х, у) называют потенциалом силового поля F, а само силовое поле F называют потенциальным. Примерами потенциальных силовых полей могут служить электро- статическое кулоново поле и поле силы тяжести. Работа А потенциального силового поля по перемещению из точки (хь yi) в точку М2 (х2, уг) определяется интегралом, стоящим в ле- вой части (14.11), и в силу равенства (14.11) не зависит от вида пути и определяется только разностью U(х2, у2)-U(хх, ух) значений потенциала в конечной и начальной точках пути. В частности, если путь замкнут, то работа А потенциального силового поля равна нулю. Пример. Найдем работу А поля силы тяжести по перемещению в верти- кальной плоскости Оху (вблизи поверх- ности земли) материальной точки массы т из положения М\ (хь у,) в положение М2 (х2, у2) (см. рис. 14.4). Если ось Ох горизонтальна, а ось Оу вертикальна, то компоненты силы тяже- сти, действующей на материальную точ- ку массы т, равны P(x,y) = Q, Q(x,y) = -mg. Поэтому Р(х, y)dx + Q(x, y)dy=-mgdy, и за потенциал можно принять Функцию U (х, у) = -mgy. Отсюда независимо от вида пути работа поля силы тяжести равна Л = (-mgy)|^’^I)) = -mg(y2 - Ji). 365
Глава 15 Дифференциальное исчисление функций нескольких переменных Многие вопросы естествознания приводят к рассмотрению такой зависимости между несколькими переменными величинами, при кото- рой значения одной из этих величин полностью определяются значе- ниями остальных переменных. Для изучения такого рода зависимостей в этой главе вводится понятие функции нескольких переменных и раз- вивается аппарат для исследования таких функций. § 1. Понятие функции т переменных 1.1. Понятия /«-мерного координатного и /«-мерного евклидова пространств При изложении теории функции т переменных удобно использо- вать геометрическую терминологию, обобщающую и формализующую наши представления о плоскости и о реальном (трехмерном) геометри- ческом пространстве. Назовем /и-м ерным координатным пространст- вом множество всевозможных упорядоченных совокупностей (х,,х2,...,хт) т вещественных чисел х{,х2,...,хт. Будем обозначать /«-мерное координатное пространство символом Ат. Каждую упорядоченную совокупность (х1,х2,...,хП1) мы будем на- зывать точкой /«-мерного координатного пространства и обозна- чать одной буквой М. При этом числа xt,x2,...,xm мы будем называть координата- м и точки М. Запись М (хх,х2,...,хт) означает, что точка М имеет координаты х„х2,...,хи. Читатель хорошо знаком с понятиями координатной плоскости и трехмерного координатного пространства (см. § .2 гл. 2). Обобщением этих понятий и является /«-мерное координатное пространство Ат. Заметим, что одного понятия /«-мерного координатного простран- ства Ат нам недостаточно; мы должны иметь возможность измерения расстояний между точками этого пространства. Для введения понятия расстояния между точками координатного пространства А” естествен- но отправляться от понятия расстояния между двумя точками коорди- натной плоскости и двумя точками трехмерного координатного про- странства (соответствующие формулы известны читателю из разд. 3.2 гл. 2: см. формулы (2.7) и (2.8)). 366
Определение. Координатное пространство Ат называется т-м е р ным евклидовым пространством, если между двумя любыми точками и М”(х",Х2,...,х*) простран- ства Ат определено расстояние, обозначаемое символом р(М',М") и выражающееся соотношением Р(М', М') = 7(х.'-О2 +(*;-Хг)2 + ••• + « -О2. (15Л) Формула (15.1) является обобщением формул (2.7) и (2.8) из разд. 3.2 гл. 2, определяющих расстояние между двумя точками на плоскости и в трехмерном пространстве. Будем обозначать m-мерное евклидово пространство символами Ет или Rm (в данной книге мы будем в основном употреблять символ Rm). Введенное нами понятие m-мерного евклидова пространства явля- ется естественным обобщением понятий евклидовой плоскости и трех- мерного евклидова пространства, изученных в гл. 6. 1.2. Множества точек «-мерного евклидова пространства Если у функции y=f(x) одной независимой переменной х, обла- стью определения которой является некоторое множество {х} точек одномерного евклидова пространства1 R *, заменить это множество {х} некоторым множеством [М} точек «-мерного евклидова пространства Л”, то мы естественно придем к понятию функции т независимых пе- ременных. Следовательно, введению понятия функции т переменных должно предшествовать описание важнейших типов множеств точек m-мерно- го евклидова пространства Rm' Перейдем к описанию таких множеств. 1°‘ Множество {Л^} всевозможных точек М пространства Я”, коор- динаты xt,x2,...,xm которых удовлетворяют неравенству (х, - V +(х2 - V+-+(*m-xm)2<R2, называется открытым т-м ерным шаром радиуса R с цент- ром в точке М0{хихг,...,хт). Иными словами, открытый m-мерный шар радиуса R с центром в точке Мо — это множество всех точек М, для каждой из которых рас- стояние от фиксированной точки Мо удовлетворяет неравенству р(Л/,Л/0)< R. ’Я* — это пространство Л” при т = 1. 367
2°. Множество {М} всевозможных точек М пространства Rm, коор- динаты xitx2,...,xm которых удовлетворяют неравенству (х, -х,)2 +(х2 -$2У+...+(хт -Д,)2 <R2, называется замкнутым m-м ерным шаром радиуса R с цен- тром в точке M0(x,,x2,...,xm). 3°' Множество {М} всевозможных точек М пространства Rm, коор- динаты хрх2,...,хт которых удовлетворяют равенству (X, -£t)2 +(х2 - V+-+(xM -хт)2 =R2, называется т-м ерной сферой радиусаЛс центром в точке М0&,$2, Замечание 1. Если к открытому тл-мерному шару радиуса R с центром в точке Мо присоединить от-мерную сферу радиуса R с цент- ром в точке Mq, то получится замкнутый лг-мерный шар радиуса R с центром в точке Mq. 4°. Открытый /и-мерный шар радиуса е > 0 6 центром в точке Мо бу- дем называть е-окрестностью точки Mq. 5°. Множество {М} всех точек М, координаты х},х2,...,хт которых удовлетворяют неравенствам |х, -х,|< 4|х2 -х2|< d2,...,|xm -xm|< dm, где — некоторые положительные числа, называется от- крытым /n-м ерным координатным параллеле- пипедом с центром в точке M0(xpx2,...,xOT) или прямоуго- льной окрестностью точки Mq. Имеет место следующее элементарное утверждение1: любая г-окре- стность точки Мо содержит некоторую прямоугольную окрестность этой точки; любая прямоугольная окрестность точки Мо содержит некоторую ^-окрестность точки Мо. 6°. Точка М множества {М} точек пространства Rm называется внутренней точкой этого множества, если существует неко- торая е-окрестность точки М, все точки которой принадлежат множе- ству {М}. 1 Действительно, если для фиксированного е > 0 положить dx - d2 =...= dm = г/ Jm, то прямоугольная окрестность точки Л/о с указанными tdm будет содержаться в е-окрестности точки Л/о. Если для фиксированных dx>Qid1> b,...,dm > 0 положить е = min{tZ|, tZ2,..., dm}, то Е-окресТность точки Мо будет содержаться в прямоугольной окрестности точки Мо с указанными cfi, d2i^.9dm. 368
7°. Точка М пространства Rm называется внешней точкой множества {М}, если существует некоторая е-окрестность точки М, все точки которой не принадлежат множеству {М}. 8°’ Точка М пространства Rm называется граничной точ- кой множества {М}, если эта точка не является ни внутренней, ни внешней точкой указанного множества1. Замечание 2. Граничная точка М множества {М} может как принадлежать, так и не принадлежать этому множеству. Так, любая точка m-мерной сферы радиуса R с центром в точке Мо является гра- ничной как для открытого m-мерного шара радиуса R с центром в точ- ке Мо, так и для замкнутого m-мерного шара радиуса R. с центром в точке Мо. Но любая точка указанной сферы не принадлежит открыто- му m-мерному шару радиуса R с центром в точке Мо и принадлежит замкнутому шару радиуса R с центром в Мо. 9°. Произвольное множество {М} точек пространства R т называет- ся открытым, если любая точка этого множества является его внутренней точкой2. ' 10°. Произвольное открытое множество, содержащее данную точку Мо, принято называть окрестностью точки Мо. 11°. Произвольное множество {М} точек пространства Rm называ- ется замкнутым, если это множество содержит все свои гранич- ные точки. 12°. Точку А пространства Л” назовем предельной точ- кой множества {Л/}, если в любой е-окрестности точки А содержится хотя бы одна точка этого множества, отличная от А. Утверждение. Множество {М} замкнуто тогда и только тогда, когда оно содержит все свои предельные точки. Действительно, если множество {М} замкнуто, то оно содержит все точки'пространства Rm, кроме своих внешних точек. Поскольку среди внешних точек множества {М} нет его предельных точек, то множество {Л/} содержит все свои предельные точки. Если множество {М} не содержит хотя бы одной своей предельной ' точки Мо, то оно не может быть замкнутым, ибо не принадлежащая множеству {М} его предельная точка Мо является граничной точкой множества {М}. Доказанное утверждение позволяет дать другое эквивалентное определенйе замкнутого множества: множество {М} называется замкнутым, если оно содержит все свои предельные точки. 1 Заметим, что точка М является граничной точкой множества {Л/} тогда и только тогда, когда в любой е-окрестности точки М найдутся как точки, принадлежащие мно- жеству {М}, так и точки, ему не принадлежащие. ' 2 То есть любая тбчка М множества {Л/} принадлежит этому множеству вместе с некоторой своей е-окресгностью. 369
13°. Множество {Л/} точек пространства R". называется огра- ниченным, если найдется m-мерный шар, содержащий все точки этого множества. 14°. Н е п р е р ы в н о й к р и в о й L в пространстве R “ мы бу- дем называть множество {Л/} точек этого пространства, координаты х|,х2,...,хя1 которого представляют собой непрерывные функции пара- метра t: х1=ф.(0,х2=ф2(0,...,хм=фи(0 приа<?<0. (15.2) Будем говорить, что точки М'(х'1,х'2,...,х'т) и ЛГ'(х1"х£,...,х") про- странства Rm мо жно соединить непрерывной кри- вой L, если существует такая непрерывная кривая L, определяемая параметрическими уравнениями (15.2), что х,' = ф,(а),х; =ф2(а),...Х =Фи(а), х1''=Ф1(Р),х2и = ф2(0),...,х:=Фт(₽). 15°. Множество {Л/} точек пространства Rm называется связ- н ы м, если любые две точки этого множества можно соединить не- прерывной кривой, все точки которой принадлежат этому множеству. 16°. Всякое открытое и связное множество в пространстве Rm на- зывается областью. 17°. Если множество {Л/} представляет собой область, то множест- во {М}, полученное присоединением к множеству {М} всех его гра- ничных точек, называется замкнутой областью. Открытый m-мерный шар и открытый m-мерный параллелепипед являются ограниченными, связными и открытыми множествами, т. е. являются ограниченными областями в пространстве Rm. m-мерная сфера в пространстве Rm является примером замкнутого и ограниченного множества. Замкнутый m-мерный шар представляет собой ограниченную зам- кнутую область в Rm. Дополнение к открытому m-мерному шару представляет собой нео- граниченное замкнутое множество. Совокупность двух непересекающихся областей в пространстве Rm дает пример несвязного множества. 1.3. Понятие функции т переменных Теперь мы подготовлены для того, чтобы ввести понятие функции т переменных. Если каждой точке М из множества {М} точек т-мёрного евкли- дова пространства R” ставится в соответствие по известному за- кону некоторое число и, то говорят, что на множестве {М} задана 370
функция и = и (М) или и = f (M). При этом множество {Л/} называ- ется областью.' задания функции и = f(M). Число и, соответствующее данной точке М . из множества {М}, называется част.ным “| значением функции в точке М. Совокуп- I \ ность {«} всех частных значений функции г4--I и =f(M) называется м н о ж е с т в о м зна- I [ / - ч е н и й этой функции. Так как точка М \ ' / определяется координатами хих2,...,хт , то для \ j / функции т переменных и = f (М) использует- \ \ I / ся также обозначение и = f (хих2,...,хт). г Рассмотрим примеры функций т перемен- О \ у ных. ______________ \ 1°. и = ^9-х2 - у1. Областью задания этой функции является круг радиуса 3 с центром в Рис. 15.1 начале координат, а множество значений пред- ставляет собой сегмент 0 £ и £ 3. 2°. и=х2 + у1. Область задания этой функции — вся плоскость У?2, (~оо<х< оо, — оо< у< со), а множеством значений является полупрямая и>0. (Заметим, что графиком этой функции является так называемый параболоид вращения (рис. 15.1).) 3°. и = ^9-х2 — х2—...—х2. Областью задания этой функции служит wi-мерный шар радиуса 3 с центром в точке 0 (0, 0, ..., 0). Множест- вом значений является сегмент 0<и< 3. § 2. Предел функции т переменных 2.1. Последовательности точек пространства Rm Пусть каждому числу п из натурального ряда чисел (п = 1,2,...,п,...) ставится в соответствие точка Мп евклидова пространства Rm. Возни- кающий при этом ряд точек рассматриваемый в ука- занном порядке, называется последовательностью то- чек евклидова пространства Rm. Мы будем обозначать эту последовательность символом {Мп}. Последовательность {Л/„} точек евклидова пространства^"1 на- зывается сходящейся, если существует точка А пространства Rm такая, что для любого положительного числа е можно указать отвечающий ему ‘номер Nтакой, что при п> N выполняется неравен- ство р(МП,А)<е. При этом точка А называется пределом по- следовательности {Мя}. 371
Для обозначения предела Л последовательности {Мп} используется символика: lim Мп = А или Мп -> А при и -» оо. Утверждение 1. Последовательность {Мп} точек т-мерного евк- лидова пространства Rm сходится к точке А этого пространства тогда и только тогда, когда числовые последовательности {х1(л)}>{х2Л)}>---»{хт)} координат точек Мп сходятся соответственно к числам ах,а2,.,.,ат, представляющим собой координаты точки А. , Доказательство. Необходимость. Пусть последова- тельность {Мп} сходится к точке А и требуется доказать, что последо- вательности {х,(л)},{х2л)},•••> Ю координат точек Мп сходятся соответ- ственно к координатам ара2,...,ат точки А. Из сходимости {Мп} к А следует, что для любого е > 0 можно указать номер N такой, что при п> N выполнено неравенство р(Мя,Л)<е, которое можно записать следующим образом: <15J) Следовательно, при п > N выполнены неравенства |х!<л) - «1|< е> |*2Л) - а2|< е> -,|4Л) - flm|< Е, т. е. последовательности {Х|(я)}, {х2я){х^я)} координат точек Мп схо- дятся соответственно к числам ах,а2,...9ат. Необходимость доказана. Достаточность. Пусть указанные последовательности коор- динат точек Мп сходятся соответственно к числам apa2,...,am. Тогда для любого £ > 0 можно указать номера NX9N29...9Nm такие, что при n>NX9 п> N2,...,n> Nm соответственно выполняются неравенства Отсюда следует, что при п> N = max{7Vp7V2,...,Afm} выполняется неравенство (15.3) или неравенство р(Мл,Л)<£, где А — точка Rm с координатами (ара2,...,ат), т. е. последовательность {Мп} сходится к точке А. Достаточность доказана. Последовательность {Мп} точек т-мерного евклидова простран- ства Rт называется фундаментальной или последова- тельностью Коши, если для любого положительного числа £ можно указать отвечающий ему номер Nтакой, что при п> N и при любом целом р>0 выполняется неравенство р(Мп)<г, В полной аналогии с утверждением 1 доказывается следующее утверждение. 372
Утверждение 2. Последовательность {Мп} точек т-мерного-евк- лидова пространства Rm является фундаментальной тогда и только тогда, когда является фундаментальной каждая из числовых последо- вательностей1 {х^},{х^},...,{х<">} соответствующих координат то- чек {Мп}. Доказательство. Необходимое т ь. Пусть последо- вательность точек {Мп} является фундаментальной, т. е. для любого е > 0 найдется номер такой, что при п > N и для любого целого р > О справедливо неравенство р(Л/жр,Мд)<е, или, что то же самое, нера- венство ^х'"*’ -x,w)2 + (х<"*’ -х^+.-.+Сх^* -х™)2 <£. (15.3*) Следовательно, для любого целого р > 0 и при п > N справедливы неравенства |х<^’ -xw|<e,|x<^) -x<",|<£,...,|x<'4’) -х<я)|<е, которые и устанавливают фундаментальность каждой из числовых по- следовательностей соответствующих координат точек Мп. Необходи- мость доказана. Достаточность. Пусть фундаментальна каждая из число- вых последовательностей соответствующих координат точек Мп. Тог- да для любого £>0 можно указать номера Wj,W2,...,Ww такие, что со- ответственно при п >,Nl9 п > W2,...,п > Nm и для любых целых р > 0 бу- дут справедливы неравенства Отсюда следует, что при п> N = max{N1,7\f2,...,A\n} и для любого целого р>0 будет справедливо неравенство (15.3*), которое и означа- ет фундаментальность последовательности точек {Мп}. Достаточность и утверждение 2 доказаны. Теорема 1 (критерий Коши сходимости последовательности то- чек пространства Rm). Для того чтобы последовательность {Мп} точек пространства Rm была сходящейся, необходимо и достаточно, чтобы она была фундаментальной. Доказательство. Необходимость. Если последо- вательность точек {Мп} сходится к некоторой точке А пространства Rm, то в силу утверждения 1 каждая из числовых последовательностей соответствующих координат точек {Мп} сходится к соответствующей координате точки А. Но тогда в силу критерия’Коши сходимости чис- ловой последовательности (см. теорему 16 из § 5 гл. 7) каждая из чис- 1 Понятие фундаментальной числовой последовательности см. в § 5 гл. 7. 373
ловых последовательностей соответствующих координат точек {А/и} является фундаментальной, и, следовательно, в силу утверждения 2 яв- ляется фундаментальной и последовательность точек {Мп}. Необходи- мость доказана. Достаточность. Если последовательность точек {Мп} явля- ется фундаментальной, то в силу утверждения 2 является фундамента- льной и каждая из числовых последовательностей соответствующих координат точек {Мп}. Из критерия Коши сходимости числовой после- довательности указанные числовые последовательности соответствую- щих координат сходятся к некоторым числам а19а29...9ам соответст- венно. Но тогда в силу утверждения 1 последовательность точек {Мп} сходится к точке A (aj,a2,...,am). Достаточность и теорема доказаны. 2.2. Свойство ограниченной последовательности точек Rт Последовательность {Мп} точек т-мерного евклидова простран- ства называется ограниченной, если существует такое число a>Q, что для всех номеров п выполняется неравенство р($9Мп)£а, где 0 — точка, все координаты которой равны нулю. Иными словами, последовательность {Мп} ограничена, если все ее точки принадлежат замкнутому шару достаточно большого радиуса с центром в начале координат 0. Если «„«2,...,^, ... — произвольная строго возрастающая последо- вательность целых положительных чисел, то мы будем называть после- довательность точек М ,Л/ ,...,МЯ ,... ’ п2 ’ ’ ni ’ подпоследовательностью последовательности точек {Мп}. Теорема 2 (теорема Больцано-Вейерштрасса). Из любой ограни- ченной последовательности {Мп} точек т-мерного евклидова про- странства можно выделить сходящуюся подпоследовательность. Доказательство. Заметим прежде всего, что, поскольку по- следовательность {Мп} ограничена, т. е. р(0, А/Л)<а, и так как - Р(О,м„) = л/[х1(я)]2+[х<я)]2+...+[х<я)]2 , то имеют место неравенства 1 < a, о,|х^я)| < а, которые озна- чают ограниченность последовательностей {xl<")},{xj''){х^я)}. В силу теоремы Больцано-Вейерштрасса для числовых последовательностей (см. теорему 13 § 3 гл. 7) из последовательности {х((я)} можно выделить подпоследовательность {х|(я‘|)}, сходящуюся к некоторому числу а,. Из подпоследовательности {х^"*'*} последовательности вторых координат {х^0} в силу той же теоремы можно выделить подпоследовательность 374
{Xj”*2*}, сходящуюся к некоторому числу аг. При этом соответствую- щая подпоследовательность {х1<"',)} будет сходиться к числу аГ Очевидно, что если из подпоследовательности последовате- льности {х3(п)} третьих координат точек Мп выделить сходящуюся к не- которому числу аз подпоследовательность {х3(л‘з)}, то подпоследователь- ности {х,(л*з)},{х3л‘з)}, {х3л,,)} сходятся соответственно к числам а|,а2,а3. Продолжая эти рассуждения, мы получим после т шагов сходящуюся к некоторому числу.,ат подпоследовательность {х^л‘">} последовательно- сти /и-х координат точек Мп, причем подпоследовательности {х,(л‘’ ’}, {х2"‘" {х^"‘” 1} сходятся к числам а{, а2,..., ат соответственно. Тогда в силу утверждения 1 подпоследовательность {Mnt } после- довательности точек {A/„} сходится к точке А с координатами аиаг,...,ат. Теорема доказана. Замечание. Предел А последовательности {Мп} точек, при- надлежащих замкнутому множеству {М}, также принадлежат это- му множеству. Чтобы убедиться в этом, достаточно заметить, что в любой е-окре- стности точки А имеются точки Мп, т. е. точки множества {М}, и поэ- тому точка А является либо внутренней, либо граничной точкой {М}, а, следовательно, принадлежит {Л/}. 2.3. Предел функции т переменных Рассмотрим функцию и = f (М), определенную на множестве {Л/} • точек ти-мерного евклидова пространства Rm, и точку А пространства Rm, быть может, и не принадлежащую множеству {М}, но облада- ющую тем свойством1, что в любой 5-окрестности этой точки А содер- жится хотя бы одна точка множества {М}, отличная от А. Определение 1 (предела функции в точке А по Гейне). Число b называется пределом функции u = f (М) в точке А (или при М —> А), если для любой сходящейся к А последовательности {ЛА„} точек мно- жества {М} задания этой функции, все элементы Мп которой отлич- ны от А, соответствующая числовая последовательность значений функции сходится к числу Ь. Определение 1* (предела функции в точке А по Коши). Число b называется пределом функции и = f(M) в точке А (или при М —> А), если для любого положительного числа е найдется отвечающее ему положительное число 5 такое, что для любой точки М из множест- 'Это означает, что точка А является предельной точкой множества {М} (см. разд. 1.2 этой главы). 375
ва {М} задания этой функции, удовлетворяющей условию 0<р(М,А)<8, справедливо неравенство |/(Л/)-А|<е. Для обозначения предела функции и = f (М) в точке А использует- ся символика: lim f(M) = b или lim f(xvx2,...,xm) = b M->A (здесь a},a2,...,am — координаты точки А). Доказательство эквивалентности определений 1 и 1* аналогично доказательству соответствующей теоремы для функции одной пере- менной (см. теорему 1 из § 2 гл. 8), следует лишь заменить последова- тельность {хя} последовательностью точек {Мп}, точку а —точкой разности |х-а| и |хя-а| — расстояниями р(Л/,Л) и . р(Л/л,Л) соответственно, а числовую последовательность {/(хл)} — числовой последовательностью {f{Mn)}. Введем теперь понятие предела функции и = f (Л/) при М -> оо. Для этого предположим, что множество {Л/}, на котором задана функ- ция u = f (Л/), для любого 8 > 0 имеет хотя бы один элемент М, лежа- щий вне шара радиуса 8 с центром в точке О (0,0,..., 0). Ограничимся определением соответствующего предела по Коши. Определение 2. Число b называется пределом функции и = при Л/ —> оо, если для любого положительного числа г найдется отве- чающее ему положительное число 8 такое, что для всех точек М из множества {М} задания функции, удовлетворяющих условию р(0,М)>5, справедливо неравенство |/(Л/)-б|<е. Для обозначения предела функции и = f (М) при М оо использу- ется символ lim/(M) = & M-^D Установим теперь критерий Коши существования предела функции т переменных. Определение 3. Будем говорить, что функция т переменных f (Л/) удовлетворяет условию Коши в точке М = А (соответ- ственно при М —> оо/ если для любого положительного числа е най- дется отвечающее ему положительное число 8 такое, что для любых двух точек М' и М" из множества {М} задания функции, удовлетво- ряющих условиям 0< р(МА)< 8, 0< р(ЛР, А)< 8 (соответственно ~ условиям р(Л/',0)>8, р(Л/",0)>8)), справедливо неравенство |/(Л/')-/(ЛГ|<£. Теорема 3 (критерий Коши существования предела функцйй ж переменных). Для того чтобы функция u=f (Л/) имела конечный пре- 376
дел в точке М-А (соответственно при М-а<х>), необходимо и до- статочно, чтобы эта функция удовлетворяла в точке М = А (соот- ветственно при М —> со) условию Коши. Доказательство этой теоремы идентично доказательству теоремы 2 § 3 гл. 8 и может быть получено из него формальной заменой букв х и а буквами М и А и выражений типа |х - а| символом р(Л/, А). Теорема 4 (арифметические операции над функциями, имею- щими предел). Пусть две функции f (М) и g(M) заданы на одном и том же множестве {М} и имеют в точке А пределы, соответствен- но равные b и с. Тогда функции + f(M)-g(M), f (М) • g(M) и f (Л/) I g(M) имеют в точке А пределы, соответствен- но равные b + с, b-с, b-с и b/с (в случае частного нужно дополните- льно требовать, чтобы с было отлично от нуля). Доказательство этой теоремы аналогично доказательству теоремы 3 § 4 гл. 8, только вместо определения по Гейне предела функции од- ной переменной следует использовать определение по Гейне предела функции т переменных. 2.4. Бесконечно малые функции т переменных Функция u = f (Л/) называется бесконечно малой в точке А (соот- ветственно при М-А°о), если lim/(Л/) = 0 (соответственно lim/(M) = 0). Легко убедиться в том, что функция f(M) = (xi-ai)"' + +(х2-а2)"1+...+ (хт-ат)"", где nt,n2,.;.,nm — положительные числа, является бесконечно малой в точке1 A(at,a2,...,am). Если функция и- f(M) имеет равный b предел в точке А, то функ- ция а(Л/) = f(M)-b является бесконечно малой в точке А. Действительно, lima (Л/) = lim[/(М) - />] = lim f(M) - lim b = 0. Ис- MaA MaA MaA M-aA пользуя этот результат, мы получим специальное пред- ставление для функции, имеющей равный b предел в точке А: f(M) = b+a(M), где lim а (Л/) =0. Сравнение бесконечно малых функций нескольких переменных производится точно так же, как в § 5 гл. 8 проводилось сравнение бес- конечно малых функций одной переменной. Отметим, что, как и в слу- чае одной переменной, под символом о(Р) мы будем понимать любую бесконечно малую в данной точке А функцию более высокого порядка малости, чем бесконечно малая в данной точке А функция P(Af). 1 Так как каждая функция одной переменной f(xk) = (х, является бесконеч- но малой в точке х4 = ак. 377 кг
§ 3. Непрерывность функции т переменных 3.1. Понятие непрерывности функции т переменных Пусть А — некоторая точка Rm, принадлежащая области задания {М} функции т переменных u=f (А/), и любая 5-окрестность точки А содержит точки множества, {М}. Формальное определение непрерывности функции в точке А. Функция u = f(Л/) называется непрерывной в точке А, если предел этой функции в точке А существует и равен частному значению f (А). Используя определения предела функции в точке А по Гейне и по Коши, сформулируем определения непрерывности функции в данной точке по Гейне и по Коши. Учтем при этом, что, поскольку функцйя ДМ) определена в точке А, в определении предела по Гейне нет необ- ходимости исключать из последовательности {Л/„} значения аргумента Мп, равные Л, а в определении предела по Коши нет необходимости вводить требование р(М,А)>§, или, что то же самое, МфА. Определение 1 (непрерывности функции в данной точке по Гейне). Функция и-f(М) называется непрерывной в точ- ке А, если для любой сходящейся к А последовательности {Мп} то- чек множества {А/} задания этой функции соответствующая после- довательность {j\M„)} значений этой функции сходится к числу f(A). Определение 1* (непрерывности функции в данной точке по Коши). Функция u = f (М) называется непрерывной в т оч- ке А, если для любого положительного числа е найдется отвечающее ему положительное число 8 такое, что для любой точки М из множе- ства {М} задания этой функции, удовлетворяющей усло- виюр(М,А)<8, справедливо неравенство |/(А/)-/(Л)|<& Символически условие непрерывности функции и=f (М) в точке А выражается равенством lim f (М) = f (А), которое с учетом того, что lim М = А может быть записано в виде lim f (М) =f( lim М), показы- М—ьА М-ьА М-*А вающем, что для непрерывной в точке А функции т переменных, как и для функции одной переменной, символ предела lim и символ харак- теристики функции f можно менять местами. Определение 2. Точки пространства Rm, в которых функция u = f (М) не обладает свойством непрерывности, называются точ- ками разрыва этой функции. Пусть теперь {М} — множество точек пространства Rm, в любой 5-окрестности каждой точки М которого содержатся другие точки это- 378
го множества1. Такое множество {М} называется плотным в се- бе2. Определение 3. Функция u = определенная на множестве {М}, называется непрерывной на этом множестве, если она непрерывна в каждой точке М этого множества. Назовем приращением или полным приращени- е м функции и-f (М) в точке А функцию Ди, определяемую формулой Ди=/(Л/)-/(Л), (15.4) где М — любая точка из области задания функции. Пусть точки А и М имеют соответственно координаты at,a2,...,am и x,,x2,...,xm. Положим Дх, =х, -а„ Дх2 =х2 -а2,...,Дхт =хт -ат. Ис- пользуя эти обозначения, получим для приращения (15.4) функции Ди, соответствующего приращениям аргументов Дх,, Дх2,...,Дхт, следую- щее выражение: Ди = /(а, + Дх„а2 + Дх2,...,аи +Дх„) — /(а„а2,...,ат). (15.5) Очевидно, для непрерывности функции и = f (М) в точке А необ- ходимо и достаточно, чтобы ее приращение Ди, определяемое равенст- вами (15.4) и (15.5), представляло собой бесконечно малую в точке А функцию, т. е. необходимо и достаточно, чтобы lim Au = lim(/(Af)-/(J))=O или lim Ди = 0. (15.6) М-+А М-ъА ДГ|-И), Дх2-*0, Дхж-*0 Условие (15.6) естественно назвать разности ой формой условия непрерывности функции и=f(M) в точке А. 3.2. Непрерывность функции т переменных по одной переменной Введем для функции и=/(х„х2,...,хт) понятие непрерывности по одной из переменных при фиксированных значениях остальных пере- менных. Пусть точка М(х,,х2,...,хт) принадлежит области задания функции и = /(х„х2,...,хт). Зафиксируем все аргументы, кроме перво- го, а первому аргументу придадим произвольное приращение Дх, та- кое, чтобы точка с координатами х, +Дх,,х2,...,хм находилась в облас- ти задания функции. Соответствующее приращение функции называет- 1 Это означает, что любая точка Ммножества {Л/^является предельной точкой это- го множества. ’Примером плотного в себе множества может служить любое непустое открытое множество и любая замкнутая область, а также множество всех точек, содержащихся в открытом множестве и таких, что все координаты этих точек являются.рациональны- ми числами. 379
ся частным приращением функции в точке Л/(х1,х2,...,хт), соответствующим приращению Дх, аргумента х,,. и обозначается сим- волом Дхи. Таким образом, Ax,M=/(xi +Д*р*2...........................’ (15:7) Аналогично соотношению (15.7) определяются частные прираще- ния функции, соответствующие приращениям других аргументов: Дх1“ = /КМ Яхх,хг....хт), ^^=f^x,x1,...,xm_x,xm+bxj-f{xx,xz,...,xm). Функция u=/(x„x2,...,xm) называется непрерывной в точке Л/(х,,х2,...,хт) по переменной Xk, если частное при- ращение этой функции в точке М представляет собой беско- нечно малую функцию от &хк, т. е. если lim Дх и = 0.’ Очевидно из условия непрерывности u = /(x,,x2,...,xm) в данной точке М вытекает непрерывность этой функции в точке М по каждой из переменных х,,х2,...,хт. Однако из непрерывности функции в точке М по каждой из переменных х,,х2,...,хм не вытекает, вообще говоря, непрерывность функции в этой точке. Пример. Будем говорить, что функция двух переменных u=/(3/) = /(xj) непрерывна в точке. М на некото- рой прямой, проходящей через эту точку, если для любой после- довательности точек {Мп} этой прямой, сходящейся к точке М, соот- ветствующая последовательность значений функции сходится к частному значению f(M) функции в точке М. Так как на прямой функция u = f(x, у) представляет собой функцию одной переменной, то понятие непрерывности функции на прямой совпадает, очевидно, с понятием непрерывности указанной функции одной переменной. В ча- стности, непрерывность функции в точке М по отдельным перемен- ным х и у представляет собой непрерывность ее на прямых, проходя- щих через точку М и параллельных координатным осям. Докажем, что функция и = < Х'У 2 2 л -—при х + у *0, X + у 0 при х2+у2=0 (15.8) непрерывна в точке О (0,0) по каждой из переменных х и у, т. е. непре- 1 При фиксированных значениях всех переменных, кроме переменной х*, функция и = /(X],x2,...,xm) представляет собой функцию одной этой переменной. Непрерыв- ность функции по переменной хк означает непрерывность указанной функции одной переменной. 380
рывна на каждой из координатных осей, но не является непрерывной на всех остальных прямых, проходящих через эту точку, и потому не является непрерывной в точке О. Каждая прямая, отличная от коорди- натных осей и проходящая через точку О (0,0), может быть представ- лена уравнением у-кх, где к*0. Поскольку в каждой точке прямой у = кх при к ^0, за исключением точки О (0,0), функция (15.8) принимает одно и то же постоянное зна- к чение------ 1 + Л2 то можно утверждать, что если последовательность {Мп} отличных от точки О точек такой прямой сходится к точке О, то соответ- ствующая последовательность значении функции имеет предел --------. 1 + Л Так как при к ^0 этот предел отличен от нуля и не совпадает с част- ным значением функции в точке О, то функция разрывна в этой точке на рассматриваемой прямой. Непрерывность функции на координат- ных осях вытекает из того, что ее значения на этих осях равны нулю. 3.3. Основные свойства непрерывных функций нескольких переменных В этом разделе приводятся формулировки теорем, обобщающих соответствующие теоремы о свойствах непрерывных функций одной переменной из гл. 9. Теорема 5 (об арифметических операциях над непрерывными в данной точке функциями). Если функции f (Л/) и g(M) заданы на одном и том же множестве {А/} и непрерывны в некоторой точ- ке А этого множества, то функции f(M) + g(M), f(M)-g(M), f(M) • g(M) и —— также непрерывны в точке А (в случае частного g(M) нужно дополнительно предполагать, что g(A)&0.) Доказательство теоремы совершенно аналогично доказательству соответствующей теоремы 4 § 2 гл. 9. Введем понятие сложной функции нескольких перемен- ных. Пусть функции xi = Ф10р О» х2 = ФгО|> ^к) > (1^.9) *и=Фи('р'2>-Л) заданы на множестве {N} евклидова пространства 7?*(f„/2,...,ft — ко- ординаты точек в этом пространстве). Тогда каждой точке множества {N} ставится в соответствие с помощью фор- 381
I мул,(15.9) точка М(хх,х^...,хт) евклидова пространства Rm. Обо- ? значим множество всех таких точек М через {М}. Пусть и- f(xx,x2,...,xm) — функция т переменных, заданная на указанном множестве {М}. В этом случае мы будем говорить, что на множестве {77} евклидова пространства R* определена сложная функция u=f(xx,x2,...,xm), где х1,х2,...,хи являются функциями переменных tx,t2,...,tk, заданными соотношениями (15.9). ) Теорема 6 (о непрерывности сложной функции). Пусть функции хх =.Ф1('1Л>-Л)> Х2 =Ф201Л,Хт =<рт(,1,72>-Л) непрерывны в точке А(а„а2,...,ак), а функцияи = f(xx,x2,...,xm) непрерывна в точ- ке B(bx,b2,...,bm), где bt =ф,(а|,а2,...,а4) при z'= 1,2,...,?». Тогда слож- ная функция u = f(xx,x2,...,xm), где хх,х2,...,хт представляют собой определённые выше функции (15.9) аргументов tx,t2,...,tk, непрерывна в точке А(ах,а2,...,ак). Доказательство этой теоремы совершенно аналогично доказатель- ству соответствующей теоремы И, § 5 гл. 9..... Теорема 7 (об устойчивости знака непрерывной в данной точке функции). Если функция и = непрерывна в точке А евклидова пространства Rm и если f(A)^0, то существует такая 5-окрест- ность точки А, в пределах которой f(M) не обращается в нуль и имеет знак, совпадающий со знаком f(M). \ Доказательство этой теоремы совершенно аналогично доказатель- ству соответствующей теоремы 2 § .2 гл, 9. Теорема 8 (о прохождении непрерывной функции через любое промежуточное значение). Пусть функция u=f(M) непрерывна во всех точках связного множества {М} евклидова пространства R”, причем f(A) и f(B) — значения этой функции в точках А и В этого множества. Пусть, далее, С — число, заключенное между f(A) и f(B). .Тогда на любой непрерывной кривой L, соединяющей, точки А и В и целиком располагающейся в {М}, найдется точка N такая, что f(N) = С. Доказательство. Пусть х, = ф|(*),х2 = ф2 (t),...,xm = (рт (t) при а < t < р — уравнения непрерывной кривой L, соединяющей точ- ки Л и В и целиком располагающейся в {М} (см. разд. 1.2). На сег- менте [а,Р] определена сложная функция и=f(xx,x2,...,xm), где х, = ф,(7) при i - 1, 2,... ,т, а < Z < р. Очевидно, значения этой функ- ции на сегменте [а,р] совпадают со значениями функции u = f(M) на кривой L. Указанная сложная функция одной переменной t не- прерывна на сегменте [а,Р] и согласно теореме 6 § 3 гл. 9 в некото- рой точке £ сегмента [а,Р] принимает значение С. Поэтому в точке N кривой L с координатами Ф1Й),Ф2(^),...,ФМ(^) получим /(77)=С. Теорема доказана. 382
Теорема 9 (первая теорема Вейерштрасса)., Если функция и = f(M) непрерывна на замкнутом ограниченном множестве {М}, то она ограничена на этом множестве. ' Доказательство аналогично доказательству соответствующей теоре- мы 15 разд. 9.1 гл. 9. Точной в е р х н е й_ гр а н ь ю функции f(M) на множестве {М} называется такое число и, которое удовлетворяет двум требованиям: 1) f (Л/) < й для всех точек М множества {М}; 2) для любого 8>0 найдется хотя бы одна точка М множества {М} для которой f(M)>u-E. Аналогично определяется точная нижняя грань и функции на множестве {М}. Для обозначения точной верхней и точной нижней граней функции f (М) на множестве {М} используют следующую символику: й = sup/(М), и = inf f(M). {М> ' м 1 Теорема 10 (вторая теорема Вейерштрасса). Если функция и = f(M) непрерывна на замкнутом ограниченном множестве {Л/}, то она достигает на этом множестве своих точной верхней и точной нижней граней. Доказательство этой теоремы аналогично доказательству соответ- ствующей теоремы 16 разд. 9.2 гл. 9. Функция u=f(М) называется равномерно непрерыв- ной на множестве1 {М} евклидова пространства Rm, если для любо- го положительного числа г можно указать такое положительное 5, зависящее только от е, что для любых двух точек М' и М" этого множества, удовлетворяющих условию р(Л/', Л/")<5, выполняется не- равенство |/(М")-/(Л/')|<£. Теорема 11 (теорема Кантора о равномерной непрерывности). Непрерывная на замкнутом ограниченном множестве функция равно- мерно непрерывна на этом множестве. JlpKaa&tenbCTbo этой теоремы аналогично доказательству соответ- ствующей теоремы 17 разд. 9.3 гл. 9. Диаметром ограниченного множества {М} назовем точную верхнюю грань чисел р(Л/', Л/"), где М' и М” — всевозможные точки множества {М}, а р(Л/М") — расстояние между этими точками. Колебанием <о функции f(M) на множестве {А} назовем раз- ность между точной верхней и точной нижней гранями функции на этом множестве. 1 При этом предполагается, что множество [М] плотно в себе, т. е. в любой 5-окре- стносги каждой точки М этого множества имеются отличные от М точки множест- ва {Л/}. 383
Используя введенные определения, отметим следующее вытекаю- щее из теоремы Кантора свойство непрерывных функций. Пусть фун- кция и = f (М) непрерывна на замкнутом ограниченном множестве {М}. Тогда для любого положительного числа е можно указать такое число 5 > О, что на каждом принадлежащем множеству {М} замкну- том подмножестве {N}, диаметр которого меньше 5, колебание © функции f(M) меньше а Множество {М} ти-мерного евклидова пространства Rт называется компактом, если оно замкнуто и ограничено. Таким образом, первая и вторая теоремы Вейерштрасса и теорема Кантора справедливы для функции, непрерывной на компакте. § 4. Производные и дифференциалы функции нескольких переменных 4.1. Частные производные функции нескольких переменных Пусть Л/(х1,х2,...,хот) — внутренняя точка области задания функ- ции и = /(х1,х2,...,хот). Рассмотрим в точке Мотношение частного при- ращения Д^и этой функции к соответствующему приращению tsxk ар- гумента Xk: Ax,« = /(x„x2,...,xJt.„xjt+Axt,xw,...,xm)-/(x1,...,xm) Дх4 ДхЛ Отношение (15.10) представляет собой функцию аргумента Дхъ определенную для всех отличных от нуля значений &хк, для которых точка М(х1,х2,...,хк_1,хк + Дхк,хы,...,хт) принадлежит области задания функции u = f(xux2,...,xm). Определение. Если существует предел отношения (15.10) частно- го приращения функции в точке М(хрх2,...,хж) к соответствую- щему приращению tsxk аргумента xk, то этот предел называется частной производной функции u^f(xl,x2,...,xm) в точке М по аргументу хк и обозначается одним из следующих символов: ди df , г, дхк * Таким образом, Отметим, что частная производная (15.11) функции и = f(x1}x2,...,xm) по аргументу хк представляет собой обыкновенную . производную функции одной переменной хк при фиксированных зна- 384
чениях остальных переменных, и ее вычисление производится по обычным правилам вычисления производной функции одной пере- менной. Пример. = ди--(х2+У2У ГГ ду z ’ dz z1 при z*0. Замечание 1. Из существования у функции в данной точке всех частных производных, в отличие от функции одной переменной, вообще говоря, не вытекает непрерывность функции в этой точке. Рас- смотренная нами в предыдущем параграфе функция (15.8), как мы убедились, не является непрерывной в точке 0(0,0), однако имеет в этой точке частные производные по х и у, причем в силу того, что f(x,Q) = Q и /(0,у) = 0, можно утверждать, что — (0,0)= О, ^(0,0) = 0. дх ду Замечание 2. Подчеркнем, что данное нами определение частных произ- водных пригодно, вообще говоря, лишь для внутренних, а не для граничных то- чек области задания функции. Это связа- но, в частности, с тем, что в граничных точках области задания функции не все- гда можно вычислить частные производ- ные функции (это относится, например, к граничной точке Ма области, изображен- ной на рис. 15.2). В связи с этим принято определять частные производные в граничных точках как пределы этих производных при стремлении точек к границе. 4.2. Дифференцируемость-функции нескольких переменных Напомним, что приращением (или полным приращением) функции u = f(xt,x2,...,xm) в точке М(х1,х2,...,хт), соответствующим прираще- ниям Дхр Дх2,..., Дхт аргументов, называется выражение Ди=/(х, +Дхрх2 +Дх2,...,хт +Дхм)-/(х1,х2,...,хт). 385
Определение. Функция и=f(xl,x2,...,xm) называется диффе- ренцируемой в данной точке M(xt,x2,...,xm), если ее полное приращение в этой точке может быть представлено в виде Ди = А1Дх1 + А2Дх2+...+АтДхт +а,Дх, + а2Дх2+...+атДхт, (15.12) где А1,А2,...,Ат — некоторые не зависящие от Лх1,Лх2,...,Лхт числа, а,,а2,...,ат — бесконечно малые при Дх, ->0,Дх2 -»0,...,Дхт -ьЪфун- кции, равные нулю при Дх} = Дх2 =... = Дхм =0. Соотношение (15.12) называется условием дифферен- цируемости функции в данной точке М. Это условие можно за- писать в иной форме. Рассмотрим бесконечно малую при Дх, ->0, Дх2 —>0,...,&хт —>0 функцию1 р = д/дх,2 + Дх2+...+Дх2 и отме- тим, что эта функция обращается в нуль лишь при Дх, =Дх2 =...=Дхт =0. Докажем, что входящая в правую часть соотно- шения (15.12) сумма а,Дх, +а2Дх2+...+атДхи представляет собой бес- конечно малую функцию более высокого порядка по сравнению с р, т. е. докажем, что эта сумма равна о(р). Действительно, при р *0 спра- |Дх,.| ведливо неравенство -—- < 1, и поэтому Р [а,Дх,+а2Дх2+...+атДхт| < Таким образом, условие дифференцируемости функции (15.12) мо- жет быть записано в виде: Ди = Л,Дх, + А2Дх2+...+АтДхт + о(р). (15.13) При этом величину о(р) мы считаем равной нулю при р=0. Чтобы доказать, что условие (15.13) эквивалентно условию (15.12), нужно убедиться в том, что из представления (15.13) в свою очередь вытекает представление (15.12). Для этого, считая, что не все Дх,, Дх2,...,Дхт равны нулю2, представим о(р) в виде ’Геометрически эта функция представляет собой расстояние между точками Л/(^,лг2.х„) и Л/'(^ + Д^Л2 + Дх2,...,х„ + Дх„). 2 Если все Дх( равны нулю, то все члены в правой части формул (15.12) и (15.13) также равны нулю. 386
0(р) = °<Р). Р2 = °(Р) Дх,2 + Дх2+...+Дх2 Р Р Р Р о(р) ДХ| Р Р о(р) Дх, _ Полагая ——------=о-, и учитывая, что а, является бесконечно малой Р Р при р—>0 (а стало быть, и при Дх, ->0,Дх2 ->0,...,Дх,п -»0) функцией, мы придем к представлению. (15.12). Итак, условие дифференцируемости функции можно записать как в виде (15.12), так и в виде (15.13). Если хотя бы одно из чисел Л„Л2,..., Ат отлично от нуля, то сумма А, • Дх, + А2 -Ах2+...+Ат Дхт представляет собой главную (линейную относительно приращений аргументов) часть приращения дифферен- цируемой функции. Отметим, что если приращение Ди функции мо- жет быть представлено в виде (15.12) или (15.13) при Л, =0, А2 =0,..., ,..., Ат =0, то функция также дифференцируема в данной точке. Теорема 12. Если функция u = /(x,,x2,...,xm) дифференцируема в точке Л/(х,,х2,...,хт), то в этой точке существуют частные произ- водные по всем аргументам, причем — = Л(, где А, определяются из дх, условия (15.12) или (15.13) дифференцируемости функции. Доказательство. Из условия (15.12) дифференцируемости функции в точке Л/(х,,х2,...,хт) вытекает, что ее частное приращение Д* и в этой точке равно Дх и = А/Ах, + а,.Дх(, следовательно, —— -А, +а,,, 1 Ах, и так как а, ->0 при Ах, ->0, то ди дх, Дх м lim-^- Дх,. Следствие 1. Условие (15.13) дифференцируемости функции в дан- ной точке М можно записать в следующей форме: . ди. ди. ди. , . (15.14) Аи = — Ах, А----Дх,+...н---Дх_+о(р) v 7 5х, дх2 дхт (все частные производные в (15.14) берутся в рассматриваемой точ- ке М). 387
Следствие 2. Если функция u=f(x\,x2,...,xm) дифференцируема в точке М(х1,х2,...,хт), то представление ее приращения \и в форме (15.12) или (15.13) единственно. Действительно, коэффициенты этих представлений равны ча- <Эи - . , стным производным — в данной точке М и поэтому определяются дх, однозначно. Теорема 13. Если функция u=f(x\,x2,...,xm) дифференцируема в точке М(хих2,...,хт), то она непрерывна в этой точке. Действительно, из соотношения (15.12) вытекает, что lim Ди=0, а это означает, что функция непрерывна в точке М ZLr1->0,..,Arm->0 (см. формулу (15.6) из разд. 3.1). 4.3. Геометрический смысл условия дифференцируемости функции двух переменных В случае функции u = f(x, и) двух переменных условие дифферен- цируемости может быть иллюстрировано геометрически. Плоскость П, проходящая через точку NQ поверхности, называет- ся касательной плоскостью в этой точке, если угол между этой плоскостью и секущей, проходящей через точку NQ и лю- бую точку N, поверхности, стремится к нулю, когда точка Nx стре- мится к No (рис. 15.3). Если в точке ЛГ0 су- ществует касательная плоскость, то очевидно, что касательная в точке Уо к любой кривой, расположенной на по- верхности и проходя- щей через No, лежит в указанной плоскости. Убедимся, что из # условия дифференциру- емости функции и = f (х, у) в данной точке Л/0(х0,у0) выте- кает существование ка- сательной плоскости к графику S этой функ- ции в точке Nq(x0,yQ,uQ). Положим Дх=х-х0,Ду = у-у^,\и-и-щ, где uQ =f(xQ,yQ),u = f (х,у). Очевидно, условие (15.12) дифференциру- емости в данном случае можно записать в виде: 388
и-и0 = Л(х-х0) + 5(у-у0) + аДх + рДу= = А(х-х0) + В(у-у0) + о(р), . п ди ди где А и В — постоянные, равные частным производным — и — в точ- дх ду ке Мо> а и ₽ — бесконечно малые при ЛхчОи Ду-» 0-функции, р = Л/(Дх)2+(Ду)2. Рассмотрим уравнение: U-u0 = А(х-х0) + В(у-у0), У определяющее в декартовой системе координат (х, у, U) некоторую плоскость П, проходящую через точку N0(x0,y0,u0) и имеющую нор- мальный вектор п = {Л,В,-1} (см. разд. 4.1 гл. 6). Докажем, что эта плоскость П является касательной плоскостью в точке No поверхности S. Для этого достаточно убедиться в том, что: 1) плоскость П проходит через точку No поверхности S и 2) угол <р между нормалью п к этой плоскости и любой секущей NqNi стремится к л/2, когда точка М поверхности S стремится к точке Nq. Утвержде- ние 1 очевидно. Для доказательства утверждения 2 вычислим косинус угла <р, воспользовавшись для него определением скалярного произве- дения двух ненулевых векторов (см. формулу (4.12) из разд. 2.1 гл. 4). Так как координаты вектора п равны А, В, -1, а координаты вектора ---> NqN} секущей равны x-xQ, у-уо, u-uq (см. рис. 15.3), то __ А(х-х0) + В(у-у0)-(и-и0) сиъ ip-. .........- , . .... г. 7л2 + 52+1-^(х-х,,)2 +(у-у0)2 + (u-u0)2 Из условия дифференцируемости функции вытекает, что Л(х -х0) +В(у- у0) - (“- “о) = °(Р)- Поэтому Icos ф| < । °(Р)1 — _ 1°(р)1 о, J(x-X0)2 +(у-у0)2 Р когда р->0, т. е. Итф = л/2. Утверждение 2 доказано. р->0 ~ Таким образом, дифференцируемость функции и = /(х, у) в точке М0(х0,у0) с геометрической точки зрения означает наличие касатель- ной плоскости к графику функции и = / (х, у) в точке No (х0, у0, и0). Так как коэффициенты А и В равны соответственно частным про- изводным, вычисленным в точке Af0(x0,y0), то уравнение касательной плоскости может быть записано в виде 389
U-u0=~(x-x0)-t~(y-y0) (15.15) дх ду . ди ди ...... . .. . .. (частные производные — и — в (15.15) берутся в точке Мо (х0, у0)). дх ду 4.4. Достаточные условия дифференцируемости Теорема 14. Если функция и=f(xvx2,...,xm) имеет частные произ- водные по всем аргументам в некоторой окрестности точки М0(х},х1,...,хт), причем все эти частные производные непрерывны в самой точке Мо, то указанная функция дифференцируема в точке Мо. Доказательство. Проведем доказательство для функции двух переменных u-f(x,у). Пусть обе частные производные // и f'y существуют в окрестности точки Ма (х0, у0) и непрерывны в этой точ- ке. Зададим аргументам х и у столь малые приращения дос и Ду, чтобы точка M(xQ + Дх, у0 + Ду) не выходила за пределы указанной окрестно- сти точки Л/о. Полное приращение Ди=/(х0 + Дх,у0 + Ду)-/(х0,у0) можно записать в виде Аи = [/(х0 + Дх, у0 + Ду) - /(х0, у0 + Ду)] + [/(х0, у0 + Ду) - /(х0, у0)]. Выражение [/(х0 + дос, у0 + Ду) - /(х0, у0 + Ду)] можно рассматри- вать как приращение функции f (х, у0 + Ду) одной переменной х на сег- менте [х0,х0 +Дх]. Так как функция и =f(x,y) имеет частные произ- водные, то указанная функция f (х, у0 + Ду) дифференцируема и ее производная по х представляет собой частную производную //. При- меняя к указанному приращению формулу Лагранжа (см. разд. 2.2 гл. 11), получим, что [/(х0 + Дх,у0 +Ду)-/(х0,у0 + Ду)] =//(§!, у0 +Ду)Дх, где х0 < < х0 + Дх, или [/ (*0 + Л*> Уо + Ау) -f(x0,y0+ Ду)] = /; (х0 + 0, Дх, у0 + Ду) Дх, где 0< 0, < 1. Рассуждая совершенно аналогично, получим [f(x0, Уо + Ау) - f(x0, уо)] = f'y (*о > Уо + 0 2Ау)Ау, где о< 0 2 < 1. . Так как производные /х' и f'y непрерывны в точке Л/о, то /Х'(хо +0,Дх,уо +Ду) = /;(х0,у0) + а, /Д*о, Уо + 0 2 АУ) =/,'(*о, Уо) + ₽, где аир — бесконечно малые при Дх—>0, Ду—>0 функции. 390
Отсюда, учитывая приведенные выражения для приращений и вы- ражение для Ди, найдем, что Ди = /Х'(хо, Уо) Дх + /; (х0, Уо) Ду + аДх + Р Ду. Следовательно, функция u=f(x, у) дифференцируема в точке Мй. Для функции т переменных рассуждения аналогичны, только полное прираще- ние такой функции надо представить в виде Ди = /(х| +Дх„х2 + Дх2,...,хя + Дхт)-/(х|,х2,...,хЯ1) = = £[Л*Р-Л-1Л +Дх,-,х,+1 +Дх/+|,-,хт +Дх,„)- /=1 -/(x1,...,xi_1)x,.,xw + Дх(+|,...,хт +Дхт)]. Теорема доказана. 4.5. Дифференциал функции нескольких переменных Определение. Дифференциалом du дифференцируемой в точке М(хих2,...,хт) функции u=f(xi,x1,...,xm) называется главная линейная относительно приращений аргументов часть приращения этой функции в точке М. Если все коэффициенты А, в приращении (15.12) дифференцируемой функции равны нулю, то дифференциал du функции в точке М считается равным нулю. Итак, по определению du = Л|ДХ] + Л2Дх2+...+ЛтДхт. (15.16) Используя теорему 12 и равенство (15.14), можно, очевидно, пере- писать выражение (15.16) для дифференциала следующим образом: , ди . ди . ди . (15.17) du-— Дх. + — Дх,+...+------Дх„. 4 ' дх. * дх2 2 дх Под дифференциалом r/х. независимой переменной х, можно пони- мать любое (не зависящее от xt,x2,...,xm) число. Договоримся в даль- нейшем брать это число равным приращению Дх(. независимой пере- менной х,.. Это позволяет нам переписать формулу (15.17) в виде , ди , t ди , ди , (15.18) du-— dx.+— dx,+...+--------dxm. 4 ' Sx, dx2 dxm Подчеркнем, что формула'(15.18) установлена нами лишь в пред- положении, что аргументы х1,х2,...,хЯ1 являются независимыми пере- менными, однако ниже мы докажем, что формула (15.18) остается справедливой и в случае, когда аргументы хрх2,...,хт являются диффе- ренцируемыми функциями новых переменных. 391
4.6. Дифференцирование сложной функции Рассмотрим сложную функцию вида м = /(х„х2,...,хот), где х\ = Ф1 ^), Х2 (15.19) Хт ~ О* TeopeMa^lS. Пусть функции (15.19) дифференцируемы в некоторой точке а функция и = /(х1,х2,...,хЛ1) дифференцируема в соответствующей точке М(хх,х2,...,хт)у zdexi =Ф,(?|>?2>--»^)> / = 1,2,...,ти. Тогда сложная функция м = /(х1,х2,...,хот), где хих2,...,хт определяются соотношениями (15.19), дифференцируема в точке N. При этом частные производные этой сложной функции в точке N определяются формулами ди ди дхх ди дх. ди дхт dtx дхх dtx дх2 dtx дхт dtx ди _ ди дхх ди дх2 ди дхт dt2 дхх dt2 дх2 dt2 дхт dt2 (15.20) ди _ ди дхх ди дх2 ди дхт . dtk дхх dtk дх2 dtk дхт dtk ’ ч ди ди ди ,, в которых все частные производные —, —,...,---------берутся в точке М, Л дх. дх. дхт дх. 2 а все частные производные —- функций (15.19) по аргументам dtJ tx,t2,...,tk берутся в точке N. \ J[o к а°з а т е л ь с т в о. Придадим аргументам tx,t2,...,tk в точке N(tx,t2,...,tk) произвольные приращения Д/„ Д/2,...,Д/4, не равные од- новременно нулю. Этим приращениям соответствуют приращения Дх,, Дх2>..., Дхи функций (15.19) в точке N. Приращениям Дх^ Дх2,..., Дхи в свою очередь соответствует приращение Ди функции и = f(xx,x2,...,xm) в точке М. Поскольку функция u = f(xx,x2,...,xm) предполагается дифференцируемой в точке М, ее приращение Ди мо- жет быть записано в виде .' ди . ди . ди . . . . Ди = — Дх. +—Дх,+...+--------Дх„ 4-а.Дх. +а,Дх,+...+ a_z\x_, (15.21; л 1 л 2 л т 1 I 2 2 т т' 4 дхх дх2 392
ди ди ди с где частные производные —,—------------- берутся в точке М, а Зх, дх2 дхт а,,а.2,...,<хт — бесконечно малые при Дх( —>0,Дх2 ->0,..., Дхт —>0 функции, равные нулю при Ах, = Дх2 =... = Дхт =0. Подчеркнем, что в соотношении (15.21) Дх„ Дх2,..., Дхт представляют собой приращения функций (15.19), отвечающие выбранным приращениям ДгрД/2,...,Ык аргументов этих санкций. В силу дифференцируемости функций (15.19) в точке У(/1,/2,...,^) приращения Дх. можно записать в следу- ющей форме: , дх, , дх, , дх, . , . . , _ Дх,,=-!-Atl+—-At2 +...+—-Д^+о(р), при 1 = 1,2,...,т, (15.22) dtj dt2 otk , ' дх. dxt dXi ' где частные производные —берутся в точке Nt а dt} dt2 р=7(до2+(Д'2)2+-+(до2- Для завершения доказательства теоремы мы должны убедиться в том, что после подстановки в правую часть (15.21) выражений (15.22) приращение Ди может быть приведено к виду Ди = AtAit + A2At2+...+AkAtk + о(р), (15.23) . ди дх, ди дх2 ди дхт (15.24) 1 дх, dtj дх2 dtj дхт dtj поскольку формула (15.23) устанавливает факт дифференцируемости сложной функции, а выражение (15.24) является частной производной этой сложной функции по переменной tj (см. теорему 12). Подставляя выражения (15.22) в формулу (15.21), получим: где Ди = J—Дх,- + ,.Дх( ди -^дх, . , . А . — ^-Д/у+о(р) +2>,.Дх,. = SrJ ;.| dtj J ,=i ди дх, if^dtj (=1 дх, =iAj^j+2^(р)+ >1 м дх, ,=1 Последние две суммы написанной выше формулы представляют ди собой величину о(р). Действительно, величины — берутся в точке М дх, 393
и поэтому являются постоянными, не зависящими от р числами. Сле- dt/ * довательно, V------о(р) = о(р). Далее, величины Дх( для z = 1,2,...,/h ,=| дх, удовлетворяют в силу формулы (15.22) неравенству |Ах,.|< const -р, а величины а( являются бесконечно малыми приДх,->0, Дх2 ->0,...,Ахи —>0 функциями, причем из дифференцируемости и вы- текающей из нее непрерывности в точке У функций (15.19) следует, что Ax,,Ax2.....Дхт стремятся к нулю при р->0. Поэтому =о(р), и для приращения Ди справедливо представление (=1 (15.13). Теорема доказана. Замечание. В случае, когда функции (15.19) зависят от одно- го аргумента t, мы имеем сложную функцию одной переменной t: и =f(xx,x2,...,xm), где X; =ср,(О- Производная — этой сложной функ- dt ции определяется формулой: du _ ди dxx ди dx2 + + ди dxm (15.25) dt дхх dt дх2 dt дхт dt Формула (15.25) будет использована в § 6 при выводе формулы Тейлора. 4.7. Инвариантность формы первого дифференциала Докажем, что полученная нами в разд. 4.5 формула (15.18) для первого дифференциала, функции нескольких переменных , ди , ди , ди , du = — dx. + — dx2+...+---dxm лч I л X л гП дх. дх. дхт 12 т является универсальной и справедлива не только в случае, когда аргу- менты хх,х2,...,хт являются независимыми переменными, но и в слу- чае, когда xt сами являются дифференцируемыми функциями новых переменных tx,t2,...,tk, которые мы можем считать независимыми. Это свойство первого дифференциала обычно называют свойством инвариантности его формы. Итак, рассмотрим функцию и=f(xx,x2,...,xm^, у которой аргумен- ты X/ являются дифференцируемыми в точке A(t„t2,...,tk) функциями xi =<Р, (*1Л'—Л)> а сама функция и=f(xyX2,...,xm) дифференцируема в точке В(хх,х2,...,хт), где хх = <pi(tx,t2,...,tk'). В этом случае и представ- ляет собой сложную функцию независимых переменных tx, t2...tk, диф- 394
ференцируемую в силу теоремы 15 в точке А, и, следовательно, ее дифференциал du можно записать в виде , ди . ди ди du- — dt. ч-----dt, +...4--dtk, dtt dt2 dtk (15.26) ди где — определяются из соотношений (15.20). а/, ди Подставляя — из соотношений (15.20) в равенство (15.26) и соби- , , ди ди ди рая коэффициенты при —,—,...,-------, получим &| дх2 дх,„ , ди I дх. . дх. , дх, , ] du —— —• dt, Н---dt2A-..A-dtk +...+ dtx dt2 dtk ) +^(^Л1+^!+...+^лД ахДа, a, a, *J Остается заметить, что в последнем равенстве для каждого i, рав- ди ного 1,2,...,ти, коэффициент при — равен дифференциалу dx( функции dxf х, Итак, мы получили для дифференциала du рассмат- риваемой сложной функции ту же формулу (15.18), что и для случая, когда х^х2,...,хт являются независимыми переменными. Инвариант- ность формы первого дифференциала доказана. Доказанное свойство позволяет, установить следующие правила дифференцирования для произвольных дифференцируемых функций и и v (любых не обязательно независимых) переменных: d(Cu) =C-du, где С = const;d(u ±v) = du±dv; <иУ vdu-udv — =---------. V) V 4.8. Производная по направлению. Градиент Пусть функция трех независимых переменных u = f(x, у, z) опреде- лена в некоторой окрестности точки M0(x,y,z) пространства R3 и дифференцируема в точке Мо. Рассмотрим всевозможные лучи, выходящие из точки Мо. Каж- дый такой луч задается единичным вектором е с координатами (cos a, cos Р, cos у) и определяет некоторое направление. (Действитель- но, если единичный вектор е составляет с осями координат углы, со- 395
ответственно равные а,риу, то координаты этого вектора равны cos a, cosp, cos у (см. разд. 1.3, 1.4 гл. 4). Указанные три косинуса при- нято называть направляющими косинусами вектора е.) Фиксируем некоторый луч, выходящий из точки Af0 и определяе- мый единичным вектором е с координатами (cos a, cosp, cos у). Взяв на прямой, содержащей этот луч, произвольную, отличную от > Мо точку М рассмотрим вектор или направленный отрезок МйМ и обозначим через I величину этого направленного отрезка на оси, опре- деляемой единичным вектором1 е = (cos a, cosp, cos у). > Очевидно, вектор Мо М имеет координаты (/ • cos а, I • cos р, / • cos у). С другой стороны, если координаты точки М равны (х, у, z), то век- ..... > тор МйМ имеет координаты, равные (х-х,у-у,z-z) (см. разд. 1.3 гл. 2). Сопоставляя два полученных нами соотношения для координат ------- вектора МйМ, мы приходим к равенствам х=х + /cosa,y = y + /cosp, z = z + /cosy. (15.27) Равенства (15.27) показывают, что на прямой, проходящей через точку Мо и определяемой единичным вектором е = (cos a, cosp, cos у), функция и = f(x, у, z) представляет собой сложную функцию одной не- зависимой переменной / вида u = f(x +/cosa,y + /cosp,z + /cosy). Определение 1. Производную указанной сложной функции по пере- менной I, взятую в точке 1 = 0, назовем производной функ- ции u = f(x,y,z)e точке Мо по направлению, определяе- мому единичным вектором е, и будем обозначать символом Итак, по определению — = —(A/0)cosa + — (A/0)cosp + — (A/0)cosy. (15.28) де дх ду dz Определение 2. Градиентом функции u=f(x, у, z) в данной точке Ma(x,y,z) называется вектор, координаты которого имеют вид ^(Л/о), ^(Мо), ^(Л/о). дх ду oz Для обозначения градиента функции и- f(x, у,z) обычно использу- ют символ grad и. ’См. разд. 1.1 гл. 2. 396
Итак, по определению, grad u(M0) = (Мо), ^ (Мо), (Мо Л ° 529) ду OZ ) Так как скалярное произведение двух векторов равно сумме произ- ведений соответствующих координат этих векторов (см. разд. 2.3 гл. 4), то выражение (15.28) для производной по направлению, опреде- ляемому вектором е, можно рассматривать как скалярное произведе- ние векторов (15.29) и е = (cos a, cos р, cos у). Итак, мы получаем, что ^.(..gradu), <15-30> де С помощью равенства (15.30) убедимся в том, что градиент функ- ции u=f(x, у, z) в точке Мо характеризует направление и величину максимального роста этой функции в точке Мй. Точнее, докажем два утверждения: 1) производная функции и = f(x,y,z) в точке Мо по направлению, определяемому градиентом этой функции в указанной точке, имеет максимальное значение по сравнению с производной в этой точке по любому другому направлению; 2) значение производной функции u=f(x, у, z) по направлению, определяемому градиентом этой функции в данной точке, равно |grad w|, т. е. равно длине вектора grad и в данной точке. Для доказательства утверждений 1 и 2 заметим, что скалярное про- изведение двух векторов равно произведению длин этих векторов на косинус угла между ними (см. разд. 2.1 гл. 4). Поэтому выражение (15.30) можно переписать в виде = |е| |grad u| cos <р, где <р — угол между векторами е и grad и. Учитывая, что |е| = 1, мы получим = |grad u| cos ф. Из последнего равенства вытекают оба утверждения 1 и 2. Дейст- „ - ди вительно, максимальное значение производной — получится при де cos<p = l, т. е. при совпадении направления е с направлением grad и, причем производная в этом направлении равна |gradu|. 397
Доказанные два утверждения приводят к выводу о том, что гради- ент не зависит от выбора системы координат (ибо и направление, и длина вектора grad и в каждой данной точке инвариантны относитель- но выбора системы координат). Для выяснения геометрического смысла вектора grad« целесооб- разно ввести понятие поверхностей уровня функции u=f(x, у, z), по- нимая под этим термином те поверхности, на которых функция u = f(x, у, z) сохраняет постоянное значение, т. е. удовлетворяет соот- ношению f(x,y, z) = C = const. Если в каждой точке Мй(х,у,г) поверхности уровня f(x,y,z) = C построить касательную плоскость, то можно убедиться в том, что нор- мальным вектором такой плоскости будет являться вектор (15.29), т. е. grad и. Отсюда следует, что вектор grad и в каждой точке М поверхно- сти уровня /(х, у, z)=C ортогонален к этой поверхности. § 5. Частные производные и дифференциалы высших порядков 5.1. Частные производные высших порядков гт 5w , Пусть частная производная — по аргументу х,. функции дх- w = /(xl,x2,...,xm), определенной в области {М}, существует в каждой точке области {Л/}. В этом случае частная производная представляет собой функцию переменных Хь х2,..., хт, также определенную в облас- ти {М}. „ , ди Если функция — имеет частную производную по аргументу хк в Эх,. некоторой точке М области {М}, то эту частную производную по аргу- менту х4 называют второй частной производной или частной производной второго порядка функции и=/(х),х2,...,хт) в точке М сначала по аргументу х,, а затем по аргу- менту хк и обозначают одним из следующих символов: ^2ц f (2) „(2) дхкдХ'Х*' хл' При этом если i*k, то частная производная и называется дхкдх; смешанной частной производной второго порядка. После введения понятия частной производной второго порядка можно последовательно ввести понятие третьей частной производной, затем четвертой и т. д.
1 Если предположить, что уже введено понятие (л - 1)-й частной про- изводной функции и = /(х,,х2..х,„) по аргументам х,. ,х(1 ,...,х,; ( (от- дельные или даже все номера которых могут совпадать), и что эта (л - 1)-я частная производная имеет в точке М частную производную по аргументу х(.то указанную частную производную называют л-й частной производной (или частной производ- ной л-го порядка) функции u=f (хрх2 хт) в точке М по ар- гументам х,., х,2,..., х,;. Таким образом, понятие л-й частной производной вводится индук- тивно, переходя от первой частной производной к последующим. Со- отношение, определяющее л-ю частную производную, имеет вид д"и _ д ( д'-'и дх. дх, ...дх, дх, дх, дх, ...дх, дх, 1п 1» I ;2 'l ln \ »и-| Ь h J Если не все индексы i{,i2,...,in совпадают между собой, то частная про- д"и изводная ---------------- называется смешанной частной дх, дх, ...дх, дх, производной и-г о порядка. Так как частная производная функции по аргументу х,. определяет- ся как обыкновенная производная функции одной переменной х; при фиксированных значениях остальных переменных, то методика вычис- ления частных производных высших порядков предполагает умение вычислять только обыкновенные производные первого порядка. Вы- числим вторые частные производные функции и = arctg — в любой точ- У ке (х,у), отличной от (0,0). ди _ у ди _ -х дх х2 + у2’ ду х2 + у2’ д2и _ -2ху д2и _ х2 - у2 дх2 (х2+у2)2’ дхду (х2 + у2)2> д2и _ х2 - у2 д2и _ 2ху дудх (х2+у2)2’ ду2 (х2 + у2)2 о ' д2и д2и Здесь смешанные частные производные-------и------равны друг дудх дхду Другу. Вообще говоря, значения смешанных частных производных зави- сят от порядка, в котором производятся последовательные дифферен- цирования. Например, можно проверить, что у функции 399
и = < ху^—при х2 + у2 * О, X + у О прих2+у2=0 смешанные частные производные второго порядка в точке О (0,0) су- ществуют, но не равны друг другу. Определение. Функция u = /(x1,x2,...,xw) называется п раз дифференцируемой в точке MQ(xx ,х2,...,хт), если все ее частные производные порядка (п -1) являются дифференцируемыми в этой точке функциями. Утверждение. Для того чтобы функция и = f(xl9x29...9xm) была п раз дифференцируема в точке М^(хх ,x2,...,xw), достаточно, чтобы все ее частные производные п-го порядка были непрерывными в точ- ке Мо. Справедливость этого утверждения вытекает из определения диф- ференцируемости функций и теоремы 14 о достаточных условиях диф- ференцируемости. Теорема 16. Пусть функция и = f(x,y) дважды дифференцируема в точке Л/0(х0,у0). Тогда в этой точке частные производные /х<2) и равны. Доказательство. Так как функция u = f(x, у) дважды диф- ференцируема в точке Л/0(х0,у0), то частные производные // и f'v определены в некоторой 5-окрестности точки Ма и представляют со- бой дифференцируемые в этой точке функции. Рассмотрим выражение Ф = /(*о + Л> Уо + й) - f(xQ + h, у0) -/(х0, у0 + А) + /(х0 > Уо )> (15.31) где h — любое столь малое число, что точка М (х0 + h, уа + й) находит- ся в указанной 8-окрестности точки Мй. Выражение Ф можно рассматривать как приращение Дф = ф(х0 + /Хх)-ф(х0) дифференцируемой на сегменте [х0,х0 + й] фун- кции ср(х) = f (x,y0 + й) - f (х, у0) одной переменной х. Поэтому, поль- зуясь, как и при доказательстве теоремы 14, формулой Лагранжа и обозначая через 0 некоторое число из интервала 0< 0< 1, можем запи- сать: Ф = Дф = ф' (х0 + 0й)й = [/; (х0 + 0й, уа + й) - /; (х0 + 0й, у0 )]й = = {[А'(хо +бА,у0 +й)-/х'(х0,у0)]-[/;(х0 +0й,уо)-//(хо,уо)]}й. (15.32) 400
Так как частная производная // является дифференцируемой в точ- ке Мо функцией, то [/; (х0 + 0й, у0 + Л) - /; (х0, у0)] = (х0, у0 )0Л + (х0, у0 )Л + а ,6Л + р ,й, [/; (х0 + ел, у0) - /; (х0, у0)]=f* (х0, у0 )ел+а 2ел, где а|,р1 и а 2 — бесконечно малые при Л->0 функции. Подставляя найденные выражения для [/Х'(хо +Qh,y0 +h)~ -/x'OWo)] и [/70о +0Л>-Ио)_Л'(*о>Я>)] в формулу (15.32), получим Ф=[/®(х0,у())+а]Л2, (15.33) где а=а|0+Р1-а20 — бесконечно малая при Л->0 функция. С другой стороны, выражение Ф, определяемое соотношением (15.31), можно рассматривать как приращение Ду = у(у0 +h)~ -у(у0) дйфференцируемой на сегменте [у0,у0 - функции у(у) = /(х0 +h,у)- f(x0> у). Применяя формулу Лагранжа и учитывая дифференцируемость частной производной /' в точке Мй, мы полу- чим совершенно аналогично предыдущему следующее выражение для Ф: Ф=[/^(х0,Л)+Р]й2, (15.34) где р — бесконечно малая при Л^О функция. Приравнивая правые части (15.33) и (15.34) и сокращая обе части полученного равенства на й2, найдем, что f™ (х0, у0) + а = (х0, уа) + р. Так как аир — бесконечно малые при Л -> 0 функции, то из последне- го равенства следует, что /™(х0,у0) = /®(х0,у0). Теорема доказана. Теорема 16 утверждает, что в данной точке Л/о (х0, у0) имеет место равенство /^2) = fyx, если в этой точке дифференцируемы обе частные производные /х' и f. Из дифференцируемости f'x и f'. в точке Мо вы- текает существование в этой точке всех частных производных вто- рого порядка. Но равенство выполнено и при условии суще- ствования только этих частных производных и при дополнитель- ном требовании непрерывности этих частных производных в точке Мо. Теорема 16*. Пусть в некоторой окрестности точки Мй(х0,уй) функция u=f(x,y) имеет частные производные Пусть, кроме того, производные и fyx непрерывны в точке Мо. Тогда в этой точке f£2) = Л(2). ✓ ху j ух Доказательство. Из (15.32) вытекает, что- Ф представляет собой умноженную на h разность значений функции fx(x, у) в точках 401
(х0 + ОА, уй + Л) и (х0 + Qh, у0). Применяя к этой разности формулу Лаг- ранжа по переменной у на сегменте [у0,у0 +А], получим Ф = /^2)(х0 +9Л.Л ^е,Л)Л2, где 0< 0, < 1. В силу непрерывности в точке М0(х0,у0) из последнего ра- венства получаем Ф=[7№,Уо) + а(Л)]Л\ где а(Л)-»0 при Л-»0. С другой стороны, Ф=Л[/;(х0 +h,y0 + 02A)-/J,'(xo,yo + 02й)] при 0< 02 < 1. Применяя к этой разности формулу Лагранжа по переменной х на сегменте [х0,х0 +А] и учитывая непрерывность в точке Мо, получим Ф = [/№>Л) + Р(Л)]/Л где Р(й)-»О при А—>0. Приравнивая последние два выражения для Ф и рассуждая так же, как и в конце доказательства теоремы 16, мы убедимся в справедливо- сти равенства f^(x0,y0)=f^(X(>,y0). Теорема 17. Пусть функция и = f(xl9x2,...,xm) п раз дифференци- руема в точке MQ(xx ,х2,...,хот). Тогда в этой точке значение любой смешанной частной производной п-го порядка не зависит от порядка, в котором производятся последовательные дифференцирования. Доказательство. Достаточно доказать равенство дГи = (15.35) dxi ...dXjiMdxii...dXi dxl'...dxitdxi^...dxii ’ означающее независимость значения любой п-й смешанной производной от поряд- ка проведения двух последовательных дифференцирований по х( их,. Рассмотрим функцию ----------, представляющую собой дважды Чг&| дифференцируемую функцию переменных xit и х4ц. В силу теоремы 16 дх, дх,дх, ...дх, дх,дх, дх, ...дх, •ы 4 4 4 4ч 4-i 4 Отсюда и вытекает справедливость равенства (15.35). Теорема доказана. 402
5.2. Дифференциалы высших порядков В рассуждениях настоящего раздела мы будем использовать для обозначения дифференциалов аргументов и дифференциала самой функции u = f(xx,x2,...,xm) наряду с символами dxx,dx2,...,dxm и du , символы бхр5х2...5хти 5и соответственно. В этих обозначениях выра- жение для первого дифференциала (15.18) будет иметь вид _ ди» ди „ ди „ ои =—ох. +--------бх,+...+-----охт. Эх, дх2 дхт Возвращаясь к прежним обозначениям, рассмотрим выражение (15.18) для первого дифференциала дифференцируемой в данной точке М(хрх2,...,х„) функции и=/(хрх2,...,хт): , ди , ди , ди , du = — dx. +------dx,+...+-----dx„. 4*4 1 4*4 * 4*4 m ox, dx2 dxm (15.18) Пусть величина в правой части (15.18) представляет собой функ- цию аргументов хрх2.....хт, дифференцируемую в данной точке М. Для этого достаточно потребовать, чтобы функция w=/(xpx2,...,xm) была два раза дифференцируема в точке М, а аргументы хрх2........хи являлись либо независимыми переменными, либо два раза дифферен- цируемыми функциями некоторых независимых переменных tx,t2,...,tk. При этих предположениях мы можем рассмотреть дифференциал 6(Jw) = 5 jt=l ОХк от величины (15.18). Определение 1. Значение 8 (du) дифференциала от первого диффе- ренциала (15.18), взятое при 8х, =dkj,Sx2 = rfx2,...,8xm = dxm, называет- ся вторым дифференциалом функции м = /(х1,х2,...,хш) (в данной точке M(xi,x2,...,xm)) и обозначается символом du. Итак, по определению1 d2u=8(du) 5х] =dx\ 6x2=dx2 5xj =dx\ 8x2=dx2 Jt=l OXk 5xm dxm dxm ’Символ {...} 5х|=Л| &С2=Ч&2 обозначает, что в выражении, заключенном в фигурные скобки, следует положить 8.^ = dxl,8x2 = dx2,...,8xm = dxm. 403
Дифференциал d”u любого порядка п введем по индукции. Пусть уже введен дифференциал dn~'u порядка п-1 и функция и=f(xx,x2,...,xm) п раз дифференцируема в данной точке М, а ее аргу- менты xt,x2,...,xm являются либо независимыми переменными, либо п раз дифференцируемыми функциями некоторых независимых перемен- ных tx,t2,...,tk. Определение 2. Значение 5(d"^u') дифференциала от (п - 1)-го дифференциала d"~'u, взятое при 5xt =dxt,5x2 = dx2,...,5xm =dxm, назы- вается п-м д и ф ф е р е н ци а л о м функции и = f(xx,x2,...,xm) (в данной точке^М(Х(,х2,...,хт)) и обозначается символом d”u. Итак, по определению dnu = 8л; = Л; 5х2 = cb^ 8х„, = dxm При вычислении второго и последующих дифференциалов прихо- дится существенно различать два случая: 1) случай, когда аргументы хх,х2,...,хт являются независимыми переменными, 2) случай, когда ар- гументы хх,х2,...,хт являются соответствующее число раз дифферен- цируемыми функциями некоторых независимых переменных tx,t2,...,tk. Рассмотрим сначала первый случай. Если хх,х2,...,хт являются не- зависимыми переменными, то мы имеем право считать, что dxx,dx2,...dxm не завйсят от хх,х2,...,хт. Каждый дифференциал dxk мы можем взять равным одному и то- му же приращению длк для всех точек М(хх,х2,...,хт). При этом мы получим, что /=1 дх. Последнее соотношение и правила дифференцирования, установ- ленные в разд. 4.7, позволяют нам записать для дважды дифференци- руемой в точке Мфункции и = f(xx,x2,...,xm) следующую цепочку ра- венств: 404
*=1 z=l ^{dxk) dxk 32и „ , ox,axk dXjdx,. 5xl = dx, Ц = A d2u , , ---—-axiaxt. dxtdxk (15.36) 6^ = dx^ 5xm = dxm (Мы воспользовались тем, что для дважды дифференцируемой функции смешанные производные второго порядка не зависят от по- следовательности, в которой производится дифференцирование.) Итак, из цепочки равенств (15.36) мы получаем, что в случае, ког- да аргументы х1,х2,...,х/п являются независимыми переменными, для второго дифференциала дважды дифференцируемой в данной точке функции м = /(х1,х2,...,хш) справедливо представление /=1 л=1 dXjdxk (15.37) Замечание 1. Функция т переменных ^,r2,...,^m виДа Ф = где aik — постоянные вещественные числа, называется /=1 ы квадратичной формой от переменных а числа aik — ее коэффициентами. Квадратичная форма называется симметричной, если ее коэф- фициенты удовлетворяют условию aik = aki (для всех i = 1,2,..., т\ к =1,2,...,/и). Полученное нами выражение (15.37) позволяет утверждать, что для случая, когда аргументы х1,х2,...,хЯ1 являются независимыми перемен- ными, второй дифференциал дважды дифференцируемой в точке М функции и —/(Х|,х2,...,хот) представляет собой симметричную1 квад- ратичную форму от переменных dxx,dx2,...,dxm, коэффициенты кото- рой равны соответствующим частным производным второго порядка функции и = /(х1,х2,...,хот), взятым в данной точке М. ’Симметричность этой квадратичной формы вытекает из теоремы 17, т. е. из ~ /1,4 /1,4 равенства —— (М) = —— (М). охрхк ux&oXj 405
Используя формальный символ , , . д , д , д а = ах, — + ах, —+...+ах„ —, *4*4 X л /Л 4*\ ' Эх, дх2 дхт можно переписать выражение (15.37) в виде (\2 dx. — + dx2 I и. 1 X /Л I Эх, Эх2 дхт) (15.38) (15.39) По индукции легко убедиться в том, что в случае, когда аргументы х,,х2,...,хт п раз дифференцируемой в данной точке М функции u = /(x,,x2,...,xm) являются независимыми переменными, для л-го дифференциала этой функции справедливо представление Э"м , , , ------——-------ах, ах, ...ах, . дх.дх, ...Эх. 1 1 '| ’я С помощью формального символа (15.38) это представление может быть переписано в виде у и. ,„(,5,5 , д а и= dx.— + dx2-+...+dxm- I I 4*4 X 4*4 Л! 4*4 Эх, Эх2 дхт (15.40) Установим теперь выражение для второго дифференциала два раза дифференцируемой в данной точке М функции и = /(х„х2,...,хт), ар- гументы х},х2,...,х'т которой являются дважды дифференцируемыми функциями некоторых независимых переменных tl,t2,...,tk. Повторяя рассуждения из цепочки (15.36), мы на этот раз получим d2u = 5(с/и) ди ч +—)( Эхл Заметим, что в силу определения второго дифференциала функции и=х*(где к — любой из номеров 1,2,...,т) 406
[5(<ад = d2xk. = cb\ 5хж = dxm Учитывая это соотношение, мы приходим к следующему представ- лению для второго дифференциала: jt=i /=1 дх^охк £-1 дхк или (с использованием символа (15.38)) ,2 ,, д , д' , д х2 du- (dx, — + dx,-------+...+dxm-----) и + дхх дхг дхт . ди ,2 ди ,2 ди ,2 + —d х. + — d x,+...-l--------d2xm . ' dx2 dxa ) (15.41) Сравнивая полученное нами представление (15.41) с представлени- ем (15.39), мы убедимся в том, что (в отличие от первого дифференци- ала) второй дифференциал уже не обладает свойством инвариантности формы, и тем более не обладают этим свойством все последующие дифференциалы. Замечание 2. Укажем важный частный случай, когда второй и последующие дифференциалы все же обладают свойством инвариан- тности формы и определяются формулой (15.40). Будем говорить, что переменные хХ9х29...,хт являются линей- ными функциями независимых переменных tx,t2,...,tk, если они определяются равенствами = aiQ.+ aixtx + ai2t2+...+atktk(i = 1,2,..., mj, где aiOaiX..,,aik — некоторые постоянные. Заметим, что если функция u = f(xx,x2,...,xm) является п раз диф- ференцируемой в данной точке М(хх,х2,...,хт\ а ее аргументы хх,х29...,хт являются линейными функциями независимых переменных t\.t2,,.,9tk, то п-й дифференциал функции u = f(xx,x2,...,xm) определя- ется той же самой формулой (15.40), что и для случая независимых переменных хХ9х29...9хт. Действительно, так как tX9t29...9tk являются’независимыми перемен- ными, то n-й дифференциал х, как функции аргументов tx,t2,...,tk опре- деляется равенством d\ =(dt^+dt2-l-+...+dtk^-yxi. otx ot2 otk 407
Но любая частная производная выше первого порядка от линейной функции Xi равна нулю. Стало быть, d2xt- = 0, d3xt = 0,dnXi = 0. Равенство d2xi = 0 (z = 1, 2,т) и представление (15.41) дают пра- во заключить, что d2u определяется равенством (15.39). Совершенно аналогично, используя соотношения d3x( = 0,..., dnXi = 0, мы по индук- ции докажем, что d3u, d4u,..., dnu определяются равенством (15.40). § 6. Формула Тейлора для функции нескольких переменных Ради сокращения записи будем рассматривать функцию двух пере- менных и = f(x, у). Формула Тейлора имеет своей целью представить приращение этой функции Ди = /(х + Дх,у + Ду) -/(х, у) в малой окре- стности точки Мй(х,у) в виде суммы однородных многочленов отно- сительно приращений Ах и Ду степеней 1, 2, ..., п соответственно й оценить совершаемую при таком представлении погрешность. Фиксировав достаточно малые по модулю Дх и Ду, предположим, что функция u = f(x, у) дифференцируема (л+1) раз всюду в прямоуго- льнике {х-1 Дх| < х < х+| Дх|, у-| Д^ < у < у+| Д^}. Введем в рассмотрение новую независимую переменную t и положим х=х + /-Дх, у=у + Г-Ду. (15.42) При этом функция u = f(x, у) превращается в сложную функцию одной независимой переменной t u=f(x + t-Ax,y + t- Ду) = <p(Z), (л + 1) раз дифференцируемую на сегменте 0 < t< 1. Согласно результатам разд. 6.2 гл. 11 для функции и = <p(z) при лю- бом t из сегмента 0 < t < 1 справедливо следующее разложение по фор- муле Маклорена с остаточным членом в форме Лагранжа (см. форму- лы (11.35) и (11.36) из разд. 6.2 гл. И): /ч ,/Лч Ф2(0) Ф(,°(0) „ «I ф(0 - Ф 0) = ф' (0)+/ + ... + tn + X z , П5 43ч 2! л! (л + 1)! (Дхчз) в котором через 0 обозначено некоторое число из интервала 0< 0< 1. Так как t независимая переменная и функция и = <p(z) имеет на сег- , менте 0 < t < 1 производные до. порядка (л + 1), то (как установлено в разд. 6.4 гл. 10) для любого t из сегмента 0< t < 1 и любого номера к, равного 1, 2,... ,(л + 1), справедливо равенство dku = tfk\t)‘(dt)k. (15.44) 408
С другой стороны, так как в силу (15.42) переменные хи у являют- ся линейными функциями t, то в силу утверждения, установленного в конце предыдущего параграфа, для всех х и у из рассматриваемого прямоугольника и всех номеров к, равных 1, 2,..., (п + 1), справедливо равенство ( я -у <Z‘u= dx— + dy— f(x,y). у дх ду J (15.45) Из сопоставления равенств (15.44) и (15.45) и из того, что в силу (15.42) dx = l\x-dt, dy = &y-dt, вытекает, что для любого к, равного 1, 2,... ,(л+1), / я a У ф(*’(0= Ах—+ Ду— /(х,у). (15.46) дх ду ) v ' Так как в силу (15.42) х-х, у-у при < = 0 и х=х+0Дх, у=у+ 0-Ду при Z = 0, то из (15.46) получим, что Га а У <р(*’ (0) = Дх— + Ду— f(x,y) I Яу Яи I 4 ' при любом к= 1, 2,..., (л + 1) и / \»Н (р<пЯ)(0) = Дх— + Ду—I /(х + 0Дх,у +0Ду). I дх ду I (15.47*) Подставляя (15.47) и (15.47*) во взятое при t= 1 равенство (15.43) и учитывая, что <р(0) = f (х, у), <р(1) = /(х + Дх, у + Ду), окончательно по- лучим для функции двух переменных и=/(х, у) ф о р м у л у Тей- лора с остаточным членом в форме Лагранжа /(х + Дх, у + Ду) - У (х, у) => Ах—+Ау— \Г(Х>У} + I дх ду) +^Ах^- + дУт->| Лх,у) + ...+-^Гдх^- + Ду|->| /(х,у) + 2!^ дх ду) и!^ дх ду) 1 / д xml —— Ах— + Ду— /(х + 0Дх,у+0Ду). (л + 1)!^ дх ду) (15.48) В этой формуле 0 — некоторое число из интервала О<0<1. Подчеркнем, что формула (15.48) справедлива без предположения о непрерывности частных производных функции u = f(x, у) порядка (и+1) в точке Af0(x,y). 409
Совершенно аналогично выводится и записывается формула Тей- лора для функции любого конечного числа переменных. Так, для фун- кции трех переменных u=f(x, у, г) она имеет вид f(x + Дх,у + Ду,г + Дг) -/(х, y,z) = = 2L— Дх — + Ду— + Дг— /(x,y,z) + *=! к! дх оу oz J [х /Н-1 Дх— + Ду— + Дг— | f(x + 0Дх,у + 0Ду,г + 0Дг). дх ду dz) § 7. Локальный (безусловный) экстремум функции нескольких переменных 7.1. Понятие и необходимые условия локального экстремума Определение 1. Будем говорить, что функция т переменных и = f(x}9x2...,xm) имеет в точке Af0 (х,,х2,...,хм) л окольный м и - н и м у м (соответственно л о к а л ь н ы й макс и м у л/), если су- ществует такое достаточно малое положительное число 5, что раз- ность Au = f(x} + Дх,,х2 + Дх2,хш + &xm)-f(xl9x29...,xm) является не- отрицательной (соответственно неположительной) для всех ^хХ9дос29...9^хт, удовлетворяющих условию (Дх,)2+(Дх2)2+...+ +(Д*т)2 ^82, т.е. если значение f(MQ) является наименьшим (соответ- ственно наибольшим) среди всех значений f(M) из достаточно малой 8-окрестности точки А/о. Определение 2. Будем говорить, что функция u = /(x,,x2, ...,хт) имеет в точке MQ(x]9x29...9xm) л охальный экстр емум, если она имеет в этой точке либо локальный минимум, либо локальный максимум. Теорема 18 (необходимое условие экстремума дифференцируе- мой в данной точке функции). Если функция и = /(х,,х2,...,хш) диф- ференцируема в точке MQ(x}9x2,...9xm) и имеет в этой точке локаль- ный экстремум, то все частные производные первого порядка этой функции обращаются в точке Мо в нуль, т. е. справедливы равенства ^(Мо)=О, ^(Л/о)=О, |^(Мо)=О. (15.49) дх. дх? дхт I l т Доказательство. Докажем, например, справедливость пер- вого равенства (15.49). Для этого фиксируем у функции и=f(xt,x2,...,xm) все аргументы, кроме первого, положив их равными х2 =х2, х3 = х3, ..., хт =хт. При этом получим дифференцируемую фун- 410
кцию w=/(xl>x2...хт) одной переменной хь имеющую локальный эк- стремум при Х| =Х|. В силу теоремы 2 из § 1 гл. 11 необходимым усло- вием этого является обращение в нуль при Xj =х, первой производной ^-(х(,х2,...,хм), т.е. первое равенство (15.49). Справедлйвость осталь- дхх ных равенств (15.49) доказывается аналогично. Теорема доказана. Следствие. Если функция и=/(х1,х2,...,хш) дифференцируема в точке Мо и имеет в этой точке локальный экстремум, то ее первый дифференциал в этой точке du = $L(M0)dxx + &-(MQ)dx2 +... + ^(Ma)dxm 5Xj ox, дхт равен нулю тождественно относительно дифференциалов независи- мых переменных dx\, dx2, ..., dxm. Подчеркнем, что обращение в нуль в точке Мо всех частных произ- водных первого порядка является только необходимым и не является достаточным условием локального экстремума дифферен- цируемой в этой точке Мо функции u=f(xx,x2,...,xm). Например, функция двух переменных и=ху дифференцируема в точке (0,0), имеет в этой точке равные нул!оч частные производные df df га лч первого порядка — = у и — =х, но не имеет в точке (0,0) никакого ло- дх ду кального экстремума, ибо эта функция равна нулю в самой точке (0,0), а в как угодно малой окрестности этой точки имеет как строго поло- жительные, так и строго отрицательные значения. Точки Мо, в которых выполняются равенства (15.49), называются стационарными т о ч к а м и или т о ч к а м и возмож- ного экстремума. Для того чтобы убедиться, что в данной точке возможного экстре- мума действительно имеется локальный экстремум, следует проверить выполнение достаточных условий локального экстремума, которые будут установлены ниже. 7.2. Краткие сведения из теории симметричных квадратичных форм В замечании разд. 5.2 мы уже выяснили, что второй дифференциал <?и дважды дифференцируемой в данной точке функции т перемен- ных w=/(xl,x2,...,xm) является симметричной квадратичной формой относительно dx\, dx2, ..., dxm. Так как при выяснении достаточных условий локального экстрему- ма функции и = f(xx,x2,...,xm) в точке Мо основную роль будет играть 411
взятый в этой точке второй дифференциал d2u, то установлению доста- точных условий локального экстремума должны предшествовать крат- кие сведения из теории симметричных квадратичных форм. Рассмотрим квадратичную форму от т переменных Х|, х2,х„: (15,50) х /=1 Напомним, что квадратичная форма (15.50) называется сим- метричной, если au = aik для всех £=1,2, ..., т и для всех /=1,2,..., т. Каждая квадратичная форма (15.50) определяется матрицей а\\ а\2 “• а\т а21 а22 ... а2т &т2 ’•* &тт / Определители этой матрицы вида /7,, /7,„ ... /7, 11 V4.J2 а , а п ... а ml m2 тт называются главными минорами матрицы квадратичной формы (15.50). Определение 1. Квадратичная форма (15.50) называется поло- жительно определенной (соответственно отрица- тельно определенной), если она принимает строго поло- жительные (соответственно строго отрицательные) значения для всех xi, х2, ..., хт, одновременно не равных нулю. Определение 2. Квадратичная форма (15.50) называется зна- коопределенной, если она является либо положительно опре- ' деленной, либо отрицательно определенной. Определение 3. Квадратичная форма (15.50) называется зна- копеременной, если среди ее значений имеются как строго по- ложительные, так и строго отрицательные числа. Составим из главных миноров А\, А2, ..., Ат матрицы квадратичной формы (15.50) следующие т чисел: А А А ... _А. <15-51) 4 А Ат_1 412
Утверждение 1 (критерий Сильвестра). Для того чтобы сим- метричная квадратичная форма (15.50) являлась положительно опре- деленной (соответственно отрицательно определенной), необходимо и достаточно, чтобы все числа (15.51) были положительными (соот- ветственно отрицательными). Доказательство проведем для1 т = 2 и ти = 3. 1. Необходимость. Сначала рассмотрим случай т = 2. Предположим, что симметричная квадратичная форма Ф2 (xj, х2) = ах jXj2 + 2a12XjX2 + а22х2 является положительно (соответст- венно отрицательно) определенной. Тогда ее значение Ф2(1,0) = ап = АХ является положительным (соответственно отрицательным). Учитывая, что А2 = ахха22 -аХ2, легко проверить, что при симметричную квадратичную форму Ф2(Х1,х2) можно записать в виде Ф2(х„х2) = А1 xf+^-x2 I Ai + ^-х22. (15.52) Из (15.52) следует, что поскольку форма ®2(xi,x2) является поло- жительно (соответственно отрицательно) определенной, ее значение (Л|2 , J А2 , —— ,1 = — является положительным (соответственно отрицате- 4 J Ах льным) числом. Тем самым для т = 2 необходимость положительности (соответственно отрицательности) первых двух чисел (15.51) доказана. Ф, -—,1,0 =Ф, 3 А. 2 Переходя к случаю т = 3, заметим, что форма Фз(хь х2,0) совпада- ет с формой Ф2(х|, х2), так что Ф3 (1,0,0) = Ф2 (1,0) = ах j = Ах, -—,1 =—, и необходимость положительности 4 J 4 > ' (соответственно отрицательности) первых двух чисел (15.51) доказана. Для доказательства необходимости положительности (соответственно j отрицательности) третьего числа (15.51), т.е. числа —, заметим, что, Л2 как легко проверить, при А \ * 0 и А2 * 0 симметричную квадратичную форму Ф3 (хрх2,х3) = anx2 + а22х2 + а33х3 + 2аХ2ххх2 + 2ахзххх3 +2а23х2х3 можно записать в виде 1 Случай любого т рассмотрен, например, в кн.: Ильин В. А., Позняк Э. Г. Линей- ная алгебра. М.: Физматлит, 2001. Гл. 7. §4. 413
2 1 j (15.53) ,^2 , а23а11 “ а12а13 r . ^3 „2 । I Л л г Л * • A • 4 I A2 ) A2 Возьмем в (15.53) x3 = 1 и после этого выберем х2 так, чтобы обра- тилась в нуль вторая круглая скобка в правой части (15.53). Затем при таким образом выбранных х2 и х2 выберем xt так, чтобы обратилась в нуль первая круглая скобка в правой части (15.53). При таким образом А выбранных значениях получим, что Ф3(Х|,х2,1) = — является положи- 4 тельным (соответственно отрицательным) числом, т.е. доказательство необходимости для т = 3 завершено. 2. Достаточность. Пусть сначала т - 2, и первые два числа (15.51) положительны (соответственно отрицательны). Из (15.52) сле- дует, что для всех и форма Ф1(*ь*з) является неотрицательным (соответственно неположительным) числом и обращается в нуль толь- ко для тех значений xi и х2, для которых одновременно справедливы два равенства а । л х, +—х, =0, х2 = 0. Ах Так как указанным двум равенствам удовлетворяют только значе- ния Х| = 0, х2 = 0, то форма Фг(х1,х2) имеет строго положительные (со- ответственно строго отрицательные) значения для всех Х| и х2, одно- временно не равных нулю. Для т = 2 достаточность доказана. Переходя к случаю т = 3, предположим, что первые три числа (15.51) положительны (соответственно отрицательны). Из (15.53) сле- дует, что для всех хь х2 и х2 форма Фз(хь х2, хз) является неотрицатель- ным (соответственно неположительным) числом и обращается в нуль только для тех значений Х|, х2 и хз, для которых одновременно спра- ведливы три равенства х, +51Х2 +£11Хз =о, х2 + ^-5|~5151Хз =0, хз = 0. 4 4 А2 Так как указанным трем равенствам удовлетворяют только значе- ния Xi = 0, х2 = 0, хз = 0, то форма Фз(хь х2, хз) имеет строго положите- льные (соответственно строго отрицательные) значения для всех хь х2 414
и хз, одновременно не равных нулю. Утверждение 1 для т = 2 и т = 3 полностью доказано. Утверждение 2. Если квадратичная форма Фт(х|,х2, ...,хт) являет- ся знакопеременной, то среди ее значений на единичной т-мерной сфе- ре X]2 + х2 + ...+Х2 =1 обязательно имеются как строго положитель- ные, так и строго отрицательные значения. Доказательство. Пусть форма Фт(хьх2...........хт) является знакопеременной, М\х\,х'г, —,х'т) — точка, в которой она принимает положительное значение, Л/'ЧхрХ*, ...,х") — точка, в которой она при- нимает отрицательное значение. Так как в точке (0,0,..., 0) форма равна нулю, то обе точки ЛГ и М' отличны от (0,0,..., 0), и потому (х()2 +(х')2 +... + (х;)2>0, (xf)2 + (х")2 +... + (х,:)2>0. Для любого к, равного 1, 2...т, положим Д' =_________( д" =________________________________ 7w)2+(xd2+-+«)2’ к J(x,”)2+(x’)2+...+(x:)2' Заметим, что обе точки (h\,h'2,...,h'm) и (/i" М', лежат на еди- ничной m-мерной сфере и (х;)2+(х')2+...+(х;)2 Ф(х[,х', .,х' )>0, ад л;, (^2+(х")2+...+(х:)2 Ф(х"х2",...,<)<0. Утверждение 2 доказано. 7.3. Достаточные условия экстремума функций нескольких переменных Теорема 19. Если функция и = f(xx,x2,...,xm) один раз дифференци- руема в достаточно малой Ъ-окрестности точки М^{хх,х2....,хт) и дважды дифференцируема в самой точке Mq и если точка Mq являет- ся точкой возможного экстремума этой функции, т. е. справедливы равенства (15.49), то функция и = f(xx,x2,...,xm) имеет в точке Mq ло- кальный минимум в случае, если второй дифференциал d2f в этой точ- ке является положительно определенной квадратичной формой, лока- льный максимум в случае, если второй дифференциал d2f в этой точке является отрицательно определенной квадратичной формой, и не имеет в точке Mq никакого локального экстремума в случае, если вто- рой дифференциал d2f в этой точке является знакопеременной квад- ратичной формой. 415
Доказательство. Для сокращения записи проведем доказа- тельство для функции u=f(x, у) двух переменных. Итак, предположим, что функция u=f(x, у) один раз дифференци- руема в достаточно малой 8-окрестности точки М0(х,у) и дважды дифференцируема в самой точке Мо и что эта точка является точкой возможного экстремума функции u = f(x, у), т. е. справедливы равен- ства ^(•?J) = 0, ^(J?,;)=0. <15-54) дх ду Фиксировав достаточно малые по модулю и не равные одновре- менно нулю приращения аргументов txx и Ду, разложим разность Ди=/(х + Дх,у + Ду)-/(х,у) по формуле Тейлора (15.48), взяв в этой формуле п = 0, т. е. записав остаточный член, в котором число п+1 равно единице. Получим, что найдется число 0 из интервала 0 < 0 < I такое, что f (х + Дх, у + Ду) - /(х, у) = Дх • — (х + 0Дх, у + 0 Ду) + дх df „ „ ‘ (15.55) +Ду- —(х+0Дх,у+ 0Ду). ду Так как функция u-f(x,у) дважды дифференцируема в точке А/* Л/0(х,у), то обе частные производные первого порядка — (х, у) и дх — (х, у) являются дифференцируемыми в этой точке функциями. Запи- шу шем условия дифференцируемости этих функций в точке Мо (см. разд. 4.2 этой главы). С учетом равенств (15.54) эти условия име- ют вид: — (х + 0Дх,у + 0Ду) = (х,у)0Дх + —— (х,у)0Ду+Е]Р0, (15.56) дх д х дхду — (х +0Дх,у +0Ду) =-^-^-(х,у)0Дх+ ^-у-(х,у)0Ду+ Е2р0, (15.57) ду дудх ду где р = д/(Дх)2 + (Ду)2, а 81 и еа — бесконечно малые при р 0 вели- чины. 416
Будем обозначать частные производные второго порядка функции м=/(х,у) в точке М0(х,у) символами1: «„ = VT= °,, (M,). дх дхду дудх ду2 °' (15.58) Подставляя (15.56) и (15.57) в (15.55) и используя символы (15.58), получим равенство Дх + Дх, у + Ду) - f(x, °у) = е[а„ (Дх)2 + +2а12Дх-Ду+а22(Ду)2 + £,рДх + Е2рДу]. (15.59) „ , &Х , Д у , 2 , Э Положим теперь , Л2 = — и заметим, что + hi = 1, т е точ- Р Р ка с координатами (Ль hi) лежит на единичной окружности, причем |Л2|<1, (15.60) Дх = р-А1, Ду = р-Л2. (15.61) Подставляя Дх и Ду, выражаемые равенствами (15.61), в правую часть (15.59), мы придадим равенству (15.59) следующий вид: /(х + Дх,у + Ду)-/(х,у) = ер2{[анй|2 +2а12Л1Л2 + а22%] + г}, (15.62) в котором величина &=z]hxys'2h2 является бесконечно малой при р -> 0 (в силу неравенств (15.60) и того, что величины £i и е2 являются бесконечно малыми при р -> 0). Из равенства (15.62) легко вытекают все утверждения доказывав-, мой теоремы. Действительно, рассмотрим сначала случай, когда второй диффе- ренциал в точке Мо d2f = an(dxi)2 +2апс1х} dx2 + a22(dx2)z (15.63) является положительно определенной квадратичной формой. В этом случае все значения стоящей в (15.62) в квадратных скобках функции аргументов и hi строго положительны, и так как эта функция опре- делена и непрерывна на единичной окружности hf +h%=\ являющей- ся замкнутым и ограниченным множеством, то по второй теореме Вей- ерштрасса (см. теорему 10 из § 3) эта функция достигает в некоторой 1 Так как функция и = f(x, у) дважды дифференцируема в точке Л/®, то в силу тео- ремы 16 из разд. 5.1 обе смешанные производные второго порядка в этой точке равны друг другу. 417
точке указанной окружности своей точной нижней грани а,с которая является строго положительным числом. Итак, в рассматриваемом случае величина, стоящая в (15.62) в квадратных скобках, при всех р не меньше положительного числа а, и поскольку величина е стремится к нулю при р 0, то при всех доста- точно малых р величина, стоящая в (15.62) в фигурных скобках (а по- тому и вся правая часть (15.62)), положительна, что и означает нали- чие локального минимума в точке Л/0(х,у). Совершенно аналогично доказывается, что в случае, когда взятый в точке Mq второй дифференциал (15.63) является отрицательно опре- деленной квадратичной формой, правая часть (15.62) отрицательна при всех достаточно малых р, что и означает наличие локального максиму- ма в точке Л/0(х,у). Наконец, в случае,'когда взятый в точке MQ второй дифференциал (15.63) является знакопеременной квадратичной формой, в силу утвер- ждения 2 из разд. 7.2 на единичной окружности h* + h^ =1 найдутся две точки M'(h^h'2) и такие, что при всех р величина, стоя- щая в (15.62) в квадратных скобках, в первой из этцх точек будет по- ложительна, а во второй из этих точек — отрицательна. Так как е стремится к нулю при р -> 0, то величина, стоящая в (15.62) в фигурных скобках (а потому и вся правая часть (15.62)), име- ет при как угодно маль!х р значения разных знаков, что и означает от- сутствие локального экстремума в точке А/0(х,у). Итак, для функции двух переменных и = /(х, у) теорема 19 доказана. Для функции т переменных u = /(xj,x2,...,xm) доказательство про- водится аналогично, только вместо формулы (15.62) устанавливается формула /(х, + Дх,х2 + Дх2,...,хт + Дх„)-/(х„х2,...,хи) = аМ [L*=1 /=1 в которой р = д/(Ах1)2 +(Дх2)2 + ... + (Axm)2, hk =^-, аи = f (Мо), Р дхкдх, а символ е обозначает величину, бесконечно малую при р->0. Замечание 1. В математике особенно ценятся результаты, по- лученные при отсутствии излишних, не вызванных существом дела~ требований. Подчеркнем, что в теореме 19 не требуется ни непрерыв- ности частных производных второго порядка функции и=/(Х|,х2,...,хт) в точке М0(х1,х2,...,хт'), ни даже существования этих производных в окрестности точки М0. 418
7.4. Более углубленное рассмотрение случая двух переменных Для функции двух переменных и=f(x, у), приняв для ее частных производных второго порядка в точке Л/0(х,у) обозначения (15.58), мы можем доказать следующие утверждения, уточняющие теорему 19: Г. Функция u-f{x,у) имеет в точке Молокальный экстремум при выполнении неравенства А2 =alt -а22 -af2>0, причем это будет лока- льный минимум при ац >0 и локальный максимум при ац >0'. 2°. Функция u=f(x, у) не имеет в точке Мо никакого локального экстремума при выполнении неравенства = Дц • fljj — < 0- (15.64) Утверждение Г сразу вытекает из сопоставления теоремы 19 с критерием Сильвестра (т. е. со взятым при т = 2 утверждением 1 из разд. 7.2).; Для доказательства утверждения 2° в силу той же теоремы 19 до- статочно доказать, что при выполнении неравенства (15.64) квадратич- ная форма, ф2(х1>х2) = апх|2 +2al2xix2 +а22х? (15.65) является знакопеременной. Убедимся в этом отдельно для, случаев а,, *0 и аП =0. В случае ап *0 это сразу вытекает из того, что (как уже установле- но в разд. 7.2) квадратичная форма (15.65) имеет значения Ф2(1,0) = а|Г и Ф2 —— ,1 | = —, являющиеся (вследствие того что ^2<0) числами \ ап ) аи разных знаков. В случае аИ =0 квадратичная форма (15.65) принимает вид ^"^22^2 = %2(2^12^1 ^22^2)» > (15.65*) причем из условий ан =0 и (15.64). вытекает, что д12 *0. Если при этом агг ~ 0> то (15.65*) является знакопеременной квад- ратичной формой вследствие того, что значения Ф2(1,1)=2а12 и Ф2(1,-1) = -2д12 являются числами разных знаков. Если же;’д22 *0, то квадратичная форма (15.65*) является знакопе- ременной вследствие того, что ее значения- Ф2 -^-,1 = 3д22 и \ап J Ф2 •^•,-11 = -а22 являются числами разных знаков. 1^2 J1' ' • 1 При выполнении неравенства - ц2 > 0 число Д| । обратиться в нуль не мо- жет, Ибо При ЭТОМ (\на21 > 0. 419
I Замечание 2. Случай A2 = an • a22 - al2 =0 является; сомните- льным (в этом случае возможно и наличие, и отсутствие локального * экстремума в точке А/о). Этот случай требует дополнительного иссле- дования, выходящего за рамки нашей книги. В качестве примеров займемся отысканием точек локального экст- ремума следующих двух функций: _ х2 у2 U~^+b2’ (15-66) х2 (15.67) (при условии, что а и Ь — положительные постоянные). Вычисляя и приравнивая нулю частные производные первого по- рядка функций (15.66) и (15.67), мы получим, что обе эти функции имеют единственную точку возможного локального экстремума — на- чало координат 0(0, 0). Вычисляя в этой точке частные производные второго порядка, мы получим, что А2 =аи -а22 -а22 равно 4 „2/2 а о >0яля функции (15.66) и равно ———<0 для функции (15.67). Отсюда следу- fl b ет, что функция (15.66) имеет в точке 0(0,0) локальный минимум и = 0, а функция (15.67) не имеет точек локального экстремума. Этот факт становится геометрически ясным из рассмотрения гра- фиков исследуемых функций: графика эллиптического параболоида (15.66), изображенного на рис. 6.24 гл. 6, и графика гиперболического параболоида (15.67), изображенного на рис. 6.25 гл. 6. 7.5. Отыскание максимального и минимального значений функции нескольких переменных Пусть функция u = f(xvx2, ...,хт) определена и непрерывна в огра- ниченной замкнутой области D и дифференцируема во всех внутрен- них точках этой области. По второй теореме Вейерштрасса (см. теоре- му 10 из § 3) эта функция обязательно достигает в некоторой точке Л/0(х„х2,...,хт) указанной области своего максимального (соответст- венно минимального) в этой области значения. Если указанная точка Мо лежит внутри области D, то она является точкой возможного лока- льного экстремума, но указанная точка может лежать и на границе об- ласти D. Поэтому для нахождения максимального (соответственно минима- льного) значения функции и=f(xx,x2, .-.,хт) в области D следует най- 420
ти значения этой функции во всех точках возможного локального эк- стремума и сравнить эти значения со значениями функции на границе области D. § 8. Условный экстремум функции 8.1. Понятие условного экстремума функции В математике и в ее приложениях часто приходится отыскивать экст- ремумы (т.е. максимумы и минимумы) функции, аргументы которой удовлетворяют некоторым дополнительным условиям, называемым условиями связи. Такие экстремумы называют условными (с целью отличить их от безусловных экстремумов, изученных в §7). Приведем простейший пример задачи об отыскании условного эк- стремума функции. Предположим, что требуется найти экстремумы функции и = х2 + у2, аргументы х и у которой удовлетворяют дополни- тельному условию связи х+у-1=0. Иными словами, экстремумы функции и = х2 + у2 ищутся не на всей плоскости Оху, а только на пря- мой х + у - 1 = 0. Для решения поставленной задачи подставим в выра- жение для функции и = х2 + у2 значение у, определяемое из условия свя- зи х + у - 1 = 0. При этом получим функцию и - 2х2 - 2х + 1 одной пер- , л( Ч меннои х, экстремум которой легко находится: так как и = 4| х-- |, и” = 4, то функция и = 2Х2 - 2х + 1 имеет мини: ким образом, функция и = х2+у2 с условием связи х+у-1=0 имеет условный минимум 1 1 1 -г и = - при х = -, у=Подчеркнем, что наиден- 2 2 2 ный условный минимум отличается от безу- словного минимума функции и = х2+у2, кото- рый достигается при х = 0, у = 0 и равен и = 0. Впрочем, этот факт очевиден и из нагляд- ных геометрических соображений (см. рис. 15.4). Ясно, что минимум функции и = х2+у2 (графиком ^которой является параболоид вра- щения) на свсей плоскости Оху не совпадает с ее минимумом на прямой х+у-1=0. Переходя к общей постановке задачи об отыскании условного эк- стремума, будем для,;упрощения записи рассматривать функцию пяти переменных и=/(Х|,х2,х3,у„у2) (15.68) 421
при наличии двух условий связи г 'F1(x„x2,x3,y„y2)=0, /’2(х|>х2,х3,у„у2)=0. <15-69) Будем говорить, что функция (15.68) при наличии связей (15.69) имеет условный максимум (соответственно условный минимум) в точке ЛГ0(хрх2,х3,ух,у2), координаты которой удов- летворяют условиям связи (15.69), если найдется такая окрестность точки Mq в пространстве R5 переменных хрх2,х3, у, у2, в пределах которой значение функции (15.68) в точке Mq является наибольшим (соответственно наименьшим) среди ее значений во всех точках М указанной окрестности, координаты которых удовлетворяют услови- ям связи (15.69). Будем считать функции /, и F2 дифференцируемыми в окрестно- сти рассматриваемой точки Mq, а уравнения (15.69) разрешимыми в этой окрестности относительно у\ и у2.1 * Разрешая уравнения (15.69) относительно у\ пу2, мы найдем функ- ции у, = ф,(х1,х2,х3) и у2 = ф2(х1,х2,х3), являющиеся решениями урав- нений (15.69), в рассматриваемой окрестности точки Mq. Подставляя найденные решения в (15.68), мы сведем рассматриваемую задачу об условном экстремуме к задаче о безусловном экстремуме функции трех переменных н = Ф(х|,х2,х3) = /[х1,х2,х3,<р|(х|,х2,х3),ф2(х|>х2,х3)]. (15.70) Как нам известно из § 7, необходимым условием локального экст- ремума функции (15.70) в точке Мо является равенство нулю в этой точке ее первого дифференциала , дФ , дФ , дФ , _ (15.71) du =—dx.+ — dx,+---------dx,=0, 4 3 дхх дх2 дх3 тождественное относительно dx\, dx2 и dx^. 1 Для этого достаточно потребовать, чтобы в рассматриваемой окрестности точки Л/о был отличен от нуля определитель BF, BF, Зи, SF> SFi SFi aFt dFj, dyt dy, dy, dyt * * '' Эи, d)7| называемый якобианом функций и F2 по переменным yi иу2. См. по этому по- воду кн.: Ильин В. А., Позняк Э. Г. Основы математического анализа. М.: Физматлит, 2001. Т. 1. Гл. 15. 422
В силу инвариантности формы первого дифференциала, установ- ленной в разд. 7.4, и вида сложной функции (15.70) выражение для первого дифференциала du можно переписать в виде *=£<&, + + S-Ldy, АУ1 =0, (1W< дх, дх2 дх3 ду, 1 ду2 2 но поскольку переменные у\ и у2 не являются независимыми, равенст- во нулю (15.72) уже не является тождеством относительно dxt, dx2, dx3, dyi и dy2. Если мы продифференцируем тождества, в которые превращаются условия связи (15.69) при подстановке в них решений = <р|(х1,х2,х3) и у2 = <р2(х1,х2,х3), то мы получим линейную систему двух уравнений I dF dF dF dF 9F -1-dx. +^-dx2 + ^-dx3 + ^-dy. dy2 =0, ЙХ] UX2 4У1 ЦУ2 dF2 , dF2 , dF2 dF2 dF2 , . —-dx, +—-dx2 +—-dx, +—-dy. +—-dy, =0 Л I Л Z Л Л У I Л J L ЙХ| SXj (15.73) относительно dyi и dy2. Так как называемый якобианом опреде- литель этой системы dFt dF, Эу, ду2 dF2 dF2 ду2 dFx dF2 dF, dF2 dyx dy2 dy2 dy, (15.74) предполагается отличным от нуля в окрестности рассматриваемой точ-’ ки Мо, то система (15.73) имеет единственное решение, определяемое формулами Крамера (см. разд. 1.2 гл. 3). Подставляя это решение на место dyi и dy2 в равенство (15.72) и собирая члены, содержащие dxi, dx2 и dx3, мы получим соотношение A,dx, + A2dx2 + A3dx3 =0, (15.75) в котором At, А2 и А3 являются рациональными дробями относительно частных производных первого порядка функций f, F\ и F2. Так как в соотношении (15.75) стоят дифференциалы только неза- висимых переменных, то это соотношение является тождеством отно- сительно dx\, dx2 и dx3, т. е. из него следует, что Ai = 0, А2 = 0, А3 = 0. Присоединяя к последним трем равенствам два условия связи (15.69), мы получим необходимые условия существования в точке Мо 423
условного экстремума функции (15.68) при наличии связей (15.69) в виде пяти равенств At = О, А2 = О, А3 = 0, Ft = О, F2 = 0. , (15.76) Равенства (15.76) представляют собой систему пяти уравнений для определения пяти координат точки возможного условного экстремума. 8.2. Метод неопределенных множителей Лагранжа При изложенном нами методе отыскания точек возможного услов- ного экстремума была нарушена симметрия относительно переменных Xi, х2, Хз, yi, у2. Часть из этих переменных х\, х2, хз мы считали незави- симыми, а остальные yt и у2 — функциями х\, х2, хз. Укажем принадлежащий Лагранжу метод, симметризирующий роль переменных и называемый методом неопределен- ных множителей Лагранжа. Умножим первое и второе равенства (15.73) соответственно на и Х2> где Ii и Х2 — постоянные и пока неопределенные числа. Получен- ные после умножения на 1] и 12 равенства сложим почленно с равен- ством (15.72). В результате получим равенство Й у Sw , , chi/ , дш , п , — dxt + —dx2 + —— dx3 + — dyx + —- dy2 = 0, dxt dx2 dx3 dyx dy2 (15.77) в котором символом у = v|/(xi, х2, хз, yi, у2) обозначена функция V=/+11F,+12F2, (15.78) называемая функцией Лагранжа. Выберем теперь постоянные li и Х2 так, чтобы были справедливы равенства <*L=0, ^L = o. (15.79) dyi ’ ду2 Это заведомо можно сделать, ибо равенства (15.79) приводят к ли- нейной относительно Xj и Х2 системе уравнений [df . dFx , dF2 . Зу, dy, ду, df . dF, . dF2 л —+1.—-+12—-=0, Эу2 ду2 ду2 . определителем которой является якобиан (15.74), по предположению отличный от нуля. При таком выборе Xi и Х2 равенство (15.77) перехо- 424
Эи/ , 5ш , Эи/ , п дит в соотношение —-ахх + —^-ахг +—-dx2 =0, которое в силу ранее Эх, дх2 дх} предположенной независимости переменных хь х2 и х3 является тожде- ством относительно dx\, dx2 и dx2 и из которого вытекают равенства «1=о, «1-0, «1=0. . dxt дх2 дх3 (15.80) Присоединяя к равенствам (15.79) и (15.80) условия связи (15.69), мы получим систему семи уравнений &=о, «1=О,«1=оЛ=О,^1-О,?,-О,£г-О (15.81) Эх, дх2 дх3 ду} ду2 для определения пяти координат точки возможного условного экстре- мума и двух постоянных Х| и Х2. При практической реализации метода неопределенных множителей Лагранжа рбычно поступают так. Составляют функцию Лагранжа (15.78) и для нее находят точки возможного безусловного экстремума (выражающиеся через постоян- ные Х| и Х2). Для исключения этих постоянных используют условия связи (15.69). Такой путь отыскания точек возможного условного экст- ремума законен, ибо он приводит именно к семи уравнениям (15.81). 8.3. Достаточные условия условного экстремума Предположим, что в точке Мо для функции (15.68) при наличии связей (15.69) выполнены необходимые условия условного экстремума (15.81), и дополнительно потребуем, чтобы функции f F\ и F2 были два раза дифференцируемы в точке Мо. Из конструкции функции Лаг-’ ранжа (15.78) вытекает, что при наличии связей (15.69) разности f(M)-f(M0) и у(М)-у(М0) равны друг другу, т.е. при наличии связей (15.69) экстремумы функций (15.68) и Лагранжа совпадают. Но тогда в силу результатов § 7 для получения достаточного усло- вия экстремума функции (15.68) при наличии связей (15.69) следует присоединить к равенствам (15.81) требование знакоопределенности при наличии связей (15.69) второго дифференциала d2xy функции Лаг- ранжа в точке Mq. При этом, если взятый в точке Мо второй дифференциал х72\|/ явля- ется при наличии связей (15.69) положительно (соответственно отри- цательно) определенной квадратичной формой, то функция (15.68) при наличии связей (15.69) имеет в точке Мо условный минимум (соответ- ственно условный максимум). 425
Замечательным является то обстоятельство, что второй дифферен- циал функции Лагранжа d2y в точке возможного условного экстре- мума Mq можно вычислять так, как если бы все переменные хь х2, хз, У\ « У1 были независимыми, т. е. по формуле (\2 ,5 , д , д , д , д | dxi — + dx2 — + dx3 — + dyi — + dy2—\w- (15.82) дхх дх2 ох3 дух ду2 J 4 7 Действительно, как мы знаем из разд. 5.2, с учетом зависимости ух и уг от хь х2 и х3 второй дифференциал J2\|/ должен определяться формулой [\ \2 ,5 ! д , д , д , д | 5\|/ , Л, —+ <fc2 —+ <Zr3 —+ —+ Jy2 — h|/+-^t/y,+-^jy2> дх2 дх3 ду, ду2) ду, ду2 (15.83) но в силу того, что в точке возможного условного экстремума Mq вы- полняются соотношения — (Л/о) = 0, ^-(Л/о) = 0, равенство (15.83) Зу, , ду2 переходит в (15.82). В качестве примера найдем условный экстремум функции трех переменных и = xf + х2 + х2 при наличии одного условия связи Xj + х2 + х3 -1 = 0. Составим функ- цию Лагранжа \|/ = (х2 + х2 + х2) + Х(х( + х2 + х3 -1). Так как = 2xk + X для любого Sx, £= 1, 2, 3, то координаты точки возможного экстремума Л/0(хрх2,х3) равны Xj = х2 = х3 = —. Из условия связи Xj + х2 + х3 -1 = 0 вытекает, что X = —. Таким й 2 ILff1 1 П П образом, точка возможного экстремума имеет координаты А/о1 —I- Поскольку второй дифференциал rf2\|/= 2[(<fr,)2 + (<fr2)2 + (<&3)2] для всех xi, х2 и хз является положительно определенной квадратичной формой, то ъгП 1 точка А/о1 - I является точкой условного минимума и минимальное значение и 1 ' в этой точке равно -.
Глава 16 Двойные и тройные интегралы Из разд. 6.1 гл. 13 нам известно, что типичной геометрической за- дачей, приводящей к понятию определенного интеграла от функции одной переменной /(х) по сегменту а<х<Ь, является задача о вычис- лении площади криволинейной трапеции, т. е. фигуры, лежащей под графиком неотрицательной функции у =f (х) на сегменте [а, 6]. Совершенно аналогично типичной геометри- ческой задачей, приводящей к понятию двойного z интеграла от функции двух переменных f(x,y) по двумерной области D, является задача о вы- числении объема так называемого к р и во- дой н о г о цилиндра, т. е. объема изобра- женного на рис. 16.1 тела, лежащего под графи- ком неотрицательной функции двух переменных z=f(x,y) в этой области D. JIflx более эффективного использования ана- логии с однократным Интегралом мы начнем с определения двойного интеграла для прямоуго- льника. § 1. Определение и существование двойного интеграла 1.1. Определение двойного интеграла для прямоугольника Пусть произвольная функция двух переменных f(x,y) определена на прямоугольнике R = [а < х Z>] х [с у < </], изображенном на рис. 16.2. Рис. 16.2 Разобьем сегмент а < х < 6 нал частичных сегментов при помощи точек а = xo<xt<X2< ...<хп-Ь, а сегмент с < у < d на р частичных сегментов при помощи точек с= Уо< У\< У2< •••< УР =d. Этим разбиениям при помощи прямых, параллельных осям Ох и Оу (см. рис. 16.2), отвечает разбие- ние прямоугольника R на п • р час- тичных прямоугольников 427
Л/ =[х*-( ^-v<xJx[yM < у< у,] (к~ 1, 2, ..., и; /= 1, 2, ,.., р). 1 ' (16.1) Указанное разбиение прямоугольника R в дальнейшем будем называть разбиением (16.1). Отметим, что всюду в этой главе под термином «прямоугольник» будет пониматься прямоугольник со сторонами, параллельными коор- динатным осям. ' На каждом частичном прямоугольнике Rki возьмем произвольную точку (^А, г|/). Положим Axt -хк -хы, Ду, = yt - ум и обозначим через Д2?и площадь прямоугольника Rh. Очевидно, что ДЯ17 = ДхА. -Ду,. Составим для рассматриваемого произвольного разбиения (16.1) прямоугольника R следующую сумму: а=££/й1.п,)^. (16'I 2) Ы /=1 Сумма (16.2) называется интегральной суммой для функции/(х,у) на п р я м о у г о л ь н и к е Л, отвечающей дан- ному разбиению (16.1) на частичные прямоугольники Rh й данному выбору точек (^,т|;) на частичных прямоугольниках Rh- Диагональ д/(Аха.)2 + (Ду,)2 частичного прямоугольника Rh будем называть его диаметром. Обозначим символом d наибольший из диаметров всех частичных прямоугольников 7?#. Определение 1. Число I называется пределом интегра- льны х с у мм (16.2) при стремлении к нулю наибольшего из диа- метров d частичных прямоугольников, если для произвольного числа е > 0 найдется отвечающее ему положительное число 8(e) такое, что при единственном условии d < 8(e) (независимо от выбора точек (^, Т|7) на частичных прямоугольниках Rh) справедливо неравенство |а~7|<£. Определение 2. Функция f(х,у) называется интегрируе- мой на прямоугольнике R, если для этой функции сущест- вует на прямоугольнике R конечный предел I ее интегральных сумм (16.2) при стремлении к нулю наибольшего из диаметров Цчастичных прямоугольников Rh- При этом указанный предел I называется двойным интегралом от функции/(х,у)по пря- моугольнику R и обозначается одним из символов I = JJ f(x, y)dxdy = JJ f(M)da. R R 428
Замечание. Точно так же, как для однократного определенно- го интеграла (см. разд. 1.1 гл. 13), доказывается, что ограниченность функции /(х, у) на прямоугольнике R является необходимым условие м ее интегрируемости на этом прямоугольнике. Это дает нам основание рассматривать в дальнейшем только ограничен- ные на прямоугольнике Л функции/(х,у). 1.2. Существование двойного интеграла для прямоугольника Изложенная в разд. 1.2 гл. 13 теория верхних и нижних сумм пол- ностью переносится на случай двойного интеграла в прямоугольнике. Поэтому мы ограничимся указанием общей схемы рассуждений. Для произвольной ограниченной на прямоугольнике R функции /(х,^) рассмотрим произвольное разбиение (16.1) этого прямоугольни- ка на частичные прямоугольники Rki. Так как функция f(x,y} ограничена на прямоугольнике 7?, то она ограничена и на каждом частичном прямоугольнике Rkb и потому у нее существуют на прямоугольнике Rki точная верхняя грань, которую мы обозначим символом Mkh и точная нижняя грань, которую мы обо- значим символом ты. Для рассматриваемого произвольного разбиения (16.1) рассмотрим две суммы S * AR-kl’ S = ^^imkl '^kl‘ £=l /=1 v k=\ /=1 Сумма 5 называется верхней суммой, отвечающей разбие- нию (16.1) а сумма s — нижней суммой, отвечающей разбие- нию (16.1). Эти суммы обладают следующими свойствами. Свойство 1. Для любого фиксированного разбиения (16.1) при любом выборе точек (^k, T|z) на частичных прямоугольниках Rki интег- ральная сумма (16.2), верхняя сумма S и нижняя сумма s связаны не- равенствами s < а < S. Свойство 2. Для любого фиксированного разбиения (16.1) и любого числа е>0 точки на частичных прямоугольниках Ria можно выбрать так, что отвечающая этому выбору точек (^,Т|7) интегральная сумма (16.2) и верхняя сумма S будут связаны неравен- ствами 0< S -а<е. Для любого фиксированного разбиения (16.1) и любого числа £>0 точки (^Л, T|z) на частичных прямоугольниках Rh можно выбрать и 429
так» что отвечающая этому выбору точек (£*, т],) интегральная сум- ма (16.2) и нижняя сумма s будут связаны неравенствами 0<а -5<е. Будем называть измельчением разбиения (16.1) то разбие- ние, которое возникает при добавлении к разбиению (16.1) нёсколыдах новых линий разбиения, каждая из которых параллельна либо оси Ох, либо оси Оу. Свойство 3. При измельчении произвольного разбиения верх- няя сумма не возрастает, а нижняя сумма не убывает. Свойство 4. Нижняя сумма s и верхняя сумма S двух произво- льных и, вообще говоря, различных разбиений связаны неравенством s<S. Следствие из свойства 4. Множество {S} всех верх- | них сумм, отвечающих всевозможным разбиениям прямоугольника R, ограничено снизу (в качестве нижней грани этого множества можно | взять любую нижнюю сумму). Множество {5} всех нижних сумм, от- j вечающих всевозможным разбиениям прямоугольника R, ограничено ’ сверху (в качестве верхней грани этого множества можно взять любую верхнюю сумму). Из этого следствия и из теоремы 1 гл. 1 вытекает, что существует точная нижняя грань множества {5} всех верхних сумм, ко- торую мы обозначим символом I и назовем верхним интег- ралом Дарбу, и существует точная верхняя грань । множества {5} всех нижних сумм, которую мы обозначим символом / и назовем нижним интегралом Дарбу. Свойство 5. Верхний и нижний интегралы Дарбу связаны не- равенством I_<I. i Следствие из свойства 5. Для верхней суммы S и ниж- ней суммы s произвольного разбиения (16.1) прямоугольника R справед- ливы неравенства s<I<I<S. ' С помощью свойств верхних и нижних сумм точно так же, как и в § 1 гл. 13 для однократного определенного интеграла, доказывается следующее утверждение. Теорема 1. Для того чтобы для функции f(x,y) из некоторого~ класса существовал двойной интеграл по прямоугольнику R, необходи- мо и достаточно, чтобы для любого числа е > О существовало отве- чающее ему число 5(e) > 0, обеспечивающее справедливость неравенст- ва S -s< е для верхней суммы S и нижней суммы s любого разбиения 430
(16.1), у которого наибольший диаметр d частичных прямоугольников удовлетворяет условию J<5(e). j С помощью этой теоремы и теоремы о равномерной непрерывно- сти функции двух переменных (см. теорему 11 из § 3 гл. 15) точно так же, как в гл. 13 для однократного определенного интеграла, доказыва- ется следующее утверждение. Теорема 2. Любая непрерывная в прямоугольнике R функция f (х, у) интегрируема на этом прямоугольнике. Чтобы несколько расширить класс интегрируемых в прямоугольни- ке R функций, введем следующие понятия. Определение 3. Назовем элементарной фигурой мно- жество точек, представляющих собой сумму конечного числа лежа- щих на плоскости Оху и не имеющих общих внутренних точек прямо- угольников со сторонами, параллельными координатным осям. Определение 4. Будем говорить, что функция f(x,y) о б л а да- ет 1-с в р й с т в о м в прямоугольнике R (в ограниченной замкнутой области D), если выполнены два требования'. 1) функция f(x,y) огра- ничена в прямоугольнике R (в области 2) для любого числа е > 0 су- ществует элементарная фигура, содержащая все точки и линии раз- рыва функции f(x,y) и имеющая площадь, меньшую е. Можно доказать следующее утверждение. Теорема 3. Если функция f(x,y) обладает 1-свойством в прямоуго- льнике R, то она интегрируема на этом прямоугольнике. Доказательство этой теоремы может быть проведено по схеме до- казательства теоремы 10.4 из § 4 гл. 10 книги В. А. Ильина и Э. Г. По- зняка «Основы математического анализа» (т. 1. М.: Физматлит, 2001). 1.3. Определение и существование двойного интеграла для произвольной области Рассмотрим на плоскости Оху произвольную ограниченную зам- кнутую и квадрируемую область1 D. Договоримся называть кривую Г на плоскости Олу кривой площади нуль, если для любого числа £ > 0 существует элемен- тарная фигура, содержащая все точки Г и имеющая площадь, мень- шую £. Из сопоставления данного в разд. 6.1 гл. 13 определения квадриру- емости с определением кривой площади нуль тривиально вытекает, ’Определение ограниченной и замкнутой области см. в разд. 1.3 гл. 15. Квадрируемость любой плоской фигуры (в частности, области D) определена в разд. 6.1 гл. 13. 431
что ограниченная замкнутая область D квадрируема тогда и только тогда, когда ее граница Г имеет площадь нуль. Рассмотрим далее произвольную функцию f(x,y), заданную и огра- ниченную в области D. Обозначим через R любой прямоугольник (со сторонами, паралле- льными координатным осям), содержащий область D (см. рис. 16.3). В этом прямоугольнике R определим следующую функцию: F(x, У) = f (х, у) в точках области D, О в остальных точках R. (16.3) Определение 5. Функцию f{x,y) на- зовем интегрируемой в о б - л a emu D, если функция F(x, у) интег- рируема в прямоугольнике R. При этом число I = назовем R J д в о й н ы м и н т е г р а л о м от функции /(х, у) по области D и обозна- х чим одним из символов I = JJ f(x, y)dxdy=JJ f(M)d<s. D D '• Теорема 4. Если функция f(x,y) либо непрерывна в области D, либо обладает 1-свойством в этой области, то она интегрируема в области D. Доказательство. Достаточно провести рассуждения для функции f(x,y}> обладающей в области D /-свойством. Достаточно до- казать, что для такой функции f(x,y) функция F(x, у), определяемая равенством (16.3), обладает /-свойством в прямоугольнике R. ‘ Фиксируем произвольное число £>0 и обозначим через Ф1 эле- ментарную фигуру, содержащую все точки и линии разрыва функции g f(x,y) и имеющую площадь, меньшую -. Так как граница Г: области D • . с есть кривая площади нуль, то существует элементарная фигура Ф2, со- _ Е _ держащая все точки Г и имеющая площадь, меньшую -. Остается за- метить, что все точки и линии разрыва функции F(x, у) либо совпала- — ют с точками и линиями разрыва функции /(х,у), либо лежат на кри- вой Г. Поэтому имеющее площадь, меньшую е, объединение элемен- тарных фигур Ф| и Ф2 содержит все точки и линии разрыва функции F(x,y) в прямоугольнике R. Теорема доказана. 432
Замечание 1.Из определения 5 сразу же вытекает, что двой- ной интеграл jj Ictrafy равен площади области D. Действительно, под- D вергая соответствующий прямоугольник R все более мелким разбиени- ям на частичные прямоугольники, мы получим, что верхние суммы этих разбиений будут равны площадям элементарных фигур, содержа- щих область D, а нижние суммы — площадям элементарных фигур, содержащихся в D. Замечание 2. В отношении определения 5 возникает вопрос, зависит ли существование двойного интеграла и его величина от выбо- ра декартовых прямоугольных осей Ох и Оу на плоскости и от выбора прямоугольника R, содержащего область D. Этот вопрос снимается в следующем разделе, в котором будет дано другое определение двойного интеграла, эквивалентное определе- нию 5 и не зависящее ни от выбора осей Ох и Оу9 ни от выбора пря- моугольника R. 1.4. Определение двойного интеграла при помощи произвольного разбиения области Пусть снова D — произвольная ограниченная замкнутая область, имеющая границу Г площади нуль. Разобьем область D при помощи конечного числа кривых площади нуль на конечное число г частичных областей Оь О2, -^Dr- Заметим, что каждая частичная область О, квадрируема (ибо ее граница имеет площадь нуль), и обозначим символом ДО, площадь об- ласти О/. В каждой частичной области О,- выберем произвольную точку Р,-Л,-) и составим интегральную сумму g=£/(P/)AD,. (164) 1=1 Назовем диаметром частичной области О,- точную верхнюю грань расстояний между двумя любыми точками этой области и обо- значим через d наибольший из диаметров всех частичных областей. Число I назовем пределом интегральных сумм (16.4) при стремлении к нулю наибольшего из диаметров d частичных областей, если для любого числа £ > 0 найдется отвечающее ему положительное число 8(e), обеспечивающее справедливость неравенства |а-7|<б при единственном условии d < 8(e). Определение 5*. Функция f(x,y) называется интегрируе- мой в о б л а с т и О, если для этой функции существует конечный 433
предел I ее интегральных сумм (16.4) при стремлении к нулю наиболь- я шего из диаметров d частичных областей D,. Этот предел I и назы- $ вается двойным интегралом о-т ф у н к ц и и f(x, у) п о области D. 1 Мы опускаем доказательство эквивалентности определений 5 и 5*, т. е. доказательство того, что . функция f(x,y) имеет в области D рав- ный I двойной интеграл по определению 5 тогда и только тогда, когда 1 она имеет в этой области D равный тому же числу I двойной интеграл по определению 5*. Доказательство эквивалентности определений 5 и 5* можно найти в кн.: Ильин В. А., Позняк Э. Г. Основы математического анализа. М.: Физматлит, 2001. Т. 2. Гл. 2. § 1, п. 4. । § 2. Основные свойства двойного интеграла < Свойства двойного интеграла и их вывод вполне аналогичны свой- ствам однократного определенного интеграла, и мы ограничимся их формулировкой. 1°. Линейное свойство. Если функции f(x,y) и g(x,у) интегрируемы в области D, а а и 0 — любые вещественные числа, то функция [а • f(x, у) + 0 • g(x, у)] также интегрируема в области D, при- чем JJ [а • f(x, у) + р • g(x, y)}dxdy = а • f(x, y)dxdy + р • g(x, y)dxdy. D D D В частности, интеграл от суммы или разности двух интегрируемых функций существует и равен соответственно сумме или разности ин- I тегралов от каждой из этих функций. 2°. Аддитивность. Если функцияf(x,y) интегрируема в об- ласти D и если область D при помощи кривой Г площади нуль разби- вается на две не имеющие общих внутренних точек области £>i и £>2, то функция f(x,y) интегрируема в каждой из областей D\ и Di, причем I ff f(x, y)dxdy=JJ f(x, yjdxdy+JJ f(x, y)dxdy. D Di D2 3°. Если каждая из функций f (х,у) ng(х,у) интегрируема в облас- 1 ти D, то и произведение этих функций также является, интегрируемой в области D функцией. 434
4°. Если обе функции f(x,y) и g (х,у) интегрируемы в области D и всюду в этой области f (х, у) < g (х, у), то Я f(.x, y)dxdy < JJ g(x, y)dxdy. D D 5°. Если функция /(х, у) интегрируема в области D, то и функция |/'(х,у)| интегрируема в области D, причем JJ f(x, y)dxdy < ЯI /(*> ^)l dxdy. D D 6°. Формула среднего значения. Если обе функции fix, у) и g(x,y) интегрируемы в области D, функция g(x,y), кроме того, или неотрицательна, или неположительна в области D, символы М и т обозначают соответственно точную верхнюю и точную ниж- нюю грани* функции f(x,y) в области D, то найдется число р, удов- летворяющее неравенствам т < ц £ М и такое, что справедливо равен- ство \\f{x,y)-g{x,y)dxdy=\x^g{x,y)dxdy. (16.5) D D , В частности, если функция/(х,у) не прерывна в области D, а область D является связной, то в этой области найдется точка (%, т|) такая, что ц=/(4, т|), и формула (16.5) принимает вид Яу№х’ уУ^уп) • Я 8^х> y^dxdy- D ' D § 3. Сведение двойного интеграла к повторному однократному Излагаемое в этом параграфе сведение двойного интеграла к по- вторному однократному является одним из эффективных способов вы- числения двойного интеграла. 3.1. Случай прямоугольника Л Теорёма 5. Пусть для функции f(x,y) существует в прямоугольни- ке R= [а < х < Z>] х [с < у < d\ двойной интеграл jj f (х, y)dxdy и, кроме r того, для каждого х из сегмента а<х< b существует однократный интеграл d I(x) = \f(x,y)dy. ’Точная верхняя и точная нижняя грани существуют вследствие того, что интегрируемая в области D функция является ограниченной в этой области. 435
d b b „ Тогда существует повторный интеграл j I(x)dx = j j/(x, y)dy dx и x a a [_c справедливо равенство ь p Jf f(x, y)dxdy = j J/(x, y)dy dx. Я a Lc (16.7) Доказательство. Подвергнем прямоугольник R произволь- ному разбиению (16.1) на частичные прямоугольники R^i и, как в разд. 1.1, обозначим через Дх* и Ду, разности &хк = хк -хкА, by, = у,-ум, через ДА*/ — площадь частичного прямоугольника R^, равную &хк • Ду;, и через Л/*/ и тн — точную верхнюю и точную ниж- нюю грани функции f(x,y} на частичном прямоугольнике А*/. Тогда всюду на частичном прямоугольнике А*/ <,f(x,y)£Mu. (16.8) Возьмем на сегменте [х*_ь xj произвольную точку и положим х = ^ в неравенствах (16.8). Проинтегрировав полученные при этом неравенства по у в пределах от у^ до у/, получим ты -ЬУ!^ j/&*, y)dy < Ми Ьу,. (16,9) Л-1 Суммируя неравенства (16.9) по всем I от 1 до р, учитывая, что d k>y)dy = jf(£>k>y)dy> и используя обозначение (16.6), получим Z/-1 С следующие неравенства: / £ти-Ду, </£*)< Ду,. (16.10) м ’ z=i Умножим теперь неравенства (16.10) на Дх* и после этого просумми- руем по всем к от 1 до п. В результате получим неравенства Цтк1-^хк-Ау1 < ^/(^)-Дх4 < ^^Л/И-Дх4-Ду,. ^16Л1) А=1 /=1 *-1 *=1 /=1 Окаймляющие члены в (16.11) равны соответственно нижней сум- ме 5 и верхней сумме S для разбиения (16.1). Из существования двойного интеграла и из теоремы 1 вытекает, что при стремлении к нулю наибольшего диаметра d частичных пря- 436
моугольников обе суммы s и S стремятся к двойному Интегралу1. Но тогда и средний член в (16.11), являющийся интегральной суммой для функции (16.6) на сегменте [а, 6], стремится при d 0 к двойному ин- тегралу. Вместе с тем, поскольку при стремлении d к нулю и max Axt d стремится к нулю, то указанный средний член стремится к повторному b b d интегралу J I(x)dx = J J f(x, y)dy dx. Теорема доказана. Замечание к теореме 5. В теореме 5 можно поменять х и у ролями, т. е. можно предположить существование двойного интег- рала и существование для каждого у из сегмента с< у<d однократно- го интеграла K(y) = \f(x,y}dx и доказать существование повторного d интеграла ^K(y)dy=j j/(x, y)dx dy и справедливость равенства jf/(x,y)dxdy=[ [/(x,y)dxdy. я с !_<* (16.12) Используя теорему 5, сведем двойной интеграл от функции f(x, у) = е 2 по квадрату R (А) = [-А < х < Л] х [-А < у $ А ] к одно- кратному интегралу. Используя равенство (16.7), получим, что ^.у1 Л ||е 2 dxdy=fe 2 Я(Л) -л Л / 1 (Ае — Y j е 2 dy dx= j е 2 dx ,~л . > (16.13) С помощью равенства (16.13) мы в следующем параграфе вычис- 00 лим несобственный интеграл j е 2 dx. 3.2. Случай произвольной области Теорема 6. Пуспи> выполнены следующие два условия: 1) область D ограничена, замкнута и такова, что любая прямая, параллельная оси Оу, пересекает ее границу не более чем в двух точках, ординаты 1 Ибо для любого числа е > О существует отвечающее ему число 5(e) > О, обеспечивающее справедливость неравенства S-s<t при */<6(е), а двойной интеграл заключен между s п S. 437
ч которых суть yj(x) и уг(х), где yj(x) <у2(х) (см. рис. 16.4); 2) функция ? f(x,y) допускает существование двойного интеграла f (х, y)dxdy и D существование однократного интег- рала У2(х) J f(x, y)dy Ji (X) для любого х из сегмента х, <х<х2, где х\ и Х2 — наименьшая и наиболь- шая абсциссы точек области D. При выполнении этих условий существует повторный интеграл и справедливо равенство i JJ f(x, y)dxdy = J |/(x, y)dy dx. D XiL>’i(x) (16.14) Рис. 16.5 Доказательство. Обозначим через R прямоугольник co сторонами, параллельными координатным осям, содержащий область D, а через F(x,y) функцию, совпадающую с f(x,y) в точках области D и равную нулю в остальных точках R. Для функции F(x, у) вы- полнены в прямоугольнике R все условия те- оремы 5, и потому справедливо равенство (16.7), которое (с учетом того, что F(x,y) рав- на нулю вне D и совпадает с f (х, у) в D) пе- реходит в равенство (16.14). Теорема доказа- на. Замечание 1 к теореме 6. В теореме 6 можно поменять х и у ролями, т. е. можно предположить, что выполнены следующие два условия: 1) область D ограничена, зам- кнута и такова, что любая прямая, параллельная оси Ох, пересекает ее границу не более чем в двух точках, абсциссы которых суть Х1(у)*и ' х2(у), где xi(y) <х2(у) (см. рис. 16.5); 2) функция f(x,y) допускает суще- ствование двойного интеграла по области D и существование одно- кратного интеграла 438
для любого у из сегмента у, < у< у2, где у\ и у2 — наименьшая и наи- большая ординаты точек области D. При выполнении этих условий су- ществует повторный интеграл J J fix, y)dx dy я и справедливо равенство JJ fix, y)dxdy = j J f(x, y)dx dy. D я § 4. Замена переменных в двойном интеграле Предположим, что в двойном интеграле Z = JJ/(x,y)drrfy D мы переходим от переменных х, у к новым переменным т| при помо- щи преобразований (16.15) х = Т1й,П), ,y=W (16.16) Предположим, что преобразования (16.16) являются взаимно одно- значными, обозначим через D' ту область в пространстве переменных Т|, которая при преобразованиях Q6.16) переходит в область D, и' предположим, что функции (16.16) имеют в области D' непрерывные частные производные первого порядка и отличный от нуля определи- тель1: дх дх _ дх ду _дх ду (16,17> Эл Справедливо следующее утверждение: если преобразования (16.16) переводят область D' в область D и являются взаимно одно- значными и если функции (16.16) имеют в области D' непрерывные 1 Этот определитель называют определителем Якоби или якобианом от переменных х, у по переменным q. 439
частные производные первого порядка и отличный от нуля определи- тель (16.17), то для двойного интеграла (16.15) справедлива следую- щая формула замены переменных: (16.18) а^с/т|. D' дх ду _ дх ду д^дх\ дх\д^ Доказательство этого утверждения можно найти в кн.: Ильин В. А., Позняк Э. Г. Основы математического анализа. Т. 2. М.: Физматлит, 2001. Гл. 2. § 5. Рассмотрим важный частный случай, когда новыми переменными являются полярные координаты точек (г,», т. е. когда преобразования (16.16) имеют вид: x = rcoscp, y=rsin<p „ ( дх ду дх , Легко видеть, что определитель-------—-------- равен г, и формула ^<Эг<Э<р дудг) замены переменных (16.18) принимает вид I = || f (rcos <р, rsin (p)nZnftp. (16.19) D’ С помощью формулы замены переменных (16.19) вычислим интег- _х2+у2 рал 1(A) от функции f(x, у) = е 2 по кругу D(A) радиуса А с центром в начале координат, т. е. по области D(A) = {x2 + у1 < А2}. Очевидно, что областью D' является прямоугольник [0 < г < А] х [0 < ср < 2л], функция f(x,y) = e 2 переходит в е 2, и ис- комый интеграл 1(A) равен Л Г2 С /(Л)=||е 2 dxdy=je 2 r-Jr| J<p=2n 1-е 2 DM) 0 0 I j (16.20) Сопоставляя вычисленный двойной интеграл (16.20) с двойным ин- х2+у2 тегралом (16.13) от той же неотрицательной функции е 2 по квадра- ту R(A) = [-A < х < А]х[-А < у < А] и учитывая, что при любом А > 0 круг D(A) радиуса А содержится в квадрате R(A), а квадрат R(A) содер- жится в круге D(A^2) радиуса Ау/2, мы получим, что для любого А > 0 справедливы неравенства Х2-Ьу2 Х2+у* ||е 2 dxdy<^e 2 dxdy£ ||е 1 dxdy, ‘ DM) ЯМ) DMV2) которые в силу (16.13) и (16.20) могут быть переписаны в виде 440
2л 1 - е 2 < j е 2 dx < 2л(1 - e~A1). (16.21) Так как окаймляющие функции в (16.21) имеют при А -> оо общий предел, равный 2л, то этот же предел при А -» оо имеет и заключенный между ними квадрат интеграла*. Тем самым мы вычислили несобственный интеграл “ -ii л f е 2 dx- lim f\е 2 dx- л/2л, J А-*о J J A-*x> J -co -A который будет играть важную роль в теории вероятностей (см. гл. 19). § 5. Тройные интегралы Теория тройных (а также и л-кратных) интегралов строится в пол- ной аналогии с теорией двойных интегралов. Сначала рассматривается тройной интеграл в прямоугольном па- раллелепипеде R со сторонами, параллельными координатным осям. Каждое из трех ребер этого параллелепипеда, выходящих из одной вершины, подрергается разбиению на частичные сегменты, и таким об- разом строится разбиение R на частичные параллелепипеды Rkim, на каждом из которых выбирается произвольная точка (£*, гр, С по- мощью этих точек и объемов ARkim частичных параллелепипедов Rkim составляется интегральная сумма по всем Rklm Тройной интеграл по параллелепипеду R определяется как предел интегральных сумм ст при стремлении к нулю наибольшей диагонали частичных параллелепипедов. Точно так же, как для двойного интеграла, вводятся верхние и нижние суммы и с помощью их свойств устанавливается необходимое и достаточное условие существования тройного интеграла в паралле- лепипеде R и доказывается интегрируемость непрерывной функции. Интегрируемость функции f(x,y,z) в произвольной ограниченной замкнутой кубируемой области D проще всего определить как интег- рируемость по содержащему D параллелепипеду R функции F(x,y,z), совпадающей с f(x,y,z) в области D и равной нулю вне D. 'В силу теоремы 12 из разд. 7.1 гл. 9. 441
Для обозначения тройного интеграла от функции f(x,y, z) по обла- сти D используется символ , I - JU / (х, у, z)dxdydz. о (16.22) Для сведения тройного интеграла (16.22) к однократному и двой- ному интегралам предположим, что трехмерная область D ограничена, замкнута и такова, что любая прямая, параллельная оси Ох, пересекает ее границу не более чем в двух точках, абсциссы которых суть xi(y, z) и хг(у, z), где xt(y,z)<X2(y,z), и что для функции f(x,y,z) существует тройной интеграл (16.22) и, кроме того, для любых у, z из области Dh являющейся проекцией области D на плоскость Oyz, существует одно- кратный интеграл (ул) jf(x,y,z)dx. . Тогда существует двойной интеграл по области D\ Jf jf(x,y,z)dx dydz A и этот двойной интеграл равен тройному интегралу (16.22). Пусть теперь в тройном интеграле (16.22) мы переходим от пере- менных х, у, z к новым переменным т|, так что нам заданы функ- ’ ции х = Т,&П& 2 = тзй,п,0. (16.23) Предположим, что преобразования (16.23) являются взаимно одно- значными, и обозначим через D' ту область, которую они переводят в D. Тогда, если функции (16.23) имеют в области D' непрерывные час- тные производные первого порядка и отличный от нуля определитель1 дх дх дх д^ дг\ дС, D(x, y,z) _ ду ду ду d(^q~^ д£ dz dz dz д^ дг\ 1 Этот определитель называют определителем Якоби или якобианом от переменных х, у, z по переменным ц, С,. 442
то для тройного интеграла (16.22) справедлива слёдующая форму- ла замены переменных: I=JJJ лад-ш адпО, Ч'з&п,;)]- D- D(x, у, z) d^dxyK? В частности, если новыми переменными являются сферические ко- ординаты г, ср, 0, т. е. еслиx = r-cos<p-sin0, y=r-sin<p-sin0, z = rcos0, то поскольку D(x,y,z) D(r,y,Q) cos <p- sin 0 sin ф-sin 0 COS0 -Г8Шф-5т0 ГСО8ф’8Ш0 о rcos<p-cos0 Г8Шф-СО50 -rsin0 = r2 sin0, формула замены переменных приобретает вид I = JU/(гсозф-зт0, гвтф втО, rcos0)r2 sin0 • drd(pdQ. D‘
Глава 17 Ряды В этой главе будут изучаться суммы, содержащие бесконечное число слагаемых. Такие суммы, называемые числовыми рядами, требу- ют самостоятельного углубленного изучения, поскольку являются важ- ным инструментом для представления различных функций. § 1. Понятие числового ряда 1.1. Понятие о сходящихся и расходящихся, рядах Рассмотрим произвольную числовую последовательность иь и2, ик, .... Формально составленную бесконечную сумму всех элементов этой последовательности wi +й2 + ... +ик+... = . U7-1) t=i мы и будем называть числовым рядом или просто рядом. Отдельные слагаемые ик будем называть членами ряда (17.1), а сумму первых п членов ряда (17.1), обозначаемую символом Sn = ui +w2 + ... + ип = £ик, t17,2) ы будем называть и-й частичной суммой этого ряда. Основное определение. Ряд (17.1) называется с х од я щимся, если существует конечный предел S последовательности {Sn} его час- тичных сумм. При этом указанный предел S называется суммой ряда (17.1). Если конечного предела последовательности {Sn} частичных сумм не существует, то ряд (17.1) называется расходящимся. Ддя сходящегося ряда, имеющего сумму S (и только для него), можно записать равенство Ь=1 Мы видим, что, в отличие от конечной суммы, сумма ряда вводит- ся посредством операции предельного перехода. Основной вопрос теории рядов — установление признаков, позво- ляющих сделать заключение о сходимости или расходимости изучае- мого ряда. 444
Сделаем три замечания, непосредственно вытекающих из опреде- ления сходимости ряда. Замечание 1. Изучение рядов — это новая форма изучения числовых последовательностей, ибо каждому ряду (17.1) однозначно соответствует последовательность {S„} его частичных сумм, и, наобо- рот, каждой последовательности {£„} однозначно соответствует ряд (17.1) с членами iq =Sb и* = S*-St-i при к> 2, для которого эта по- следовательность является последовательностью его частичных сумм. Замечание 2. Отбрасывание конечного числа первых членов (или добавление к ряду конечного числа первых членов) не влияет на его сходимость. (При этом все частичные суммы начиная с некоторого номера уменьшатся или увеличатся на одно и то же число.) Замечание 3. Если С — отличная от нуля постоянная, и* = Си'к для всех номеров к, то ряд ^ик сходится тогда и только тогда, когда ы сходится ряд ^и'к. ы (Частичные суммы Sn и S' указанных двух рядов будут связаны соотношением S„ = CS'„, и так как С* 0, то {5„} сходится тогда.и то- лько тогда, когда сходится {£'}). Примеры. 1°. Рассмотрим ряд 1+9+92 + ...+/-* + ...=£9ч <17-3) Л=1 (Мы считаем, что q° = 1.) При q*l п-я частичная сумма Sn ряда (17.3) имеет вид Sn=l+q + ..:+q^=^_ (17,4) 1-? q | < 1 существует предел lim Sn = —J—, т. е. л-ио 1 — q Из (17.4) ясно, что при | при |?| <1 ряд (17.3) сходится и имеет сумму, равную 1/(1 -q). При |<?| > 1 из (17.4) ясно, что конечного предела у {5Л} не суще- ствует, т. е. ряд (17.3) расходится. Если |^| = 1, то ряд (17.3) также расходится, ибо при q = 1 полу- чим, что Sn = п, а при q = -1 получим, что Si = 1, Sz = О, S3 = 1, S4 = О, ..., а такая последовательность расходится. 2°. Пусть х — любое фиксированное число. Рассмотрим ряд 1+-+...+ 1! (л-1)! + (17-5) (Мы считаем, что 0! = 1, х° = 1.) 445
Если разложить ev по формуле’Маклорена, то получим/что ег = 1 + — —-------+ R„ (х), 1! (п-1)! (17.6) где R,, (х) — остаточный член, для которого в разд. 7.1 гл. 11 доказано, что для любого х он стремится к нулю при стремлении и к + оо. Заме- тим теперь, что в правой части (17.6) стоит сумма остаточного члена Rn (х) и n-й частичной суммы S„ (х) ряда (17.5). Таким образом, для любого х и-я частичная сумма (х) имеет предел при л->оо, равный е\ т. е. для любого х ряд (17.5) сходится к сумме е\ 1.2. Критерий Коши и следствия из него Так как вопрос о сходимости ряда эквивалентен вопросу о сходи- мости последовательности его частичных сумм, то (в силу критерия сходимости числовой последовательности1) мы приходим к следую- щей теореме. Теорема 1 (критерий Коши сходимости числового ряда). Для того чтобы ряд (17.1). сходился, необходимо и достаточно, чтобы для любого числа г> 0 нашелся номер N(е), гарантирующий справед- ливость неравенства (17.7) для всех номеров п, удовлетворяющих условию n>N (е), и всех натура- льных р. ' Достаточно заметить, что левая часть (17.7) равна где S„ — л-я частичная сумма ряда (17.1). Из теоремы 1 сразу вытекает расходимость так называемого га р - монического ряда , ибо для произвольного как у г о д - i=i к но большого номера л и для р = п . S„+, - Sn = S2n - Sn = + -1- +... + A- > ± 1 n + 1 n + 2 2n 2n 2 в силу того, что разность ($2П - Sn) содержит п слагаемых, наименьшее 1 ' ' из которых равно —. 2п Следствие 1 (необходимое условие сходимости ряда). Для схо- димости ряда необходимо, чтобы его к-й член стремился к нулю при ’См. теорему 16 из § 6 гл. 7. 446
k-*<n> m. e. необходимо, чтобы последовательность его членов явля- лась бесконечно малой. . Действительно, из сходимости ряда (17.1) и из теоремы 1 вытекает, что для любого числа е > 0 существует номер N (е) такой, что для всех п >N(e) и для /2=1 что и требовалось доказать. Для любого ряда (17.1) назовем ряд, полученный отбрасыванием первых п членов ряда (17.1), и-м о с т ат к о мрядз (17.1).. Если ряд (17.1) сходится, то в силу замечания 2 из разд. 1.1 и лю- бой его п-й остаток является сходящимся рядом. Поэтому, обозначив через гп сумму ряда, являющегося n-м остат- ком ряда (17.1), мы можем записать, что г.-.£ч- (17'8) А-т-1 Следствие 2. Если ряд (17.1) сходится, то последовательность {гп} сумм рядов (17.8), представляющих его п-е остатки, является бесконечно малой. Действительно, из сходимости ряда (17.1) и из критерия Коши вы- текает, что для любого числа е > 0 существует номер У (е), гарантиру- ющий справедливость неравенства (17.7) для всех л >7V(e) и для всех р = 1, 2, .... Фиксировав в (17.7) произвольный номер n>N(e), устремим р к бесконечности. ' В силу теоремы о предельном переходе под знаком неравенства* мы получим из (17.7) в пределе при /»-><», что £ Щ к-пА < £ < 2е при произвольном п > N (е), что и требовалось доказать. Наличие критерия Коши не снимает проблемы установления рабо- чих признаков сходимости рядов. В § 2 такие признаки будут установ- лены для рядов с неотрицательными членами. ’См. теорему 8 из разд. 1.4 гл. 7. 447
§ 2. Признаки сходимости рядов с неотрицательными членами 2.1. Необходимое и достаточное условие сходимости ряда с неотрицательными членами Будем рассматривать ряд <17” Л=1 все члены рк которого неотрицательны. Мы обозначим эти члены символом рк вместо ик, чтобы оттенить их неотрицательность. Основное характеристическое свойство такого ряда (17.9) заключа- ется в том, что последовательность {Sn} его частичных сумм являет- ся неубывающей. Так как необходимым и достаточным условием сходимости неу- бывающей последовательности является ее ограниченность (см. заме- чание 2 разд. 2.2 гл. 7), то мы приходим к следующей теореме. Теорема 2. Для сходимости ряда (17.9) с неотрицательными чле- нами необходимо и достаточно, чтобы последовательность его час- тичных сумм являлась ограниченной, 2.2. Признаки сравнения Так называют признаки, позволяющие сделать заключение о схо- димости (или расходимости) рассматриваемого ряда посредством срав- нения его с другим рядом, сходимость (или расходимость) которого нам известна. Теорема 3 (первый признак сравнения). Пусть у (17.10) Z^Pk ы и Sp; (1711) ы — два ряда с неотрицательными членами, и пусть для всех номеров к справедливо неравенство1 рк<р'к. (17-12) ’При выполнении неравенства (17.12) говорят, что ряд (17.11) мажорирует ряд (17.10). 448
Тогда сходимость ряда (17.11) влечет за собой сходимость ряда (17.10), а расходимость ряда (17.10) влечет за собой расходимость ряда (17.11). Доказательство. Обозначая п-е частичные суммы рядов (17.10) и (17.11) через Sn и S'„ соответственно и замечая, что в силу (17.12) S„<S', мы получим, что ограниченность S' влечет за собой ограниченность {£„}, а неограниченность {£„} влечет за собой нео- граниченность {S'}. В силу теоремы 2 данная теорема 3 доказана. Замечание 1 к теореме 3. В силу замечания 2 из разд. 1.1 выполнения неравенства (17.12) можно требовать не для всех номеров к, а только начиная с некоторого номера к. Замечание 2 к теореме 3. В силу замечаний 3 и 2 из разд. 1.1 вместо неравенства (17.12) можно требовать выполнения не- равенства рк < Ср'к, где С — отличная от нуля постоянная, причем вы- полнение этого последнего неравенства можно требовать только на- чиная с некоторого номера к. Теорема 4 (второй признак сравнения). Если (17.10) — ряд с не- отрицательными членами, а (17.11) — ряд со строго положительны- ми членами, и если существует конечный предел г Рк г (17.13) lim — = L, v 7 Рк то сходимость ряда (17.11) влечет за собой сходимость ряда (17.10), а расходимость ряда (17.10) влечет за собой расходимость ряда (17.11). Действительно, из существования предела (17.13) следует, что для любого числа е > 0 существует номер N (е) такой, что при всех к>N(е) справедливы неравенства L-e< — < L + е и, в частности, Р'к неравенство рк Ср'к при С = L + е, которое в силу замечания 2 к тео- реме 3 доказывает теорему 4. Теорема 5 (третий признак сравнения). Пусть (17.10) и (17.11) — два ряда со строго положительными членами и для всех номеров к справедливо неравенство Ры Ры (17.14) Рк ~ Рк Тогда сходимость ряда (17.11) влечет за собой сходимость ряда (17.10), а расходимость ряда (17.10) влечет за собой расходимость ряда (17.11). 449
Доказательство. Записывая неравенство (17.14) для номе- ров к= 1, 2, ..., п - 1, где п — любой номер, строго больший единицы, получим Р^Рг. Р” с Р" Рх Рх Рг Pt Р,,-х Р'п-х Почленно перемножая все эти неравенства (что можно делать для не- ч р р' равенств одного знака с положительными членами), получим — < ^-s— р, Рх Рх или ра<Срп , где С = —>0. Р'х В силу замечания 2 к теореме 3 теорема 5 доказана. В силу замеча- ния 2 разд. 1.1 выполнения неравенства (17.14) можно требовать толь- ко начиная с некоторого номера к. Примеры. 1°. Изучим вопрос о сходимости ряда У —Цг, где b > 0. ы 3 + Ьк Если Ь<\, то к-н член рассматриваемого ряда не стремится к нулю при к-+<х>. Тем самым нарушено необходимое условие сходимо- сти ряда, и ряд расходится. Если же b > 1, то, поскольку для любого номера к справедливо неравенство з+ьк ьк и РЯД S СХ°ДИТСЯ (см- пример 1 разд. 1.1), теорема 3 (первый при- ы о знак сравнения) прзволяет утверждать сходимость рассматриваемого ряда. 2°. Исследуем вопрос о сходимости ряда при 0<а< 1. а-=| к* (Такой ряд называют обобщенным гармоническим рядом.) Поскольку при 0 < а < 1 для любого номера к справедливо неравенство ±>1 ка к и гармонический ряд У — расходится (см. разд. 1.2), то теорема 3 *-1 к 450
(первый признак сравнения) позволяет утверждать расходимость рас- сматриваемого ряда. ' 3°. Исследуем на сходимость ряд Очевидно, что для к > 2 выполнено неравенство ±<_1_ к1 к(к-\) Изучим вопрос о сходимости ряда 1 Г кк ’ У —L_ = £ к(к-\) £1 п-я частичная сумма 5„ которого имеет вид: S„ = 1 - п-1 п-1 п п Поскольку при л->оо последовательность {5Я} частичных сумм ряда, мажорирующего ряд / j , сходится к пределу, равному единице, те- *=2 к орема 3 (первый признак сравнения) позволяет утверждать сходимость рассматриваемого ряда. 2.3. Признаки Даламбера и Коши Эти два очень употребительных признака устанавливаются при по- мощи сравнения изучаемого ряда со сходящимся при 0 < q < 1 рядом для геометрической прогрессии q + q2 + q3 + ... или с расходящимся ря- дом 1 + 1 + 1 + .... Эти два признака имеют много общего, и мы будем формулиро- вать и доказывать их параллельно, помещая в левой половине страни- цы текст, относящийся к признаку Даламбера, а в правой половине — текст, относящийся к признаку Коши. Тексту относящийся к обоим признакам, будет формулироваться без разделения страницы на две половины. Итак, будем рассматривать произвольный ряд со строго положите- льными членами , <17Л5) Л=1 451
Теорема 6 (признак Даламбера) | Теорема 7 (признак Коши) I. В непредельной форме. Если для всех номеров к или, по крайней мере, начиная с некоторо- го номера к справедливо неравенство < <7 < 1 (соответственно > 1), Рк Рк \[p'k^q<l kfPk^), (соответственно то ряд (17.15) сходится (соответственно расходится). II. В предельной форме. Если существует предел lim^ = L, = Д (**) **"?* .. то ряд (17.15) сходится при L< 1 и расходится при L> 1. Доказательство теоремы!. Положим р'к (соответственно р'к = 1) и.заметим, что ряд р'к 1 t=i сходится (соответственно расходится). Заметим далее, что = q (соответственно = 1). Рк Рк Это дает нам право переписать неравенство (*) в виде Ры < Ры (соответственно £ &*). Рк Рк Рк Рк Из последнего неравенства, из ‘ ( оо теоремы 5 и из того, что ряд £ р'к £=1 сходится (соответственно расхо- дится), вытекает, что и ряд (17.15) сходится (соответственно расходится). (соответственно \[р~к> > VpT) или, что та же самое, рь р^ (соответственно рк > р'к). Из последнего неравенства, из теоремы 3 и из того, что ряд Рк сходится *=i (соответственно расходится), вытекает, что ряд (17.15) сходится (соответственно расходится). 452
Доказательство теоремы II. > > . А. Случай L<1. Так как L < 1, то найдется число е > 0 такое, Что L = 1 - 2 е, т. е. £ + £ = 1 - £. В силу существования предела (**) для указанного е > О существует номер У (в) такой, что при всех k>N(e) справедливы не- равенства £-e<^<Z, + s=1-e Л L-z<\[pi<L + E=\-£ (17.16) В силу правого из этих неравенств и уже доказанной теоремы I ряд (17.15) сходится. ' ' Б . С л у ч а й L > 1. Так как L > 1, найдется е > 0 такое, что L = 1 + е, т. е. L - е = 1, а в силу существования предела (**) для указанного е > 0 существует но- мер А(е) такой, что при всех k>N(z) справедливы неравенства (17.16). В силу левого из этих неравенств, соотношения L - в = 1 и уже доказанной теоремы I ряд (17.15) расходится. Замечание к теоремам 6 и 7. В теоремах 6 и 7 неравенства , ^<q< 1 А нельзя заменить одним неравенством 2«< j А ибо при выполнении неравенства (***) уже нельзя сделать какого-либо заключения о сходимости или расходимости ряда (17.15). Действительно, неравенству (***) удовлетворяют начиная с номера к-2 все члены каждого из двух рядов ..... S 7 “ £ Р ы к к=\ к (17.17) но первый из этих рядов, как было доказано в разд. 1.2, расходится, а второй, как было доказано в разд. 2.2, сходится. 453
Те же два ряда (17.17) показывают, что при L = 1 признаки Далам- бера и Коши в предельной форме (теоремы II) «не действуют», ибо для каждого из двух рядов (17.17) предел (**) равен L = 1, но один из этих рядов расходится, а второй сходится. Примеры. 1°. Изучим вопрос о сходимости ряда f (Jk)k if ki Применяя признак Даламбера в предельной форме, получим к ’ рк (Л+ 1)1(71/ '7Г+11 к) ' Следовательно, lim-^± = lim-! J1 + — j- = lim——— lim I1 + — = 0-7ё=0<1. pt +1 k kJ y/k+1 *">4 kJ Таким образом, рассматриваемый ряд сходится. . . 2°. Изучим вопрос о сходимости ряда м Будем применять признак Коши в предельной форме и учтем, что Используя пример из разд. 1.4 гл. 7, получим, что Следовательно, рассматриваемый ряд сходится. § 3. Абсолютная и условная сходимость рядов с членами любого знака Будем рассматривать произвольный ряд (17.18) ы v ,, с членами ^любогознака. 454
Определение 1. Ряд (17.18) называется абсолютно схо- дя щи м с я; если сходится ряд, составленный из модулей членов ряда (17.18) £14 <1719> к=\ В этом определении ничего не говорится о том, сходится ли при этом сам ряд (17.18). Оказывается, сходимость ряда (17.18) автомати- чески вытекает из сходимости ряда (17.19). Теорема 8. Из сходимости ряда (17.19) вытекает сходимость ряда (17Л8). . , Доказательство. Фиксируем произвольное число е > 0. Из сходимости ряда (17.19) и из критерия Коши (теоремы 1) выте- кает, что существует номер N (е) такой, что Й4<° (17'20) Л=/н-1 для всех и > Af (е) и всех натуральных р. Но модуль суммы р слагае- мых не превосходит суммы модулей этих слагаемых. Поэтому, исполь- зуя также (17.20), получим <£ для всех n>W(e) и всех натуральных р. В силу- критерия Коши ряд (17.18) сходится. Определение 2. Ряд (17.18) называется условно сходя- щимся, если сам этот ряд сходится, но соответствующий ряд из модулей членов (17.19) расходится. । Убедимся в том, что условно сходящиеся ряды существуют. Дока- жем, что ряд 2 3 4 Л сходится условно. Действительно, соответствующий ряд из модулей членов — гармо- нический ряд , как мы уже доказали, расходится. *=1 к Остается доказать, что сам ряд (17.21) сходится. Мы сейчас сфор- мулируем и докажем утверждение (так называемый признак Лейбни- ца), из которого будет вытекать сходимость ряда (17.21). 455
Будем называть ряд знакочередующимся, если все его члены с четными номерами положительны, а с нечетными номерами — отрицательны. . Знакочередующийся ряд удобно записывать так, чтобы были вы- явлены знаки всех его членов, т. е. в виде Рх -Р2+Р3-Р4 + = £(-1)*''а, (17’22) Л-1 где все р*>0. Теорема 9 (признак Лейбница). Если члены знакочередующегося ряда, будучи взяты по модулю, образуют невозрастающую бесконечно малую последовательность, то этот ряд сходится. Доказательство. Пусть дан произвольный ряд (17.22), у которого последовательность {/?*} является невозрастающей и беско- нечно малой. Частичную сумму этого ряда четного порядка Sin можно запи- сать в виде Sin = (р\ -pi) + (рз ~Pi) + ... + (P2„-I -pin). (17.23) Вследствие того что последовательность {р*} не возрастает, каждая круглая скобка в (17.23) неотрицательна. Отсюда следует, что $2п+2 $2п, т. е. последовательность {52„} не убывает. Кроме того, последовательность {5^} ограничена, ибо, пере- писав (17.23) в виде <$2л =Р\ ~ (Р1 ~Рз) ~ “ (Р2п-2 ~P2n-l) ~Р2п, мы без труда убедимся в том, что Sin^Pi (для всех и). Итак, последовательность четных частичных сумм {S2n} не убыва- ет и ограничена. В силу теоремы 10 из разд. 2.2 гл. 7 эта последовате- льность имеет предел S, причем в силу замечания 1 к этой теореме 52п<5 (для всех л). Так как 52я+1 = S2n + P2»+i для любого номера л и бесконечно малая последовательность {p2«+i} имеет предел нуль, то последовательность нечетных частичных сумм {32и+|} имеет тот же предел S. Таким обра- зом, вся последовательность {!>„} сходится к пределу S, и теорема до- казана. Замечание к теореме 9. При доказательстве теоремы 9 мы установили, что для любого номера л справедливо неравенство S2n<S. (17.24) Записав любую частичную сумму с нечетным номером S^+i в виде •$2л+1 =Pl - (pi ~Рз) - (Р4 —ps) — — - (pin ~Р2п+\), 456
мы убедимся в том, что последовательность нечетных частичных сумм {52,i+i} не возрастает. Но тогда в силу замечания 1 к теореме 10 из разд. 2.2 гл. 7 для всех номеров п 5<52я+1. (17.25) Из (17.24) и (17.25) мы получим, что для любого номера п 52я^5^52я+1. (17.26) Так как 5гя+| -5гя =Р2«+ь то из (17.26) следует, что частичная сум- ма 5гя+| приближает сумму 5 с ошибкой, не превышающей величины Р2л+1- Из того же соотношения (17.26) следует, что и 5гя приближает 5 с ошибкой, не превышающей ргп+ь и тем более не превышающей р2я- Итак, частичная сумма Sn с любым номером п приближает сумму S ряда (17.22) с ошибкой, не превышающей модуля последнего входящего в Sn члена. Возвращаясь к ряду (17.21), мы заметим, что этот ряд удовлетворя- ет всем условиям теоремы 9 и потому сходится. Утверждение 1. Модуль суммы S абсолютно сходящегося ряда (17.18) не превосходит суммы S' ряда (17.19), составленного из моду- лей членов ряда (17.18). Доказательство. Если обозначить n-е частичные суммы рядов (17.18) и (17.19) через S„ и 5' соответственно, то имеют место равенства 7Ы + Ы + - + 1МР1’ Р»Г|М1+«2+- + Мл|- Следовательно, так как модуль суммы конечного числа слагаемых не превосходит суммы модулей этих слагаемых, ( |5„|^5; , или-5; <Sn<S'„. Переходя в последних неравенствах к пределу при п->оо и исполь- зуя теорему 8 из разд. 1.4 гл. 7 о предельном переходе под знаком не- равенства, получим, что 15|< 51. Утверждение 1 доказано. В конце настоящего параграфа рассмотрим вопрос о возможности почленного сложения и вычитания сходящихся рядов. Утверждение 2. Если два ряда ^ик и сходятся и имеют £=| Л=1 суммы, соответственнее равные U и V, то и ряд ^(uk ± vk) сходится *=1 и имеет сумму, равную U+V. 457
Доказательство. Обозначим п-е частичные суммы рядов ±vt ), J ик и соответственно через S„, Un и V„. Тогда, оче- Ы *=! ы видно, S„ = Un ± К„. Так как lim U„ = U, lim Vn = К то согласно теореме n-tx п-+х 7 из разд. 1.4 гл. 7 существует предел lim Sn = U ± V. Утверждение 2 доказано. § 4. Степенные ряды В этом и следующем параграфах изучаются ряды, членами кото- рых являются не числа, а функции, заданные на некотором фиксиро- ванном множестве (например, на сегменте или на всей прямой). Среди таких рядов особую роль играют степенные ряды, являющиеся важ- ным инструментом для представления функций как действительного, так и комплексного аргументов. 4.1. Понятие степенного ряда. Теорема Коши—Адамара Степенным рядом называется ряд вида а0 + а{х + а2х2 +...= а0 + ^akx\ (17.27) *=1 в котором а0> Дь ..., cik,... — постоянные вещественные числа, называе- мые коэффициентами рассматриваемого ряда. Составим из коэффициентов ряда (17.27) следующую числовую последовательность: Д, Д............ (17.28) кратко обозначаемую символом {^| at|}. Числовая последовательность (17.28) может быть либо неограни- ченной, либо ограниченной. В случае если она является ограниченной, по теореме 14, доказанной в § 4 гл. 7, она обязательно имеет верх- ний предел, который мы обозначим через L. Этот верхний предел L может быть либо строго положительным, либо равным нулю. Отри- цательным указанный верхний предел L быть не может, ибо из после- довательности (17.28), все члены которой неотрицательны, нельзя вы- делить подпоследовательность, сходящуюся к отрицательному числу. Итак, возможны только следующие три случая: 1) последовательность (17.28) является неограниченной, 2) последовательность (17.28) является ограниченной и имеет стро- го положительный верхний предел L, 458
, 3) последовательность (17.28) является ограниченной и имеет рав- ный нулю верхний предел L. Эти три случая мы должны проанализировать при решении основ- ного интересующего нас вопроса: при каких значениях х сходится и при каких значениях х расходится степенной ряд (17.27)? Сразу же заметим, что любой степенной ряд (Y121) сходится (при- чем даже абсолютно) при х = 0. Далее заметим, что существуют степенные ряды, сходящиеся только пр и х = 0. Примером такого степенного ряда может слу- жить ряд £jk\xk, у которого при х * 0 нарушено необходимое условие . х.=1 . . f ; сходимости, заключающееся в стремлении к нулю1 при £->оо егб к-го члена к\х*. Докажем следующую замечательную теорему, состоящую из трех утверждений. Теорема ДО (теорема Коши—Адамара). I. Если последовательность (17.28) является неограниченной, то степенной ряд (17.27) сходится только при х = 0. II. Если последовательность (17.28) является ограниченной и ее верхний предел L строго положителен, то степенной ряд (17.27) схо- дится абсолютно для значений х, удовлетворяющих неравенству |х|<—, и расходится для значений х, удовлетворяющих неравенству L III. Если последовательность (17.28) является ограниченной и её верхний предел L равен нулю, то степенной ряд (17.27) сходится аб- солютно для всех значений х. Утверждения I, II, и III докажем отдельно. Доказательство утверждения I. Пусть последова- тельность (17.28) является .неограниченной. Так как в точке х = 0 схо- дится любой степенной ряд (17.27), то достаточно доказать, что при любом х^О степенной ряд (17.27) расходится. Поскольку последова- 1 Легко убедиться в том, что при х * 0 модуль к-ro члена этого ряда к! | л*| при £->оо стремится не к нулю, а к + оо. Для этого следует положить а = Д и учесть, что для И а* - любого а>0 существует предел Нт—=0 (см. пример из разд. 1.3 гл. 7). 459
тельность (17.28) является неограниченной, то при любом х^О будет неограниченной и последовательность, к-й член которой равен (17,29) Это означает, что найдутся члены (17.29) с как угодно бо- л ь ш и ми номерами к, удовлетворяющие неравенству > 1, а отсюда вытекает, что найдутся члены ряда (17.27) с как угодно большими номерами к, удовлетворяющие неравенству | ap/j > 1. Таким образом, при любом х * О для степенного ряда (17.27) нарушено необходимое условие сходимости, и этот ряд расходится. : Доказательство утверждения II. Пусть последова- тельность (17.28) является ограниченной и ее верхний предел L строго положителен. Сначала фиксируем произвольную точку х, удовлетворяющую не- равенству |х|< —,' и докажем, что степенной ряд (17.27) сходится в 1 этой точке х абсолютно. Так,как |х|< —, найдется число е>0 такое, что1 L <17-30’ 1 1 L+S 1 Так как число L является верхним пределом последовательности (17.28), то (в силу теоремы 14 из § 4 гл. 7) у этой последовательности может существовать только конечное число элементов, больших или равных числу ^ + |- Иными словами, все элементы последовательно- сти (17.28) начиная с некоторого номера к удовлетворяют неравен- ству (1М1) • f vl *1 О 1 Так как |х| < —, то L < и потому разность р-• -L является положительным - £ |х| |х| । числом, которое мы обозначим через 2е. Из равенства --£=28 вытекает, что , 11 I I 1 |х| £ + 8 = 7—г — 8 < г—так ЧТО X <-. М |х| Ь+е - 460
Из неравенств (1730) и (1731) мы получим, что начиная с некото- рого номера к справедливы неравенства , , г £ _ La— d____________= | x | • i, которые в силу теоремы 7 (т. е. признака Коши в непредельной фор- ме) устанавливают сходимость ряда Ы+Е1а*4 Л=1 . т. е. абсолютную сходимость степенного ряда (17.27). 4 .г' Фиксируем теперь произвольную точку х, удовлетворяющую нера- венству |х|>—, и докажем, что степенной ряд (17.27) расходится в L этой точке. Так как |х|>—, то найдем число е >6 такое, что1 L ' < (1732) Так как верхний предел L является одной из предельных точек, то из последовательности (17.28) можно выделить подпоследовательность п = 1, 2, сходящуюся к пределу L. По определению предела для выбранного выше числа е > 0 найдет- ся номер ЛГ(е) такой, что для всех и>ЛГ(е) ' L-E<dlak I<£ + £. . , /Ц-ЗЗ) Из (17.32) и левого неравенства (17.33) получим, что для всех n>N(e) \1\ак -х*п| = I х I • *"/| ак I > ——- = 1 и потому | ак хк” |> 1. Послед- у I п | ' уI я | _g п нее неравенство означает, что нарушено необходимое условие сходимости степенного ряда (17.27) в рассматриваемой точке х, и этот ряд расходится. Так как |х| > то L > j—-j и потому разность Z-р-1 является положительным числом, которое мы обозначим через 2е. Из равенства £-Дг = 2е вытекает, что х 11 1 £-8 = — + е> —, так что I х I >-. |х| |х| 1 1 L — z 461
Доказательство у т в е р ж д е н и я III. Пусть последова- тельность (17.28) ограничена и имеет верхний предел L = 0. Требуется доказать, что степенной ряд (17.27) абсолютно сходится для всех зна- чений х. Так как при х = 0 любой степенной ряд сходится абсолютно, то достаточно доказать, что степенной-ряд (17.27) сходится абсолют- но в любой точке х*0. Фиксируем произвольную точку х Ф 0. Так как верхний предел L равен нулю, а отрицательных предельных точек последовательность (17.28), состоящая из неотрицательных чисел, иметь не может, то чис- ло L = 0 является единственной предельной точкой последова- тельности (17.28) и потому (в силу теоремы 15 из § 4 гл. 7) число L = 0 является пределом этой последовательности, т. е. последова- тельность (17.28) является бесконечно малой. По определению бесконечно малой последовательности для поло- жительного числа е = -Д-т найдется отвечающий ему номер N (е) такой, что для всех к £ N (е) будет справедливо неравенство л,| < -J-у а по- тому для всех &>N(e) будут справедливы неравенства akxk\ = |х|* ^/|а^<^< 1, которые в силу теоремы 7 (т. е. признака Коши в непредельной форме) устанавливают для фиксированного ; нами х*0 сходимость ряда |а0| + 2 т- е- абсолютную сходи- Л=1 мость стеленного ряда (17.27). Теорема 10 полностью доказана. Теорему ГО удобно перефразировать, соединив все три ее утверж- дения в одно и обозначив через R число —, обратное верхнему L пределу L. Теорема И (теорема Коши—Адамара). Для всякого степенного ряда (17.27), если он не является рядом, сходящимся только при х = 0, ’ существует такое положительное число R (возможно, равное + оо), что этот степенной ряд абсолютно сходится для значений х, удов- летворяющих неравенству I х I < 7?, и расходится для значений х, удов- } летворяющих неравенству I х I > R. Это число R называется радиу- сом сходимости, а интервал (-R, R) — промежутком 462
сходимости степенного ряда (17.27). Для радиуса сходимости R справедлива формула Адам ара1 д = (17.34) lim */| а,.1 vi ‘I Замечание 1. На концах промежутка сходимости (-R, R), т. е. в точках x = -R и x = R степенной ряд (17.27) может как сходиться, так и расходиться. Так, оба степенных ряда ' (|735) Л=1 Л=1 Л как легко проверить с помощью формулы Адамара (17.34), имеют ра- диус сходимости 7?= 1, но первый из рядов (17.35) расходится и при х = - 1, и при х= 1 (см. пример из разд. 1.1), а второй из рядов (17.35) сходится и при х = -1, и при х= 1 (см. пример 3° из разд. 2.2). Замечание 2. Все проведенные в настоящем разделе рассуж- дения переносятся на случай степенного ряда, у которого веществен- ная переменная х заменена на комплексную переменную z = х + iy, т. е. на случай степенного ряда . <1736> *=| Для степенного ряда (17.36), если он не является рядом, сходя- щимся только npuz = 0, устанавливается существование такого ра- диуса сходимости R, определяемого формулой Адамара (17.34), что степенной ряд (17.36) абсолютно сходится для значений и, удовлетворяющих неравенству I z | < 7?, и расходится для значений z, удовлетворяющих неравенству I z I > R. Круг I z I = ^х2 + у2 < R назы- вается кругом сходимости степенного ряда (17.36). Рассмотрение комплексной переменной z оправдывает термин «ра- диус сходимости» (радиус сходимости — это радиус круга сходимо- сти). 4.2. Радиус сходимости степенного ряда, полученного формальным дифференцированием основного степенного ряда Теорема 12. Если степенной ряд (17.27) не является рядом, сходя- щимся только при х= 0, и имеет радиус сходимости R, то степенной ’Напомним, что символ обозначает верхний предел (т. е. наибольшую предельную точку) последовательности 463
ряд, полученный формальным почленным дифференцированием ряда ах+2агх + ... + (к+Х)амхк + ... = ах+^к-акхк~\ (17.37) *«2 имеет тот же радиус сходимости R и потому в силу теоремы 11 аб- солютно сходится для всех х из интервала (-R, R). Доказательство. Так как у степенного ряда (17,37) коэф- фициент, при х* равен (£+!)• ам, то по( формуле Адамара (17.34) ра- диус сходимости ряда (17.37) является обратной величиной к верхнему пределу последовательности ы' (17.38) Кратко обозначим к-й элемент последовательности (17.28) через ст*, дЛ-й. элемент последовательности (17.38) — через т*. В силу формулы Адамара (17.34) достаточно доказать, что верхние пределы последова- тельностей {ст*} и {т*} совпадают, и тем более достаточно доказать, что все предельные точки этих двух последовательностей совпадают. Из (17.38) очевидно, что ст - 1 (17-39) Т* УК+1-аы, ам-—==-Тк . лН+1 Так как limVA + 1 =1, lim +1 =1, то из (17.39) следует, что лю- к-Уао к-**> ’ бой сходящейся к некоторому пределу I подпоследовательности {стл }, п = 1, 2,... отвечает сходящаяся к тому же пределу I подпоследователь- ность {тл J, и, наоборот, любой сходящейся к некоторому пределу/' подпоследовательности {?* } п = 1, 2, ... отвечает сходящаяся к тому я же пределу I' подпоследовательность {ст4+1}. Это и означает совпаде- ние всех предельных точек последовательностей {ст*} и {т*}. Теорема доказана. Последовательно применяя теорему 12 к степенному ряду, полу- ченному однократным формальным дифференцированием ряда (17.27), затем к степенному ряду, полученному двукратным формальным диф- i ференцированием ряда (17.27) и т. д., мы придем к следующему, утвер- ждению. , - Следствие из теоремы 12. Если степенной ряд (17.27) не являет- ся рядом, сходящимся только при х= 0, и имеет радиус сходимости । R, то степенной ряд, полученный сколько угодно кратным формаль- ным почленным дифференцированием ряда (17.27), имеет тот же ра- 464
диус сходимости R и потому в силу теоремы 11 абсолютно сходится для всех х из интервала (-R, R)- 4.3. Непрерывность суммы степенного ряда внутри промежутка сходимости Теорема 13. Если степенной ряд (17.27) не является рядом, сходя- щимся только при х= 0, и имеет радиус сходимости R, то его сумма S (х) непрерывна всюду внутри промежутка сходимости (- R, R). Доказательство. По теореме Коши—Адамара (теореме 11) степенной ряд (17.27) сходится (даже абсолютно) во всех точках ин- тервала (-/?, R) к сумме, которую мы обозначим через S (х). Для дока- зательства непрерывности S(x) в любой точке х интервала (-R, R) до- статочно доказать непрерывность S (х) в любой точке х сегмента [-7? + 5, R - 8] при любом достаточно малом 8 > 0. Фиксируем произвольное достаточно малое число 8 > 0 и произво- льную точку х сегмента [-Я + 8, Я-8]. Зададим аргументу функции S(x) в этой точке х произвольное отличное от нуля приращение Дх, удовлетворяющее условию |Дх|<—. g При этом точка х + Дх будет принадлежать сегменту [-Я + —, Л-—] и будут справедливы равенства 5(х) = а0 +£Хх*> 5(х + Дх) = а0 +]^at(x +Дх)*. (17.40) Вычитая первое равенство (17.40) из второго и учитывая доказанное в § 3 утверждение 2 (о разности сходящихся , рядов), получим, что 5'(х + Дх)-5(х) = а1Дх + ^аД(х+Дх)* -х*]. (17.41) . t=2 Оценим разность, стоящую в (17.41) в квадратных скобках. Применяя к функции ? по сегменту, ограниченному точками х и (х + Дх), теоре- му Лагранжа (см. теорему 4 из разд. 2.2 гл. 11) и учитывая, что (?) - к • ?_|, мы получим, что между х и х + Дх найдется точка такая, что справедливо равенство (х + Дх)* -х* =к-^' • Дх. Вставляя послед- нее равенство в (17.41), мы получим, что 465
Достаточно доказать, что модуль суммы ряда, стоящего в (17.42) в квадратных скобках, ограничен некоторой постоянной А, не зависящей от Дх. Действительно, если это будет доказано, то из (17.42) мы полу- чим, что |5(х + Дх) -5(х)| < А-|Дх|, откуда будет следовать, что сущест- вует предел lim 5(х + Дх) = 5(х), устанавливающий непрерывность S (х) в точке х. Aw0 Согласно утверждению 1, доказанному в § 3, модуль суммы ряда, стоящего в (17.42) в квадратных скобках, не превосходит суммы соот- ветствующего ряда из модулей членов |ф2Н'Н5.Г'. Ь2 а сумма последнего ряда (в силу того что заключено между х и 5 5 х + Дх и потому принадлежит сегменту [- R + —, R - —]) не превосходит суммы А ряда (17.43) Сходимость же ряда (17.43) вытекает из того, что этот ряд является взятым в точке x = R~ — рядом из модулей членов степенного ряда (17.37), абсолютно сходящегося в силу теоремы 12 всюду на интерва- ле (-/?, R). Теорема доказана. Следствие из теорем 12 и 13. Если степенной ряд (17.27) не явля- ется рядом, сходящимся только при х = 0, и имеет радиус сходимости R, то сумма степенного ряда, полученного сколько угодно кратным почленным дифференцированием ряда (17.27), непрерывна всюду внутри промежутка сходимости (-R, R). 4.4. Дифференцируемость суммы степенного ряда внутри промежутка сходимости Мы убедились в том, что если степенной ряд (17.27) имеет радиус сходимости R>Q, тр степенные ряды, полученные сколько угодно кратным почленным его дифференцированием, сходятся абсолютно на интервале (-R, R), и их суммы являются непрерывными на этом ин- тервале функциями. Остается выяснить вопрос о том, как связаны суммы степенных ря- дов, полученных почленным дифференцированием степенного ряда (17.27), с суммой S(x) самого степенного ряда (17.27). 466
Теорема 14. Если степенной ряд (17.27) не является рядом, сходя- щимся только при х = 0, и имеет радиус сходимости R, то его сумма S (х) имеет всюду внутри промежутка сходимости (- R, R) производ- ную S'(x), являющуюся суммой степенного ряда (17.37), полученного почленным дифференцированием степенного .ряда (11.27). Доказательство. Достаточно, фиксировав любое достаточ- но малое число 5 > 0, доказать существование производной S'(x) и равен- ство этой производной сумме степенного ряда (17.37) для любого х из сегмента [- R + 5, R - б]. Фиксировав любое х из этого сегмента, задав аргументу функции S(x) в этой точке х произвольное отличное от нуля приращение Дх, |Л I 8 удовлетворяющее неравенству | Дх|< —, и повторив рассуждения, про- веденные при доказательстве теоремы 13, мы придем к равенству (17.42), которое после деления на Дх^О запишется в виде (17.44) Вычитая из обеих частей (17.44) сумму ряда (17.37) и используя доказанное в § 3 утверждение 2 о разности сходящихся рядов, полу- чим равенство S(x + Ax)-S(x) ' Дх Оценим разность, стоящую в правой части (17.45) в круглых скобках. Применяя при любом к > 2 к функции Л1 по сегменту, ограниченному точками х и ^к, теорему Лагранжа (см. теорему 4 из разд. 22 гл. 11), и учитывая, что (tk~')' = (к -1) • tк~2, мы получим, что между х и ^ найдется точка т|* такая, что справедливо равенство -хм = (к - 1)ц*"2 • (&к -х). Вставляя последнее неравенство в (17.45), получим, что S(x + Ax)-S(x) Дх ai+'^Lak’k-xk~' к=2 = ^ак’к(к-\)-ц*‘2 • (&к -х). к=2 (17.46) Достаточно доказать, что модуль суммы ряда, стоящего в правой части (17.46), не превосходит произведения А • |Дх|, где А — некото- рая не зависящая от Дх постоянная. Действительно, если это будет доказано, то мы получим, что ле- вая часть (17.46) имеет равный нулю предел при Дх->0, а это означает, 467
. .. S(x +Дх)-5(х) , J что существует предел hm—-----------— (по определению равный производной S'(x)) и этот предел равен сумме ряда (17.37). Согласно утверждению 1, доказанному в § 3, модуль суммы ряда, стоящего в правой части (17.46), не превосходит суммы соответствую- щего ряда из модулей его членов (17.47) . , к=2 . В силу того что расположено между х и х + Дх, a r|jt расположе- но между х и можно утверждать, что | £ к - х | < | Дх |, а точка гц заве- 8 8 домо принадлежит сегменту [-7?+—, R—] и потому / й 2 2 |<Хя-!Ь Таким образом, сумма ряда (17.47) не превосходит суммы ряда- (17.48) Нам остается заметить, что сходимость ряда, стоящего в (17.48) в квадратных скобках, к некоторой сумме А вытекает, из того, что этот D 8 ряд является взятым в точке х = R — рядом из модулей членов того степенного ряда, , который получается двукратным почленным диффе- ренцированием степенного ряда (17.27)1. Теорема доказана. Следствие из теорем 13 и 14. Если степенной ряд (17.27) не явля- ется рядом, сходящимся только при х = 0, и имеет радиус сходимости R, то его сумма S (х) имеет внутри промежутка сходимости (-R, R) непрерывные производные сколь угодно высокого порядка, являющиеся суммами тех степенных рядов, которые получаются при соответст- вующем почленном дифференцировании степенного ряда (17.27). 4.5. Разложение функции в степенной ряд Определение 1. Будем говорить, что функция /(х) может быть разложена в степенной р яд на интервале (-R, R) 1 Напомним, что степенной ряд, полученный двукратным почленным дифференцированием ряда (17.27), сходится абсолютно на интервале (- R, R) (в силу следствия из теоремы 12). 468
(соответственно на множестве {х}1), если сушествует степенной ряд вида (17.27), сходящийся к f(x) на интервале (-R, R) (соответст- венно на множестве {х}). Справедливы следующие утверждения. I. Для того чтобы функция f (х) могла быть разложена в степен- ной ряд на интервале (- R, R), необходимо, чтобы функция f(x) имела на этом интервале непрерывные производные сколь угодно высокого порядка. Действительно, предположим, что функция/(х) может быть раз- ложена в степенной ряд на интервале (-R, Я).. Тогда промежуток схо- димости этого степенного ряда во всяком случае содержит интервал (-R, R), а в силу следствия из теорем 13 и 14 сумма степенного ряда (совпадающая на интервале (- R, R) с функцией f (х)) обладает непре- рывными производными сколь угодно высокого порядка всюду внутри промежутка сходимости (и тем более на интервале (-R, RJy II. Если функция f (х) может быть разложена в степенной ряд на интервале (-R, R), то лишь единственным образом. ' Действительно, предположим, что функция f (х) может быть разло- жена в степенной ряд (17.27) на интервале (-R, R). Тогда в силу след- ствия из теорем 13 и 14 сумму f(x) степенного ряда (17.27) можно диф- ференцировать на интервале (-Я, Л) любое число к раз (к = 1, 2, ...), причем к-я производная f(k\x} будет на интервале (-R, R} являться суммой степенного ряда, полученного ^-кратным почленным диффе- ренцированием ряда (17.27), т. е. • . » /(‘’(х) = Л!а4+(А:+1)!аых + (Л + 2)(^ + 1)...3-ашх2+... . (17.49) Полагая в (17.49) х = 0, мы для любого к, равного 1, 2.получим равенство /*(0) = к\ • ак, из которого вытекает, что ак = -——. Пола- Л! гая х = 0 в самом разложении /(х) в степенной ряд (17.27), мы полу- чим, что ао=/(О). Итак, если функция /(х) может быть разложена в степенной ряд (17.27) на интервале (-R, Я), то коэффициенты ряда (17.27) однознач- но определяются равенствами z/пч /W(0) . , о ’ (17.50) яо=/(О)> ак= ,, при к = 1, 2.. А! • 1 Под множеством {х} понимается либо сегмент [- R, Я], либо полусегмент-!— Я, Я], либо полусегмент [-Я, Я), либо бесконечная прямая (-оо, оо), .,,,•!!• 469
Определение 2. Степенной ряд (17.27), коэффициенты которого определяются равенствами (17.50), называется рядом Тейлора функции f (х). Определение 2 позволяет следующим образом переформулировать утверждение II. III. Если функция f (х) может быть разложена в степенной ряд на интервале (- 7?, R), то этот степенной ряд обязательно является ря- дом Тейлора функций /(х). • Сойоставляя утверждения I й III с теоремой о разложении функций /(х) по' формуле Тейлора (см. теорему 10 из § 5 гл. 11), мы приходим к следующему утверждению. ( -IV.- Длятого чтобы функция f(x) могла быть разложена в сте- пенной ряд на интервале (-R) (соответственно на множестве {х}), необходимо и достаточно, чтобы эта функция имела на интер- вале (-R, R) (соответственно на множестве {х}) непрерывные произ- водные любого порядка и чтобы остаточный член R^\(x) в разложе- нии этой функции по формуле Маклорена стремился к нулю при п—><п на интервале (-R, R) (соответственно на множестве {х}). В разд. 7.1 и 7.2 гл. 11 было доказано, что остаточные члены в разложении по формуле Маклорена функций ех, cosx и sinx стремятся к । нулю для всех значений х (т. е. на всей бесконечной прямой -оо < х < +оо), а остаточный член в разложении по формуле Маклорена функции 1п(1 +х) стремится к нулю на полусегменте -1 <х< 1. .. В ,силу утверждения .IV это приводит нас к следующим разложени- ям в степенные ряды: . (17-51) cosx = ел = 1+А—> -1)*-х“ (2^)! к-\ „2к-\ (17.52) (17.53) (17.54) sinx = У -— ------, w (2Л-1)! 1 а ч ^(-1)*-'-х* 1п(1 + х) = 2,-У^--- К t-i Ряды' (17.51), (17.52) и (17.53) сходятся (причем даже абсолютно) для всех значений * (это можно установить и из формулы Адамара (17.34), согласно которой радиус сходимости R каждого из этих трех разложений равен +а>). v РяЛ (17.54) в силу установленных в разд. 7.2 гл. 11 оценок остаточ- ного члена 7?л+1(х) сходится на полусегменте -1 <х< 1. Из формулы 470
Адамара (17.34) можно сделать заключение о сходимости разложения (17.54) (причем даже абсолютной) только на интервале -1<х<1. 4.6. Элементарные представления о функциях комплексной переменной В замечании 2 разд. 4.1 мы уже указали, что теорема 11 (Коши—Адамара) переносится на случай степенного ряда, у которого вещественная переменная х заменена на комплексную, переменную z = x + iy. Степенные ряды такого типа используются для определения функций комплексной переменной z. Так, в полной аналогии с разложениями (17.51), (17.52) и (17.53) функции е:, cos z и sin z комплексной переменной z определяются как суммы следующих рядов: , ег=1 + £4 Як! cosz = l+> -—---------, ы (2Лг)! ф(-1)*-'.гц-' (2к - (17,55) (17.56) (17.57) Указанные три ряда абсолютно сходятся для всех значений z (ибо их радиус сходимости R равен +оо). Установим связь между функциями е1, cosz и sinz. Заменяя в раз- ложении (17.55) z на zz, получим 1г . . (zz)2 (zz)3 (zz)4 (zz)5 2! 3! 4! 5! z2 z4 1-—+— 2! 4! .1 z z + z z--------+----- I 3! 5! (17.58) Сопоставляя правую часть равенства (17.58) с разложениями (17-56) и . (17.57), мы придем к следующей замечательной формуле: еа = cos z + i sinz. (17.59) Формула (17.5?) играет фундаментальную роль в теории функций комплексной переменной и называется формулой Эйлера.. 471
Полагая в формуле Эйлера (17.59) переменную z сначала равной вещественному числу х, а затем равной вещественному числу -х, мы получим соотношения е,х = cosx + f-sinx, e~lx = cosx-f-sinx, посредством сложения и вычитания которых устанавливаются выраже- ния функций cosx и sinx через показательную функцию е* + e~ix . eix - e'ix COS X =-------, sin X =-------. 2 2i В заключение остановимся на определении логарифмической функции w = In z комплексной переменной z. Эту функцию естественно определить как функцию, обратную к показательной функции, т. е. из соотношения z = е"’. Полагая w = и + h>, z = х + iy, поставим перед собой цель — выразить и и v через z = х + iy. Из соотношения z = x + iy= = e"(cosv+ zsinv) получим, используя понятия модуля и аргумента комплексного числа (см. § 5 гл. 2), |z| = -Jx2 + у = е", argz = v-2nk, где к = 0, ± 1, ± 2, .... Из последних равенств находим, что и = ln| z\ = In фс2 + У, v = argz + 2пк (к = 0,± 1,± 2, ...) или окончательно Inz = ln|z|+ /(argz+ 2пк\ где к = 0,± 1,± 2, ... (17.60) Формула (17.60) показывает, что логарифмическая функция в комплексной области не является однозначной: ее мнимая часть для одного и того . же z имеет бесчисленное множество значений, отвечающих различным к = 0, ± 1, ± 2, .... Аналогичная ситуация будет иметь место и при определении в комплексной области обратных тригонометрических функций. § 5. Краткие сведения о рядах Фурье 5.1. Понятия ортонормированной системы и ряда Фурье Исторически идея разложения функции в тригонометрический ряд Фурье возникла в связи с необходимостью разложения описываемого периодической функцией периодического процесса по элементарным гармоникам. Более современная математическая идея разложения функции в любой (и, в частности, в тригонометрический) ряд Фурье — это идея разложения по ортонормированному базису в бесконечномерном про- странстве. 472
Рассмотрим пространство L [- /, /], состоящее из всех интегрируе- мых на сегменте [-1, /] функций. Введем понятие скалярного произведения двух элементов этого пространства, т. е. понятие скалярного п р о и з в е д е н и я двух интегрируемых на сег- менте [-1, /] функций f(x) и g (х), обозначив это скалярное произведе- ние символом (4 g) и определив равенством ,f ч г (17.61) (f, g) = }f(x)-g(x)dx. । -i Интеграл (17.61) существует, ибо в силу свойства 3° из § 3 гл. 13 произведение двух интегрируемых на сегменте [-1, Z] функций являет- ся интегрируемой на этом сегменте функцией. Введенное скалярное произведение обладает теми же свойствами, что и скалярное произведение геометрических векторов, изученное в § 2 гл. 4, а именно следующими свойствами: 1°. (/> g)= (g, f) Для любых двух йнтегрируемых на сегменте [-1, /] функций f(x) и g (х); 2°. (f+g, h) = (f, h) + (g, h) для любых трех интегрируемых на сег- менте [- /, /] функций f (х), g (х) и h (х); 3°. (1 •/, g) = X • (4 g) для любого вещественного числа X и любых интегрируемых на сегменте [-/, /] функций /(х) и g(x); 4°. (f, f) > 0 для любой интегрируемой на сегменте [- /, /] функции /(х). Справедливость свойства 1° сразу вытекает, из определения ска- лярного произведения равенством (17.61). Справедливость свойств 2° и 3° вытекает из линейного свойства интеграла (см. свойство 2° из § 3 гл. 13), а справедливость свойства 4°, i заключающегося в неравенстве (f, f) = j f2(x)dx> 0, непосредственно вытекает из свойства 5° § 3 гл. 13. Назовем нормой любой интегрируемой на сегменте [-1, /] фун- кции f (х) неотрицательное число, обозначаемое символом ||/|| и равное ||/|| = = Jff2(x)dx. (17.62) i V-/ Две интегрируемые на сегменте [- /, /] функции /(х) ng (х) назо- вем ортогональными, если их скалярное произведение (17.61) равно нулю. 473
Рассмотрим в пространстве L [-1, /] всех интегрируемых на сег- менте [- /, /] функций бесконечную последовательность функций уо(Д \|/i(x), V2OO, •••> Wk(x), кратко обозначаемую символом {\|/*(х)}. Определение 1. Последовательность функций {\|/а(х)} называется о р т о н о р м и р о в а н н о й' (в L[-19 /]) системой, если все входя- щие в эту последовательность функции попарно ортогональны и нор- ма каждой функции равна единице. Классическим примером ортонормированной в пространстве L [-1, /] системы является так называемая тригонометрическая система . Гл. V Гл. sin — kx cos — kx YoW = ^j>Ym-iW = - (17.63) при k = 1, 2, ... Читатель без труда проверит, что для любых целых неотрицатель- ных т и п / Ч f / Ч Z Ч f [О ПРИТИХ П, (Vm»Vn) = J Ym(17.64) [1при/и = л. Другие ортонормированные в пространстве £[-/,/] при различных I > 0 системы возникают при решении ряда задач математической фи- зики. Приведем в качестве примера систему так называемых нормиро- ванных полиномов Лежандра ш0(х) = -?=, Y.(x) = J& +------г---------г2-*, А = 1, 2, .... То у/2 ‘ V 2 Ш* (dx)k являющуюся ортонормированной системой в пространстве L [- 1, 1] всех интегрируемых на сегменте [-1, 1] функций. Рассмотрим в пространстве L [-1, /] всех интегрируемых на сег- менте [-/, /] функций произвольную ортонормированную систему Ш*)}- Определение 2. Рядом Фурье произвольной интегрируемой на сегменте [-/, /] функции f(x) по ортонормированной в простран- стве L [-1, /] системе {у*(х)} называется ряд вида (1765> *=0 в котором числа fk, называемые коэффициентами Фурье функции f(x) по системе 0|/*(*)}> определяются равенствами 474
y*=(/,Vj = j/(xW*)^- • " ' (17.66) -/ ' *- Установим одно важное свойство коэффициентов Фурье Д. 5.2. Неравенство Бесселя и следствия из него Теорема 15. Для произвольной ортонормированнойв пространст- ве L[-l, /] системы {ул(х)} и произвольной интегрируемой на сегмен- те /] функции f(x) сходится ряд > i / , £л= . ьо из суммы квадратов коэффициентов Фурье fk функции f (х) по систе- ме {\|/л(х)}. Более того, для суммы ряда (17.67) справедливо следую- щее неравенство: tf‘ £|ИГ• -< . ..('?-б8) А=0 "/ ’ г- ' называемое неравенством Бесселя. ‘ Доказательство. Для любого номера п рассмотрим неотри- цательный квадрат нормы . ’ ||Z-/o-Vo -/|-Y|---fn •'Ил||2 J:.-.-’ . . = (f -A .-'Vo ~fi -Vi -•••-/. 'V.’f-fi -V! -fi-.Vt -••-Д.-М'Д: ' j(17.69) • В силу свойств 1°—3° скалярного произведения (см. разд. 5.1), ра- венства (17.64), вытекающего из ортонормированностй' системы {\|/t(x)}, и выражения (17.66) для коэффициентов Фурье Д квадрат нор- мы (17.69) равен " ' ? : < -!‘s V,n-V, •СЛЧ'.НЛ•</.4-,)+...+/. •y,v.)] + «'.!+/c +-,+/?)'= ' =И’-2£л‘=|ИГ-tfi- - - . к^О k^Q к=0 Так как квадрат нормы (17.69) неотрицателен, то мы получим, что для любого номера п справедливо неравенство ||/||2 - > 0, а *=о потому и неравенство 2/^И’- -(17-70) I 475
Слева в неравенстве (17.70) стоит частичная сумма Sn с любым но- мером п ряда (17.67), и потому неравенство (17.70) означает, что все частичные суммы ряда с неотрицательными членами (17.67) ограни- чены числом ||/||2. Из этого в силу теоремы 2 из § 2 вытекает сходи- мость ряда (17.67). Переходя в неравенстве (17.70) к пределу при и-»оо и используя теорему о предельном переходе под знаком неравенства (см. теорему 8 из разд. 1.4 гл. 7), мы получим, что сумма ряда (17.67) удовлетворяет неравенству Бесселя (17.68). Теорема доказана. Следствие из теоремы 15. Для любой ортонормированной в про- странстве L[-l, /] системы {\|/*(х)} и любой интегрируемой на сег- менте [-/,7] функции f(x) последовательность {Д} коэффициентов Фурье функции f(x) по системе {\|4-(х)} является бесконечно малой. Действительно, достаточно воспользоваться необходимым услови- ем сходимости ряда (17.67), заключающимся в стремлении к нулю его k-ro члена (см. следствие 1 из теоремы 1). В дальнейшем мы сосредоточимся на изучении ряда Фурье по три- гонометрической системе (17.63), отвечающей случаю / = л, т. е. будем рассматривать в пространстве L [- л, л] всех интегрируемых на сег- менте [—л, л] функций ряд Фурье по тригонометрической системе ' ч 1 ' ч sin(Ax) . . cos(fcc) VoM = -f=> Ya-iW = —7=-^, V2*W =— yJ2n Vn 'xlit при k= 1, 2, ... Ряд Фурье по этой системе, называемый тригонометри- ческим рядом Фурье, имеет вид sin(Ax) cos(fo) Ч1к 7= л/л (17.71) где для коэффициентов Фурье fk справедливы равенства л К •К П -д при к = 1, 2, ... •К (17.72) Однако общепринята другая (эквивалентная (17.71) и (17.72)) за- пись тригонометрического ряда Фурье и его коэффициентов. 476
Следуя установившейся традиции, мы будем записывать тригоно- метрический ряд Фурье в виде . —+ • cos(foc) + bk sin(Ax)} 2 к=\ (17.73) При этом для коэффициентов at и Ьк, называемых тригономет- рическими коэффициентами Фурье, будут справед- ливы следующие равенства: -к а =2^ = 1 ° я «* = Ф = - J Лу) cos(Ay)<Zy, bk = = - j Л У) sin(Ay)</y, к = 1,2,.. Vn «Л л/л «4 (17.74) При такой форме записи тригонометрического ряда Фурье и его коэффициентов и с учетом равенства I = я неравенство Бесселя (17.68) принимает вид а02 2 гЛ\1 f /*2/ (17.75) -Г- + 2Ж + Ь1•) - - [ f (x)dx. 2 *=I itiK Так как неравенство Бесселя (17.75) справедливо для любой только интегрируемой на сегменте [-я, я] функции/(х), то, используя необ- ходимое условие сходимости для ряда, стоящего в левой части (17.75) (см. следствие 1 из теоремы 1), мы придем к следующему утвержде- нию. Теорема 16. Тригонометрические коэффициенты .Фурье = - f /(у) • cos(Ay)Jy и bk = - J j\y) • sm.(ky)dy , "Л *-п любой интегрируемой на сегменте [-я, я] функции f(x) стремятся к нулю при к—ко. Следствие из теоремы 16. Для любой интегрируемой на сегменте [-я, я] функции F(x) числовая последовательность {с*} с членами сь (17.76) является бесконечно малой. 477
Доказательство. Пользуясь равенством • I , 1 ) sm \ к + - у I 2/ у у = sin • cos(£y) + cos • sin(Ay), представим ck в виде суммы q=-f F(y)-sin^ л<_ 2. 1 п cos(ky)dy + — f F(y)-cos— sin(ArWy nL_ 2 ’~K«- (17.77) и заметим, что в правой части (17.77) стоит сумма коэффициента Фу- рье ак интегрируемой функции F(_y)-sin-^ и коэффициента Фурье 6* интегрируемой функции F(y)-cos-^ . 5.3. Выражение для »-й частичной суммы тригонометрического ряда Фурье В дальнейшем нам удобно будет предположить, что функция f(x) задана на всей бесконечной прямой -оо<х<оо и является перио- дической функцией периода 2л, т. е. для любого х из бесконечной прямой удовлетворяет условию f(x + 2л) = f (г). Кроме того, мы-будем считать функцию f(x) интегрируе- мой на сегменте [-л, л], ибо без этого предположения нельзя вычислить ее коэффициенты Фурье и рассмотреть ее ряд Фурье. Заметим, что, предположив функцию f(x) интегрируемой на сег- менте [—л, ijt], мы в силу ее периодичности.с периодом 2л получим, что функция /(г)-является интегрируемой на любом конеч- ном сегменте. Докажем следующее простое утверждение. > Лемма. Если функция f(x) периодична с периодом 2л и интегриру- ема на сегменте [- л, л], то все интегралы от этой функции по любо- му сегменту длины 2л равны друг другу, т. е. для любого числа х спра- ведливо равенство (17-78) -n-х -п Доказательство. В силу свойства аддитивности интегра- ла (см. свойство 4° из § 3 гл. 13) 478
j./ (y)dy = jf(y)dy + j f(y)dy + j f(y)dy, (17-79) -Л-Х -Л-Х —Л Л причем последний интеграл в правой части (17.79), у которого верх- ний предел интегрирования п -х оказывается меньше нижнего предела Л л (в случае, если х> 0), можно понимать как -J j\y)dy (в силу свой- ства 1° из § 3 гл. 13). Итак, равенство (17.79) можно переписать в виде jf(y)^y=jf(y)dy+ff(y)dy-ff(y)dy, -Л~Х -л-х -л л-х и для доказательства справедливости .равенства (17.78) достаточно до- казать, что J f(y)dy - j f(y)dy=0, -л-х л-г а справедливость последнего равенства' вытекает из того, что так как /(у)=/(у+2л) (в силу условия периодичности), то с помощью замены <=у+2л мы получим, что \ -Л -л Л Л } J f(y)dy = J f(y+2л) dy = J f(t)dt = J f(y)dy. -л-х -л-х л-х л-х Лемма доказана. Вычислим теперь в произвольной точке х0 сегмента [- л, л] n-ю ча- стичную сумму Sn (х0, f) тригонометрического ряда Фурье (17.73) • S„(x0,f) = ^- + ^[ak-cos(kx0) + bk -sin(Ax0)] ' <17-80> 2 *=i ' л для произвольной периодической с периодом 2л и интегрируемой на сегменте [-л, л] функции /(х). ? • Подставляя в правую часть (17.80) значения (17.74) коэффициентов Фурье, мы получим, что (х0 ,/) = -? /О')] | i [cos(jty) • cos(Ax0) + sin(Ay) • sin(Ax0 )]l dy= 12 ы 4 J = - f+ £cos[A(y-x0)]ldy. n-n (2 ы J 479
Сделав замену переменной интегрирования y = xQ +1, мы придем к ра- венству Так как подынтегральная функция в последнем интеграле является периодической функцией периода 2л и интегрируема по любому ко- нечному сегменту, то в силу леммы (а точнее, в силу равенства (17.78)) мы получим, что ^cos(Zrf) dt. м (17.81) Остается подсчитать сумму, стоящую в (17.81) в квадратных скоб- ках. Так как для любого номера к 2sin-cos(Ar) = sin I к +i и 2 I 2) то, суммируя последнее равенство по всем к, равным 1, 2, ..., п, мы придем к соотношению . t -sin-. 2 Поделив последнее соотношение на 2sin-, мы получим, что Сопоставляя последнее равенство с (17.81), мы окончательно полу- чим следующее выражение для (хо, У): 480
S„(x0,/)=if/(xo+O л_„ n + - |f sin 2sin- 2 (17.82) Замечание. Так как для функции /(х)s 1 все частичные сум- мы S„ (хо, 1) с любым номером пив любой точке хо равны единице, то из (17.82) мы получим справедливое для любого номера п равенство п-я 2sin- 2 (17.83) 5.4. Принцип локализации Римана Мы сейчас установим одно замечательное свойство тригонометри- ческого ряда Фурье любой периодической с периодом 2л и интегриру- емой на сегменте [-л, л] функции/(х). Теорема 17 (принцип локализации Римана). Если функция f(x) только периодична с периодом 2л и интегрируема по сегменту [- л, л], то поведение тригонометрического ряда Фурье этой функции в про- извольной точке х0 (т. е. вопрос о том, сходится или расходится этот ряд в точке х0) зависит исключительно от поведения функции /(х) в как угодно малой окрестности точки Хо. Замечание. Точка хо не обязательно принадлежит сегменту [- л, л], она может являться произвольной точкой бесконечной прямой (-00, оо). Доказательство. Фиксируем произвольное как угодно ма- лое число 5 > 0 и установим, что вопрос о том, сходится или расходит- ся тригонометрический ряд Фурье функции f (х) в точке хо, зависит то- лько от поведения функции /(х) на сегменте [xq-5, хо + 5]. Действительно, пользуясь свойством аддитивности интеграла (см. свойство 4° из § 3 гл. 13) и считая 5 меньшим л, мы можем перепи- сать равенство (17.82) в виде* 1 Интеграл по множеству 5 £ 1t1 £ л является суммой интегралов по сегментам [8, л] и [-л, -8]. 481
• ( 1 I sin л + - r id' I 9 I (*o, /)=- f Ж + 0 — 71-* 2sin- 2 Л+- f f(x0+t) Я 5s| l |Slt . • t 2sm- 2 (17.84) Обозначим через g (г) кусочно непрерывную (а потому и интегри- руемую) на сегменте [-л, л] функцию вида О g(0 = ^—1 2sin- 2 при 0 < 111 < 5 при 8 < | /1<л и положим F(t)= f(xQ + t)-g(t). Тогда второй интеграл в правой части (17.84) можно переписать в виде 1 п + - 2 - f Ж + О Л 6ф|<п о • t 2sin- 2 Так как функция F(0, являющаяся произведением двух интегриру- емых на сегменте [-л, л] функций/(х0 + 0 ng(t), сама является ин- тегрируемой на этом сегменте, то в силу следствия из теоремы 16 вто- рой интеграл в правой части (17.84) стремится к нулю при п-мо. Стало быть, вопрос о сходимости или расходимости тригонометри- ческого ряда Фурье в точке хо решает только первый интеграл в пра- вой части (17.84), а этот интеграл зависит только от значений функции /(х) на сегменте [х0-5, х0 + 5]. Теорема доказана. 5.5. Условия сходимости тригонометрического ряда Фурье Мы только что убедились в том, что для любой только периодиче- ской с периодом 2л и интегрируемой по сегменту [-л, л] функции/(х) вопрос о сходимости ее тригонометрического ряда Фурье в данной точ- ке х0 определяется лишь поведением функции /(х) в как угодно малой окрестности точки хо- Приступим теперь к решению вопроса о том, ка- кое поведение функции /(х) в малой окрестности точки хо гарантирует сходимость ее тригонометрического ряда Фурье в этой точке. 482
Определение 1. Будем говорить, что функция /(х) у д о в л е.т - воряет в данной точке % справа (соответст- венно слева) условию Липшица, если, во-первых, у этой функции существует в точке хо конечный правый предел f(xo + 0) (со- ответственно конечный левый предел /(хо-О)) и, во-вторых, сущест- вуют такие постоянные М>0 и 5 > 0, что |/(х0 +1) - f(xQ +0)| < М • t при 0<t<8 (соответственно |/ (х0 +1) - f (х0 - 0)| < М • 111 при -8<t<0). Справедливо следующее утверждение. Теорема 18. Если функция /(х) является периодической функцией периода 2 л, интегрируемой по сегменту [- л, л], и, кроме того, удов- летворяет в данной точке х0 условию Липшица как справа, так и сле- ва, то тригонометрический ряд Фурье функции f (х) сходится в точке Ж +О)+/(хо -0) х0 к значению 2 В частности, если при этом функция f (х) является непрерывной в точке хо, то f(xQ + О)=/(хо -0)= /(х0), и тригонометрический ряд Фурье функции f(x) сходится в точке х0 к значению /(хо). Замечание. Точка хо в формулировке теоремы 18 не обязате- льно лежит на сегменте [-л, л], она может являться произвольной точкой бесконечности прямой (-оо, оо). Доказательству теоремы 18 предпошлем два вспомогательных утверждения. Определение 2. Заданную либо на всей бесконечной прямой, либо на сегменте [- л, л] функцию f(x) будем называть четной (соот- ветственной нечетной), если f(-x) = f(x} (соответственно f(-x} = -f (г)) для всех х из области ее задания. Утверждение 1. Если функция f(x) интегрируема на сегменте [-л, л] и является на этом сегменте четной (соответственно нечетной), то К К к | f(x)dx = 2| f (x)dx (соответственно j f (x}dx = 0). -я 0 , -к Для доказательства этого утверждения достаточно воспользоваться равенством j/(x)dr=f/(x)c& + j/(x)dr (17.85) —к -к 0 и в первом из интегралов в правой части (17.85) сделать замену пере- менной х = -у. Мы получим при такой замене, что 483
Од к J f(x)dx =J f(-y)dy=J f(-x)dx = -к О О я | f(x)dx в случае четной функции/(х), о я —J f(x)dx в случае нечетной функции f(x), что и доказывает утверждение 1. Применяя утверждение 1 к интегралу (17.83), подынтегральная функция которого является четной, мы получим соотношения • 7 • ГГ И' ? К = 1 LI п0 2sin- 2sin7 2 2 2 (17.86) Утверждение 2. Существует число 5о > 0 такое, что для всех t9 удовлетворяющих условию 0< 111 < 80, справедливо неравенство Id . 7“П<2, (17.87) Т1П2 Действительно, согласно первому замечательному пределу (см. разд. 7.2 гл. 9)" . t sin- lim—- Г—>0 t 2 = 1, так что и lim t->0 2 sin - 2 и по определению предела для любого е > 0 и, в частности, для 6=1 найдется число 5q > О такое, что 0< <2 при 0<111<50. 2 sin - J 2 Доказательство теоремы 18. Так как по условию функция /(х) удовлетворяет в точке х0 условию Липшица как справа, так и слева, то найдутся постоянные М\ > 0, 51 > О, М2 > 0 и 82 > О та- кие, что |/(*о + 0 “ Л*о + 0)| Л/] • t при 0 < t < 8Ь |/(х0 +/) -/(х0 -0)|< Мг -| /| при -32 < t < 0. 484
Обозначив через М наибольшее из двух чисел М\ и Л/2з а через 8 — наименьшее из двух чисел 81 и^Зг, мы получим, что для всех t, удов- летворяющих условию 0< 111 < 8, справедливо неравенство |Ж ±0)|<М-|4 (17.88) в котором знак «+» берется для положительных значений t, а знак «-» берется для отрицательных значений t. Из равенств (17.82) и (17.86) вытекает, что Ж +о)+Ж -0) (17.89) . о sin +^[Ж+')-Ж-о)]— | п + i К i---- 2sin- 2 Достаточно доказать, что разность', стоящая в левой части (17.89), яв- ляется бесконечно малой при п->оо, т. е. доказать, что для любого чис- ла е > 0 найдется номер N такой, что модуль указанной разности мень- ше е для всех номеров п, удовлетворяющих условию n>N. Фиксируем произвольное число £ > 0 и по нему число 5 > 0, мень- шее л и настолько малое, чтобы оно было меньше числа 5о, гарантиру- ющего справедливость неравенства (17.87), меньше числа 5, гаранти- рующего справедливость неравенства (17.88), и, кроме того, удовлет- воряло условию (17.90) п 4’ в котором М — постоянная из неравенства (17.88). . Пользуясь свойством аддитивности (см. свойство 4° из § 3 гл. 13), разобьем каждый из интегралов, стоящих в правой части (17.89), на сумму двух интегралов, т. е. представим равенство (17.89) в виде +Q)+^(X^ = A„ +В„ +С„ +Dn, (17.91) 485
где Л=-|[№+О-/(хо+о)]- 71 о .1 п+- 2 _ • * 2 sin- 5„=ij[/(xo+O-/(xo+O)]- , о sin C„=if[/(x0+O-/(Xo-0)]----- »+n i-- 2sin- 2 (Uiyi ' ll VI*. 2sin- 2, -5 S*n ^=^f[/(xo+O-/(xo-O)]---- Докажем, что для любого номера п справедливы нера- венства К1<| 1с-1<| (17.92) Ограничимся доказательством первого неравенства (17.92), ибо второе доказывается аналогично. Используя неравенства ( неравенства sin п + - |/ 2) 7.87) и (17.88) для случая t>0, а также < 1 и (17.90), получим, что ”1 ” 4 Остается доказать, что для фиксированного нами произвольного числа е > 0 найдется номер W такой, что для всех номеров п, удовлет- воряющих условию n>N, справедливы неравенства (17.93) а для этого достаточно доказать, что каждая из последовательностей {£„} и {/)„} является бесконечно малой. 486
Если ввести в рассмотрение кусочно непрерывную. на сегменте [- л, л] (а потому и интегрируемую на этом сегменте) функцию g (?) вида О при - л< ? < 3, g(0=- 1 _ • * 2sin- 2 приЗ< t< л; и положить F(t) = [f(x0 +f)-f(x0 +0)]-g(?), то последовательность {Вп} можно переписать в виде Так как функция F (?), являющаяся произведением двух интегриру- емых на сегменте [- л, л] функций [/(х0 + ?) - f (х0 + 0)] и g (?), сама является интегрируемой на этом сегменте функцией, то в силу следствия из теоремы 16 последовательность {£„} является бесконечно малой. Для последовательности {£•„} рассуждения аналогичны, только функцию g (?) следует взять равной —-— при - л < ? <-8 и равной 2sin- 2 нулю при -3 < ? < л, а функцию F (?) равной [/(х0 +t)-f (х0 - 0)] • g(?). Итак, неравенства (17.93) доказаны для всех n>N. Из равенства (17.91) и неравенств (17.92) и (17.93) вытекает, что для всех номеров п, удовлетворяющих условию п > N, справедливо неравенство 5ДХо>/)_Ж+о)+Ж 1О)<е> и доказательство теоремы 18 завершено. Замечание к теореме 18. Функция f (х) будет удовлетво- рять в данной точке Хо условию Липшица как справа, так и слева, если эта функция имеет в точке хь конечные правый и левый пределы /(х0 + 0) и f (х0 - 0) и конечные правую и левую производные, опреде- ляемые пределами (х0 + 0) = lim+0\ и /->0+0 £ Г (*о -0) = lim ~0). 740 7 /->0-0 I 487
На практике часто приходится иметь дело с функциями, не являю- щимися периодическими или вообще заданными только на сегменте [-л, л] и дифференцируемыми или кусочно дифференцируемыми на этом сегменте. Функция f(x) называется кусочно дифференцируе- мо й на сегменте [-л, л], если с помощью конечного числа точек - л = х0 < *i < Х2 <... < хт = л сегмент [- л, л] разбивается на т частич- ных сегментов [х^, xj, к = 1, 2, ..., т, внутри каждого из которых функция f (х) непрерывна и дифференцируема, а на концах каждого из которых функция /(х) имеет конечные односторонние пределы /(xjt-i+0) и /(х*-0) и конечные односторонние производные 2-1/ 1- f(xk 1 +t)~f(xk । +0) f (xk. +0) = lim ' —7 11--- J v ‘ 1 ’ i->MI t a\ 1- f(xk +t)-f(xk-0) f• (xk -0) = lim Чтобы применить к такой функции Дх) теорему 18, продолжим ее периодически, т. е. рассмотрим функцию /*(х), совпадающую с Дх) при - л < х < л, равную f (-л) при х = л и определяемую за пределами сегмента [-л, л] из соотношения /*(х + 2л) =/*(х). Так как посчитанные по сегменту [-л, л] коэффициенты Фурье функции Дх) совпадают с соответствующими коэффициентами Фурье функции/*(х) и Дх) = /*(х) всюду внутри сегмента [- л, л], то в силу теоремы 18 и замечания к ней тригонометрический ряд Фурье любой кусочно дифференцируемой на сегменте [- л, л] функции f (х) сходит- ся в каждой точке сегмента [- л, л], причем он сходится к значению Дх) в каждой внутренней точке х каждого частичного сегмента [х*.ь xj, Дх*+0)+/(х4-0) сходится к значению ----- в каждой лежащей внутри 2 [- л, л] точке Хк стыка двух частичных сегментов и сходится к Д-л+0) + Дл-0) значению —--------——------- в точках х = л и х = -л. 2 '• ' Подчеркнем, что при этом значения разлагаемой функции Дх) в точках Хк стыка частичных сегментов и в точках х = л и х = -л не ока- зывают никакого влияния ни на величину коэффициентов Фурье функ- ции Дх)1, ни на сходимость ее тригонометрического ряда Фурье. 'Напомним, что в силу замечания 1 к теореме 1 из разд. 1.3 гл. 13 изменение значений функции f (х) в конечном числе точек не влияет ни на интегрируемость/(х), ни на величину интеграла от нее. 488
5.6. Заключительные замечания Если интегрируемая на сегменте [-л, л] функция f(x) является ч е т н о й, то для любого номера к функция /(х) • sin (кх) является не- четной и потому (в силу утверждения 1 из разд. 5.5) все коэффициен- 1 п ты Фурье bk =— j/(y)sin(Ay)dy равны нулю. Таким образом, четная функция f(x) разлагается в тригонометрический ряд только по коси- нусам, т. е. в ряд — + ^aA.cos(Ax). 2 *=1 Аналогично с помощью того же утверждения 1 устанавливается, что нечетная функция f(x) разлагается в тригонометрический ряд только по синусам, т. е. в ряд ^^sin(Ax). > 1=1 Наконец, заметим, что все результаты настоящего параграфа оста- ются справедливыми и в случае, если вместо сегмента [-л, л] взять сегмент [-/, /] с любым Z>0. В этом случае тригонометрический ряд Фурье любой интегрируемой на сегменте [-/, /] функции f (х) имеет вид I п, ] , . ак cosl — кх l + otsin| 2 а коэффициенты ао, ак и Ьк определяются равенствами 1 £ к=\, 2, ... Дополнение к главе 17. Формула Стирлинга В этом дополнении, используя изложенные в § 5 гл. 13 основные методы интегрирования, введенное в § 8 гл. 13 понятие несобственно- го интеграла и вычисленное в § 4 гл. 16 значение у(2п несобственного х2 интеграла ( е 2 dx и опираясь на то, что сумма степенного ряда (как J—оо доказано в разд. 4.4 гл. 17) имеет внутри промежутка сходимости не- прерывные производные любого порядка, мы оценим порядок роста величины п! при стремлении номера п к бесконечности. Наша цель — установить.,для л! соотношение л!=-72лл — (17.94) 489
в котором символ а п обозначает элемент бесконечно малой последова- тельности {а,,}. Соотношение (17.94) называется формулой Стирлинга. 1°. Прежде всего докажем, что для любого номера п несобственный интеграл1 jУ' -e ydy сходится к значению л!, т.е. докажем равенство о л! = | У • eydy. о Достаточно доказать, что существует равный п\ предел я lim 'в- -dy. , о Производя л-кратное интегрирование по частям, получим я (17.95) (17.96) / Уe'dy = [-/еу ] + л/ y"~'eydy = [-ye“v - пу^1е у ] о ° о я 5 о о я + о j У“2е‘*’ф о лУ“1е •’ - п(п - 1)У'““е (17.97) Я * к ё - 1)(л - 2)... 2уе у ] + л!J eydy = 0 о = -RneR -nRn~'eR - л(и- 1)/Г"Vя п существует равный нулю предел п1Еек + п1(1-ея). X Переходя в равенстве (17.97) к пределу при А—>-юо и учитывая, что для любого целого неотрицательного Rn lim[7?VA]= lim— (см. пример в конце разд. 4.2 гл. 11), мы установим Я-н-х R-+t-x существование равного л! предела (17.96). 2°. Сделаем теперь в интеграле (17.95) замену переменной у = n(\ + x\dy= ndx. Тогда, учитывая, что У = ля(1 + х)”= ляе*1п(кл),е’/ = е‘я(кдс) = еп -е‘пх, мы получим, что (17.98) Введем в рассмотрение функцию t = g(x), определяемую равенством t = (х) = f~V^“ln(l+x) При -1 < X <0, (17.99) 1+7x-ln(i+ x)при 0 < X < +00, и убедимся в том, что функция t-g(x) возрастает и непрерывна на открытой полупрямой -1<х<+оо, имеет на этой полупрямой непрерывные производные 1 Напомним, что переменную под знаком любого определенного (и, в частности, несобственного) интеграла можно обозначить любой буквой. Нам удобно обозначать эту переменную через у. 490
любого порядка и что множеством ее значений является бесконечная прямая -оо < t < +оо. Л Действительно, из равенства g2 *(x) = х - 1п(1 + х) (17.100) и из того, что каждая из функций х и 1п(14-х) непрерывна и имеет непрерывные производные любого порядка на полупрямой -1 < х < -ню, вытекает, что и функция g~(x) непрерывна и имеет непрерывные производные любого порядка на полупрямой -1 < х < 4-00. Далее, из равенства ах 14-х (17.101) и из того, что правая часть (17.101) отрицательна при -1<х<0 и положительна при 0 < х < 4-оо, вытекает, что функция g2(x) убывает при -1 < х < О и возрастает при 0 < х < 4-оо, откуда в силу того, что g2(0) = 0, следует, что функция g2(x) строго положительна и при -1 < х < 0, и при 0 < х < 4-оо, и что функция t = g(x) возрастает на всей полупрямой -1 < х < -ню. Заметим теперь, что из того, что функция g2(x) непрерывна и имеет непрерывные производные любого порядка в любой точке полупрямой -1 <х < -ню и всюду на этой полупрямой, кроме точки х = 0, положительна, вытекает, что и функция g(x) непрерывна и имеет непрерывные производные любого порядка всюду на полупрямой -1 <х < -ню, кроме, быть может, точки х - 0. Чтобы доказать, что функция g(xj непрерывна и имеет непрерывные производные любого порядка и в окрестности точки х = О, достаточно доказать, что функция g(x) разложима в окрестности точки х = 0 в степенной ряд. Так как в силу разд. 4.5 гл. 17 функция 1п(14-х) разложима в степенной ряд х2 х2 х4 1п(14-х) = х--4-------4-..., имеющий радиус сходимости R = 1, то из равенства 2 3 4 (17.100) следует, что функция g2(x) разложима в степенной ряд <17ло2> 2 3 4 также имеющий радиус сходимости R = 1. р,2(х) Из (17.102) вытекает, что функция Л(х) = — , - разложима в степенной ряд х 1 х х2 1 й(х) = —радиус сходимости R которого в силу формулы Адамара также равен единице. Таким образом, в окрестности точки х = 0 функция й(х) положительна, непрерывна и имеет непрерывные производные любого порядка. Отсюда следует, что и функция2 7^(х), а потому и, функция g(x) = х7Л(х) непрерывна и имеет непрерывные производные любого порядка в окрестности точки х = 0. ’См. формулу (17.34) из разд. 4.1 гл. 17. 2 Если функция Л(х) положительна, непрерывна и имеет непрерывные производные любого порядка в окрестности данной точки, то и функция y/h(x) положительна, непрерывна и имеет непрерывные производные любого порядка в окрестности этой точки. . 491
. Итак, мы убедились в том, что функция t = g(x) возрастает, непрерывна и имеет непрерывные производные любого порядка на полупрямой -1<х<+Ьо. Легко проверить, что limg(x) = lim [-Jx - ln(l + x) 1 = -oo, x-H-0 .v->l-0 limg(x) = lim yjx - ln(l + x) = +oo, •V-Hx „Г-Н-Х откуда следует, что множеством значений функции t = g(x) является вся бесконечная прямая -оо < t < +оо. Но тогда в силу теоремы 10 из разд. 4.6 гл. 9 для функции t = g(x) существует обратная функция х = <р(/)> возрастающая и непрерывная на бесконечной прямой -оо < t < +оо. Чтобы убедиться в том, что эта обратная функция х - <р(0 имеет на бесконечной прямой -со < t < +оо непрерывные первую и вторую производные, докажем, что производная g'(x) не обращается в нуль ни в одной точке полупрямой - 1<х<+оо. Переписывая равенство (17.101) в виде 2g(x).g'(x) = -^ <17?103) 1 + х и учитывая, что правая часть (17.103) не обращается в нуль ни в одной точке полупрямой -1 <х < +оо, кроме точки х = 0, мы получим, что и производная g'(x) не обращается в нуль ни в одной точке полупрямой -1<х<+оо, кроме, быть может, точки х = 0. Докажем, что и в точке х = 0 производная g'(x) не обращается в нуль, и вычислим значение g'(0). -.2 /хч । Из (17.102) следует, что lim---, =—, и потому, устремляя х к нулю в х->о х 2 j?^(x) 1 вытекающем из (17.103) равенстве 4^-y-^-[g'(x)]2 =-------------мы получим, что х (1 + х) Ч^ЧО)]2 = 1, откуда следует, что g'(0) = ^ Итак, производная g'(x) не обращается в нуль ни в одной точке полупрямой -1 <х <+оо. Поэтому для функции х = <р(0, обратной к функции t = g(x), в любой точке t бесконечной прямой -оо < t < +оо выполнены все условия теоремы 4 из разд. 3.2 гл. 10 и согласно этой теореме в любой точке t существует производная ф'(0» определяемая равенством (17.104) 1 4 (17.105) Ф (/) gUWJ’ из которого следует, что эта производная Непрерывна на бесконечной прямой Используя Отравило дифференцирования сложной функции (см. разд. 3.1 гл. 10), продифференцируем равенство (17.105) по t. Получим, что ф»(0 = _Иф(0]ф,(0 Фи Иф(0]}2 Последнее равенство устанавливает существование и непрерывность второй производной ср"(О в любой точке t бесконечной прямой -оо < t < +оо. 492
3°. Перейдем теперь непосредственно к установлению формулы Стирлинга (17.94). Используя обозначение (17.100), перепишем формулу (17.98) в виде л! = • / (л), где 1(п) = fe~”s (x)dx. е -i Для обоснования формулы Стирлинга (17.94) достаточно доказать соотношение „ ч Ж (17.106) /(л) = _- + 01_ I уп \ynj Г И к я в котором символ о обозначает элемент бесконечно малой последовательно- , - f 1 1 сти более высокого порядка, чем 5-7^?. [уп J Фиксируем произвольное число а>0 и положим b = ср(-а),с = <р(л), так что g(b) = -a,g(c) = а. Так как функция g(x) отрицательна при -1 < х < 0 и положительна при 0 < х < +оо, то -1 < b < 0 и 0 < с < +оо. Разобьем интеграл 7(л) на сумму трех интегралов /(л) = /,(/:)+ А(л) + АО1), где /,(»)= Je4'2'”*, /2(и) = /,(я)= р-”:,”Л. Q -I Ь с Для доказательства соотношения (17.106) достаточно установить соотношения = /3(л) = о^=) , (17.107) л/2л ( 1 /г ” (17.Ю8) Для установления соотношений (17.107) убедимся, что каждый из интегралов /, (л) и А (л) имеет порядок епа. Действительно, так как при -1 < х £ b справедливы неравенства g(x) < g(b) = -а < 0, то e’ngJ(x) £ e~nal, так что ь /,(п) < е-”1 • = е-"‘‘ (b+l)<Z е"“'. -1 Аналогично, так как при 0<с^х<+оо справедливы неравенства О < а = g(c) < g(x), то при л > 1 получим, что _ -(л-1)«2(*) -g2(x) < -(п-\)а2 -g2(x) С С С — С <5 , так что /3(л) < e“(n‘I)ffJ. jegi(x}dx <C(a)-e~nal. с Соотношения (17.107) установлены, и нам остается установить только соотношение (17.108). Сделав в интеграле 12(п) замену переменной х = ср(О, dx = <p'(f)dtt t = g(x), мы получим, что 493
(17.109) /2(л) = j e"g'(x)dx = J е-"'1 • <p'(t)dt. b -a Функция cp'(O имеет на сегменте -a<t<a непрерывную производную ф"(г). Поэтому по теореме Лагранжа (см. теорему 4 из § 2 гл. И) между 0 и t найдется точка £ такая, что справедливо соотношение ФХО-Ф'(О) = Г-Ф"©. (17.110) Из равенства (17.104) и из взятого при t = 0 равенства (17.105) вытекает, что ф'(0) = 7^ так что соотношение (17.110) можно переписать в виде ф'(0 = ^2 +Кр"(£). Из последнего равенства и из (17.109) вытекает, что г Г„~л'2 . .4. м (17.111) Сделав в первом из интегралов, стоящих в правой части (17.111), замену переменной т = у/2п -t, dx = Jin • dt, мы получим, что 2п fl Гп +°[Л (17.112) поскольку, как установлено в § 4 гл. 16, ' ajln t2 Для оценки второго интеграла, стоящего в правой части (17.111), заметим, что непрерывная на сегменте [-я,а] функция ф"(Г) ограничена на этом сегменте, т.е. найдется постоянное число М > 0 такое, что |ф"(£)| < М, и потому Jentl • (p"ft)• tdt £ M• Jentl|4& = 2M • Jent' • tdt = о = М • f е ) =— (1 - = of j. о п п \y»J (17.113) Из равенства (17.111) и оценок (17.112) и (17.113) вытекает справедливость соотношения (17Л 08). Вывод формулы Стирлинга (17.94) завершен.
Глава 18 Дифференциальные уравнения § 1. Понятие дифференциального уравнения Дифференциальным называется уравнение, которое кро- ме независимых переменных х\, хг, хп и искомой функции от них Xxi,*2,-,*л) содержит еще производные искомой функции или ее дифференциалы. Если функция, относительно которой составлено дифференциаль- ное'уравнение, зависит только от одной независимой переменной, то это уравнение называется обыкновенным дифференци- альным уравнением. Если же искомая функция зависит от нескольких независимых пе- ременных и дифференциальное уравнение содержит частные произ- водные по этим переменным, то это уравнение называется диффе- ренциальным уравнением с частными произ- водными. Таким образом, для искомой функции у(х) одной независимой пе- ременной х обыкновенное дифференциальное уравнение может быть записано в виде F(x,y,y',y’,,...,yM)=0, (18.1) причем в частных случаях функция F может не зависеть от х, у и не- которых производных функции у(х) порядка ниже п. Наивысший порядок п производных, входящих в уравнение (18.1), называется порядком этого дифференциального уравнения. Дифференциальное уравнение (18.1) называется л и н е й н ы м, если его левая часть является многочленом первой степени относите- льно искомой функции у и ее производных у', у", ...,ум, т. е. если это уравнение имеет вид ,.. , . а0(х)У"> +а,(х)А,) + ... + ая(х)у-/(х)=0, (18.2) причем при f(x) = 0 уравнение (18.2) называется однородным линейным уравнением порядка п, а при /(х)^0 — неоднород- ным линейным уравнением порядка п. Всякая п раз дифференцируемая функция у=ср(х), которая, будучи подставлена в уравнение (18.1), обращает его в тождество, называется решением дифференциального уравнения (18.1), а график любого решения называется интегральной кривой. 495
Задачу нахождения всех решений данного дифференциального уравнения принято называть интегрированием этого уравне- ния. В § 2 и 3 данной главы будут рассмотрены обыкновенные диффе- ренциальные уравнения первого и второго порядков. Среди дифференциальных уравнений с частными производными важнейшую роль играют уравнения второго порядка, которые для слу- чая двух -независимых переменных х, у и искомой функции от них и(х,у) могут быть записаны в виде з , F(x,y,u,p,q,r,s,t) = O, (18.3) ди ди д2и д2и д2и где р-—, q=—, г = —s =--------, t-—-. дх ду дх2 дхду ду2 Постановки важнейших задач для наиболее часто встречающихся уравнений с частными производными будут рассмотрены в § 4. § 2. Дифференциальные уравнения первого порядка 2.1. Общие сведения Обыкновенное дифференциальное уравнение первого порядка от- носительно функции у=у(х~) имеет вид F(x,y,y)=0. (18:4) Если уравнение (18.4) может быть разрешено относительно произ- водной у', то мы придем к уравнению У=/(х,у), (18.5) правую часть которого естественно считать непрерывной функцией двух переменных в некоторой области G плоскости Оху. Многие вопросы теории упрощаются, если их рассматривать для разрешенного относительно производной уравнения (18.5), причем к этому уравнению приводят многие прикладные задачи. Заметим, что, используя, свойство инвариантности первого диффе- f dy ренциала, выражающееся равенством у = —, мы можем переписать 1 , dx уравнение (18.5) в виде dy = f (х, y)-dx, а в таком виде оно является ча- стным случаем более общего уравнения P(x,y)dx+Q(x,y)dy = O (18.6) с непрерывными в некоторой области G плоскости Оху функциями Р(х,у) и Q(x,y). 496
,В уравнении (18.6) естественно считать обе переменные х и у рав- ноправными и не интересоваться вопросом о том, какая из этих пере- , менных является независимой. 1 Обратимся к выяснению геометрического смысла уравнений (18.5) и (18.6). Рассмотрим сначала уравнение (18.5) и предположим, что некото- , рая функция у=у(х) является решением этого уравнения. Тогда в де- картовой прямоугольной системе координат Оху касательная к интег- ральной кривой у=у(х) в каждой лежащей на этой кривой точке М(х,у) имеет угловой коэффициент к, равный /(х,у). Таким образом, нахождение всех решений у=у(х) уравнения (18.5) геометрически приводит к следующей задаче: при условии, что в каж- дой точке М(х, у) некоторой области G плоскости Оху с помощью фун- ( кции f(x,y) задано определенное направление, найти все кривые, кото- рые в каждой своей точке М имеют направление, совпадающее с зара- нее заданным в этой точке направлением. Если функция f(x,y) из уравнения (18.5) непрерывна в каждой точ- । ке М(х,у) области G, то при перемещении этой точки М заданное в ней направление меняется непрерывно, и можно нагдядно изобразить поле направлений, проведя в большом числе достаточно густо распо- ложенных в области G точек короткие черточки, указывающие эти на- правления. - Проиллюстрируем сказанное на примере рассмотрения дифферен- циального уравнения 1 У = У2- (18.7) Для отыскания множества всех решений этого уравнения перепи- ; шем его в виде равенства -у = dx и возьмем неопределенный интеграл 4 у от обеих частей этого равенства. В результате йолучим, что — =х + С, где С — любая постоянная. • У Таким i образом, совокупность’всех решений уравнения (18.7) . имеет вид i ____L_' (18.8) х + С’ где С — любая постоянная. , На рис. 18.1 короткими черточками изображены направления, зада- ваемые в каждой из густо расположенных точек функцией /(х,у).= у1, а жирными линиями изображены интегральные кривые (т. е. реше- 497
ния (18.8) дифференциального урав- нения (18.7)), отвечающие значени- ям С = 0 и С= 1. Переходя к выяснению геомет- рического смысла уравнения (18.6), сразу же заметим, что при помощи пары непрерывных в области G функций Р(х,у) и Q(x,y) можно за- дать в этой области совершенно произвольное поле направлений. За- дача интегрирования дифференциа- льного уравнения (18.6) совпадает с геометрической задачей отыскания рис 18.1 интегральных кривых по заданному в области G произвольному полю направлений, определяемому непрерывными в области G функциями Р(х,у) и Q(x,y). Сразу же заметим, что тем точкам (хо.уо) области G, в которых обе функции Р(х,у) и Q(x,y) обращаются в нуль,, не отвечает никакое определенное направление. Такие точки называются особыми т о ч к а м и уравнения (18.6). В качестве примеров рассмотрим два уравнения < x-dx + y-dy=0, (18.9) y-dx-x-dy=Q. (18.10) Для каждого из этих уравнений точка х = 0, у = 0 (т. е. начало ко- ординат) является особой точкой. Интегрирование уравнения (18.9) приводит к интегральным кривым х2 + у2 = Сг с произвольной посто- янной С, т. е. к окружностям с центром в начале координат, изобра- женным на рис. 18.2. Легко проверить, что интегральными кривыми уравнения (18.10) являются проходящие через начало координат пря- мые х = 0 и у = Сх, где С — любая постоянная (см. рис. 18.3). Вернемся к рассмотрению уравнения (18.5) с непрерывной в облас- ти G плоскости Оху функцией f(x,y). Проведенное нами рассмотрение дает основание предположить, что через каждую внутреннюю точку области G проходит интегральная кривая дифференциального уравне- ния (18.5), и притом только одна. Оказывается, что если функция f(x, y) является только непрерыв- ной в области G и не удовлетворяет никаким дополнительным услови- ям, то можно доказать, что через любую внутреннюю точку (хо,уо) области G проходит хотя бы одна интегральная кривая урав- нения (18.5). 498
Этот факт впервые был доказан Дж. Пеано в 1890 г. Однако при одном условии непрерывности функции f (х, у) в обла- сти G (без дополнительных требований) нельзя доказать, что через каждую внутреннюю точку области проходит только одна ин- тегральная кривая. Так, для дифференциального уравнения у' = у2/3, у которого функция f(x,y) = y2/3 непрерывна на всей плоскости Оху, утверждение о том, что через любую точку М(х,у) проходит только одна интегральная кривая, наруша- ется в каждой точке М(х, 0) оси Ох (см. рис. 18.4). Утверждение о том, что через любую внутреннюю точку области G можно провести интегральную кривую уравнения (18.5), и притом только одну, справедливо при усло- вии, что функция f(x,y) не только непрерывна в области G, но и име- ет в этой области ограниченную ча- df , \ стную производную — (х, у), ду Впрочем, в большинстве учеб- ников .по дифференциальным, урав- нениям требование о существова- ' rtf' нии в области G ограниченной, частной .производной .— (х, у) заменяют Эу . . . более слабым требованием о (Существовании постоянной М> 0, обес- печивающей справедливость для всех точек области G неравенства \f(x,yi)-f(X,y2)^M]yi-y2\, (18.11) называемого условием Липшица (по аргументу у). 499
Итак, если в дифференциальном уравнении (18.5) функция f(x,y) непрерывна в области G и удовлетворяет в этой области условию Липшица (18.11), то для любой внутренней точки М^х^уо) области G существует единственное решение у-у(х) уравнения (18.5), удовлет- воряющее условию Ххо) = Уо- (18.12) Если трактовать независимую переменную х как время, то момент времени х = хо естественно назвать начальным моментом, а условие (18.12), задающее значение функции Xх) в начальный момент времени х = хо, естественно назвать начальным условием. Задачу об отыскании решения дифференциального уравнения (18.5), удовлетворяющего начальному условию (18.12), принято назы- вать задачейКоши. Общим решением дифференциального уравнения (18.5) на- зывают такое зависящее от произвольной постоянной С решение у=у(х,С), из которого при надлежащем выборе значения постоянной С может быть получено решение, удовлетворяющее произвольному начальному условию (18.12). Всякое решение дифференциального уравнения (18.5), которое по- лучается из общего его решения при задании конкретного значения постоянной С, называется частным решением этого диффе- ренциального уравнения. Сразу же отметим, что не существует общих методов интегрирова- ния произвольного дифференциального уравнения первого порядка. В следующих разделах настоящего параграфа будут рассмотрены важнейшие частные виды дифференциальных уравнений первого по- рядка, интегрирование которых может быть сведено к вычислению не- определенных интегралов. Такие дифференциальные уравнения приня- то называть интегрируемыми в квадратурах. 2.2, Уравнение радиоактивного распада вещества Мы начнем с рассмотрения дифференциального уравнения, к кото- рому приводит актуальная прикладная задача, связанная с радиоактив- ным распадом вещества. Физический закон, описывающий процесс радиоактивного распада вещества, заключается в том, что скорость распада отрицательна и пропорциональна количеству нераспавщегося к данному моменту, вре- мени вещества, причем коэффициент пропорциональности а называ- ется коэффициентом распадаи является характерной для данного вещества постоянной величиной, не зависящей от времени. Если мы обозначим через х время, отсчитываемое от некоторого 500
начального момента xq, а через у(х) — количество нераспавшегося к данному моменту времени х вещества, то математическое выражение закона радиоактивного распада принимает вид дифференциального уравнения первого порядка j ^ = -аЯх). а813’ dx Записывая это уравнение в виде равенства — = -adx, учитывая по- У ложительность количества вещества у и беря неопределенный интег- рал от обеих частей указанного равенства, получим, что In у -In С] = -ах, где С\ — любая положительная постоянная1. Таким образом, общий интеграл уравнения, (18.13) имеет вид y(x) =Ct -е'”. (18.14) . Если известно, что в момент времени хо количество нераспавшего- ся вещества было равно у0, то к дифференциальному уравнению (18.13) следует присоединить начальное условие (18.12), и частное ре- шение получающейся при этом задачи Коши позволяет определить по- стоянную С|. Действительно, из (18.14) получим, что у0 =С( • е~ш", так что С| = у0 • £*“•. Подставляя это значение Ci в (18.14), получим, что уЮ = у0-е-а(*-">\ (18.15) Одной из важнейших физических характеристик процесса радиоак- тивного распада вещества является время полураспада, т. е. промежуток времени Т, за который количество распадающегося веще- ства уменьшится вдвое. Такой промежуток времени Т сразу же опреде- ляется из равенства (18.15). Взяв в равенстве (18.15) (х-хо) равным Т у и положив при этом левую часть равенства равной -у-, мы получим, что Z±. = yQe~aT, откуда следует, что время полураспада Т равно 1-1п2. а Дифференциальное уравнение (18.13) является математической мо- делью многих процессов деления и размножения вещества, у которых скорость деления или размножения вещества пропорциональна его ко- личеству в данный момент времени. 1 Мы учитываем, что любое число С из бесконечной прямой -оо < С < +оо можно записать в виде С = 1пСр где С\ — положительное число. 501
2.3. Уравнение первого порядка с разделяющимися переменными Дифференциальное уравнение первого порядка вида fxWy = f1(x)dx (18.16) с непрерывными функциямиf (у) nf2(x) принято называть уравне- нием с разделенными переменными. Если функция у = у(х) является решением этого уравнения, то при подстановке этой функции Xх) в уравнение (18.16) мы получим тожде- ство, интегрирование которого дает J/1Wy=J/2(x)^ + C, (18.17) где С — произвольная постоянная. Уравнению (18.17) удовлетворяют все решения уравнения (18.16), причем каждое решение уравнения (18.17) является решением уравне- ния (18.16), ибо если функция Xх) обращает в тождество уравнение (18.17), то, дифференцируя это тождество, мы получим, что у(х) удов- летворяет и уравнению (18.16). Под неопределенными интегралами, стоящими в равенстве (18.17), можно понимать любые первообразные функций f\ и f2, причем эти первообразные можно брать в форме интегралов с переменным верх- ним пределом, т. е. равенство (18.17) можно переписать в виде |/1(()Л<Лда+с. . Л *о где хо и уо — любые две точки, в окрестностях которых определены и непрерывны функции f2(x) и /\(у). Для получения решения дифференциального уравнения (18.16), удовлетворяющего произвольному начальному условию у(х0) = у0, следует положить в (18.18) х = хо, у=уо- При этом получим, что С = 0, и потому решение уравнения (18.16), удовлетворяющее начальному условию Ххо) = Уо» определяется равенством |/>(0Л = //2(0Л. (1819) Подчеркнем, что дифференциальное уравнение (L8.16) считается интегрируемым в квадратурах независимо от того, выражаются или не выражаются через элементарные функции неопре- 502
деленные интегралы и первообразные, стоящие в равенствах (18.17)—(18.19). Конкретным примером уравнения вида (18.16) является уже рас- смотренное в разд. 2.1 уравнение (18.9), в котором f\(y)=y, fi(x) = -x, так что интегралы, стоящие в (18.17), являются табличными интегра- лами, берущимися в элементарных функциях, и общее решение имеет вид х2 +у2 = С2. В качестве второго примера рассмотрим уравнение = е~г! с/х, In у для которого равенство (18.17) принимает вид + (18.20) In у J и хотя интегралы, стоящие в (18.20), как уже было указано в конце разд. 1.4 гл. 12, не берутся в элементарных функциях, рассматривае- мое уравнение считается интегрируемым в квадратурах. Дифференциальное уравнение вида <PiW-Yi(y)^ = <p2W-V2Wy. (18.21) в котором коэффициенты при дифференциалах распадаются на произ- ведение множителей, каждый из которых зависит только от х или то- лько от у, называется дифференциальным уравнени- ем с разделяющимися п е р е м е н н ы м и, ибо путем де- ления на у । (у) • ср2 (х) это уравнение приводится к рассмотренному выше уравнению с разделенными переменными (18.22) У/У) ф2(х) Единственное, о чем нужно заботиться, — это возникающая при делении на \|/((у) • <р2(х) возможная потеря частных решений, обращаю- щих в нуль произведение у j (у) • (р2 (х). Впрочем, легко проверить, что в случае, если число х = а является корнем уравнения ср2(х) =0, дифференциальное уравнение (18.21), кро- ме решений, определяемых из уравнения (18.22), имеет дополнитель- ное решение х = а, а' в случае, если число у = b является корнем урав- нения V|(y)=0, дифференциальное уравнение (18.21) имеет дополни- тельное решение у = Ь. В качестве примера рассмотрим уравнение х(1 + y2)dx = у(1+x2)dy. (18.23) 503
(18.24) Разделяя переменные, получим уравнение —dy = --Х dx, 1 + у2 1+х2 в котором функции (1 +у2) и (1 + х2) не обращаются в нуль. Поэтому все решения уравнения (18.23) получаются интегрированием уравне- ния (18.24) и имеют вид [—^—rdy={—dx + C. JI + y2 Jl + x2 Эти решения можно переписать в виде 1п(1 + у2) = 1п(1 + х2) + 1пС„ где Ci — произвольная положительная постоянная1. Окончательно получим, что 1 + у2 =Ct(l+x2). 2.4. Однородные дифференциальные уравнения первого порядка Дифференциальные уравнения первбго порядка, имеющие вид у=//|, (18-25) принято называть однородными. Эти уравнения сводятся к изу- ченным в предыдущем разделе уравнениям с разделяющимися пере- менными посредством замены искомой функции у(х) на новую иско- мую функцию и(х)=-^^. . X ' Действительно, при такой замене у(х) = х• и(х), у' =х-и' + и, вслед- ствие чего (18.25) переходит в уравнение х • и1 + и = f (и), которое мож- но переписать в виде du _dx f(u)-u х \ Интегрируя последнее уравнение, получим, , что [ ——— = lnx + In С,, где Ci — произвольная положительная постоян- J/(«)“« ная, так что окончательно f du x'=Ct-efW-u. 1 Ибо любое значение С из бесконечной прямой -оо < С < оо можно записать в виде С = In Ct, где С| — Положительное Число. 504
Функцию двух переменных Р(х,у) назовем однородной функцией степени.л, если для любого числа к Ф 0 справедли- во тождество Р(х,у) = ±Р(кх,ку). (1826) Убедимся в том, что уравнение в дифференциалах Р(х, y)dx + Q(x, y)dy=0, (18.27) в котором Р(х, у) и Q(x, у) -г- две произвольные непрерывные однород- ные функции одной и той же степени п, приводится к уравнению (18.25). Действительно, уравнение (18.27) можно переписать в виде dy Р(х,у) п/ ч ziz \ — = — -, из которого, используя для Р(х, у) и Q(x, у) тождество dx. Q(x,y) вида (18.26), взятое при к = —, получим уравнение х x"-P|l/j pfl,^ | . , Р(х,.у)_ I х)_ /у) Z ч i У I k X J (Мы обозначили через / ~ отношение ---------0. В качестве примера рассмотрим уравнение 'y' = y+igy. <18-28) X X Полагая у(х) =х- и(х) и учитывая, что / =х• и* + и, приведем урав- .,о„о. , - , cos и , dx некие (18.28) к виду х-и +u = u + tgu, эквивалентному --du = —. sin и х Интегрируя последнее равенство и обозначая через G произвольную положительную постоянную, получим ln|sinM| = ln|x|+lnC|, откуда сле- дует, что * " у sinu = C|-x, т. е. sin—= С,-х. 505
2.5. Линейное уравнение первого порядка Линейным уравнением первого порядка, раз- решенным относительно производной, называется уравнение вида у'+ р(*)У=/(*), (18.29) которое при /(х) = 0 называется однородным, а при f(x)£0 — неоднородным. Для однородного линейного уравнения / + р(х)у=0 переменные разделяются, и, поделив это уравнение на у, мы можем при у * 0 пере- писать его в виде ^ = -Хх)Л. («30) у Интегрирование уравнения (18.30) приводит к равенству lnH = -J/?(x)t£c + lnC„ (18'.31) в котором Ci обозначает произвольную положительную посто- янную. Равенство (18.31) в свою очередь можно переписать в виде двух равенств ln-£ = -J p(x)dx при у > 0, In — = - J p(x)dx при у < 0. Из этих двух равенств вытекает, что у = С,-е J при у > 0, (18.32) -\p(x)dx у=-Схе при у < 0, (18.33) где Ci, как и выше, принимает любые положительные значения. Равенства (18.32) и (18.33) можно: объединить и записать в виде одного равенства v-C-e'ipMJx (18-34) в котором постоянная С 0 принимает любые строго положительные и любые строго отрицательные значения. Функция (18.34) с такой по- стоянной С является при у * 0 решением дифференциального уравне- ния (18.30), а потому и решением однородного линейного уравнения у' + р(х)у=0. 506
Остается заметить, что при получении уравнения (18.30) из указан- ного однородного линейного уравнения мы производили деление на у и вследствие этого потеряли решение1 у = д. Учитывая, что потерянное решение у = 0 может быть включено в найденное нами семейство решений (18.34), если допустить, что по- стоянная С может быть равна нулю, мы окончательно получим, что общее решение однородного линейного уравнения у' + р(х)у = 0 опреде- ляется равенством (18.34), в котором С является совершенно произ- вольной постоянной. Для отыскания решения н е о д н о р о д н о г о линейного уравнения (18.29) применим так называемый метод вариа- ции постоянной, заключающийся в том, что решение неодно- родного уравнения (18.29) ищется в том же виде (18.34), что и реше- ние однородного уравнения, но при условии, что С является не посто- янной величиной, а искомой функцией С(х). Фактически мы перехо- дим в неоднородном уравнении (18.29) от искомой функции у(х) к но- вой искомой функции С(х) с помощью равенства ^)'=С(х).<18-35) Дифференцируя равенство (18.35), получим, что у = С'(х)-3'(* -СМ.р(х).г>МЛ <18-36) Подставляя у и у', определяемые равенствами (18.35) и (18.36), в уравнение (18.29), мы получим следующее уравнение: для определения искомой функции С(х). Из этого уравнения заключа- ем, что cW=f/W?-“.*+c, <18-37> где С — произвольная постоянная. ; Подставляя найденное значение (18.37) функции С(х) в равенство (18.35), мы получим, что общее решение неоднородного уравнения (18.29) определяется равенством y = <18-38> в котором С обозначает произвольную постоянную. ’Тривиально проверяется, что функция у = 0 является решением уравнения У + р(х)у=0. 507
Таким образом, общее решение неоднородного уравнения (18.29) равно сумме общего решения (18.34) соответствующего однородного уравнения и частного решения неоднородного уравнения получающегося из (18.38) при С = 0. В качестве примера проинтегрируем неоднородное линейное урав- У 2 некие У - — = х . Сначала находим общее решение соответствующего х однородного уравнения у' - — =0, являющегося однородным линейным х уравнением у' + р(х)у=0 с функцией р(х) = -—. Общее решение этого х уравнения, определяемое равенством (18.34), приводится к виду у = Сх, где С — произвольная постоянная. Теперь варьируем постоян- ную С и ищем решение неоднородного уравнения в виде у = С(х) • х. Подставляя это значение у и значение производной у' = С'(х)-х + С(х) в неоднородное уравнение, получим, что С'(х)-х = хг, откуда следует, № х^ что С(х) = —+ С и потому у= — + Сх, где С — произвольная посто- янная. ( 2.6. Уравнения Бернулли и Рикатти Многие дифференциальные уравнения путем замены переменных могут быть сведены к линейным уравнениям. Классическим примером такого дифференциального уравнения является так называемое уравнение Бернулли У+ Р«У = /«/• (18.39) В этом уравнении р(х) nf(x) — произвольные непрерывные функ- ции, ап — число, которое мы будем считать не равным единице, ибо при и = 1 уравнение (18.39) превращается в уже изученное нами одно- родное линейное уравнение^ . Вводя с помощью равенства и = у1"". новую искомую функцию и(х) и замечая, что iZ = (1 - п) • у~п • у', мы получим вместо уравнения Бер- нулли (18.39) линейное уравнение —— и' + р(х)и = /(х). В качестве примера рассмотрим уравнение Бернулли вида , у х2 1 у- — = —, у которого и=-1. 2х 2у 508
Вводя новую искомую функцию и=у2 и замечая, что и'=2 у-У, мы приведем рассматриваемое уравнение Бернулли к линейному урав- I U 2 нению и — -х , уже проинтегрированному нами в конце предыдуще- х го раздела. В приложениях встречается так называемое уравнение Р и - катти У' + P(x)y+q(x)y2 =f(x), (18.40) которое в общем виде (при произвольных непрерывных функциях р(х), q(x) и /(х)) не интегрируется в квадратурах, но обладает тем свойст- вом, что его можно свести к уравнению Бернулли с п = 2 в случае, если известно одно его частное решение yi(x). Действительно, вводя с помощью равенства у=и + у, новую иско- мую функцию и(х) и замечая, что у' = и' + yj, мы приведем уравнение (18.40) к виду и' + у, + р(х)(и + yt) + q(x)(u + yt)2 = f (x), из которого, в силу того что + р(х)у} + q (х)у2 = f (х), вытекает, что w(x) удовлетво- ряет уравнению Бернулли u' + [р(х) + 2q (х) • yt (х)]и + q(x)u2 = 0. В качестве примера читателю предлагается самостоятельно рас- смотреть уравнение Рикатти у - у = —для которого легко подби- х2 / ч 1 рается частное решение у1(х) = —. k х 2.7. Метод ломаных Эйлера численного решения обыкновенного дифференциального уравнения Поскольку не существует точных методов нахождения решения об- щего дифференциального уравнения у' = /(х,у), (18.41) то особую актуальность приобретают приближенные методы решения этого уравнения, удобные для реализации на ЭВМ. Важнейшим из та- ких методов является методломаных Эйлера, излагаемый в настоящем разделе. Будем искать интегральную кривую, .являющуюся решением урав- нения (18.41), удовлетворяющим начальному условию Яхо) = Уо- Фик- сировав достаточно малый шаг h, построим на оси Ох точки хл =х0 + п• h, где п = 0, 1, 2, ..., и заменим искомую интегральную кри- вую у(х) ломаной линией, называемой ломаной Эйлера, кото- 509
рая прямолинейна на каждом из сегментов [хп> xn+i] и ординаты у„ ко- торой в каждой из точек х„ последовательно определяются равенством = У„ + hf (х„> Л) при « = 0, 1,2. Доказывается, что если функция f(x,y) непрерывна в рассматрива- емой области изменения своих переменных, то на любом конечном от- резке [х0,х0 +Я] ломаная Эйлера при Л -> 0 стремится к интегральной кривой у(х), причем это стремление таково, что для любого числа е > О существует достаточно малое число ho > 0 такое, что при всех h < Ло отклонение ломаной Эйлера от интегральной кривой меньше числа е на всем сегменте [х0,х0 +Я]. Если же функция f(x,y) дифференцируема, то отклонение ломаной Эйлера от интегральной кривой имеет на всем сегменте [х0,х0 +Я] порядок, равный шагу h. § 3. Дифференциальные уравнения второго порядка 3.1. Об обыкновенных дифференциальных уравнениях выше первого порядка Разрешенное относительно старшей производной обыкновенное дифференциальное уравнение второго порядка имеет вид /=/(*, У, У), (18.42) а разрешенное относительно старшей производной уравнение п-го по- рядка — вид Уя)=/(х,у,У,...,Уя-')). (18.43) Естественно ожидать, что общее решение дифференциального урав- нения второго порядка (18.42) зависит от двух произвольных постоян- ных Ci и С2, а общее решение дифференциального уравнения п-го по- рядка (18.43) зависит от и произвольных постоянных Сь С2, ..., Сп. Геометрически решения дифференциального уравнения второго порядка (18.42) представляют собой пучок интегральных кривых, про- ходящих через каждую точку Мо(хо,уо) плоскости Оху (см. рис. 18.5). Поэтому, для того чтобы выделить из множества всех интеграль- ных кривых одну определенную интегральную кривую у=у(х), недо- статочно задать точку Мо(хо,уо), через которую должна проходить эта - интегральная кривая, а следует задать еще и направление, которое должна иметь эта интегральная кривая у=у(х) в точке Л/о(хо,уо), т. е. задать еще и тангенс угла ао, образованного касательной к этой кри- вой в точке Мо с положительным направлением оси Ох. 510
Из разд. 1.3 гл. 10 мы знаем, что указанный тангенс равен произ- водной У (х0) интегральной кривой у(х) в точке х0- Таким образом, для выделения единственного решения диффе- ренциального уравнения второго порядка (18.42) следует присоединить к этому урав- нению два начальных условия Х*о) = Уо, У'(х0) = Уо, (18.44) в которых уо и уо — заданные числа, назы- ваемые начальными значения- м и. Задача об отыскании решения диффе- ренциального уравнения второго порядка (18.42), удовлетворяющего начальным условиям (18.44), называется задачей Коши. Для дифференциального уравнения л-го порядка (18.43) задача Коши состоит в отыскании решения этого уравнения, удовлетворяю- щего и начальным условиям Х*о) = Л. У(хо) = Уо.......Л°(*о) = У^, (18-45) в которых yQ, уд,уГ — заданные числа, называемые началь- ными значениями. Справедлива следующая теорема о существовании единственного решения задачи Коши, которую мы сформулируем сразу для диффе- ренциального уравнения и-го порядка: если в окрестности начальных значений у0, yj,..., функция п аргументов f стоящая в правой ча- сти уравнения (18.43), является непрерывной функцией всех своих ар- гументов и удовлетворяет условию Липшица (18.11) по каждому из аргументов начиная со второго, то в указанной окрестности сущест- вует единственное решение дифференциального уравнения (18.43), удовлетворяющее начальным условиям (18.45). Определение. Общим ^интегралом дифференциального уравнения п-го порядка (18.43) называется такое зависящее от п. про- извольных постоянных Cj, С2, ..., Сп решение у=у&,С\, Сг, ..., Сл) этого уравнения, из которого ^посредством надлежащего выбора по- стоянных Ci, С2, ..., Сп можно получить^ решение этого уравнения, удовлетворяющее произвольным начальным условиям (18.45). Беря в этом определении п = 2, мы получим определение общего интеграла дифференциального уравнения второго порядка (18.42). 511
С помощью дифференциального уравнения второго порядка вида 1 (18.42) записывается о с н о в н о е уравнение динамики d2x „( dx А dt1 I dt) задающее координату x(t) в момент времени t движущейся вдоль оси ~ ~ - «Г. dx} Ох материальной точки массы т под действием силы F /,х,— . \ dt) Чтобы полностью описать движение указанной материальной точ- ки, следует задать ее начальное положение x(Z0) = х0 и ее начальную скорость — (x0) = v0, т. е. задать начальные условия вида (18.44). dt В следующих разделах настоящего параграфа изучаются диффе- ренциальные уравнения второго порядка. Мы начнем с изучения некоторых типов таких уравнений, допуска- ющих интегрирование в квадратурах. 3.2. Три простейших типа уравнений второго порядка, допускающих интегрирование в квадратурах Тип I. Дифференциальное уравнение /=/(*), (18.46) явно не содержащее у и у', после первого интегрирования превращает- ся в равенство / = J f(x)dx + С( с произвольной постоянной С\, а по- сле второго интегрирования дает выражаемый в квадратурах общий интеграл уравнения (18.46) y=j[jf(.x)dx]dx + Clx + C2, содержащий две произвольные постоянные Ct и Тип I1!. Для интегрирования дифференциального уравнения /=ЛЛ. (18.47) явно не содержащего х и у', сделаем подстановку р=у' и будем рас- сматривать переменную р как функцию аргумента у. При этом полу- „ dtf dp dp dy dp ним равенство у =-^- = — = — •— = р —, позволяющее переписать dx dx dy dx dy уравнение (18.47) в виде р- — = f(y). Разделяя в последнем уравнении dy переменные и производя интегрирование, придем к равенству 512
2 t ' ~- = \f{y)dy + Cx с произвольной постоянной C\. Из последнего ра- венства следует, что р- ±^2$ f(y)dy+Cx, т. е. ^ = ±^2j/(y)dy+C,. (1848) Разделяя в (18.48) переменные и еще раз интегрируя, окончательно . получим следующее выражение для общего интеграла уравнения (18-47): , J„ -------------= ±(х + С2), j2.J/(y)dy + C, в котором С| и С2 — произвольные постоянные. Тип III. Дифференциальное уравнение /=/(У), (18.49) явно не содержащее х и у, с помощью подстановки р=у' и с учетом того, что — = у", сводится к дифференциальному уравнению с разде- dx. дяющимися переменными — = f (р). Разделяя в последнем уравнении dx, переменные и после этого производя интегрирование, получим равен- ство [ — =х + С{ с, произвольной постоянной С|. Определяя из этого J Лр) dy , равенства р = — как функцию х и производя еще одно интегрирова- ла ние, найдем общий интеграл у- y(x,Ct,C2) уравнения (18.49). В качестве примера рассмотрим задачу Коши для относящегося к типу III дифференциального уравнения у" = — с начальными условия- 2/ ми у(1)= 0, у'(1)=1. Полагая р = у', — = У, получим уравнение dx dp 1 — =—, которое после разделения переменных и интегрирования при- dr 2р водит к равенству p2 = x+Ci. Из начального условия у'(1)=р(1) = Ь получаем, что Cj = 0. Таким образом, р2 = х, т. е. р = — = 4х, причем перед 4х нами взят dx знак «+» вследствие того, что р= 1 при х= 1. 513
тх ^У Г" 2 3/2 x4» Интегрируя равенство — = Vx, получаем, что y = -x + C2, при- dx 3 чем постоянная C2 определяется из начального условия у(1)= 0- Из 2 этого условия следует, что С2 так что искомая интегральная кри- вая, являющаяся решением рассматриваемой задачи Коши, имеет вид у=|(^2-1). 3.3. Два типа уравнений второго порядка, допускающих понижение порядка Понижение порядка дифференциального уравнения обычно облег- чает его интегрирование. Поэтому мы укажем два типа дифференциа- льных уравнений второго порядка, для которых удается понизить по- рядок уравнения. Тип I. Дифференциальное уравнение * /=/(*, У), (18.50) явно не содержащее/. Полагаяу'=р, у" получим вместо (18.50) dx дифференциальное уравнение первого порядка с искомой dx функцией р=р(х)- Тип II. Дифференциальное уравнение /=/СиУ). (18-51) явно не содержащее независимой переменной х. Полагая у' -р и учи- тывая, что у"=-^= —• —= р-—, получим вместо (18.51) дифферен- dx dy dx dy циальное уравнение первого порядка p-^=f(y,p\ в котором роль <7/ независимой переменной играет у. у Пример 1. Найти общий интеграл уравнения Полагая у'~р, ,, dp w dp p , получим однородное линейное уравнение первого порядка — = —, уже dx dx х рассмотренное в конце разд. 2.5 и имеющее общий интеграл р = Сх х, где С\ — dy произвольная постоянная, так что — = Сх-х. Разделяя в последнем равенстве пере- dx менные и еще раз производя интегрирование, окончательно получим искомый об- х2 щий интеграл в виде y=Ci~ + C2. 514
' (V)2 Пример 2. Найти общий интеграл уравнения у" = Полагая у'=р, У dp dp dy dp j У = — ----= p- —, получим уже встречавшееся нам ранее уравнение первого по- dx dy dx dy dp p „ Л „ рядка — = —, общий интеграл которого имеет вид р = С. • у, где С\ — произвольная по- dy У dy стоянная. Итак, — = С. • у. Снова разделяя переменные и используя формулу (18.34) при dx р(х) = - С], мы получим общий интеграл в виде у = С2 • ес,х, где С2 - также произвольная постоянная. 3.4. Однородное линейное уравнение второго порядка Линейным дифференциальным уравнением второго порядка, разрешенным относительно старшей произ- водной, называется уравнение вида У’+Хх)у’+?(х)у = /(х), (18.52) которое при f(x) = 0 называется однородным, а при f(x)£ 0 — неоднородным. В настоящем разделе мы изучим однородное линейное дифферен- циальное уравнение второго порядка /+Хх)У+9(х)у = 0 (18.53) с произвольными непрерывными на некотором интервале а<х<Ь функциями р(х) и q(x). Обозначим левую часть уравнения (18.53) через 2(у). Заметим, что оператор ^у), действующий на функцию у = у(х), об- ладает следующим свойством: для любых двух два раза диффе- ренцируемых функций yi =yi(x) и У2=У2(х) и любых двух постоянных Ci и С2 справедливо равенство ад, .у,(х) + С2 •у2(х)] = С1 -ад)+С2 -ад). (18.54) Справедливость свойства (18.54) вытекает из следующих равенств: [С, • у, (х) + С2 • у2 (х)] = С, • у, (х) + С2 • у2 (х), [С, у,(х) +С2 • у2(х)]' = С, • Х(х) + С2 /2(х), [С, • у,(х) + С2 у2(х)Т =С, • /(х) + С2 Х(х). Оператор 3%у), обладающий свойством (18.54), называется линей- ным. Из равенства (18.54) вытекает следующее утверждение: ес- ли yi(x) и уг(х) — два произвольных решения однородного уравнения ’С точностью до обозначения переменных это уравнение (18.10) из разд. 2.1, рассмотренное нами в конце разд. 2.5. 515
(18.53), а С\ и С2 — две произвольные постоянные, то и функция [Cj • yl (х) + С2 * У2 (х)] является решением однородного уравнения (18.53). Определение 1. Две произвольные заданные на интервале а<х<Ь функции yi(x) и yi(x} называются линейно независимыми, если тождество СсУ\(х}+С2-у2(х)=Ъ (18.55) справедливо для всех точек интервала а<х<Ь только при условии, что обе постоянные С\ и С2 равны нулю. Если же существуют такие постоянные С\ и С2, хотя бы одна из которых не равна нулю, что для всех точек интервала а<х<Ь спра- ведливо тождество (18.55), то функции у\(х} и уг(х) называются ли- нейно зависимыми. Из определения 1 следует, что дифференцируемые на интервале а<х<Ь функции yi(x) и у2(х) являются линейно зависимыми тогда и только тогда, когда хотя бы одно из двух отношений —2 — и —5 У1(*) У2(х) является на интервале а<х<Ь постоянной величиной, т. е. тогда и только тогда, когда хотя бы одна из двух производных У2(*)1 - Ух'Уг-Уг'У'х _У1-У\-У\'У1 (18 56) ,У1(*)] У12 ’ 1^2 WJ У2 тождественно на интервале а<х<Ь равна нулю. Определение 2. Назовем определителем Вронского (или кратко вронскианом} двух произвольных дифференцируе- мых на интервале а<х<Ь функций yi(x) и у2(х) величину, обозначае- мую символом РГ(уьу2) и равную W{yx,у2) = Уг^ = у,(х)• /2(х)-у2(х) Х(х). (18’57) Х(х) Х(*) = _^(УрУ2) (18.58) Уг Заметим, что с помощью выражения для вронскиана (18.57) произ- водные (18.56) могут быть переписаны в виде f У1(х) _^(У^У2)} У1(х) .yWj у2 ’ |Ж Из равенств (18,58) сразу же вытекает следующее утверждение. Теорема 1. Две произвольные дифференцируемые на интервале а<х<Ь функции /1(х) и у2(х) линейно зависимы тогда и только тог- 516
да, когда вронскиан от них И^СиьУг) тождественно на интервале а<х<Ь равен нулю. В дальнейшем в качестве функций yi(x) и у2(х) мы будем рассмат- ривать два решения однородного линейного уравнения (18.53). Прежде всего убедимся в том, что в этом случае вронскиан облада- ет следующим замечательным свойством. Теорема 2. Для вронскиана ИХиьУг) двух любых решений yi(x) и у2(х) однородного линейного уравнения (18.53) справедливо равенство -р(ОЛ W{y„y2) = W0-e’t , ' (18.59) в котором Хо — произвольная фиксированная точка интервала а <х< b, a Wq — постоянная, равная значению вронскиана W(y\,y2) в этой точке xq. Доказательство. Дифференцируя равенство (18.57), полу- чим -у- Уг) = X • X + У, • У2 - у{ • У2 - У2 • Х= У, У2 ~ У2 1 Ур (18’60) ах Так как yi(x) и у2(х) являются решениями однородного линейного уравнения (18.53), то справедливы равенства y"=-p(x)y; -q(x)yt, у! = -р(х)У2-д(х)у2. (18.61) Подставляя в правую часть (18.60) значения Х-и определяемые равенствами (18.61), мы придем к равенству ^(УрУг) = • У2 - • X] = -р(х) • W(y, у2). . dx Таким образом, для вронскиана W(y\,y2) справедливо однородное линейное дифференциальное уравнение первого порядка -= dx = -^(х)Иг(у1,у2), общий интеграл которого в силу разд. 2.5 имеет вид й^(у1,у2)=^*е "° > где С — произвольная постоянная. Если задано значение вронскиана Wq при х =хо, то, положив в последнем равенстве х = хо, мы получим, что С = Wq. Теорема доказана. Следствие из теоремы 2. Вронскиан W(yi,y2) любых двух решений У1(х) и у2(х) однородного линейного уравнения (18.53) либо тождест- венно равен нулю (в случае, когда в равенстве (18.59) Wq = 0), либо не равен нулю ни в одной точке интервала а <х<Ь (в случае, когда в ра- венстве (18.59) Wq*Q). 517
Мы учитываем при этом, что показательная функция не обращает- ся в нуль ни для одного значения аргумента. Из этого следствия и из теоремы 1 вытекает следующее утвержде- ние. . Теорема 3. Два произвольных решения yi(x) и уг(х) однородного ли- нейного уравнения (18.53) линейно зависимы тогда и только тогда, когда их вронскиан ^(yi,y2) тождественно равен нулю, и линейно не- зависимы тогда и только тогда, когда их вронскиан W(y\,y2) не равен нулю ни в одной точке интервала а<х<Ь. Докажем теперь следующее фундаментальное утверждение. Теорема 4. Если yi(x) и уг(х) — два произвольных линейно незави- симых решения однородного линейного уравнения (18.53), то общее ре- шение уравнения (18.53) записывается в виде Xx)=CryI(x) + C2.y2(x), z (18.62) где С\ и Сэ — произвольные постоянные. Доказательство. Тот факт, что при любых постоянных С1 и С2 функция у(х)9 определяемая равенством (18.62), является решени- ем однородного линейного уравнения (18.53), уже установлен нами выше (он z вытекает из равенства (18.54)). Поэтому достаточно дока- зать, что для произвольных наперед взятых начальных условий Х*о ) = Уо» У (*о) = Уо (18.63) постоянные С\ и С2 в равенстве (18.62) можно выбрать так, что реше- ние (18.62) с этими постоянными будет удовлетворять начальным условиям (18.63), т. е. постоянные С\ и С2 можно выбрать так, что бу- дут справедливы равенства * У\ (*о) + С2У2 (*о)= Уо > ,С1.Х(Х0)+С2у2(х0)=у0. <1864) Равенства (18.64) представляют собой линейную систему двух уравнений относительно двух неизвестных Ci и Сг- Определителем этой системы является взятый в точке х0 вронскиан W(yi,y2), который в силу теоремы 3 и линейной независимости решений у\(х) и уг(х) от- личен от нуля. В силу разд, 1.2 гл. 3 система (18.64) имеет, и притом единственное, решение, определяемое формулами Крамера. Теорема доказана. В силу теоремы 4 задача интегрирования однородного линейного уравнения (18.53) сводится к нахождению его двух произвольных ли- нейно независимых решений. 518
Оказывается, достаточно найти одно не равное тождественному нулю решение yi(x) однородного линейного уравнения (18.53), ибо второе линейно независимое с ним решение yi(x) может быть найдено интегрированием в квадратурах. Действительно, если yi(x) найдено, то, подставляя в первое равен- ство (18.58) значение вронскиана (18.59) и производя интегрирование, получим соотношение из которого следует, что = FF0-y,(x)-Je'" (18-65) Таким образом, в качестве второго линейно независимого с у/х) решения однородного линейного уравнения (18.53) можно взять функ- цию У2(х), определяемую равенством (18.65), с любым отличным от нуля значением WQ. Итак, мы убедились, что для отыскания в квадратурах общего ре- шения однородного'линейного уравнения (18.53) достаточно знать одно частное решение yi(x)^0 этого уравнения. Сразу же отметим, что для произвольного однородного линейного уравнендя (18.53) най- ти указанное частное решение в квадратурах (или тем более в конеч- ном виде) невозможно. Найти указанное частное решение в квадратурах или в конечном виде удается для некоторых видов коэффициентов р(х) и q(x) и, в част- ности, для случая, когда эти коэффициенты являются постоянными числами (см. разд. 3.6). В разд. 3.7 излагается часто применяемый на практике метод на- хождения указанного частного решения в виде суммы степенного ряда. 3.5. Неоднородное линейное уравнение второго порядка Переходим к рассмотрению неоднородного линейного уравнения второго порядка (18.52). Предположим, что нам известно какое-то одно частное решение уо(х) этого уравнения. Тогда, полагая у(х) = у0 (х) + у(х) и подставляя в (18.52) это значение у(х), мы полу- чим уравнение [X +P(x)y'0+q(x)y0] + [y' + p(x>)y'+q(x)y\ = f(x). (18.66) 519
Поскольку функция уо(*) является решением уравнения (18.52), то Уо + P(x)Jo *М(х)Уо = /(*)> и из сопоставления последнего, равенства с (18.66) мы получим, что у(х) является решением однородного линей- ного уравнения i y + p(x)y' + q(x)y = 0, (18.67) отличающегося от однородного линейного уравнения (18.53) только заменой искомой функции Xх) на Xх)- Уравнение (18.67) или (18.53) называется однородным уравнением, соответствующим неоднородно- му уравнению (18.52). Из разд. 3.4 мы знаем, что если yi(x) и у2(х) — два любых линейно независимых решения однородного уравнения (18.67), то общее реше- ние этого уравнения имеет вид у(х) = С1 •у1(х) + С2 • у2(х), где Ct и С2 । — произвольные постоянные. Отсюда и из равенства у(х) = Уо (х) + Xх) заключаем, что 7 ‘ I Xх) = Уо (х) + с, • у, (х) + С2 у2 (х), J т. е. общее решение неоднородного линейного уравнения (18.52) равно сумме произвольного частного решения уо (х) этого уравнения и обще- го решения соответствующего однородного уравнения. Замечательным является тот факт, что, зная два линейно независи- мых решения соответствующего однородного уравнения, оказывается возможным найти в квадратурах частное (а потому и общее) решение । неоднородного линейного уравнения (18.52). Для обоснования этого факта применим метод вариации ( постоянных, т.е. будем искать решение Xх) неоднородного урав- нения (18.52) в том же виде (18.62), в котором мы нашли общее реше- ние однородного уравнения (18.53), но при этом будем считать, что Q и С2 являются не постоянными числами, а искомыми функциями Ci(x) и С2(х), связанными соотношением С,'(х)у)(х) + С;(х)у2(х)=0. (18.68) Итак, мы ищем решение у(х) неоднородного уравнения (18.52) в ( виде Хх) = С,(х)у,(х) + С2(х)у2(х), (18.69) - считая, что yi(x) и у2(х) — линейно независимые решения однородного уравнения (18.53), a Ci(x) и С2(х) — искомые функции, удовлетворяю- * щие тождеству (18.68). 520
Два раза дифференцируя равенство (18.69) и используя при этом тождество (18.68), получим У(х) =С,(х) • Х(х) + С2(х) • у'2 (х), (18.70) /(х) = СХх)-Х(х) + С2(х) у2Чх) + С;(х)Х(х) + С;(х)у'(х). (18.71) Подставляя Xх)» /У(х) и У(х)> определяемые равенствами (18.69), (18.70) и (18.71), в неоднородное уравнение (18.52), получим /(х) + р(х)У (х) + Xх) Xх) = С, (х)[Х(х) + р(х)Х(х) + +<1(Х')У (*)] + С2 (х)[Х (х) + Р(х)у2 (х) + q {х)у2 (х)] + С18-72) уС[{х)^(х} + С^х)У2(х) = /(х). х Так как функции у^х) и у2(х) являются решениями однородного уравнения (18.53), то выражения, стоящие в (18.72) в квадратных скоб- ках, равны нулю, и мы получим из (18.72) уравнение С,'(х)Х(х) + С' (х)У2 (х) = /(х). (18.73) Остается заметить, что тождество (18.68) и уравнение (18.73) пред- ставляют собой систему двух линейных уравнений относительно двух неизвестных С,(х) и С2(х), определитель которой равен вронскиану ЩуьУг) и в силу линейной независимости решений yi(x) и у2(х) отли- чен от нуля в каждой точке х. С помощью формул Крамера (см. разд. 1.2 гл. 3) однозначно опре- деляются функции С{(х) и С2(х), а интегрированием этих функций определяются в квадратурах и сами функции Cj(x) и С2(х). Сопоставляя установленный факт с результатом, полученным в конце разд. 3.4, мы приходим к выводу, что для отыскания в квадра- турах частного и общего решений неоднородного уравнения (18.52) достаточно знать хотя бы одно частное решение yi(x)^0 соответ- ствующего однородного уравнения (18.53). 3.6. Однородное линейное уравнение второго порядка с постоянными коэффициентами Рассмотрим теперь случай, когда в однородном линейном уравне- нии (18.53) коэффициенты р(х) и q(x) являются постоянными числами, т. е. случай, когда р(х) = /> = const, q(x) = q = const. Будем искать решение у(х). однородного уравнения / + р-У + ?-у=0 (18.74) в виде. Xх) = еЬ, гДе к — искомое постоянное вещественное (или ком- плексное) число. 521
Подставляя в уравнение (18.74) вместо Xх) функцию etv, производя дифференцирование этой функции и вынося за скобки общий множи- тель е , получим равенство еь‘(к2 + рк + q)=Q, из которого следует, что искомое число к является корнем квадратного уравнения k2+p-k + q=0. (18.75) Квадратное уравнение (18.75) называется характеристиче- ским для однородного дифференциального уравнения (18.74). Могут представиться три случая. Случай I: —— q>Q. В этом случае квадратное уравнение 4 I 2 (18.75) имеет два различных вещественных корня кх =~2 V 4 и „ „2 к2 =-—-J—-q. 2 2 V 4 2 Случай II: ——q=Q. В этом случае квадратное уравнение 4 (18.75) имеет два совпадающих вещественных корня к1=к2=-^. 2 Случай III:—— q<0. В этом случае квадратное уравнение 4 (18.75) имеет два комплексно сопряженных корня fc,=<x+ip и I 'd2 к2=а - гр,- где а = -у, р = Jq - В случае I двумя линейно независимыми решениями уравне- ния (18.74) являются функции у1(х) = ек'х и у2(х) = е*1Ж. Линейная неза- висимость этих решений вытекает из того, что их отношение =g(*j-*i)» не равно тождественной постоянной (ибо A2*^i)- У|(х) В случае II, когда кх =к2 одним из решений уравнения -£х (18.74) является функция у,(х) = е 2 . Легко проверить, что другим решением уравнения (18.74) является X функция у2(х)=х-е 2 . п2 -£.х . Р-Уг(х) = р-е2 ~^‘е 2 , Уг +РУ2+9У2= °- 2 -Р-Х _ „ z X Р Действительно, q-y2\x) = — 'xe L , 4 _Р_Х -Lx У1(х)-^Р'е 2 + — -х-е 2 , так что 522
—•—X -—X Решения yt(x) = e 2 , и у2(х)=х-е 2 линейно независимы, ибо их у, (х) отношение ——=х не является тождественной постоянной. Вслучае III легко проверить, что двумя решениями уравне- - ния (18.74) являются функции yi(x) = eajt -cosp* и у2(х) = еах -sinpx. Проведём проверку для функции yi(x). Учитывая, что р = -2а, д=а2+р2, получим, что qyt(x) = (а2 +р2)еаг -cospx, p yj(x) = = -2а2еах •cosPx.+2aPear -sinpx, yt"(x) = a2eCLV cospx -2aPeax sinPx- -p2 ea' - cospx, так что yf+ py[ + qyt =0. Решения y,(x) и уг(х) линейно независимы, ибо их отношение =tgPx не является тождественной постоянной. Таким образом, для всех трех случаев нами построены два линейно независимых решения однородного уравнения (18.'74). Используя эти решения и изложенный в разд. 3.5 метод вариации постоянных, мы по- лучим в квадратурах и решение неоднородного уравнения У'+рУ+^у=/(х) с произвольной функцией /(х). 3.7. Интегрирование линейного уравнения с помощью степенного ряда Предположим, что в однородном линейном уравнении (18.53) ко- эффициенты р(х) и q(x) допускают разложение в степенные ряды Р(х) = %ак-хк, q{x) = ^bk-xk, (1876) ЬО ьо имеющие радиусы сходимости, не меньшие числа R > 0. Будем искать решение у(х) уравнения (18.53) в виде степенного ряда Лх^.-х'. <18'77> ьо Формально подставив выражения для решения у(х) и его производ- ных и разложения (18.76) в уравнение (18.53), мы придем к равенству У (£* “***' *=о J ^к(к-\)ак -х*"2 + Ь2 (18.78) 523
Перемножая ряды, стоящие в левой части (18.78), собирая члены, содержащие одинаковые степени х, и после этого приравнивая нулю коэффициенты при х°, х1, х2. получим соотношения 2-1-а 2 +аоа, + Ьоао =0, 3-2-ai+2a0a2+alai+b0al+bla0 =0, 4-3-а4 + Заоа3 +2а{а2 + аоа, + Z>0a2 + ^а, +&2а0 =0, Соотношения (18.79) являются уравнениями для последовательно- го (шаг за шагом) определения коэффициентов аг, аз, а4,... через пер- вые два коэффициента ао и а> и через коэффициенты а* и Ьь степен- ных рядов (18.76). Из первого уравнения (18.79) определяется аг, затем из второго уравнения (18.79) определяется аз, затем из третьего уравнения (18.79) определяется а4 и т.', д. Коэффициенты а0 и а| играют роль произвольных постоянных. Удобно сначала положить а0 = 1, ai = 0 и, определив с помощью урав- нений (18.79) все последующие коэффициенты, построить в виде сум- мы ряда (18.77) первое решение уi(x), а затем положить ao = O, ai = 1 и, определив с помощью уравнений (18.79) все последующие коэффи- циенты, построить в виде суммы ряда (18.77) второе решение У2(х). При таком построении первое решение yi(x) будет удовлетворять начальным условиям yi(0) = 1, yf(O) =0, а второе решение у2(х) — нача- льным условиям уг(О) = 0, J^(O)=L При этом решение у(х)> удовлетворяющее произвольным началь- ным условиям у(О) = А, у'(0) = В, где А и В — любые два числа, оче- видно будет иметь вид Ях) = 4ц(х) + 5у2(х). Приведем без доказательства следующие утверждения. Если ради- усы сходимости степенных рядов (18.76) не меньше числа R>0, то и радиус сходимости определяющего решение ряда (18.77) не меньше числа R, т. е. при |х| < R сумма степенного ряда (18.77) дифференци- руема сколько угодно раз и потому определяет решение однородного уравнения (18.53). В частности, если коэффициенты р(х) и q(x) уравнения (18.53) яв- ляются многочленами (т. е. являются степенными рядами, имеющими радиус сходимости 7?~оо), то степенной ряд (18.77) сходится и опре- деляет решение уравнения (18.53) для всех х. В качестве примера найдем два линейно независимых решения У1(х) и уч{х) однородного уравнения у"-лу = 0. 524
Подставляя значение у(х), определяемое степенным рядом (18.77), в это уравнение, получим равенство (21а, +3-2-а3х + 4-За4 -х2 + ...)-х(а0 +atx+a2x2 +...) =0.(18.80) Собирая в левой части (18.80) члены, содержащие одинаковые сте- пени х, и после этого приравнивая нулю коэффициенты при х°, х', х2, ..., х" .... получим соотношения 2-1-а2=0, 3-2-а3-ао=О, 4-3-а4-а1=0, ..., ...(n+ZXn+lJa^-a^O, ... (18.81) Для построения первого решения yi(x) положим а0 = 1, at = 0. При этом из равенств (18.81) получим, что аг = 0, а3= ——, а4 = а5 = 0, 2-3 11-4 Л 1 1-4-7 а, =--------= —, а7 = а8 = 0, а, =---------------=------, ..., так что 2-3-5-6 6! 2-3-5-6-8-9 9! Я(*)=1 + Х 1-4-7-...-(3^-2) « (18.82) (ЗА:)! Для построения второго решения у2(х) положим ао = 0, ai = 1 и с помощью соотношений (18.81) получим, что 2-5-8-...-(ЗЛ-1) хЗЫ (18.83) ы (ЗЛ + 1)! В силу сформулированного выше утверждения степенные ряды (18.82) и (18.83) сходятся и определяют решения уравнения у"-ху = 0 для всех х. Заметим, впрочем, что сходимость рядов (18.82) и (18.83).для всех х может быть установлена путем применения к каждому из этих рядов признака Даламбера (т. е. теоремы 6 из разд. 2.3 гл. 17). § 4. Постановки основных задач для уравнений с частными производными Типичной особенностью дифференциальных уравнений с частными производными, отличающей их от обыкновенных дифференциальных уравнений, является то, что для однозначного определения частных решений уравнения с частными производными требуется не задание значений конечного числа постоянных, а задание конечного числа функций. - Так, для однозначного определения решения и = u(t, xit ..., хп) диф- ференциального уравнения первого порядка 525
.... dt , (18.84) следует присоединить к этому уравнению начальное условие и(/0,х„...,хл) = <р(х1, ...,х„), . (18.85) в котором (tfx,,'...,*„) — заданная функция. Задача об определении решения дифференциального уравнения первого порядка (18.84) с начальным условием (18.85) называется з а - дачейКоши. В приложениях особо важную роль играют дифференциальные уравнения с частными производными второго порядка, называемые уравнениями математической физикии возникаю- щие при изучении математических моделей различных физических яв- лений. Рассмотрим сначала уравнения, описывающие эволюцию протекаю- щих во времени физических процессов, решения u(t,xi,...,xn') которых являются функциями времени t и геометрических координат х(.....х„, где л = 1, 2 или 3. Для исчерпывающего описания физического процесса помимо уравнения необходимо задать картину процесса в некоторый фиксиро- ванный (начальный) момент времени /о (т. е. Задать н а ч а л ь н'ы е у с л о в и я) и, кроме того, задать режим на границе Г той области G в пространстве геометрических переменных хь ..., хп, в которой7 разви- вается этот процесс (т. е. задать так называемые граничные условия). Пусть p(xi, ..., хп) и p(xi, ..., хп) — функции, принимающие строго положительные значения. Дифференциальное уравнение второго порядка (18.86) решение и(х\, ..., хп, t) которого является смещением точек среды (xi ,..., хп) в момент времени t, называется уравнением коле- баний. Обычно в уравнении (18.86) функция р — это плотность среды, а функция р — коэффициент натяжения или упругости (иногда называемый модулем Юнга). При такой физической интерпре- тации уравнение (18.86) описывает малые поперечные колебания стру- ны и малые продольные колебания стержня (при п = 1), малые попе- речные колебания мембраны (при п = 2). Это же уравнение (18.86) описывает и акустические, и электромаг- нитные колебания. 526
При р = 1, р = а2 - const уравнение (18.86) переходит в так называе- мое волновое урав нен и е д2и 2 А . zv а (18.87) — = а •Ди+/(х„...,хл,0, , dt . -^д и „ _ в котором Ди = /,—- — так называемый оператор Лапласа. *=i дх; . Отметим, что при flxi, хя, t) = Q волновое уравнение (18.87) и уравнение колебаний (18.86) называются однородными. Дифференциальное уравнение второго порядка, содержащее только первую производную по времени t, ди & д ди dt fci дхк дхк +f(xl,...,x„,t) (18.88) называется уравнением диффузии. । Уравнение диффузии (18.88) описывает процесс диффузии вещест- ва, в частности жидкости или.газа (в этом случае его решение u(xi,..., х„, i) является концентрацией диффундирующего вещества), а также процесс распространения тепла (в этом случае его решение u(xt, ..., х„, t) является температурой в точке (х|, ..., х„) в момент времени t). Входящая в уравнение (18.88) функция р представляет собой коэф- фициент пористости в случае/ когда изучается процесс диффузии, и произведение плотности на коэффициент теплоемкости в случае, когда изучается процесс распространения тепла. Функцию р в уравнении (18.88) принято называть коэффициентом диффузии (со- ответственно коэффициентом теплопроводности). При psi, р = а2 = const уравнение диффузии (18.88) переходит в так называемое у р а в н е н и е теплопроводности 2 а у/ — = а • Ди+/(х„...,хп,<). (18.89) Для стационарных (т. е. не зависящих от времени /) процессов уравнение колебаний (18.86) и уравнение диффузии (18.88) переходят в дифференциальное уравнение (18.90) которое при р = 1 в свою очередь превращается в так называемое уравнение Пуассона Ди = -/(х>,...,хя). (18.91) 527
Однородное уравнение Пуассона, отвечающее случаю /=0, Ди=0 (18.92) называется уравнением Лапласа. Уравнениям Лапласа и Пуассона удовлетворяют различные потен- циалы (ньютонов или кулонов потенциал, потенциал течения несжима- емой жидкости). Для описания процесса колебаний к уравнению (18.86) или (18.87) следует присоединить так называемые начальные условия «(*!.........*„>'o) = <P(*p•••»*,.), ^(х1,...,хлЛ)='1'(*р •••>*,.). (18.93) dt в которых (pCqи \|/(x,,...,x„) — функции, заданные в той облас- ти G в пространстве геометрических переменных х„, в которой происходит процесс колебаний, и равные соответственно начальному возмущению и начальной скорости точек колеблющейся среды. Для описания процесса диффузии или распространения тепла к уравнению (18.88) или (18.89) следует присоединить только одно на- чальное условие u(xt, ...,x„, t0) = ф(х„ ...,х„). (18.94) В случае, если область G в пространстве геометрических перемен- ных хь ..., х„, в которой происходит изучаемый эволюционный про- цесс, не совпадает со всем пространством'* Rn, к рассматриваемому дифференциальному уравнению кроме указанных начальных условий следует присоединить еще и граничное условие на границе - Г области G, которое для широкого класса физических задач может быть записано в виде справедливого в точках поверхности Г соотно- шения . . аи + Р* (18.95) \ г где h — заданная на поверхности Г функция; v — внешняя (по отно- шению к области G) нормаль к поверхности Г; а и р — заданные на Г неотрицательные функции, одновременно не обращающиеся в нуль. В частности, для волнового уравнения (18.87) с одной геометриче- ской переменной х, описывающего малые поперечные колебания рас- положенной на отрезке а<х<Ь струны, граничное условие и| =0 означает, что конец струны х = а закреплен, а граничное условие ди дх Задачи, состоящие в -отыскании решения одного из дифференциа- льных уравнений (18.86) — (18.89) с указанными начальными условия- = 0 означает, что конец струны х = Ь свободен. 528
ми и с граничным условием вида (18.95), принято называть сме- шанными-задачами. В случае, когда область G, в которой происходит эволюционный процесс, не имеет границы и совпадает со всем пространством Rn, гра- ничные условия отсутствуют и соответствующие задачи, состоящие в отыскании решения дифференциального уравнения (18.86) или (18.87) с начальными условиями (18.93) или в отыскании решения дифферен- циального уравнения (18.88) или (18.89) с начальным условием (18.94), называются задачами Коши. Рассмотрим теперь постановки основных задач для стационарных (не зависящих от .времени t) уравнений (18.90), (18.91) и (18.92). Эти уравнения мы будем рассматривать в области G пространства, пере- менных хь ..., х„, ограниченной поверхностью Г. Задача, состоящая в отыскании решения u(xiy ..., хп) одного из уравнений (18.90), (18.91) или (18.92) с граничным условием (18195), в котором а = 1, Р = 0, называется задачей Дирихле или пер- вой краевой задачей, а задача, состоящая в отыскании ре- шения одного из указанных трех уравнений с граничным условием (18.95), в котором ат0, Р = 1, называется задачей Неймана или второй краевой задачей. В заключение найдем решение задачи Коши для однородного вол- нового уравнения (18.87) с одной геометрической переменной х, т. е. найдем решение и(х, /) дифференциального уравнения 2 дги (18.96) dt2 дх2’ удовлетворяющее для всех х из бесконечной прямой -<х>< х< оо началь- ным условиям и(х,0) = ср(х), ^(х,0)=у(х), (18.97) dt в которых <р(х) — произвольная два раза дифференцируемая функция, а \|/(х) — произвольная один раз дифференцируемая функция. Пусть /(х) и g(x) — две произвольные заданные на всей бесконечной прямой и два раза дифференцируемые функции одной переменной х. Тривиально проверяется, что каждая из имеющих вид волны-функций двух переменных f(x + at) и g(x-at) является решением волнового уравнения (18.96). Поэтому естественно общее решение волнового уравнения (18.96) взять в виде ' и(х, t) = f (х + at) + g(x - at) (18.98) 529
и выбрать функции f и g так, чтобы функция u(x, t), определяемая ра- венством (18.98), удовлетворяла начальным условиям (18.97). Так как из (18.98) следует, что — (х, t) = а • f' (х + at) - а • g' (х - at), (18.99) dt где штрихами обозначены производные по аргументам функций f (х) и g(x), то, полагая в (18.98) и (18.99) t = Q и используя начальные усло- вия (18.97), мы получим равенства /(x) + g(x) = <p(x), v (18.100) а-/'(х)-а^(х)=\|/(х). (18.101) Интегрируя поделенное на а равенство (18.101), мы придем к соот- ношению /W-gW = ^Jv(yXy+C, (18.102) где С — постоянная. Из соотношений (18.100) и (18.102) заключаем, что f (х) = <р(х) + f у (y)dy+£ 2 2а- 2 g(x)=|<p(x)-2-fv(y)rfy-^ 2 2а * 2 и потому' . 4 г/ Ч 1 Z .4 1 Т / ч. с (18.103) /(х + аГ) = -<р(х + а/) + — J y(y)dy+—, 2 2а Jo 2 , А 1 , -ч 1 т < с (18.104) g(x - at) = - <р(х - at) - — I ^{y)dy~—. 2 2а ' 2 Подставляя значения f(x + at) и g(x-at), определяемые равенства- ми (18.103) и (18.104), в правую часть (18.98), мы получим знамени- тую формулу Даламбера, дающую решение рассматривае- мой задачи Коши • Ф,()=ж*+»)+ж* - «) w 530
Глава 19 Основы теории вероятностей Теория вероятностей занимается изучением закономерностей, воз- никающих при рассмотрении большого числа однотипных случайных явлений. ‘' Такие закономерности, присущие массовым случайным явлениям, встречаются в самых разнообразных ситуациях: при анализе результа- тов многократного бросания шестигранной игральной кости, при выяс- нении процента брака в различных промышленш>1Х производствах, при анализе народонаселения, в теории стрельбы, при изучении закономер- ностей взаимодействия большого числа частиц в физике и химии и т. д. Теория вероятностей возникла примерно в середине XVII в. Ее первые шаги связаны с именами Паскаля, Ферма и Бернулли. Первона- чально теория вероятностей занималась преимущественно задачами, относящимися к различным азартным играм (играм в карты, кости и т. п.). В это время ее аппарат сводился к чисто арифметическим и ком- бинаторным приемам. Дальнейшему ее развитию способствовали за- просы естественных и социальных наук и техники (теория ошибок на- блюдения, теория артиллерийской стрельбы, учет народонаселения, развцтиё статистической физики). Расширению круга рассматриваемых ею вопросов й совершенствованию ее аналитического аппарата спо- собствовали работы Лапласа, Гаусса и Пуассона (на рубеже ХУШ и XIX вв.). С середины XIX в. фундаментальную роль в развитии теории вероятностей стала играть российская математическая школа (работы П. Л. Чебышева, А. М. Ляпунова и А. А. Маркова). В XX в. в развитие теории вероятностей выдающийся вклад внесли работы А. Н. Колмого- рова, С. Н. Бернштейна и А. Я. Хинчина. § 1. События. Вероятности событий . . В каждом разделе математики имеются некоторые основные поня- тия, возникающие посредством абстракции из опыта и практики и яв- ляющиеся фундаментом для построения теории. Например, в .геомет- рии такими основными понятиями являются понятия точки, прямой и плоскости. В анализе основную роль играет понятие целого числа, с помощью которого затем вводятся рациональные и вещественные чис- ла, понятие предела и т. д. 531
В теории вероятностей основную роль будет играть понятие события. Событием мы будем называть всякое явление, относительно которого имеет смысл говорить, произошло оно или не произошло. Например, при бросании шестигранной игральной кости можно рассматривать такие события: 1) выпадение одного очка, 2) выпадение четного числа очков, 3) выпадение менее трех очков и т.' д. При этом каждый раз будут рассматриваться: 1) некоторый ком- плекс условий (например, состоящий в том, что бросается иг- ральная кость) и 2) некоторая фиксированная система собы- тий, которые могут произойти или не произойти при осуществлении данного комплекса условий. Различные события, принадлежащие рассматриваемой системе, мо- гут быть связаны между собой определенными соотношения- м и, которые мы сейчас перечислим. 1°. Если при каждом осуществлении данного комплекса условий, при котором наступает событие А, наступает и событие В, то говорят, что с о б ы т и е. А влечет за собой событие В, и пишут А сВ или ВгэА. Например, при бросании игральной кости событие «выпало два очка» влечет за собой событие «выпало четное число очков». 2°. Если событие А влечет за собой событие В и в то же время со- бытие В влечет за собой событие А, то события А и В называют р а в - носил ь н ы м и, и пишут А = В. Например, при бросании игральной кости событие А, состоящее в выпадении четного числа очков, равносильно событию В, состоящему в невыпадении нечетного числа очков. 3°. Назовем произведением двух событий А и В событие, обозначаемое символом А • В или В • А и состоящее в одновременном наступлении событий А и В. Например, если при бросании игральной кости событие А состоит в выпадении четного числа очков, а событие В — в выпадении меньше четырех очков, то событие А В означает ^выпадение двух очков. 4°. Событие, состоящее в том, что наступило хотя бы одно из событий А и В, называется ихсуммойи обозначается символом А + В или В + А. Определения суммы и произведения событий очевидным образом переносятся на случай любого числа событий. 5°. Событие, состоящее в том, что событие А происходит, а собы- тие В не происходит, называется разностью событий А и В и обо- значается символом А-В. 532
Например, если при бросании игральной кости событие А состоит в выпадении четного числа очков, а событие В в выпадении более двух очков, то событие A-В означает выпадение двух очков. 6°. Если А — какое-либо событие, то событие, состоящее в том, что событие А не наступило, называется противоположным событию А и обозначается символом А. . : Например, если при бросании кости событие А состоит в выпаде- нии четного числа очков, то событие А состоит в выпадении нечетно- го числа очков. 7°. Событие называется достоверным, если.оно обязательно происходит при каждой реализации данного комплекса условий.». , Например, если брошена игральная кость, то выпадение не менее одного очка — достоверное событие. . 8°. Событие называется невозможным, если оно не может произойти ни при одной реализации данного комплекса условий. Например, если брошена игральная кость, то выпадение больше 6 очков.— невозможное событие . Естественно считать^ что все достоверные события равносильны между собой и все невозможные события равносильны между собой. Поэтому все достоверные события мы будем обозначать одной и той же буквой Е, а любое невозможное событие — одной и той же буквой N.; Очевидно, что противоположные события А и А связаны между со- бой соотношениями А + А =Е, А A=N. 9°. События А и В называются несовместимыми, если их одновременное наступление невозможно, т. е. если A-B = N. Аналогично п событий В\, В2, ..., В„ называются попарно не- совместимыми, если Bj Bj = N при всех i *j. 10°. Если А =В\ + В2 +... + Вп и события В\, В2, ..., Вп попарно не- совместимы, то говорят, что событие Л подразделяется начастные с л у ч а и В\, В2, ..., Вп. ,11°. Говорят, что события Bi, В2, ..., В„ о б р, а з у.ю т пол н у ю группу, если хотя бы одно из них обязательно должно произойти, т. е. если Bi + В2 +... + Вп = Е. В дальнейшем важную роль будут играть полные г,р у п п ы попарно несовместимых событий, т. е. такие группы событий В\, В2, ..., Вп, которые удовлетворяют условиям В\ + В2 + ... + Вп = Е, В-, • Bj = N при всех i*j. Например, при бросании игральной кости события В2,..., В6, со- стоящие в выпадении соответственно 1, 2, ..., 6 очков, образуют пол- ную группу попарно несовместимых событий. 533
.12°. Рассматривая определенный комплекс условий и определен- ную группу S событий, которые могут произойти при реализции этого комплекса условий, целесообразно предполагать, что эта группа собы- тий удовлетворяет следующим двум условиям: 1) если группе S принадлежат события А и В, то ей принадлежат также и события А В, А + В и А -В; 2) группе S принадлежат достоверное и невозмож- ное, события. Группу S событий, удовлетворяющих требованиям 1 и 2, называют полем с-обытий. Перейдем теперь к определению вероятности события. Классическое определение вероятности события основано на понятии равновозможности (равновероятности) событий. При этом понятие равновероятности не определяется, а является исходным, основным. Мы считаем те или иные события равновероят- ными на основании тех данных, которыми мы располагаем о них из опыта. . > Например, если игральная кость изготовлена из однородного ме- талла, и имеет в точности форму куба, то из! соображения симметрии мы считаем выпадение 1, 2,..., 6 очков равновероятными событиями. Классическое определение вероятности события А. Если собы- тие А подразделяется на т частных случаев, входящих в полную груп- пу п попарно несовместимых и равновероятных событий, то в ер о - я т.н остью события А называется число Р(А) = —. п Например, если бросается монета, то возможны два равновероят- ных результата: выпадение герба и выпадение решетки. Эти события несовместимы и образуют полную группу1. Следовательно, вёроят- ность каждого из этих событии равна -. При бросании игральной кости возможны 6 равновероятных исхо- дов, образующих полную группу попарно несовместимых событий: выпадение 1, 2,..., 6 очков. Вероятность каждого из этих событий рав- ' г • ' ' на . 6 . . - Пусть теперь для того же бросания игральной кости событие А со- стоит в выпадении четного числа очков. Это событие подразделяется на три частных случая: выпадение 2, 4 и 6 очков. Поэтому т = 3, п = 6 3 1 и искомая вероятность равна Р(Л) = - = - 1 Мы считаем, что монета не может встать на ребро. 534
В теории вероятностей удобно пользоваться такой терминологией. Каждое осуществление данного фиксированного комплекса условий мы будем называть и спы такие м, а полную группу попарно несо- вместимых и равновероятных событий, которые могут произойти при этом испытании, мы назовем полной группой возмож- ных исходов испытания. Те из возможных исходов, на ко- торые подразделяется событие А, мы назовем исходами, благо- приятствующими событию Л. В этих терминах классическое определение вероятности можно пе- реформулировать так: вероятность Р (А) события А равна от- ношению числа возможных исходов испытания, благоприятствующих событию А, к числу всех возможных исходов испытания. Непосредственно из определения вытекают следующие с в о й с т - ва вероятностей. 1°. Для вероятности Р (А) любого события А справедливы неравен- ства 0 < Р(Л) < 1. Это вытекает из того, что среди всех п возможных исходов испы- тания число т исходов, благоприятствующих событию А, изменяется в пределах 0 < от < и. 2°. Вероятность достоверного события равна единице, а вероят- ность невозможного события равна нулю. Это вытекает из того, что в случае достоверного события все исхо- ды испытания благоприятствуют событию А, т. е. т = п, а в случае не- возможного события число от исходов испытания, благоприятствую- щих событию Л, равно нулю. 3°. Если событие А влечет за собой событие В, то Р (Л) Р (В). Действительно, если событие Л влечет за собой событие В, то чис- ло исходов, благоприятствующих событию В, н е меньше числа исходов, благоприятстствующих событию Л. 4°. Теорема сложения вероятностей. Если собы- тия А и В несовместимы, то Р (А + В) = Р (Л) + Р (В). Доказательство. Пусть среди общего числа возможных ис- ходов п событию Л благоприятствуют к исходов, а событию В благо- приятствуют / исходов. Так как по условию события А и В несовмес- тимы, то исходов, благоприятствующих одновременному наступлению событий Л и В, нет ни одного. Поэтому число тех исходов, при кото- рых наступает или событие Л, или событие В, равно к+1. Отсюда сле- дует, что Р(Л+В) = —= -+- = Р(Л) + Р(В). п п п 535
. Следствие. Вероятность суммы конечного числа попарно несовме- ' стимых событий равна сумме вероятностей этих событий. , Достаточно учесть, что если каждое из событий А и В несовмести- мо с событием С, то и их сумма А + В — событие, несовместимое с С. Приведем примеры использования классического определения ве- роятности. 1. Бросаются две игральные кости. Вычислить вероятность того, что сумма выпавших на двух костях очков равна 5. При бросании двух костей на каждой из них может выпасть от 1 до 6 очков. Таким обра- зом, всего возможно 36 различных исходов, которые, очевидно, все следует считать равновероятными. Из них благоприятствуют интересу- ющему нас событию следующие четыре исхода: 1) на первой кости выпало 1 очко, на второй кости выпало 4 очка; 2) на первой кости выпало 2 очка, на второй кости выпало 3 очка; 3) на первой кости выпало 3 очка, на второй кости выпало 2 очка; 4) на первой кости выпало 4 очка, на второй кости выпало 1 очко, т. е. из 36 исходов' благоприятствуют интересующему нас событию 4. „ 4 1 Следовательно, искомая вероятность равна 2. В ящике находится 20 лампочек, из них 15 новых и 5 перегорев- ших. Какова вероятность того, что 3 наудачу вынутые лампочки все окажутся новыми? . Так как 3 лампочки из общего числа 20 можно вынуть1 =1140 способами, а те же 3 лампочки из 15 новых можно вынуть С’5 =455 й 455 91 способами, то искомая вероятность равна-----=----. 1140 228 Классическое определение вероятности, основанное на понятии равновероятности событий и на конечности числа испытаний и весьма удобное для решения многих задач, оказывается неприменимым для решения более сложных задач (таких, как определение вероятности распада атома радиоактивного вещества или вычисление вероятности брака в некоторой массовой продукции). К решению подобных задач можно подойти с помощью так называемого статистическо- го определения вероятности, которое вводится следую- щим образом. Предположим, что производится большое число повторных испы- таний (т. е. многократно воспроизводится один и тот же комплекс 1 Символ С” обозначает число сочетаний из п элементов по т элементам, равное „ (см. § 3 гл. 1).' 536
условий) и наблюдается частота появления при этом некоторого собы- тия А. Если относительная частота наступления события А обнаружи- ли . вает устойчивую закономерность, т. е. если отношение —, где и — об- fl щее число испытаний, а т — число появлений события А, для доста- точно больших и и для большинства серий испытаний мало уклоняет- ся от некоторой постоянной величины, то эту постоянную величину называют статистической вероятностью события А. Рассмотрим следующий простой^ пример. В результате многих испытаний установлено, что при 200 выстре- лах стрелок попадает в цель 185 раз. Какова статистическая вероят- ность р поражения этим стрелком цели и сколько попаданий в цель можно ожидать от него при 2000 выстрелах? 185 Очевидно, что р =---= 0,925, и можно ожидать, что из 2000 вы- 200 стрелов удачными будут 2000-0,925 = 1850 выстрелов. В подробных курсах теории вероятностей устанавливается, что при широких предположениях вероятности события в классическом и ста- тистическом смыслах совпадают между собой. § 2. Условная вероятность. Независимость событий. Теорема умножения вероятностей С помощью классического определения вероятности рассмотрим задачу об отыскании вероятности некоторого события А при условии, что некоторое другое событие В произошло. Начнем с рассмотрения простого примера. Предположим, что в аудитории находятся 100 человек: 50 мужчин и 50 женщин, из кото- рых говорят по-английски 30 мужчин и 20 женщин, т. е. всего говорят по-английски 50 человек. Тогда вероятность события А, состоящего в том, что один из этих 100 человек, наудачу встреченный, будет гово- рить по-английски, равна, очевидно, 0,5. Пусть теперь нам известно, что наступило событие-В, состоящее в том, что встреченный человек — мужчина. Какова при этом вероятность того, что встреченный чело- век будет говорить по-английски? В этом случае полная группа равно- вероятных событий будет состоять из 50 элементов, а число благопри- ятствующих — равно 30, и потому искомая вероятность- (т. е. условная вероятность события А при усло- вии, что произошло событие Б, обозначаемая симво- лом Р(А/В)) будет равна 0,6. Аналогично вводится понятие условной вероятности и в общем случае. 537
Предположим, что из общего числа п исходов испытания событию А благоприятствуют т исходов, событию В благоприятствуют к исхо- дов, а событию А • В (т. е. одновременному наступлению событий А и В) благоприятствуют / исходов. Если событие В наступило, то это означает, что осуществился один из к благоприятствующих ему исхо- дов, причем из этих к исходов благоприятствовать событию А будут те / исходов, при которых наступает событие А • В. Отсюда следует, что вероятность Р (A/В) события А при условии, что наступило событие В, равна _/ Р(А / В) = - = -2- = к к Р(В) п В случае статистического определения вероятности равенство Р(А! В) = Р(А'В) <191> , Р(Р) принимается за определение условной вероятности Р (A/В) (при этом, конечно, предполагается, что Р (В) * 0). Равенство (19.1) можно переписать в виде Р(А-В) =Р(В)-Р(А / В). (19.2) - Меняя события А и В ролями, получим Р(А*В)=Р(А)-Р(В / А). (19.3) Таким образом, Р(Л-В) = Р(Л)-Р(В/Л)=Р(В)-Р(Я/В), и мы приходим к теореме умножения вероятностей: ве- роятность произведения двух событий равна произведению вероятно- сти одного из них на условную вероятность другого при условии, что первое событие произошло. Отметим, что эта теорема остается справедливой и в случае, если одно из событий А или В невозможно (так как, если, например, Р(А) = 0, то и Р(А - В) = 0). Одним из основных понятий всей теории вероятностей является понятие независимости событий. Определение. Говорят, что событие А независимо от события В, если Р (А/В) = Р (А). (19.4) 538
: ' / При выполнении равенства (19.4) соотношение (19.2) переходит в равенство Р(Л-В)=Р(Л)Р(2?), из которого с помощью (193) полу- | чим, что Р(В) = = Р(В / А). Это означает, что если событие А независимо от события В, то и । событие В независимо от события А. Поэтому при выполнений ра- I венства (19.4) мы будем говорить, что события А и В н е з а в й - симы. ’ i Для независимых событий теорема умножения вероятностей фор- мулируется особенно просто: если события А и В независимы, то ве- роятность одновременного их наступления равна произведению их ве- роятностей: I Р(А-В)=Р(А)-Р(В). 1 ’ Отметим, что обычно независимость тех или иных событий уста- навливается не с помощью формальной проверки справедливости ра- | венства (19.4), а на основании анализа реальных условий опыта. Так; 1 например, при бросании двух игральных костей мы вправе считать, что выпадение того или иного числа очков на одной из них является событием, независимым от того, сколько очков выпалр на другой ко- ' сти. ' ' Понятие независимости вводится и в случае любого числа п > 2 со- । бытий:, события Ah А2, ..., Ап называются независимыми в I совокупности, если каждое из этих событий независимо в паре с лю б ым произведением остальных событий (содержащим как все остальные события, так и любую их часть). ) Из этого определения сразу вытекает, что если события А\,Ац •••> Ап 1 независимы в совокупности, то вероятность произведения, этих собы- тий Р\(АГ- А2-...- Ап) v равна произведению. вероятностей Р(А1)-Р(А2)-...-Р(Ап) каждого из этих событий; _• Очевидно, что независимость событий Ai, А2, ..., Ап в совокупно- сти влечет за собой попарную независимость этих событий. < Чтобы показать, что обратное неверно, приведем следующий при- j мер. Рассмотрим тетраэдр, одна грань которого окрашена красной кра- ской, вторая — синей краской, третья — желтой краской, а четвер- тая— содержит участки, окрашенные всеми тремя этими красками. Назовем при бросании этого тетраэдра на пол событием А выпадение । грани, содержащей красную краску, событием В — выпадание грани, содержащей синюю краску, и событием С — выпадение грани, содер- жащей желтую краску. I 539
Так как каждая из трех красок присутствует на двух гранях из че- тырех, то Р(Я) = Р(В) = Р(С) = ^. Далее, легко проверить, что Р(А! В) = Р(С / В) =Р(А / С) = Х Действительно, если, например, про- изошло событие В, т. е. выпала грань, содержащая синюю краску, то возможны два случая: 1) либо эта грань содержит все три краски, 2) либо эта грань содержит только синюю (краску (и не содержит ни красной, ни желтой). Это означает, что Р(А / В)-Р(С I В) = &нало- 2 гично проверяется что P(J/C) = i. Таким образом, Р(А) = Р(А/В), Р (С) = Р (С/В) и Р (А) = Р (А/С), а это означает, что события А, В и С попарно независимы. Но эти.события не являются независимыми в со- вокупности, поскольку, например, Р(А) *Р(А / В - С), ибо Р(А) = ^, а Р(А / В • С) = 1 (в силу того, что грань, содержащая две кра- ски, содержит и третью). § 3. Формула полной вероятности. Формулы Бейеса Пусть Ai, А2, ..., Ап — полная группа попарно несовместимых со- бытий, а. В — некоторое событие, которое может произойти при на- ступлении одного и только о д н о г о из событий Ai, А2,..., Ап. Это означает, что , В=В-А,+В-А2+... + В-А„=£в-Аг (=1 Так как из попарной несовместимости событий А\, А2, ..., Ап выте- кает попарная несовместимость событий В-А\, В-А2, ..., В*Ап, то в силу следствия из теоремы сложения вероятностей (см. § 1) Р(В)=Р(В • 4)+Р(В • А2)+..:+Р(в -А„)=£p(B А/) й потому, при- ' ‘ 1=1 меняя к каждому слагаемому формулу умножения вероятностей вида (19.3), мы получим равенство р(в)=£р(4)-р(В/л,). (195) /=1 Формула (19.5) называется ф о р м у л о й п о л н о й вероят- ности и имеет многочисленные применения. 540
Приведем пример применения этой формулы. . ; Предположим, что мы располагаем четырьмя ящиками с электри- ческими лампочками, причем первый ящик содержит 10 исправных и 2 бракованные лампочки, второй и третий ящики содержат по 5 исп- равных и по 5 бракованных лампочек, а четвертый ящик содержит то- лько 10 исправных лампочек. Наудачу выбирается один ящик и из него одна лампочка. Какова вероятность того, что эта лампочка ока- жется исправной (события^)? Здесь события Ль Лг, Лз и Л4 — это выбор соответственно первого, второго, третьего и четвертого ящиков. Очевидно;'' что P(At) = P(A2) = P(A3) = P(A4) = —. Условные вероятности выбора исп- 4 равной лампочки из первого, второго, третьего и четвертого ящиков соответственно равны Р(В /4) = “ = “, Р(5/ Л2) = Р(Р/Л3) = Д = i Р(В/44) = 1. Следовательно, по формуле' (19.5) получим р(5)=1.5 + 1..1 + 1.1+1.1=12. 4642424 24 С помощью формулы полной вероятности легко получить так на- , зываемые формулы Б е й е с а; также широко используемые в раз- личных задачах. Пусть, как и выше, событие В может произойти при наступлении одного и только одного события Ai, А2, ..., А„ из некоторой полной группы попарно несовместимых событий. Требуется найти вероятность события At при условии, что событие В наступило. По теореме умножения вероятностей (см. равенства (19.2) и (19.3)) Р(А. • В) = Р(В) • Р(А/ / В) = P(At) • Р(В / Л,), откуда следует, что Р(Л/Я) = Р(4ГР(£М). Р(В) Воспользовавшись в знаменателе последнего равенства формулой полной вероятности (19.5), мы получим следующие формулы: Р(А./В) = (,= 1, 2, £р(лу)-р(в/лу) >1 Это и есть формулы Бейеса. Поясним их применение на рассмотренном выше примере с четы- рьмя ящиками, содержащими лампочки. Допустим, что взятая наудачу 541
лампочка оказалась исправной. Какова вероятность Р (Ад/В) того, что она вынута1 из четвертого ящика? Применив формулу Бейеса, получим,. ЧТО • р(л/*)=^=Л . 24 § 4. Последовательности независимых испытаний. Биномиальное распределение вероятностей Предположим, что мы производим некоторое испытание, исхода- ми которого "является полная группа попарно несовместимых событий Ai, А^Af, вероятности которых равны соответственно р\, р2..Рк, так что1 р\ + р2 + ...+рк= 1. Предположим далее, что эти испытания мы можем повторять сколько угодно раз и что вероятности р\, р2, ..., Рк различных его исхо- дов не зависят ни от номера испытания, ни от результатов испытаний, предшествовавших данному. В этом случае говорят, что рассматривается последовате- льность независимых испытаний. Изучение таких последовательностей имеет большой прикладной интерес. ..... Мы в дальнейшем будем рассматривать важнейший частный слу- чай к= 2, т. е. будем изучать испытания с двумя возможными исхода- ми (эти исходы мы условно будем называть «успехом» и «неудачей»). Такая схема была впервые изучена Я. Бернулли и носит его имя. Она сострит в, следующем...Нам известно, что вероятность наступления со- бытия А при одном испытании равна р (и потому вероятность проти- воположного события при одном испытании равна q= l-p'). Требуется найти вероятность Р„ (т) того, что в серии из п испыта- ний событие А наступит т раз (и потому противоположное событие наступит (и—т) раз). Вычислим сначала вероятность того, что в серии из п испытаний событие А наступит при т испытаниях, имеющих определенные фик- сированные номера (например,* номера ib i2i im), а при остальных испытаниях не наступит. Учитывая, что результаты различных испытаний независимы меж- ду собой, и, пользуясь теоремой умножения вероятностей, мы полу- чим, что искомая вероятность равна рт •qn"m. 'В силу того, что группа А2, .... Ац является полной. 542
Теперь, для того чтобы вычислить вероятность Рп (т), остается учесть, что число различных произведений, содержащих т эле- ментов, которые можно составить из п элементов, равно числу сочета- ет и! нии из п по ти, т. е. равно С„ =----------. nil(n-ni)\ Применяя теорему сложения вероятностей попарно несовместимых событий (см. § 1), мы окончательно получим так называемую ф о р - мулу Бернулли Р„(т) =---2?----p-.q т\(п-т)\ (19.6) Формулу (19.6) называют также формулой биномиаль- ного распределения вероятностей, ибо в правой ча- сти ее стоит (т + 1)-й член бинома Ньютона . (р+9)" =c„V +с>Г' +...+c;>v"’' +...+с><л В качестве простейшего примера применения формулы (19.6) вы- . числим вероятность того, что при 10-кратном бросании монеты герб выпадет ровно 5 раз. Применяя формулу (19.6) при п = 10, т = 5, 1 р = q = -, получим, что искомая вероятность равна р (5) = J“L-|'1Y/1Y= W! »о,25. 51-51 UJ UJ (5!)!-2“ Если рассматривается серия из п испытаний и вероятность р на- ступления события А при каждом из этих испытаний отлична от нуля и от единицы, то Рп (т) > 0 для всех т от нуля до я, т. е. в этой серий событие А может наступить любое число раз от нуля до п. При этом, однако, одни значения т будут более вероятны, а другие — ме- нее вероятны. Рассмотрим’ следующую задачу: при заданных пир найти то зна- чение т, для которого вероятность Рп (т) будет наибольшей. Иными словами, требуется найти наиболее вероятное число на- ступлений данного события А в серии из п испытаний. Если т — наи- более вероятное число наступлений события А, то Р„(т -1) £ Р„0и) > Р„(т +1), т. е. > 1, < 1. Ря(щ-1) . Р„(т) 543
Подставляя в последние два неравенства значения Рп (т -1), Р„ (т) и Р„(т + 1), определяемые формулой Бернулли (19.6), мы придем ю неравенствам л-ти + 1 п-т р т q т + 1 q которые-в свою очередь эквивалентны неравенствам п-р-т- р + р> mq, п-р-т-p^m-q + q. Два последних неравенства с учетом того, что р + q = 1, окончательно устанавливают диапазон изменения т: п-p-q<m<n-р + р. Так как р + q = 1, то сегмент [и • p-q, п- р + р] имеет длину, в точности равную единице. Поэтому этот сегмент сдержит либо одно целое число, либо (в исключительном случае, когда его концы сами яв- ляются целыми числами) два целых числа, которые и являются наибо- лее вероятными числами наступления события А. Примеры. 1°. Вероятность того, что в июле в течение дня пой- дет дождь, равна 3/17. Каково наиболее вероятное число дождливых дней в июле? о 3 14 93 14 .11 .11 Здесь п = 31, р =—, q =—, п- p-q =--------— = 4—, п- р + р=5—, .17 . 17 17 17 17 17 откуда следует, что наиболее вероятное число дождливых дней в июле равно 5. 2°. Каково наиболее вероятное число выпадений герба при 15-крат- ном бросании монеты? Здесь л = 15, р = q = -, п- p-q = l, п- р + р= 8, откуда следует, что наиболее вероятными , числами выпадений герба являются 7 и 8., § 5. Формула Пуассона . Формулы биномиального распределения вероятностей приводят при больших п к очень громоздким, практически трудно осуществи- мым вычислениям. Поэтому очень важно иметь достаточно простые приближенные формулы для, вычисления соответствующих вероятно- стей. Для задач, в которых число п независимых испытаний велико, а вероятность р наступления данного события А при каждом отдельном испытании мала, искомые вероятности Рп (т) могут быть вычислены с практически достаточной степенью точности по так называемой ф о рм уле Пуассона, которую мы сейчас установим. 544
Итак, предположим, что и велико, р мало, а произведение п • р = X есть некоторая ф и к с и р о в а н н а я величина. Прежде всего заметим, что из выражения для второго замечатель- ного предела lim(l + a)v“ = е (см. разд. 7.3 гл. 9) и из того, что (-а)->0 при а“До вытекает, что lim (1 -a)v“ = lim {[1 + (-a)]V(-“’Г1 = e\ a-*0 a-»0 и потому при фиксированном X г ft И г lim II — = hm n-HO I fl J n-VB i-M1 и J . (19.7) Теперь, учитывая, что X = п • р фиксировано, перепишем правую часть (19.6) в виде . . . . Рп= и(и-1)...(и-»7 + 1) р1П(1 _ру.т = /я! = 'л(л-1)...(л-от4-1) 1 Хт Л _ X ¥ ( _ X ml I п) ( п -т п Так как при фиксированном т и при п —> оо дробь, заключенная в последнем равенстве в квадратные • скобки, стремится к единице и limf 1-— I =1, то, используя выражение для предела (19.7), мы окон- **"1 п) чательно получим, что -т limP„(m) = ^--e’x. т1 Таким образом, биномиальное распределение вероятностей Рп(т) при п —> оо, при п • р = X = const и при фиксированном т переходит в так называемое распределение Пуассона, определяемое формулой Л m Р{т)=—е т\ Тривиально проверяется, что1 (19.8) 1 vS А!" Это вытекает из того, что V — = & (см. разд. 4.4 гл. 17).' ..о ml = е 545
Практически формула Пуассона дает малое отклонение от биноми- альной формулы (19.6) даже при сравнительно небольших п и не очень малых р, а вычисление вероятности по этой формуле существен- но проще, чем по формуле биномиального распределения. Особенно широкое применение формула Пуассона находит в теории массового обслуживания. Рассмотрим несколько примеров ее применения. 1°. При выработке некоторой массовой продукции вероятность по- явления одного бракованного изделия равна 0,01. Какова вероятность того, что в партии, состоящей из 100 изделий этой продукции, 2 изде- лия окажутся бракованными? Здесь вероятность р = 0,01 мала, а число п = 100 велико, так что X = р п = 1 По формуле Пуассона (19.8) получим, что искомая вероят- ность равна Р(2) = ^е*' «0,184. 2°. В лотерее разыгрывается один выигрыш на каждые 10 билетов. Какова вероятность получить не менее двух выигрышей, имея 50 биле- тов? Искомая вероятность равна Р(лг>2) = 1-Р(0)-Р(1). По формуле Пуассона (19.8) (при л = 50, /? = 0,1, Х = 5) получаем, что Р(0) = е'5 « 0,0067, Р(1) = 5 • е"5 « 0,034, так что Р (т > 2) = 1 - 6 • е*5 « 0,96. 3°. В учреждении, имеющем 100 внутренних телефонов, устанавли- вается коммутатор для связи с городом. Вероятность того, что данный телефон в данный момент времени ведет разговор с городом, равна 0,05. Сколько выходов в город должен иметь коммутатор для того, чтобы в каждый момент с вероятностью, не меньшей, чем 0,9, по крайней мере один из этих выходов был свободен? ' Предположим, что коммутатор имеет к выходов в- город, и заме- тим, что вероятность того, что число разговоров в данный момент не превышает (к - 1), равна Р(0) + Р(1) +... + Р(к- 1). Каждое слагаемое в последней сумме находится по формуле Пуас- сона (19.8), в которой л = 100, р = 0,05, Х = п-р = 5. Следовательно, Р(0) = е*5, Р(1) = 5-е'5, Р(2)=^-е-5, ..., P(fc-l>-2— Число к определяется из условия Р(0) + Р(1) +... +Р(к- 1) > 0,9. Нетрудно проверить, что это условие выполнено при к > 12. § 6. Предельные теоремы Муавра—Лапласа В этом параграфе мы установим другую предельную теорему, счи- тая, что вероятность р события А при каждом независимом испытании не является малой, а имеет некоторое фиксированное значение, отлич- 546
ное от нуля и di единицы, так что произведение п - р с ростом числа испытаний п не остается фиксированным (как это предполагалось прй выводе формулы Пуассона), а растет вместе с ростом п. „ ж Г Соответствующая предельная формула для частного-случая Р = ~ была найдена Муавром, а затем обобщена Лапласом на случай любого р, отличного от нуля и от единицы. 6.1. Локальная теорема Муавра—Лапласа Для строгой математической формулировки теоремы Муав- ра—Лапласа нам понадобится понятие равномерной с х од й - мости последовательности, с которого мы и начнем. Рассмотрим последовательность {/,(т)}> члены fn(ni) которой зави- сят от числа т, принадлежащего некоторому множеству М. Предполо- жим, что для каждого т из множества М последовательность {fn(m)} сходится при п -» оо к пределу f (т). Будем говорить, что последовательность {/й(т)} сходится к преде- лу/(т) равномерно по т н.а множестве М, если для любого сколь угодно малого чйсла е > 0 найдется номер N, обеспечи- вающий справедливость неравенства |4(/n) -f(m)\ < е для всех номеров п, удовлетворяющих условию п >.N, и с р а з у для всех т и з м н о ж е с т в а М. Теорема 1 (локальная теорема Муавра—Лапласа). Пусть веро- ятность наступления некоторого события А при каждом из п незави- симых испытаний постоянна и равна р, где 0<р< 1, -р, т — неотрицательное целое число, не превосходящее п и такое, что дробь хт = принадлежит фиксированному сегменту [а, Ь], Рп(пг) — / -Jn-pq ' вероятность того, что при этих п испытаниях событие А наступит ровно т раз. Тогда при п—><х> последовательность {yjnpq -Р^х)} схо- 1 ' - дится к пределу -=-е 2 равномерно по т для всех номеров т,для у2п которых хт принадлежит фиксированному сегменту [а, 6]. тт ТХ т -пр , Доказательство. Из равенств хт = —и q = 1 - р выте- кает, что ___ упРд т = пр + хт -yjnpq, n-rn = nq -xmylnpq. (19.9) Так как р и q не обращаются в нуль, а хт лежит на фиксированном сегменте [а, 6], то из равенств (19.9) вытекает, что при п-><х> оба чис- ла т и п-т также стремятся к бесконечности. 547
Отсюда следует, что для всех трех чисел л!, т\ и (п справед- ливы формулы Стирлинга1 и!=(—1 -л/2ли-(1 + ал), 1 • ^2пт • (1 + аm), V е ) \е) , м \п-т\ -----г л V е ), в которых ал, ат и ап_т стремятся к нулю при п оо. В силу формулы (19.6) Тйр? • л(”»)=• - - ” рт ?"~и- (1911) тцп-ргу. Используя в правой части (19.11) формулы Стирлинга (19.10), мы получим, что /--- d / ч п"-4п. Jnpq • Р„(т) = -^-==-=....... ..I., х v2n т"Чт • (п - т)"~т-Чп-т (19 12) V п” ЛП~т Р “ ’~п Vrt ?• (l+am)(l + a„_m) Правая часть (19.12) представляет собой произведение трех множи- телей: / \w / \п-т I I Я„(хт)=Ы • f-^-1 , = \п-т) N т \п-т Т„(хт) = ~-----(1 + ая)-. (l+aJ-(l+an-J Найдем предел при п-»оо каждого из множителей (19.13). Беря логарифм от йп(х„), получим . п/ч 1 (т\ . . . (п-т InR„(xm) = -т-In — -(n-m)-ln - ' ^пр) V nq ) (19.14) Подставляя в правую часть (19.14) значения т и (п-т), определя- емые равенствами (19.9), придем к следующему соотношению: 'См. дополнение к гл. 17. 548
lnRSxm) = 4np + xm4npq)-\n \+xm- (19.15) -{nq-xm4npq)\n Воспользуемся теперь для логарифмов, стоящих в правой части 2 (19.15), разложением по формуле Маклорена In (1 + у) = у - -у- + <9(у3), где при малых у символ О(/) обозначает величину порядка у5 (см. разд. 7.2 гл. 11). В результате получим Раскрывая скобки и учитывая, что р и q фиксированы, р + q = 1, а х„ лежит на фиксированном сегменте [а, 6], получим, что 1пД„(хт) = -хт-^npq ~х2а-q+^qx2m +о( -U | + хт 'Vw " 2 \^1п J -х2т-р + ^рх2п +of-LL-^-(p + 9) + of-^L-^ + (9f-Ll 2 \у/п J . 2 J 2 \\п) откуда вытекает, что Rn(xm) при п оо стремится к е 2 равномерно по т для всех номеров т, для которых хт принадлежит фиксированному сегменту [а, Ь]. Для нахождения предела при п оо величины 5л(хш)_ подставим в ее правую часть вместо т и (и - т) их значения, определяемые равен- ствами (19.9). При этом получим для Srt(xm) выражение 549
из которого сразу же следует, что S^(xm) при п —» оо стремится к едини- це (равномерно по т для значений т, для которых хт принадлежит фиксированному сегменту [а, />]). Наконец, из выражения для Тп(хт) очевидно, что при п -> оо эта ве- личина стремится к (равномерно по т для всех номеров т, для л/2л которых хт принадлежит фиксированному сегменту [а, /?]). , Так как произведение трех величин (19.13) равно величине, стоя- щей в правой части (19.12), то доказательство теоремы 1 завершено. 6;2. Интегральная теорема Муавра—Лапласа Локальная теорема Муавра—Лапласа оценивает вероятность того, что при большом числе п испытаний данное событие А наступит ровно т раз. В ряде прикладных задач более существенную роль играет оценка вероятности того, что число наступлений события А лежит в заданном диапазоне. Такую: оценку дает интегральная теорема Муавра—Лапла- са, которую мы сейчас установим. Теорема 2 (интегральная теорема Муавра—Лапласа). Пусть т — число наступлений события А в серии из п независимых испыта- ний;- при, каждом из которых вероятность наступления события А равна р, где 0 <р < 1, q=\-p. Тогда для любых фиксированных а и b ( ' \ „ т - пр . , а < Г__- < о того, 4пМ ) что т удов- летворяет неравенствам а<^<Ь, ^npq имеет при п со следующий предел: (19.16) (19.17) limP а< Jnpq ). 72л’ . ‘ Доказательство. В силу локальной теоремы Муавра—Лап- ласа Ря(т)=-1= V2n а+еЯЯ1), (19.18) 550
где стремится к нулю при л —> оо равномерно по всем те,;для кото- рых хт лежит на сегменте [а, £>]. В силу теоремы сложения вероятностей / Vp, ' (19.19) Р а<. —=2-Л('«), I J “ где суммирование в правой части (19.19) ведется по всем те, удовлет- воряющим неравенствам (19.16) (или, что то же самое, по всем те, для которых хт лежит на сегменте [a, Z>]). Используя в правой части (19.19) соотношение (19.18), мы получим, что EPn(w) = -i=-S-=e 2 +-А=£-=е 2 (19.20) т л/2я т ylnpq ’ >/2л т -Jnpq ' ’ ", а где во всех трех суммах суммирование ведется- по всем номера^ те, для которых хт лежит на сегменте [a, Z>]. ( 1 Заметим теперь, что первая сумма, стоящая в правой части’(19.20), 1 с учетом стоящего перед ней множителя -== является интегральной л/2л' ' 1 ' 1 -— суммой для функции —= е 2 на сегменте [а, 6], отвечающей разбие- •у2л ; . , нию этого сегмента на частичные сегменты [xm_i,xm] равной длины л 1 - ГТ Дхт =хт -хтЧ = —.-, стремящейся к нулю при п —> оо. Поэтому эта ylm । ь сумма при п -> оо стремится к интегралу -= ( е 2 dx. Вторая сумма, Ч2п За .стоящая в правой части (19.20), при п->оо стремится к нулю в силу равномерного (по всем те, удовлетворяющим неравенствам (19.16)) стремления к нулю величины елш. Теорема 2 доказана. С помощью дополнительных рассуждений можно доказать, что со- отношение (19.17) остается справедливым и в случае, когда а—>-со, b —> +оо (в этом случае интеграл, стоящий в правой части (19.17), пере- ходит в равный единице интеграл1 -=• | е 2 dx). л/2я Д Этот факт может быть использован для обоснования следующей знаменитой теоремы. ’ ’См. конец § 4 гл. 16. 551
' .Теорема Бернулли. Если т — число успехов в серии из п независи- мых испытаний up — вероятность успеха при каждом испытании, то для любого как угодно малого числа е > 0 вероятность р{- I и того, что т удовлетворяет неравенству -- р<£, п стремится при п->ю к единице. Эта теорема означает, что, как бы мало ни было число £ > 0, с ве- роятностью, сколь угодно близкой к единице, можно ожидать, что при достаточно большом числе испытаний п модуль отклонения — - р от- п носительной частоты — наступления события А ’от его вероятности р п г делается меньшим числа £. Для доказательства теоремы Бернулли достаточно заме- тить, что неравенство — - р < Епереходит в неравенства (19.16) при а = -£ ч и что при п оо число а стремится к -оо, а чис- ло Ь стремится к +оо. Рассмотрим теперь типичные задачи, приводящие к использованию теоремы Муавра—Лапласа. ' ‘ ' Сразу же отметим, что для решения многих из этих задач прихо- дится использовать значения функции Ф(х), называемой стандар- тным интегралом вероятностей или функцией Лапласа и имеющей вид1 1 х Z Е ? — (19.21) 0(x) = -7U-fe 2dt = J-je 2dt. Поэтому во всех курсах теории вероятностей приводится таблица зна- чений этой функции. Мы также приводим эту таблицу в приложении к настоящей главе. 1°. Пусть нам заданы число испытаний п и вероятность р успеха при одном испытании. Требуется вычислить вероятность того, что число успехов т будет заключено между заданными числами т\ ищ. ’Функция Лапласа Ф(х) не выражается через элементарные функции.. Она _ - л /2 -т является первообразной функции J—е 2. 552
С помощью интегральной теоремы Муавра—Лапласа получим, что эта вероятность равна . , Р(/Л| т < т2) = Р -пр < т-пр <т1-пр \]npq jnpq jnpq т2-пр j 7^ л/2тг п\~пр Пусть, например, монета бросается 1000 раз. Какова вероятность того, что выпадение герба будет заключено при этом в пределах от 470 до 530? В этом случае п = 1000, р = q = mi = 470, т2 = 530. Искомая веро- ятность будет приблизительно равна t 30 ' ' j / in \ -Д= [ е 2<£с = Ф =Ф(1,88). у/2п J30 IsTlOj _ "s-Ло Из таблицы находим, что значение Ф(1,88) равно приблизительно 0,94. 2°. Пусть снова заданы пир. Требуется найти в такое, чтобы' нера- т ’ • „ • венство----р<г выполнялось с вероятностью, не меньшей, чем за- п данная величина р. Из интегральной теоремы Муавра—Лапласа получаем для нахож- дения в уравнение 1 \РЧ f е 2 dx = р. Пусть, например, вероятность попадания в цель равна —. Произво- 4 дится 300 выстрелов. В каких пределах с вероятностью 0,89 будет ле- жать отклонение от р = — относительной частоты попаданий? Так как 4 13 и = 300, р = —, q = —, р = 0,89, то для определения s получаем, исполь- 4 4 зуя функцию (19.21); уравнение 553
< 40-е х2 [ е 2 Л = Ф(40-е) »0,89. Из таблицы находим, что 40 • в » 1,6, так что £ » 0,04. 3°. Пусть теперь заданы р, £ и р и требуется найти число испыта- ний п, обеспечивающее выполнение условия Р -- р<& I>р. I Iп ') Из интегральной теоремы Муавра—Лапласа для нахождения п по- лучаем неравенство 'гл РЧ f е 1 dx = Ф в Например, сколько раз нужно бросить монету для того, чтобы с ве- роятностью, не меньшей, чем 0,99, относительная частота выпадения герба отличалась от р-- не больше, чем на 0,02? 2 Так как р = д = ^, в = 0,02, р = 0,99, то для определения п получаем неравенство Ф(0,04-Тп)>0,99, из которого с помощью таблицы нахо- дим, что 0,04- 4п > 2,58. Таким образом, примерное число бросаний мо- неты п >4160. В заключение отметим, что формула Муавра—Лапласа дает удов- летворительные результаты уже при сравнительно небольших значени- ях п (порядка нескольких десятков). § 7. Случайные величины и функции распределения вероятностей Величины, которые могут принимать с определенными вероятно- стями те или иные значения, называются случайными вели- чинами. Точнее, переменная % называется случайной величиной, если для каждого фиксированного вещественного числа х задана веро- ятность того, что £<х. Эту вероятность мы будем обозначать сим- волом F(x). Указанную функцию F(x) назовем функцией распреде- ления вероятностей (или просто распределением вероятностей) данной случайной величины 554
Приведем примеры случайных величин. 1°. Пусть £ — число успехов в серии из п испытаний схемы Бер- нулли. Функция распределения вероятностей этой случайной величи- ны £ имеет вид ^) = ЕЛ('«)>гдеРл(/И) = С;(.рт.(1-^)"-'". , тех Это так называемое биномиальное распредел е н.и е вероятностей. ........ 2°. Пусть £ — случайная величина, принимающая значения к = О, 1, 2, ..., с вероятностями, соответственно равными Р(к) = — е~\ где Л! 1 > 0 — постоянное число. Функция распределения вероятностей этой случайной величины имеет вид . (19.22) (19.23) Это так называемое р а с п р е д е л е н и е Пуассона.. 3°. Рассмотрим случайную величину %, функция распределения ве- роятностей которой определяется формулой 1 х — F(x) = -^[e 2dt или более общей формулой Г(х) = —-== (е 201 dt. Это так называемое нормальное (или гауссово) распре- деление. Заметим, что в отличие от примеров 1° и 2° случайная вели- чина, распределенная по нормальному закону, может принимать не только целые, но и любые вещественные значения. Случайные вели- чины, подчиняющиеся нормальному закону распределения вероятно- стей, находят применение в самых разнообразных вопросах (в теории случайных ошибок наблюдений, в теории отклонения снаряда от цели и т. д.). 4°. Рассмотрим случайную величину %, функция распределения ве- роятностей которой определяется формулой 555
где p(t) равно постоянной---на сегменте а < t < b и равно нулю для Ь-а остальных значений t. Это так называемое равномерное рас- цределе н и е. Для такой случайной величины все ее значения со- средоточены на сегменте [a, Z>] и являются равновозможными. Установим основные свойства функций распределения вероятностей. i Пусть Xi и х2 — два произвольных числа таких, что xi < х2.. Для произвольной случайной величины £ выразим через ее функцию рас- пределения вероятностей F(x) вероятность Р(х,<^<х2) неравенства х,<^<х2. Докажем, что P(xt^^<x2')=F(x2')-F(xi). Действительно, пусть событие А состоит в том, что £<хь а собы- тие В состоит в том, что х, < £< х2. События А и В несовместимы. По- этому по теореме сложения вероятностей Р(А + В) = Р(А) + Р(В), т. е. Р(В) = Р(А + В)-Р(А). Но Р(А + В) = Р(&<х2) = F(x2), Р(А) = Р(^ <х()= = F(xi). Таким образом, Р(В) =Р(х{ <£<x2) = F(x2)-F(X|). Из доказанного равенства и из того, что вероятность любого собы- тия В неотрицательна, вытекает, что F(x2) >F(xi) при любых xi и х2 та- ких, что х2 > Хь т. е. функция распределения вероятностей F(x) неубы- вающая. Отметим также, что поскольку событие, состоящее в том, что £<+оо, является достоверным, то limF(x) = l. Выделим среди всех случайных*величин два важных класса. К пер- вому классу отнесем случайные величины, которые могут принимать лишь некоторый дискретный ряд значений (например, число очков, выпавших при бросании игральной кости, число выстрелов, сделанных до первого попадания, число успехов в серии из п независимых испы- таний). Такого рода случайные величины называются дискрет- ными.. Пусть £ — дискретная случайная, величина, принимающая значе- ния хь х2, х3 ... (число этих значений может быть как конечным, так и бесконечным, однако в последнем случае требуется, чтобы их можно/ было расположить в виде некоторой последовательности). Для опреде- ления функции распределения вероятностей рассматриваемой случай- ной величины % будем считать, что нам заданы вероятности pi того, что £=х,- (i= 1, 2, 3, ...), так что сумма всех этих вероятностей Pi +Р2 +рз + — равна единице. 556
Тогда, очевидно, функция F(x) распределения вероятностей будет иметь вид = (19-24) х,<х Функция (19.24) распределения вероятностей дискретной случай- ной величины является разрывной, она возрастает скачками в тех точ- ках х, которые являются возможными значениями причем величина такого скачка равна вероятности того, что £ принимает данное значе- ние Xi. Другой важный класс случайных величин образуют те, для кото- рых соответствующая им функция распределения вероятностей может быть при любом х записана в виде ч г , ч , (19.25)' F(x)= j p{y)dy. Такие случайные величины называются непрерывными, а стоящая под знаком интеграла (19.25) функция р(у) называется плотностью распределения вероятностей. Из установленных выше свойств F(x) вытекают следующие свойст- ва плотности распределения вероятностей р(у). > 1°. p(y)-Q Для всех У- 2°. При любых Х1,и хг справедливо равенство X, P(x,<£<x2) = Jp(y)dy. Х| +х 3°. J p(y)^=L -ОО Примерами непрерывных случайных величин могут служить вели- чина, распределенная по нормальному закону (19.23), и введённая выше в пункте 4° величина с равномерным распределением вероятно- стей. Введем важное понятие независимости случай н ы х величин. Две случайные величины £, и ,т| называются независимым^ если для любых двух чисел а и b события £ < а и х\<Ь независимы, т. е. если Р(&< а,х\< Ь} = Р(&< а)-Р(т|< Ь). 557
Для дискретных случайных'величин и.т|, имеющих возможные значения, соответственно равные хь х2, ..., хп ... и yh у2, ..., уп ..., это определение независимости эквивалентно тому, что Р(^=х.,т\ = ук) = Р(^-х.)-Р(т[ = ук) для любых ink. § 8. Математическое ожидание и дисперсия Полная характеристика случайной величины дается ее функцией распределения вероятностей. Однако при рассмотрении многих важ- ных задач удается обойтись без детального изучения функции распре- деления вероятностей и ограничиться изучением двух числовых харак- теристик случайной величины, первая из которых характеризует ее среднее значение и называется математическим ожида- нием, а вторая — характеризует отклонение от этого среднего значе- ния и называется дисперсией. 8.1. Определение математического ожидания Математическим ожиданием дискретной случайной величины £, принимающей значения х\, х2,..., х^ ... с вероятностями, соответственно равными р2, ..., рк, называется число, обозначаемое символом или Л/(£) и равное сумме по всем номерам к ' ? (19.26) Если число возможных значений случайной величины бесконечно, то предполагается, что ряд (19.26) сходится абсолютно (в противном случае говорят, что у случайной величины £ математического ожида- ния не существует). Математическим ожиданием непрерывной случайной величины £ с функцией распределения вероятно- стей (19.25) и с плотностью распределения вероятностей р(х) называется число, обозначаемое символом или M(Q и равное интегралу " ‘ 7 ( ' <19-27) мс, = I х • р(х)ах. - , , .Л. При этом предполагается, что несобственный интеграл (19.27) сходится но абсолютно, т. е. сходится интеграл J | х \-p(x)dx (в противном случае говорят, -оо I что у случайной величины математического ожидания не существует). Вычислим математические ожидания рассмотренных в § 7 слу- чайных величин. 558
1°. Вычислим математическое ожидание Mt, дискретной случайной величины £ с биномиальным распределением вероятностей. Так как ' принимает значения 0, 1,2, ..., п с вероятностями, соответственно рав- ными Р„(0), Р„(1), Ря(2), ..., Р„(п), то по определению Mt, = • Рп (т) = ----—----- S ^(от-1)!(л-от)! Я = п-р- £ Л Рт • Я"''"" =п-р(р + q)"~' =п-р. т*о т!(п М - от)! 2°. Вычислим математическое ожидание Mt, дискретной случайной величины £, распределенной по закону Пуассона. Эта величина t, при- нимает значения от = 0, 1, 2,... с вероятностями, соответственно равны- V / j ми e'A, ке~\ —• Поэтому по определению = £от-^-еГх . = Х • e-k • =Х. /л=0 772* m=l (^7 1). 3°. Вычислим математическое ожидание Mt, непрерывной случай- ной, величины %, распределенной по нормальному закону Гаусса с । (x~a)i плотностью распределения вероятностей —= -е 2о2 . По определе- Оу12п НИЮ 1 “ <х-а)г ] W «о U-»)3 Mt, =---==• (х-е 2°2 dx =—=f(x-a)e 2®2 dx +—Д=[е 2o1 dx. ст-л/2л Д ал/2лД сгл/2лД. (19.28) Произведя в каждом из интегралов в правой части (19.28) замену пере- „ л х-а меннои t =-------, мы получим, что а о 7 1 ? (19-29) Mt,=-=-[te 2 dt+ а —=='] е 2dt = a, Ч2п Д i / » ибо первый из интегралов (19.29) равен нулю (как интеграл от нечет- ной функции в симметричных пределах), а второй из интегралов (19.29) равен \/2я (см. § 4 гл. 16). 559
Таким образом, параметр а в нормальном распределении (19.23) представляет собой математическое ожидание рассматриваемой слу- чайной величины. 4°. Вычислим, наконец, математическое ожидание непрерывной случайной величины с равномерным распределением, определяемым плотностьюр(х), равной —-— на сегменте а <х< 5 и равной нулю вне Ь-а этого сегмента. По определению .„If, 1 (Ь2-а2) а + Ь ML =----\ х ах ------------- =--- Ь-а{ (Ь-а) 2 2 8.2. Свойства математического ожидания Математические ожидания как дискретной, так и непрерывной слу- чайных величин обладают одинаковыми свойствами. Мы будем фор- мулировать эти свойства безотносительно к тому, дискретной или не- прерывной является случайная величина, а все обоснования будем проводить для дискретной случайной величины; 1°. Математическое ожидание постоянной С равно самой этой постоянной. Действительно, постоянную С можно рассматривать как случай- ную величину, которая может принимать только одно значение С с ве- роятностью, равной единице. 2°. Математическое ожидание суммы двух случайных величин рав- но сумме их математических ожиданий. Ради определенности рассмотрим две дискретные случайные вели- чины £ и т|, принимающие бесконечное число значений хь х2> *з, — и Уъ У2, Уз, ... соответственно. Обозначим через рк вероятность принятия случайной величиной L, значения Хк, через qi — вероятность принятия случайной величиной т] значения yi, а через — вероятность того, что одновременно случайная величина % принимает значение х*, а слу- чайная величина т| принимает значение у/. Тогда по определению ма- тематического ожидания M(t, + п) = ^(хк + у,)гы = ££(хЛ + У^ги = kj=\ ы /=1 (19.30) *=i. Zz*/ • ы 560
Так как по теореме о полной вероятности 2^гк1 — это вероятность /=1 события, состоящего в том, что случайная величина £ принимает зна- чение Xk при условии, что случайная величина Т| принимает одно из всех своих возможных значений (что достоверно), то ^гк1 = рк. /=1 Совершенно аналогично устанавливается, что ^rkl=qt. Вставляя £=1 последние два равенства в (19.30), окончательно получим, что W + п) = -р^у,-9/ =№> + *=1 /=1 Следствие. Математическое ожидание суммы конечного числа случайных величин равно сумме их математических ожиданий. 3°. Математическое ожидание произведения независимых случайных величин равно произведению их математических ожиданий. Сохраним обозначения, введенные при доказательстве свойства 2°. Так как случайные величины £ и q независимы, то rkl = pk -qt. Поэто- му W -n) = £**-у,-ra =££** • у, • pk-q, = kj=\ fc=l /=1 Следствие. Постоянный множитель можно выносить за знак математического ожидания. Действительно, М(С£) = МС • М^ = С • М^ (поскольку МС = С в силу свойства 1°). 8.3. Определение дисперсии случайной величины Для того чтобы охарактеризовать не только среднее значение случай- ной величины, но и ее «рассеяние», т. е. ее отклонение от этого среднего значения, введем понятие дисперсии случайной величины. Дисперсией случайной величины Е, назовем число, обозначае- мое символом или Dfg) и равное математическому ожиданию квадрата отклонения этой случайной величины 5, от ее математиче- ского ожидания М^, т. е. равное Dt, = M(£-M&. (19.31) 561
Для дискретной случайной величины! £, принимающей значения хь х2, хь ... с вероятностями, соответственно равными Рг, • Рк, в силу соотношений (19.26) и (19.31) мы получим следующее выраже- ние для дисперсии: / = (19.32) к : Для непрерывной случайной величины £ с функцией распределе- ния вероятностей (19.25) и с плотностью распределения вероятностей р(х) в силу соотношений (19.27) и (19.31) дисперсия имеет вид D^= (х - М& p(x)dx. (1933) 1°. Вычислим дисперсию дискретной случайной величины £ с биномиальным распределением: вероятностей. Используя равенство (19.32) и свойство 2° математического ожидания и учитывая, что мате- матическое ожидание -Р„(/л) этой величины £ равно п-р, а т=0 сумма ^Р„(т) равна единице, получим, что т=0 DZ, = ^(т-пр)1 -Ря(т) = %т2 -Ря(т)-2пр-£т-Рп(т) + /л=0 т=0 т=0 +п2р2 ^Р„(т) = ^т2Р„(т)-2п2р2 + п2 р2 =^т(т-1)Ря(т) + т=0 т=0 т=2 +^т-Ря(т)-п2р2 'д""П +пР~п2Р2 = т=о т-2 т\(п-т)\ = р2 • п(п -1) • £--• Рт~2 -q""" + пр - п2 • р2 = т.2(те-2)!(л-»г)! =.р2 п(п-1)• 2—.J”"?’ + пР"п2Р2 = т=о т![(п-2)-т]1 = р2п(п - 1)(р + q)n~2 +пр- п2р2 = р2п(п -1) + пр-п2р2 = = np(l-p) = npq. 2°. Вычислим дисперсию непрерывной случайной величины распределенной по нормальному закону Гаусса (19.23). Используя ра- венство (19.33) и уже вычисленное математическое ожидание этой ве- личины, равное а, получим, что 562
X (х-а)1 D^ = -L f(x-g)2e dx. q • v2n i . X~a Сделав замену t =------и проинтегрировав по частям получающийся а ос __ при этом интеграл, получим, учитывая, что ( e~r,2dt = ^2п, Таким образом, мы выяснили смысл обоих параметров а и ст, от которых зависит нормальное распределение Гаусса (19.23): это мате- матическое ожидание и корень квадратный из дисперсии. В частности, распределение вероятностей (19.22) — это нормаль- ное распределение Гаусса с математическим ожиданием, равным нулю, и дисперсией, равной единице. Читателю предлагается проверить, что дисперсия дискретной слу- чайной величины, распределенной по закону Пуассона, равна X, а дис- персия непрерывной случайной величины с равномерным на сегменте [а, Ь] распределением равна — -(Ь-а)2. 12 8.4. Основные свойства дисперсии 1°. Дисперсия постоянной С равна нулю. Это следует из того, что математическое ожидание МС равно С. 2°. Постоянную С можно выносить за знак дисперсии, возводя ее при этом в квадрат, т. е. D(C^)=C2 -D^. Это вытекает из того, что М(С^) = С • и из равенства (19.31). 3°. Дисперсия суммы (% + Т|) двух независимых случайных ве- личин и Т| равна сумме их дисперсий. Действительно, D (5, + т|) = М (§ + т| - М(Е, + r|))2 = М [(^ - М^) + + (п - Мп)]2 = М й - Л^)2 + М (п - ЛГт|)2 + 2М [£ - (т| - Л/г|)] + + От| + 2М [(£ - MQ (т| - Мт])]. Достаточно доказать, что М[(£ - • (п - Лй])]=0. (19.34) Так как по . условию случайные величины 5, и т] независимы, а и Л/т| — числа, то случайные величины % - и г| - Л/г| также независи- мы, и потому в силу свойства 3° из разд. 8.2 563
A/[(J;-A/!;)-(q-A/q)]=A/(^-A^)-A/(q-A/q). (19,35). Так как и Л/q — числа, то в силу Свойства 1° математического ожидания М (MQ = Л/%, М (Л/q) = Л/q и потому М (% - = = = = Q и аналогично A/(q-Л/q) = Мх\-М(Л/q) = = Л/q -Л/q = 0. Из последних двух равенств и из (19.35) вытекает справедливость соотношения (19.34). Следствие 1. Дисперсия суммы конечного числа попарно не- зависимых случайных величин равна сумме их дисперсий. Следствие 2. Дисперсия разности двух независимых случай- ных величин % и q равна сумме их дисперсий. Действительно, £) (% - q) =/) [% + (-q)] = /)% + £> (-1 • q) = £>% + (-1)2 • Z)q = £>% + Dq. I 8.5. Среднее квадратичное уклонение случайной величины Средним квадрат и ч н ы м уклонением случайной величины называется корень квадратный из ее дисперсии. Непосредственно из свойств дисперсии вытекают следующие свой- ства среднего квадратичного уклонения. 1°. Среднее квадратичное уклонение постоянной равно нулю. 2°. При умножении случайной величины на постоянную ее среднее квадратичное уклонение умножается на ту же постоянную. 3°. Если ^2, ^>п — попарно независимые случайные величины, a qi, q2, qn — их средние квадратичные уклонения, то среднее квад- ратичное уклонение Q их суммы £1 + £2 + — + равно 6 = V ы Свойство 3° имеет большой интерес с прикладной точки зрения. Дей- ствительно, пусть случайные величины ^2, попарно независимы и все имеют одну и ту же функцию распределения (таковы, например, результаты повторных измерений одной и той же величины, если они производятся при постоянных условиях). При этом среднее квадратичное уклонение каждой из этих величин будет иметь одно и то же значение q. Тогда среднее квадратичное уклонение Q суммы + £2 + ••• + будет равно Q = q4n, а потому среднее квадратичное уклонение среднего арифметического - • (£1 + £2 + ••• + £л) будет равно • q. п jn Таким образом, беря вместо результата одного измерения среднее арифметическое результатов п измерений, мы уменьшаем среднюю 564
квадратическую ошибку в 4п раз (разумеется, при отсутствии ка- кой-либо систематической ошибки в измерениях). 8.6. Закон больших чисел в форме Чебышева Теорема Чебышева. Пусть £2» —> — — последовательность попарно независимых случайных величин, имеющих дисперсии, ограни- ченные одной и той же постоянной, т. е. Dt,k < С (для всех к). (19.36) Тогда для любого положительного числа е существует предел т. е. для больших п с вероятностями, как угодно близкими к единице, средние арифметические случайных величин £1, ^2, — можно заменить средними арифметическими их математических ожиданий. Доказательство проведем для непрерывных случайных величин. Сначала докажем неравенство Чебышева Р(|^ - М^\> е) < (1938) £ справедливое для любого £ > 0 и любой случайной величины имею- щей конечную дисперсию. Если р(х) — плотность распределения веро- ятностей случайной величины то Р(|^-Л^|>е)= fp(x)dx. (19.39) |х-ЛЛ|^е Поскольку для всех х, стоящих под знаком интеграла (19.39), спра- ведливо неравенство 1 < (х - М^)2, то из (19.39) вытекает неравенство £ Р(|^ - м^\ > Е) <; 4 • J - М)2 • Р<№ (19-40) Б |х-Л^Е Заменяя интеграл, стоящий в правой части (19.40), интегралом по всей бесконечной прямой, получим, что P^-M^\>s)<\-](x-M^1-p{x)dx=^. £ -оо Б Неравенство Чебышева (19.38) доказано. 565
Переходя к доказательству теоремы, заметим, что в силу свойства 2° дисперсии и оценки (19.36) (1941) 4=1 J п 4=1 п 4=1 п Из (19.41) и неравенства Чебышева (19.38), взятого при £ = — п (£1 + ^2 + ••• + Ъп), вытекает, что Переходя в последнем неравенстве к пределу при и -> оо и исполь- зуя следствие 2 из теоремы 8 гл. 7, получим, что п 4=1 п 4=1 ) limP Так как вероятность не может быть больше единицы, то теорема Че- бышева доказана. * * * В заключение отметим, что наибольший интерес с прикладной точ- ки зрения представляет анализ событий «почти достоверных» (вероят- ность наступления которых близка к единице) и «почти невозможных» (вероятность наступления которых мала). Подчеркнем, что при этом вопрос о том, какую вероятность следу- ет считать малой, а какую нет, должен решаться для каждой конк- ретной задачи отдельно. Например, если фабрика, изготовляющая пу- говицы, допускает 1% брака, то можно считать вероятность получить бракованную пуговицу достаточно малой. Но тот же процент брака со- вершенно недопустим на предприятии, изготовляющем парашюты.
Приложение Таблица значений стандартного интеграла вероятностей (функции Лапласа) Ф(а) = -}= f е~ dt = Д f е“ dt а Ф(а). а Ф(а) а Ф(а) а Ф(а) а Ф(а) 0,00 0,000 0,60 0,451 1,20 0,770 1,80 0,928 2,40 0,984 0,01 0,008 0,61 0,458 1,21 0,774 1,81 0,930 2,41 0,984 0,02 0,016 0,62 0,465 1,22 0,778 1,82 0,931 2,42 0,984 0,03 0,024 0,63 0,471 1,23 0,781 1,83 0,933 2,43 0,985 0,04 0,032 0,64 0,478 1,24 0,785 1.84 0,934 2,44 0,985 0,05 0,040 0,65 0,484 1,25 0,789 1,85 0,936 2,45 0,986 0,06 0,048 0,66 0,491 1,26 0,792 ’ 1.86 0,937 2,46 0,986 0,07 0,056 0,67 0,497 1,27 0,796 1,87 0,939 2,47 0,986 0,08 0,064 0,68 0,504 1,28 0,800 1,88 0,940 2,48 0,987 0,09 0,072 0,69 0,510 1,29 0,803 1,89 0,941 2,49 0,987 0,10 0,080 0,70 0,516 1,30 0,806 1,90 0,943 2,50 0,988 0,11 0,088 0,71 0,522 1 1,31 0,810' 1 1,91 0,944 2,51 0,988 0,12 0,096 0,72 0,528 .. 132 0,813 1,92 0,945 2,52 0 988 0,13 0,103 0,73 0,535 1,33 0,816 1,93 0,946 2,53 0,989 0,14 0,111 0,74 0,541 1,34 0,820 1,94 0,948 2,54 0,989 0,15 0,119 0,75 0,547 1,35 0,823 1.95 0,949 2,55 0,989 0,16 0,127 0,76 0,553 1,36 0,826 1,96 0,950 2,56 0 990 0,17 0,135 0,77 0,559 1,37 0,829 1,97 0,951 2,57 0,990 0,18 0,143 0,78 0,565 1,38 0,832 1,98 0,952 2,58 0,990 0,19 0,151 0,79 0,570 1,39 0,835 1,99 0,953 2,59 0,990 0,20 0,159 0,80 0,576 1,40 0,838 2,00 0,955 2,60 0 991 0,21 0,166 0,81 0,582 1,41 0,841 2,01 0,956 2,61 0,991 0,22 0,174 0 82 0,588 1,42 0,844 2,02 0,957 2,62 0,991 0,23 0,182 0,83 0,593 1,43 0,847 2,03 0,958 2,63 0,991 0,24 0,190 0,84 0,599 1,44 0,850 2,04 0,959 2,64 0,992 0,25 0,197 0 85 0,605 1,45 0,853 2,05 0,960 2,65 0,992 0,26 0,205 0,86 0,610 1,46 0,856 2,06 0,961 2,66 0,992 0,27 0,213 0,87 0,616 1.47 0,858 2,07 0,962 2,67 0 992 0,28 0,221 0,88 0,621 1,48 0,861 2,08 0,962 2,68 0,993 0,29 0,228 0,89 0,627 1,49 0,864 2,09 0,963 2,69 0,993 0,30 0,236 0,90 0,632 1,50 0,866 2,10 0,964 2,70 0,993 0,31 0,243 0,91 0,637 1,51 0,867 2,11 0,965 2,72 0,993 0,32 0,251 0,92 0,642 1,52 0,871 2,12 0,966 2,74 0,994 0,33 0,259 0,93 0,648 1,53 0,874 2,13 0,967 2,76 0,994 0,34 0,266 0,94 0,653 1,54 0,876 2,14 0,968 2,78 0,995 0,35 0,274 0,95 0,658 1,55 0,879 2,15 0,968 2,80 0,995 0,36 0,281 0,96 0,663 1,56 0,881 2,16 0,969 2,82 0,995 0 37 0 289 0,97 0,668 1,57 0,884 2,17 0,970 2,84 0,995 0,38 0,296 0,98 0,673 1,58 0,886 2,18 0,971 2,86 0,996 0,39 0,303 0,99 0,678 1,59 0,888 2,19 0,971 2,88 0,996 0,40 0,311 1,00 0,683 1,60 0,890 2,20 0,972 2,90 0,996 0,41 0,318 1,01 0,688 1,61 0,893 2,21 0,973 2,92 0,996 0,42 0,326 1,02 0,692 1,62 0,895 2,22 0,974 2,94 0,997 0,43 0,333 1,03 0,697 1,63 0,897 2,23 0,974 2,96 0,997 0,44 0,340 1,04 0,702 1,64 0,899 2,24 0,975 2,98 0,997 0,45 0,347 1,05 0,706 1,65 0,901 2,25 0,976 3,00 0,997 0,46 0,354 1,06 0,711 1,66 0,903 2,26 0,976 3,10 0,998 0,47 0,362 1,07 0,715 1,67 0,905 2,27 0,977 3,20 0,999 0,48 0,369 1,08 0,720 1,68 0,907 2,28 0,977 3,30 0,999 0,49 0,376 1,09 0,724 1,69 0,909 2,29 0,978 3,40 0,999 0,50 0,383 1,10 0,729 1,70 0,911 2,30 0,979 3,50 0,9995 0,51 0,390 1,1'1 0,733 1,71 0,913 2,31 0,979 3,60 0,9997 0,52 0,397 1,12 0,737 1,72 0,915 2,32 0,980 3,70 0,9998 0,53 0,404 1,13 0,742 1,73 0,916 2,33 0,980 3,80 0,99986 0,54 0,55 0,411 0,418 1,14 1,15 0,746 0,750 1,74 1,75 0,918 0,920 2,34 2,35 0,981 0,981 3,90 0,99990 0,56 0,57 0,425 0,431 1,16 1,17 0,754 0,758 1,76 1,77 0,922 0,923 2,36 2 37 0,982 0,982 4,00 0,99994 0,58 JL52 0,438 Q445...1 1,18 LL12 0,762 0.766- 1,78 JL29 0,925 0 97.7 2,38 239 0,983 0-983 5,00 0,99999994
Глава 20 Краткие сведения о задачах линейного программирования § 1. Постановка задачи линейного программирования Под линейным программированием понимается раздел теории отыскания минимального или максимального значения линейной функции/(х) =f(x\, х2, ..., х„) = езд + сгх2 +... + с„хл (ci, с2,...» ,..., сп — постоянные) на множествах значений хь х2,хп , задаваемых системами линейных неравенств и линейных равенств. Общая задача линейного программирования может быть сформу- лирована следующим образом: .. найти минимальное значение функции /(х) = С1Х] + С2Х2 + ... + с„х„ (20.1) при условиях: Хк > 0 для некоторых или для всех к из множества 1, 2,..., п, (20.2) * anxl+al2x2+...+alnx„< bt, a2ixt+a22x2+...+a2nx„<b2, (20.3) < +ат2х2+...+ат1х„ < Ьт amrt,lXl +атй,2Х2 +"'+атф| = (20.4) . + “,2*2 +•••+ asnxn=bs, в которых при всех j = 1, 2,..., п и при всех i = 1, 2,..., 5 значения cj, bt и ау являются заданными постоянными числами. При этом принято называть функцию (20.1) целевой функ- цией, условия (20.3) — ограничениями типа нера- венств, условия (20.4) — ограничениями типа ра- венств. Условия (20.2) неотрицательности некоторых или всех пе- ременных Хк, конечно, тоже являются ограничениями типа неравенств, но их принято выделять отдельно. При постановке общей задачи не исключаются случаи, когда усло- вия (20.2) либо справедливы для всех номеров к, либо вообще отсутст- вуют. Не исключаются также и случаи, когда в общей задаче отсутст- 568
вуют ограничения типа равенств (20.4) или отсутствуют ограничения типа неравенств (20.3). Точку х = (Х|, х2, ..., х„), координаты которой удовлетворяют всем условиям (20.2) — (20.4),.принято называть допустимой точ- кой задачи (20.1) — (20.4) или кратко просто допустимой точкой. s Множество X всех допустимых точек х принято называть допу- стимым множеством. Обозначим символом ft минимальное значение функции f(x) на допустимом множестве X. Точку х, = (Х|‘, xj, ..., х*) из допустимого множества X назовем решением задачи (20.1) — (20.4), если /(х,)-ft. Задача (20.1) — (20.4) может иметь не одно решение. Множество X», объединяющее все решения этой задачи, принято называть мно- жеством решений указанной задачи. Если ставится задача об отыскании не минимального, а максималь- ного значения функции (20.1) при тех же условиях (20.2) — (20.4), то достаточно в формулировке задачи (20.1) —(20.4) взять вместо функ- ции /(х) функцию Л(х) = -/(х). Рассмотрим примеры прикладных задач, приводящих к сформули- рованной задаче линейного программирования. 1.1. Задача оптимального планирования производства Пусть на некотором предприятии изготовляются п видов продук- ции из т видов сырья. Известно, что на изготовление одной единицы продукции у-го вида уходит а у единиц сырья г-го вида. В распоряже- нии предприятия имеется bt единиц сырья i-го вида. Известно также, что с каждой единицы продукции у-го вида предприятие получает Cj единиц прибыли. Требуется определить, сколько единиц хь х2, ..., х„ каждого вида продукции нужно изготовить предприятию, чтобы обес- печить себе максимальную прибыль. Если предприятие наметит себе план производства х = (xj, х2,..., х„) единиц продукции каждого вида, то оно израсходует а(1Х| + + адх2 +... + а/пхл единиц сырья i-ro вида и получит сзд+с2х2 + ... + с^сп единиц прибыли. Очевидно также, что х,- > 0 для всех i = 1, 2,..., п. Поэтому мы приходим к следующей задаче линейного программи- рования: найти максимальное значение функции /(x) = C|Xi + + с2х2 +... + с„хп при ограничениях х, >0, х2 > 0, ..., хп 0, а,1X1 + а12х2 + ... + ainxn < bt (для всех 1 = 1, 2, ..., т). Эта задача является частным случаем поставленной выше общей за- дачи об отыскании минимума (20.1) — (20.4) с заменой Дх) на -Дх). 569
1.2. Транспортная задача 3 Пусть имеется г карьеров, на которых добывается песок, и р по- требителей песка (например, р кирпичных заводов). В z-м карьере (z= 1, 2, ..., г) ежесуточно добывается тонн песка, а j-му потребите- лю (/ = 1, 2, ..., р) ежесуточно требуется bj тонн песка. Пусть су — сто- имость перевозки одной тонны песка с z-го карьера у-му потребителю. Требуется составить план перевозок песка так, чтобы общая стоимость перевозок была минимальной. Обозначим через ху количество тонн песка, которое требуется пе- ревезти из z-ro карьера у-му потребителю. Тогда с z-ro карьера будет вывезено хп + Х/2 + ... + xip = (20.5) тонн песка, а у-му потребителю будет доставлено ху + x2j 4-... + xrj - bj (20.6) тонн песка (z= 1, 2, ..., г; j= 1, 2, ..., р). Общая стоимость перевозок будет равна /-1 <-1 причем естественно потребовать, чтобы для всех j= 1, 2, ...» р\ i=l, 2, ..., г ху > 0. (20.8) Таким образом, мы приходим к задаче о нахождении минимума функции (20.7) при выполнении условий (20.5), (20.6) и (20.8), которая, очевидно, является частным случаем общей задачи (20.1) — (20.4). 1.3. Задача об оптимальном использовании посевной площади Пусть под посев р культур отведено г земельных участков, имею- щих площади, соответственно равные Ь\, Ь2, ..., Ьг гектарам. Известно, что средняя урожайность z-й культуры на j-м участке составляет ау центнеров с гектара, а прибыль за один центнер i-й культуры состав- ляет с,- рублей. Требуется определить, какую площадь на каждом участке следует отвести под каждую из культур, чтобы получить максимальную при- быль, если по. плану должно быть собрано не менее dt центнеров каж- дой i-й культуры. Обозначим через ху площадь, которую планируется отвести под i-ю культуру на j-м участке. Тогда для каждого J = 1, 2, ..., г x\j + ху + ... + xpJ = bj. (20.9) 570
Ожидаемый средний урожай z-й культуры со всех участков равен апхл + ааха + — + центнеров. Поскольку согласно плану должно быть произведено не менее d, центнеров z-й культуры, то для любого 1=1, 2,..., р ацха + ааХа + - + > db (20.10) Ожидаемая прибыль от урожая z-й культуры равна с, (оцХц + ацха +... + airxir), а от урожая всех культур — ч < / . . . ч (20.11) Дх) = >. с; (ацха + апха + ... + aitxir). 4 7 z=i Таким образом, мы приходим к задаче об отыскании максимально- го значения функции /(х), определяемой равенством (20.11), или, что то же самое, к задаче об отыскании минимального значения функции [-/(х)] при выполнении условий (20.9) и (20.10) и естественных огра- ничений х,у>0 при всех i= 1, 2, ..., р и всех J= 1, 2, ..., г. Если переобозначить р • г величин Ху (z = 1, 2, ..., р; j= 1, 2, ..., г) через хь х2, ..., хп, где п =р • г, и умножить неравенство (20.10) на -1, то мы также придем к задаче вида (20.1) — (20.4). § 2. Геометрическая интерпретация задачи линейного программирования Для упрощения рассуждений рассмотрим случай п = 2, т. е. рас- смотрим следующую задачу: найти минимальное значение функции /(х) = cixi + с2х2 (20.12) при выполнении условий xi>0, х2>0, (20.13) а,1X1 + апх2 < bi при z = 1, 2, ..., т. (20.14) Обозначим через Хо множество всех точек (хь х2), удовлетворяю- щих условию (20.13), т. е. неотрицательный квадрант плоскости (хь х^), а через Xt — множество всех точек (хь х2), удовлетворяющих z-му неравенству (20.14), т. е. полуплоскость, опирающуюся на пря- мую линию а,1X1 + аах2 = Z»,-. При этом z= 1, 2, ..., т. Ясно, что допустимое множество X задачи (20.12) — (20.14) явля- ется пересечением множеств Хо, Х2, ... , Хт. . Может случиться, что указанное пересечение пусто, т. е. задача (20.12) — (20.14) теряет смысл. Такой случай изображен на рис. 20.1. На этом рисунке т = 2 и два множества X и Х2 пересекаются за пре- делами квадранта Xq. 571
Рис. 20.1 Если же допустимое множество X не является пустым, то оно явля- ется пересечением конечного числа полуплоскостей и представляет со- бой выпуклое многоугольное множество, границей которого является ломаная линия, составленная из отрезков координатных осей и отрез- ков прямых <7,1X1 + <з12х2 = bj, i = 1, 2, ..., т. Это многоугольное допусти- мое множество X может быть как ограниченным (как на рис. 2ГГ.2), так и неограниченным (как на рис. 20.3). Пусть а — какое-либо значение целевой функции (20.12), которую можно представить в виде f (х) = С|Х] + с2х2 = <с, х>, где <с, х> — ска- лярное произведение двух векторов c = (ci, с2) и х = (хь х2). Тогда уравнение ciXi + с2х2 = а (20.15) задает линию уровня целевой функции f(x), соответствующую ее зна- чению, равному а, и на плоскости определяет прямую, перпендикуляр- ную вектору с = (ср с2)^0. При изменении а от -со до +оо прямая (20.15), смещаясь параллельно самой себе, «заметает» всю плоскость. При этом вектор с = (ср с2), являющийся градиентом функции /(х), ука- зывает направление, в котором нужно двигаться для увеличения значе- ния /(х). Может случиться, что при изменении а от -со до +оо прямая (20.15) при некотором значении u.=f» впервые коснется допустимого множества X и будет иметь с множеством X хотя бы одну общую точку х» = (x*,xj). На рис. 20.2, 20.3, 20.4 и 20.5 прямая (20.15) представлена четырьмя значениями а, одно из которых а, </«, другое равно /♦, а третье значение а2 и четвертое значение а3 удовлетворяют неравенст- вам /, < ctj < а3. Ясно, что /«= erf + c2xj =/(х,), т. е. х, является реше- 572
Рис. 20.6 нием задачи (20.12) — (20.14). При этом возможны случаи, когда пря- мая (20.15) при первом касании с многоугольным допустимым множе- ством X будет иметь только одну общую с X точку (рис. 20.2 и 20.3), будет иметь с АГ не одну общую точку, а целый отрезок (рис. 20.4) и бу- дет иметь с X общую полупрямую (рис. 20.5). (Последняя ситуация реа- лизуется в случае, когда граница множества X имеет сторону, перпенди- кулярную вектору с.) Если допустимое многоугольное множество неограничено, то, кроме ситуаций, изображенных на рис. 20.3 и 20.5, возможна еще одна ситуация, изображенная на рис. 20.6, при которой для любого а, удовлетворяющего неравенствам -оо < а ао «о, прямая (20.15) име- ет общую точку с допустимым множеством X. В этой ситуации пер- вого касания прямой (20.15) с множеством X нет, т. е. минимальное 573
значение целевой функции (20.12) равно -оо, и задача (20.12) — (20.14) не имеет решения. Итак, задача линейного программирования может не иметь ни од- ного решения (такая ситуация реализуется на рис. 20.1 и 20.6), может иметь лишь одно решение (такая ситуация реализуется на рис. 20.2 и 20.3) и, наконец, может иметь бесконечно много решений (такая ситу- ация реализуется на рис. 20.4 и 20.5), причем рис. 20.5 показывает, что множество решений X* может быть неограниченным. Совершенно аналогично рассматривается задача линейного про- граммирования не с двумя, а с тремя переменными х\, х2, х3. Для этой задачи допустимое множество X является многогранным. Анализ рассмотренной нами задачи (20.12) — (20.14) показывает, что если эта задача имеет хотя бы одно решение, то среди решений найдется хотя бы одна угловая точка (вершина) многоугольного допу- стимого множества X. Оказывается, это не является, случайным: и в более общей задаче линейного программирования минимальное значение целевой функции f (х) на допустимом множестве X достигается в угловой точке этого множества. При этом под угловой точкой множества X мы всегда бу- дем понимать такую точку этого множества, которая не является внут- ренней точкой ни одного отрезка, принадлежащего множеству X. Например, угловыми точками многоугольника на плоскости или параллелепипеда в пространстве являются их вершины; в пространстве любое замкнутое полупространство1 или пересечение двух замкнутых полупространств не имеет ни одной угловой точки. В задачах линейного программирования понятие угловой точки иг- рает фундаментальную роль и лежит в основе многих основных мето- дов решения этих задач. § 3. О методах решения задач линейного программирования Из общей задачи линейного программирования (20.1) — (20.4) обычно выделяют так называемую к а н он ическую задачу: найти минимальное значение целевой функции f(x) = CfXi + с2х2 +... + с^сп (20.16) при выполнении следующих условий: Xi > 0, х2 £ 0, ..., хп 0, (20.17) 1 Полупространство называется замкнутым, если оно содержит все точки плоско- сти, на которую оно опирается. 574
'анх,+а|2х2+...+а|Л=^, ..................................... (20.18) am\x\ +^2x2+-+am„xn =bm. В канонической задаче-(20.16) — (20.18) отсутствуют ограниче- ния, имеющие вид линейных неравенств, т. е. ограничения вида (20.3). Однако это не снижает общности рассмотрения, ибо ограничения, име- ющие вид линейных неравенств, можно свести к ограничениям, имею- щим вид линейных равенств, за счет увеличения числа переменных. Действительно, рассмотрим общую задачу (20.1) — (20.4) и для простоты будем считать, что в условии (20.2) все переменные хк (при всех к= 1, 2, ..., и) удовлетворяют неравенству хк>0. Добавим к переменным х\, х2, ..., х„ переменные у\, у2, ..., ут, удов- летворяющие условиям ' у, £ 0, у2 > 0, ..., > 0. (20.19) Тогда очевидно, что имеющие вид неравенств условия (20.3) при наличии неравенств (20.19) эквивалентны равенствам Чл +а12х2+...+а|лхл + у, =Ь„ а21х, + а22х2+...+а2ихл + у2 = Ь2, + ат2х2+...+ат„хп +ут= Ьт и общая задача (20.1) — (20.4) переходит в каноническую задачу (20.16) — (20.18), у которой число переменных равно не и, а (т + л) и целевая функция не зависит от последних т из этих переменных. Каноническая задача (20.16) — (20.18) привлекательна тем, что при ее исследовании и при разработке методов ее решения можно поль- зоваться хорошо известной из линейной алгебры теорией линейных систем алгебраических уравнений. Замечательно также и то, что мето- ды, созданные для решения канонической задачи, нетрудно модифици- ровать и применять для решения общей задачи. Доказывается, что всякое непустое допустимое множество X ка- нонической задачи (20.16) — (20.18) содержит хотя бы одну угловую точку и что если минимальное значение целевой функции f (х) не равно -<ю, то это минимальное значение обязательно достигается хотя бы в одной из угловых точек допустимого множества X. Сформулированные утверждения наводят на мысль о следующем подходе к решению канонической задачи: сначала найти все угловые 575
точки (их конечное число), а затем вычислить значения целевой функ- ции во всех угловых точках и взять наименьшее из этих значений. Однако такой подход к решению канонической задачи на практи- ке не применяется, так как в канонической задаче (даже с не очень большим числом переменных) число угловых точек может быть столь большим, что простой перебор всех угловых точек допустимого множества X оказывается невозможно произвести за разумное время даже при использовании самых современник суперкомпьютеров. Тем не менее идея перебора угловых точек допустимого множест- ва оказалась плодотворной и послужила основой для ряда методов ре- шения канонической задачи и другцх задач линейного программирова- ния. Одним из таких методов является так называемый симп- лекс-метод. Его название связано с тем, что сначала он разраба- тывался для задач линейного программирования, допустимое множест- во X которых представляло собой симплекс, т. е. множество точек (хь х2, хл), удовлетворяющих условиям х\ > 0, ха > 0, ..., хп > 0, ^х2к = 1. к=\ Затем этот метод был обобщен на более общий вид допустимых мно- жеств X, но первоначальное название за ним так и сохранилось. Этот метод называют также методом последователь- ного улучшения плана. Его основная идея заключается в том, что он реализует упорядоченный (направленный) пере- бор угловых точек, при котором значение целевой функции монотонно убывает, что позволяет, перебрав, быть может, лишь относительно не- большое число угловых точек, выяснить, имеет ли каноническая зада- ча решение, и если имеет, то найти его. Изложение этого и других методов решения задач линейного про- граммирования с использованием минимального аппарата математиче- ского анализа и линейной алгебры и без привлечения теории многогран- ных множеств можно найти в кн.: Васильев Ф. П., Иваницкий А. Ю. Ли- нейное программирование. М.: Факториал, 1998.
Алфавитно-предметный указатель Абсцисса— 32, 33 Аксиома Архимеда— 7 Алгебраические свойства смешанного и векторного произведений— 87 ---скалярного произведения— 81 Алгебраический многочлен степени п — 304 Аппликата— 33 Арифметический корень— 45 Бесконечно большая и бесконечно малая последовательности— 148 Биномиальное распределение вероятно- стей— 543, 555 Бином Ньютона— 27 Больцано-Вейерштрасса теорема— 164, 166, 374 Вектор— 69 —геометрический— 69 — нулевой— 69 t—противоположный— 71 Векторное произведение векторов — 85 Векторов критерий коллинеарности— 85 ---компланарности— 86 — левая тройка— 83 — правая тройка— 83 — разность— 72 — упорядоченная тройка— 83 Векторы коллинеарные— 69 — компланарные— 83 — равные— 69 — свободные— 70 — связанные— 70 — скользящие— 70 — ортогональные— 80 Величина направленного отрезка— 29 Вероятностей равномерное распределе- ние— 556 — распределение— 554 — свойства— 535 — стандартный интеграл— 552 Вероятность статистическая— 537 — события— 534 Вертикальная асимптота— 285 Верхний интеграл Дарбу— 323, 430 Верхняя сумма— 320, 429 Вершина параболы— 138 Вещественного числа модуль (абсолют- ная величина)— 10 Вещественные числа— 5, 7 ---равные— 9 Вещественных чисел произведение— 19 ---разность— 21 ---сумма— 17 ---частное— 21 Взаимное расположение прямой и плос- кости— 128, 129 Возрастание функции в точке— 258 Волновое уравнение— 527 Время полураспада— 501 Вронскиан— 516 Вторая краевая задача— 529 — производная— 250 Выпуклость, направленная вверх— 281 ---вниз— 281 ао Вычисление интеграла J ewjr’/2dr— 440, 441 — приближенных значений тригономет- рических функций— 276 — числа е с любой точностью— 276 Гипербола— 133 — вырожденная— 133 — равнобочная— 133 Гиперболический косинус— 214 — котангенс— 214 — синус— 214 — тангенс— 214 Гиперболоид двуполостный— 141 — однополостный— 141 Гиперболы асимптоты— 136 Глобальные свойства непрерывных на сегменте функций— 193— 195, 221 — 225 Годограф— 256 Граничные условия— 526, 528 Двойного интеграла линейное свойство — 434 Двойное векторное произведение — 90 577
Двойной интеграл по области— 434 ----по прямоугольнику— 428 Действительные числа— 5 Декартова прямоугольная система коорди- нат в пространстве— 33 -------1на плоскости— 32 Декартовы прямоугольные координаты — 32, 33 — координаты на прямой— 31 Диаметр частичной области— 433 Дискретные случайные величины— 556 Дисперсия случайной величины— 561 Дифференциал дуги— 348 — функции— 232, 391 Дифференциального уравнения решение — 495 -----частное решение— 500 Дифференциальное уравнение линейное обыкновенное— 495 -----обыкновенное— 495 ----с частными производными— 495 Дифференцирование сложной функции т переменных— 392—395 Дифференцируемость функции — 230, 386 Длина дуги, заданной полярным уравнени- ем — 350 ----кривой, заданной параметрически — 349 ----являющейся графиком функции — 347 Достаточное условие краевого экстрему- ма— 290 Достаточные условия локального экстре- мума функции одной переменной — 278—280 -----------т переменных— 411 Дуга спрямляемая — 346 Задача Дирихле— 529 — Неймана— 529 — Коши — 500, 511, 526, 529 — об оптимальном использовании посев- ной площади— 570, 571 — оптимального планирования производ- ства — 569 Задачи линейного программирования допу- стимая точка— 569 -------допустимое множество— 569 -------множество решений— 569 Закон больших чисел в форме Чебыше- ва— 565 Замечательные пределы— 215 Замкнутая область— 370 Замкнутое множество— 166, 369 Замкнутый m-мерный шар— 368 Измельчение разбиения— 321, 430 Инвариантность формы первого диффе- ренциала— 236, 394 Интеграл с переменным верхним преде- лом— 335 Интегральная кривая— 495 — сумма— 318, 428, 433 Интегральный логарифм— 297 — синус— 297 Интегралы Френеля— 297 Интегрирование дробно-линейных ирра- циональностей— 314 — квадратичных иррациональностей — 315— 317 — по частям— 300 — путем замены переменной— 298 — рациональных дробей— 310— 313 — тригонометрических выражений — 314 Интегрируемость произведения двух' ин- тегрируемых функций— 330, 434 Интервал — 24 Иррациональное число— 9 Испытание— 535 Исходы, благоприятствующие собы- тию — 535 ' Каноническая задача линейного програм- мирования— 572— 574 Канонические уравнения поверхностей второго порядка— 140 ----прямой в пространстве— 125 Каноническое уравнение гиперболы — 133 ----параболы— 138 ----прямой на плоскости— ПО ----эллипса— 132 Касательная к графику функции— 228 — плоскость— 388 Квадратичная форма— 405 ----знакоопределенная— 412 ----• знакопеременная— 412 ----отрицательно определенная— 412 ----положительно определенная— 412 ----симметричная— 405, 412 Квадратичной формы критерий Сильвест- ра — 413 Квадрируемая фигура— 341 Класс элементарных функций— 214 Колебание функции на множестве — 383 ----на сегменте— 225 578
Коллинеарные прямые— 113 Компакт— 225, 384 Комплексного числа аргумент— 44 ----главное значение аргумента 44 ----действительная часть — 40 —— мнимая часть— 40 ----модуль — 44 Комплексное число— 40 ----сопряженное— 42 Комплексных чисел произведение— 41 ----разность— 41 ----сумма— 40 ----частное— 41 Конус второго порядка— 142 Координатные плоскости— 33 Координаты вектора декартовы прямоуго- льные— 77 Корень из комплексного числа — 45, 46 Косинус— 209 Коэффициент диффузии— 527 г — распада— 500 — теплопроводности— 527 — Фурье— 474 Коэффициенты степенного ряда— 458 Краевой максимум— 290 — минимум— 290 ’ — экстремум— 290 Кривая кусочно гладкая— 360 Кривая площади нуль— 431 * Криводонный цилиндр — 427 Кривой особая точка— 360 Криволинейный интеграл второго рода — 359 ----первого рода— 359 Критерий Коши существования предела функции одной переменной — 181 -----------т переменных— 376 ----сходимости числовой последователь- ности— 170 -------последовательности точек в про- странстве Я” — 373 Круг сходимости степенного ряда— 463 Кубируемое тело— 345 Лагранжа формула — 260 Левая полуокрестность точки— 192 Линейного дифференциального уравнения общий интеграл— 511 Линейное дифференциальное уравнение второго порядка неоднородное— 515, 519 -----------однородное— 515 -------первого порядка— 506f Линейной системы решение —. 48, 57 ---тривиальное решение— 50 Линейные операций над векторами — 70 ---над направленными отрезками — 30 — свойства проекции вектора на ось — 79 Линия гиперболического типа— 133 — эллиптического типа— 132 — л-го порядка— 100 Логарифмическая производная— 249 — функция комплексной переменной — 472 Ломаная Эйлера— 509 Мажорирующий ряд— 448 Математическое ожидание дискретной случайной величины— 558, ---непрерывной случайной величи- ны— 558 Матрица— 47 — квадратная— 47 Мгновенная скорость— 227 Метод вариации постоянной— 507 ---постоянных— 520 — Гаусса— 66 — ломаных Эйлера— 509 — неопределенных множителей Лагран- жа— 424 — парабол приближенного вычисления определенного интеграла— 352, 354 — последовательного улучшения пла- на— 574 — прямоугольников приближенного вы- числения определенного интеграла — 352, 353 — трапеций приближенного вычисления определенного интеграла— 352, 353 Многочлен от двух аргументов— 313 Множества вещественных чисел точная верхняя грань— 12 ---------нижняя грань— 12 — внешняя точка— 369 — внутренняя точка— 368 — граничная точка— 369 — предельная точка— 165, 166, 369 Множество вещественных чисел, ограни- ченное сверху— 11 ---;----снизу— 11 Множество ограниченное— 166, 370 — плотное в себе— 379 Модуль Юнга— 526 579
Наклонная асимптота— 285 Направленный отрезок— 29, 34 Направленных отрезков сумма— 30 Направляющая цилиндрической поверхно- сти— 104 Направляющие косинусы— 396 Направляющий вектор прямой— ПО, 125 Натуральный логарифм— 207 Начальные значения— 511 — условия— 500, 511, 526, 528 Независимая переменная— 172 Независимость случайных величин— 557 Необходимое условие интегрируемости — 319 ----краевого экстремума— 291 Неопределенного интеграла линейные свойства— 294 Неопределенный интеграл— 293 Неполное уравнение плоскости— 120 ----прямой— 108 Непрерывная кривая в Д'”— 370 — в точке функция— 188, 191 Непрерывность функции вдоль кривой — 358 ----в точке слева— 189 ----в точке справа— 189 ----односторонняя— 189 ----равномерная— 223 Непрерывных функций локальные свойст- ва— 193 Неравенство Бесселя— 475 — Чебышева— 565 Несобственный интеграл— 355 ----второго рода— 356 ----первого рода— 355 Нижний интеграл Дарбу— 323 Нижняя грань множества вещественных чисел— 11 Нижняя сумма — 320, 429 Норма функции— 473 Нормальное, или гауссово, распределение вероятностей— 555 Нормальный вектор плоскости— 120 ----прямой— 120 Нормированное уравнение плоскости — 123 ----прямой— 117 Область— 370 Обратный ход метода Гаусса— 67 Общее уравнение плоскости— 119 ----прямой— 108 Объем тела— 345 Обыкновенного дифференциального урав- нения общее решение— 500 Ограниченного множества диаметр — 383 Ограниченное множество вещественных чисел— 15, 166 Однородная система линейных уравне- ний— 50, 59, 61 — функция степени п— 505 Однородное дифференциальное уравне- ние первого порядка— 504, 505 — уравнение, соответствующее неодно- родному дифференциальному уравне- нию— 520 Окрестность точки— 24, 369 Определенного интеграла линейное свой- ство— 329 Определенный интеграл— 319 Определитель второго порядка— 47 — порядка п— 64 — системы— 48, 57, 65 — третьего порядка— 50 Определителя главная диагональ— 51 — главные миноры— 412 — побочная диагональ— 51 — разложение— 54 Ордината— 32, 33 Ортонормированная система функций — 474 Оси гиперболы действительная и мни- мая— 133 — симметрии линии— 131 Основное уравнение динамики— 512 Основные свойства рациональных чи- сел— 7 — теоремы о непрерывных функциях т переменных— 381— 384 Особые точки дифференциального урав- нения— 498 Остаток ряда— 447 Остаточный член формулы Тейлора в обобщенной форме Шлемильха—Ро- ша— 270 ---------в форме Коши— 267 ---------в форме Лагранжа— 267 ---------в форме Пеано— 271 Ось абсцисс— 32, 33 — аппликат— 33 — ординат— 32, 33 — параболы— 138 Открытая полупрямая— 24 Открытое множество— 369 Открытый w-мерный координатный па- раллелепипед— 368 580
---шар— 367 Отношение, в котором точка делите направ- ленный отрезок— 36 Парабола— 138 — с вертикальной осью— 138 : Параболоид гиперболический— 143 — эллиптический— 143 Параболы директриса— 138 — параметр— 138 Параллельный перенос системы коорди- нат— 91, 94 Параметрические уравнения линии в про- странстве— 106 ---прямой— 111, 126 Первая краевая задача— 529 Первообразная функция— 292 Переменная величина— 172 Перестановка— 26 Плотность распределения вероятностей — 557 Площадь криволинейного сектора — 344 — криволинейной трапеции— 343^ — плоской фигуры— 341 Поверхность второго порядка— 105 — первого порядка— 105 < — л-го порядка— 104 Повороты системы координат — 92, 93 Подпоследовательность— 163 Подынтегральная функция— 293 Подынтегральное выражение— 293 Полином Лежандра— 474 Полная группа возможных исходов испы- тания— 535 Полное уравнение плоскости— 120, 121 ---прямой— 108 Полные группы попарно несовместных со- бытий— 533 Положительное направление обхода зам- кнутого контура— 363 Полуоси эллипса— 132 Полупрямая— 24 Полусегмент— 24 Полярные координаты— 37 Полярный радиус— 37 — угол— 37 Порядок погрешности— 271 Последовательностей произведение-1- 146 ; —разность— 146 — сумма— 146 — частное— 147 Последовательности верхний предел— 154 — верхняя грань— 147, 148 — нижний предел— 167 — нижняя грань— 147, 148 — предел — 154 — предельная точка— 163 — равномерная сходимость— 547 — точек Rm предел— 371 — частичный предел— 164 Последовательность— 146 — бесконечно большая— 149 — бесконечно малая— 149 — возрастающая— 159 — Коши— 372 — невозрастающая— 159 — независимых испытаний— 542 — неограниченная— 148 — неубывающая— 159 — ограниченная сверху— 147 снизу— 147 —с обеих сторон— 147 — расходящаяся— 155 — сходящаяся— 154 — точек евклидова пространства— 371 — точек Rm ограниченная — 374 — точек Rm фундаментальная— 372 — убывающая1— 159 — фундаментальная— 169 — числовая —146 Постановка общей задачи линейного про- граммирования— 568 Потенциал силового поля— 365 Правая полуокрестность точки— 192 Правые прямоугольные системы— 85 Правила сравнения двух вещественных чисел— 9 Правило Лопиталя— см. Раскрытие не- определенностей — параллелограмма сложения векто- ров— 72 — построения разности векторов— 73 — треугольника сложения векторов — 70 Предел интегральных' сумм— 319, 428, ’ 433 — последовательности — 154 — функции левый— 177, 178 — — одной переменной— 175;-179, 180 ---односторонний— 177 ---правый— 177, 178 Предельная теорема Муавра—Лапласа интегральная— 550 ---------локальная— 547 Признак Даламбера— 452, 453 — Коши— 452, 453 — Лейбница— 456 581
Признаки сравнения— 448, 449 Принадлежность двух прямых к одной плоскости— 127 Принцип локализации Римана— 481 Приращение функции— 226 Проекция вектора на ось— 75 — направленного отрезка на ось— 34 Произведение направленного отрезка на число— 31 Производная— 227 — векторной функции— 256 — левая— 229 — по направлению— 396 — правая— 229 — л-го порядка— 250 Проколотая окрестность точки— 175 Промежуток сходимости степенного ряда— 462 Прямой ход метода Гаусса— 67 Прямолинейная образующая поверхно- сти— 144 Прямоугольная окрестность точки— 368 Радиус-вектор точки— 42 Радиус сходимости степенного ряда — 462, 463 Разбиение сегмента— 318 Разложение функции в степенной ряд — 468 Размещение— 25 Разностная форма условия непрерывности функции— 226, 379 Разностное отношение— 227 Раскрытие неопределенностей (правило Лопиталя)— 264— 266 Распределение Пуассона— 545, 555 Рациональная дробь— 185 ---от двух аргументов— 313 ---с вещественными коэффициента- ми— 307 Рациональные числа— 5 Ряд абсолютно сходящийся— 455 — гармонический— 446 — знакочередующийся— 456 — расходящийся— 444 — степенной— 458 — сходящийся— 444 — Тейлора— 470 — условно сходящийся— 455 — Фурье по ортонормированной системе функций— 474 ---тригонометрический — 476 Ряда сумма—> 444 Сведение криволинейных интегралов к определенным— 360— 363 Свойство аддитивности интеграла— 331, 434 ---площади— 341 — линейности скалярного произведения по одному из множителей— 82 — монотонности площади— 341 Сегмент— 24 Сильвестра критерий — 413 Симплекс-метод— 574 Синус— 209 Система координат левая— 91, 93 ---правая— 91, 93 Скалярное произведение векторов — 79, 80 Случайные величины— 554 Смешанная частная производная л-го по- рядка— 399 Смешанное произведение векторов — 86 Смешанные задачи— 529 Событие— 532 — достоверное— 533 — невозможное— 533 — противоположное— 533 Событий независимость— 538 — поле— 534 — произведение— 532 — разность— 532 — сумма— 532 События независимые— 539 ---в совокупности— 539, 540 — несовместимые— 533 — попарно независимые— 540 — попарно несовместимые— 533 — равносильные— 532 Сочетание— 26 Спираль Архимеда— 100 Сравнение бесконечно больших функ- ций— 187 ---малых функций— 186 Среднее квадратичное уклонение случай- ной величины— 564 Стандартное упрощение уравнения линии второго порядка— 130 Стационарные точки— 278, 411 Суперпозиция функций— 200 Существование криволинейных интегра- лов— 360— 363 Сферические координаты— 39 Таблица значений функции Лапласа— 567 582
Тейлора, формула — 267, 409 Теорема Бернулли— 552 — Больцано—Вейерштрасса — 374 — Вейерштрасса первая— 221 ---вторая— 222 — Кантора о равномерной непрерывно- сти— 223 — Коши—Адамара— 462 — Лагранжа— 260 — Муавра—Лапласа интегральная— 550 — Муавра—Лапласа локальная— 547 — о локальной ограниченности функции, непрерывной в данной точке— 191 — о предельном переходе под знаком не- равенства— 158 — о прохождении функции через любое промежуточное значение — 194, 382 — об, арифметических операциях над схо- дящимися последовательностями — 156 — об арифметических операциях над, фун- кциями, имеющими предел — 183;377 ---------над непрерывными функциями — 193, 381 — об устойчивости знака непрерывной в данной точке функции— 192, 382 — Ролля— 259 — сложения вероятностей— 535 — Тейлора — 267, 409 — умножения вероятностей— 538 — Чебышева — 565 г Точка перегиба— 283 — разрыва второго рода— 220 — разрыва первого рода— 220 — устранимого разрыва— 219 Точки возможного экстремума— 278, 411 Транспортная задача— 570 Тригонометрическая подстановка — 299, 314 — система— 474 — форма представления комплексного чис- ла— 43 Тригонометрические коэффициенты Фу- рье— 477 Тригонометрический ряд Фурье— 476 Тригонометрического ряда Фурье условие сходимости— 483 Тройки векторов противоположной ориен- тации— 84 Убывание функции в точке.— 258 Угловая точка допустимого множества — 574 Угловой коэффициент прямой— 111 Угол между векторами— 79 ---плоскостями— 122 ---прямой и плоскостью— 129 Угол наклона вектора к оси— 76 ---прямой к оси— 111 Углы Эйлера— 94 Умножение вектора на вещественное чис- ло— 73 Уравнение Бернулли— 508 — диффузии— 527 — интегрируемое в квадратурах— 500, 502 — колебаний— 526 — Лапласа— 528 — линии— 98 ---второго порядка— 101 ---первого порядка— 101 — плоскости в отрезках— 121 < ----проходящей через три заданные точки— 123 — поверхности— 102 — прямой в отрезках— 109 — прямой, проходящей через две различ- ные точки— 126 — прямой с угловым коэффицйентом — 112 — Пуассона— 527 — Рикатти— 509 — с разделенными переменными— 502 — с разделяющимися переменными — 503 — теплопроводности— 527 — характеристическое— 522 Уравнения математической физики — 526 Условие для определения угла между прямыми— 115, 116, 128 — коллинеарности двух прямых— ИЗ, 116 — Липшица— 483 — ограниченности последовательности — 147, 148 — ортогональности прямых— 115, 116, 128 — параллельности плоскостей— 122 — параллельности прямых— 114, 116, 127 — пересечения плоскостей— 122 — перпендикулярности плоскостей— 123 — слияния плоскостей— 122 — слияния прямых— 114, 116, 127 583
Условия независимости криволинейного интеграла от пути интегрирования — 363— 366 Условный экстремум— 422 Фокальное свойство параболы— 138 Фокальные радиусы эллипса и гипербо- лы— 134 Фокус параболы— 138 Фокусы эллипса и гиперболы— 134 Формула Адамара— 463 — Бернулли— 543 — биномиального распределения вероятно- стей— 543 — Даламбера— 530 — замены переменной для определенного интеграла— 339 — замены переменных в двойном и трой- ном интегралах— 440, 443 — интегрирования по частям для опреде- ленного интеграла— 339, 340 — Коши— 263 — Лагранжа— 260 — Лейбница— 251 — Маклорена для функции одной перемен- ной — 272 — Муавра— 45 — Ньютона—Лейбница— 337 — полной вероятности— 540 — прямоугольников— 353 — Пуассона— 544 — Симпсона — 355 — среднего значения для двойного интег- рала— 435 — среднего значения для определенного интеграла— 333 — Стирлинга— 490 — Тейлора для функции одной перемен- ной— 267 — Тейлора для функции т переменных — 409 — трапеций— 354 — Эйлера— 471 Формулы Бейеса— 541 — Крамера— 49, 58, 65 Функции бесконечно малые одного поряд- ка— 186 ------эквивалентные— 186 — взаимно обратные— 196 — второй дифференциал— 253, 403 — линейно зависимые— 516 — линейно независимые— 516 — область изменения— 172 — область задания— 172, 371 — обратные тригонометрические— 213 — одной переменной локальный макси- мум— 259 — одной переменной локальный мини- мум— 259 — одной переменной локальный экстре- мум— 259 — простейшие элементарные— 201 — точки разрыва— 190 — точная верхняя и точная нижняя гра- ни— 222, 383 — участки возрастания и убывания — 211 — характеристика— 173 — ez, cosz и cos z в комплексной облас- ти— 471 — т переменных локальный максимум — 410 — т переменных локальный минимум — 410 — т переменных локальный экстре- мум— 410 — т переменных множество значений — 371 — т переменных полное приращение — 379 — т переменных по одной переменной непрерывность— 380 Функция бесконечно малая— 185, 377 — возрастающая— 195 — Дирихле— 173 — дифференцируемая в точке — 230, 386 — интегрируемая в области— 432, 433 — интегрируемая на прямоугольнике — 428 — кусочно дифференцируемая— 488 — кусочно непрерывная— 328 — Лагранжа— 424 — Лапласа— 552 — логарифмическая— 206 — монотонная— 195 — невозрастающая— 195 — неубывающая— 195 — нечетная— 209, 483 — ограниченная сверху— 191 — ограниченная снизу— 191 — ограниченная с обеих сторон— 191 — одной переменной— 172 — периодическая— 209, 478 — показательная— 203 — сложная— 200, 381 — степенная— 207 584
— строго монотонная— 195 — убывающая— 195 — четная— 209, 483, 489 — т переменных, непрерывная в точке — 378 — т переменных, ра[вномерно непрерыв- ная— 383 — т переменных п раз дифференцируе- мая— 400 Характеристическое свойство гипербо- лы— 135 ----параболы— 139 ----эллипса— 135 Целевая функция— 568 Центральная линия второго порядка— 131 Цепная линия— 350 Циклоида— 255 Цилиндр второго порядка— 144 Цилиндрическая поверхность— 103 Цилиндрические координаты— 38 Частичная сумма ряда— 444 Частная производная второго порядка — 398 ----смешанная— 398 —:—л-го порядка— 399 Частное приращение функции— 380 Число е— 161, 162 Числовая прямая— 24 Числовой ряд— 444 Член ряда— 444 Экстремум функции локальный (безу- словный) — 259, 410 ----условный — 421 Эксцентриситет— .134 Элемента определителя алгебраическое дополнение— 53 ----минор— 54, 64 Элементарная фигура— 341, 431 Эллипсоид— 140 Якобиан— 422, 423, 439, 442 е-окрестность точки— 24, 154, 368 m-мерная сфера— 368 m-мерное евклидово пространство — 367 — координатное пространство— 366 л-й дифференциал функции— 253, 404
СОДЕРЖАНИЕ Предисловие............................................................... 3 Глава 1. Вещественные числа. Множества вещественных чисел................. 5 § 1. Вещественные числа................................................... 5 1.1. Рациональные числа и их основные свойства (5). 1.2. Вещественные числа и правило их сравнения (7). 1.3. Множества вещественных чисел, ограниченные сверху или снизу (11). 1.4. Приближение вещественного числа рациональными чис- лами (16). 1.5. Операции сложения и умножения и свойства вещественных чи- сел (17). 1.6. Некоторые часто используемые соотношения (23) § 2. Некоторые конкретные множества вещественных чисел....................24 § 3. Элементы комбинаторики. Формула бинома Ньютона.......................25 Глава 2. Системы координат и их простейшие применения.....................29 § 1. Декартовы координаты на прямой.......................................29 1.1. Направленные отрезки на оси (29). 1.2. Линейные операции над направленны- ми отрезками (29). 1.3. Декартовы координаты на прямой (31) § 2. Декартовы прямоугольные координаты на плоскости и в пространстве....32 2.1. Декартовы прямоугольные координаты на плоскости (32). 2.2. Декартовы пря- моугольные координаты в пространстве (33) § 3. Простейшие задачи аналитической геометрии............................34 3.1. Понятие направленного отрезка в пространстве и его проекции на ось (34). 3.2. Расстояние между двумя точками (35). 3.3. Деление отрезка в данном отноше- нии (35) § 4. Полярные, цилиндрические и сферические координаты....................37 4.1. Полярные координаты (37). 4.2. Цилиндрические координаты (38). 4.3. Сфери- ческие координаты (39) § 5. Краткие сведения о комплексных числах................................40 Глава 3. Определители и системы линейных уравнений........................47 § 1. Определители второго и третьего порядков и их свойства...............47 1.1. Понятие матрицы и определителя второго порядка (47). 1.2. Система двух ли- нейных уравнений с двумя неизвестными (48). 1.3. Определители третьего поряд- ка (50). 1.4. Свойства определителей (51). 1.5. Алгебраические дополнения и мино- ры (53) § 2. Системы линейных уравнений с тремя неизвестными......................56 2.1. Системы трех линейных уравнений с тремя неизвестными с определителем, от- личным от нуля (56). 2.2. Однородная система двух линейных уравнений с тремя неизвестными (59). 2.3. Однородная система трех линейных уравнений с тремя не- известными (61). 2.4. Неоднородная система трех линейных уравнений с тремя не- известными с определителем, равным нулю (62) § 3. Понятие об определителях любого порядка и о линейных системах с любым числом неизвестных........................................................64 § 4. Отыскание решения линейной системы методом Гаусса....................66 Глава 4. Векторная алгебра................................................69 § 1.' Понятие вектора и линейные операции над векторами...................69 1.1. Понятие вектора (69). 1.2. Линейные операции над векторами (70). 1.3. Проек- ция вектора на ось и ее свойства (75). 1.4. Декартовы прямоугольные координаты вектора (77) § 2. Скалярное произведение двух векторов.................................79 2.1. Определение скалярного произведения (79). 2.2. Свойства скалярного произве- дения (80). 2.3. Выражение скалярного произведения в координатах (82) 586
§ 3. Векторное и смешанное произведения векторов............................83 3.1. Правые и левые тройки векторов (83). 3.2. Определения и свойства векторного и смешанного произведений (85). 3.3. Выражение векторного и смешанного произ- ведений в координатах (89). 3.4. Двойное векторное произведение трех ненулевых векторов (90) Глава 5. Преобразование декартовых прямоугольных координат на плоскости и в пространстве........................................................91 § 1. Преобразование декартовых прямоугольных координат на плоскости.......91 § 2. Преобразование декартовых прямоугольных координат в пространстве.....93 Глава 6. Основы аналитической геометрии.................................. 98 § 1. Уравнение линии на плоскости..........................................98 1.1. Понятие об уравнении линии (98). 1.2. Алгебраические линии на плоско- сти (100). 1.3. О пересечении двух линий (102) § 2. Уравнение поверхности и уравнения линии в пространстве...............102 2.1. Понятие об уравнении поверхности (102). 2.2. Алгебраические поверхности в пространстве (104). 2.3. Уравнения линии в пространстве (105). 2.4. Параметриче- ские уравнения линии и поверхности в пространстве (106) § 3. Прямая линия на плоскости.......................................... 107 3.1. Общее уравнение прямой (107). 3.2. Неполные уравнения прямой. Уравнение прямой в отрезках (108). 3.3. Каноническое уравнение прямой и уравнение прямой, проходящей через две данные точки (ПО). 3.4. Параметрические уравнения пря- мой (110). 3.5. Уравнение прямой с угловым коэффициентом (111). 3.6. Условия пе- ресечения, коллинеарности и ортогональности двух прямых. Угол между двумя пе- ресекающимися прямыми (113). 3.7. Нормированное уравнение прямой. Расстоя- ние от точки до прямой (117) § 4. Плоскость и прямая в пространстве....................................118 4.1. Общее уравнение плоскости (118). 4.2. Неполные уравнения плоскости. Урав- нение плоскости в отрезках (120).. 4.3. Взаимное расположение двух плоскостей в пространстве (121). 4.4. Уравнение плоскости, проходящей через три различные точки, не лежащие на одной прямой (123). 4.5. Нормированное уравнение плоско- сти. Расстояние точки от плоскости (123). 4.6. Канонические уравнения прямой ли- нии в пространстве (125). 4.7. Параметрические уравнения прямой в пространст- ве (126). 4.8. Взаимное расположение двух прямых линий в пространстве (126).’ 4.9. Взаимное расположение прямой и плоскости в пространстве (128) § 5. Линии второго порядка на плоскости.....................................129 5.1. Стандартное упрощение уравнения линии второго порядка на плоскости (129). 5.2. Центральные линии второго порядка (131). 5.3. Фокальные свойства эллипса и гиперболы (134). 5.4. Асимптоты гиперболы. Равнобочная гипербола как график обратной пропорциональности (135). 5.5. Нецентральные линии второго поряд- ка (137). 5.6. График квадратного трехчлена (139) § 6. Поверхности второго порядка в пространстве.............................140 Глава 7. Предел последовательности..........................................146 § 1. Понятия последовательности и ее предела................................146 1.1. Понятия последовательности и арифметических операций над последователь- ностями (146). 1.2. Ограниченные, неограниченные, бесконечно большие и беско- нечно малые последовательности (147). 1.3. Основные свойства бесконечно малых последовательностей (151). 1.4. Сходящиеся последовательности и их свойст- ва (154) § 2. Монотонные последовательности..........................................159 2.1. Понятие монотонной последовательности (159). 2.2. Теорема о сходимости мо- нотонной ограниченной последовательности (160). 2.3. Число е (161) 587
§ 3. Предельные точки последовательности и множества . . . ........../... 163 3.1. Предельные точки последовательности (163)1-3.2. Предельные точки множе- ства (165) §4. Верхний и нижний пределы последовательности.........................166 § 5. Критерий Коши сходимости последовательности.........................169 Глава 8. Функция и ее предел................1............................172 § 1. Понятия переменной величины и функции...............................172 § 2. Предел функции по Гейне и по Коши...................................174 § 3. Критерий Коши существования предела функции.........................181 § 4. Арифметические операции над функциями, имеющими предел..............183 §5. Бесконечно малые и бесконечно большие функции.......................185 Глава 9. Непрерывность функции...........................................188 § 1. Основные определения................................................188 § 2. Локальные свойства непрерывных функций.......................... 190 § 3. Прохождение функции, непрерывной на сегменте, через любое промежуточное значение,............................................................... 193 § 4. Свойства монотонных функций.........................................195 4.1. Понятия монотонной и строго монотонной фуцкций (195). 4.2. Понятие обрат- ной функции (196). 4.3. Условие существования обратной функции для строго мо- нотонной функции (196). 4.4. Существование односторонних пределов у любой не- строго монотонной функции (197). 4.5. Необходимое и достаточное условие непре- рывности на сегменте строго монотонной функции (198). 4.6. Условие существова- ния для данной функции строго монотонной й непрерывной обратной функ- ции (199) § 5. Сложная функция и ее непрерывность .................................200 § 6. Простейшие элементарные функции.....................................201 6.1. Рациональные степени положительных вещественных чисел (201). 6.2. Показа- тельная функция (203). 6.3. Логарифмическая функция (206). 6.4. Степенная функ- ция с любым вещественным показателем (207). 6.5. Тригонометрические функ- ции (208). 6.6. Обратные тригонометрические функции (213). 6.7. Гиперболические функции (214). 6.8. Класс элементарных функций (214) § 7. Первый и второй замечательные пределы...............................215 7.1. Функциональный аналог теоремы 9 из главы 7 (215). 7.2. Первый замечатель- ный предел (215). 7.3. Второй замечательный предел (216) § 8. Классификация точек разрыва функции.................................219 § 9. Три глобальных свойства непрерывных на сегменте функций.............221 9.1. Первая теорема Вейерппрасса (221). 9.2. Вторая теорема Вейерштрасса (222). 9.3. Теорема Кантора о равномерной непрерывности (223) Глава 10. Основы дифференциального исчисления.......................... 226 § 1. Производная. Ее физическая и геометрическая интерпретации........ .226 1.1. Приращение аргумента и функций. Разностная форма условия непрерывно- сти (226). 1.2. Определение производной (226). 1.3. Производная с физической и геометрической точек зрения (227). 1.4. Правая и левая производные (229) § 2. Понятие дифференцируемости функции..................................230 2.1. Определение дифференцируемости функции (230). 2.2. Связь между понятиями 1 дифференцируемости и непрерывности функции (231). 2.3. Понятие дифференциа- ла функции (231) § 3. Дифференцирование сложной функции и обратной функции................233 3.1. Дифференцирование сложной функции (233). 3.2. Дифференцирование обрат- ной функции (234). 3.3. Инвариантность формы первого дифференциала (236) 588
§'4. Дифференцирование суммы, разности, произведения и частного функций . . . 237 § 5. Производные простейших элементарных функций.......................240 5.1. Производные тригонометрических функций (240). 5.2. Производная логариф- мической функции (242). 5.3. Производные показательной и обратных тригономет- рических функций (243). 5.4. Производная степенной функции (245). 5.5. Таблица производных простейших элементарных функций (246). 5.6. Таблица дифференциа- лов простейших элементарных функций (247). 5.7. Использование дифференциала для установления приближенных формул (247). 5.8. Логарифмическая производная. Производная степенно-показательной функции (248) § 6. Производные и дифференциалы высших порядков........................249 6.1. Понятие производной л-го порядка (249). 6.2. л-е производные некоторых функций (250). 6.3. Формула Лейбница для л-й производной произведения двух функций (251). 6.4. Дифференциалы высших порядков (252) § 7. Дифференцирование функции, заданной параметрически.................254 § 8. Производная векторной функции......................................256 Глава 11. Теоремы о дифференцируемых функциях и их приложения...........258 § 1. Возрастание (убывание) функции в точке. Локальный экстремум........258 1.1. Возрастание (убывание) функции в точке (258). 1.2. Локальный экстремум функции (259) § 2. Теоремы Ролля и Лагранжа и их следствия............................259 2.1. Теорема Ролля (259). 2.2. Теорема Лагранжа (260). 2.3. Постоянство функции, имеющей на интервале равную нулю производную (261). 2.4. Условия монотонно- сти функции на интервале (262) § 3. Формула Коши..................................................... 263 § 4. Раскрытие неопределенностей (правило Лопиталя).....................264 4.1. Раскрытие неопределенностей вида — (264). 4.2. Раскрытие неопределен- ОО О ности вида — (266) 00 § 5. Формула Тейлора....................................................267 § 6. Остаточный член в форме Пеано. Формула Маклорена...................271 6.1. Остаточный член в форме Пеано (271). 6.2. Формула Маклорена (272) § 7. Оценка остаточного члена. Разложение некоторых элементарных функций. Примеры применения формулы Маклорена.....................................272 7.1. Оценка остаточного члена для произвольной функции (272). 7.2. Разложение по формуле Маклорена некоторых элементарных функций (273). 7.3. Примеры приме- нения формулы Маклорена (276) § 8. Участки монотонности функции. Отыскание точек экстремума...........277 8.1. Отыскание участков монотонности функции и точек возможного экстрему- ма (277). 8.2. Первое достаточное условие экстремума (278). 8.3. Второе достаточ- ное условие экстремума (279). 8.4. Экстремум функции, не дифференцируемой в данной точке. Общая схема отыскания экстремумов (280) § 9. Направление выпуклости графика функции...............................281 § 10. Точки перегиба графика функции......................................283 10.1. Определение точки перегиба. Необходимое условие перегиба (283). 10.2. Пер- вое достаточное условие перегиба (284). 10.3. Второе достаточное условие переги- ба (284) §11. Асимптоты графика функции...........................................285 §12. Схема исследования графика функции..................................286 §13. Пгобальные максимум и минимум функции на сегменте. Краевой экстремум. . 289 13.1. Отыскание максимального и минимального значений функции, определенной на сегменте (289). 13.2. Краевой экстремум (290) 589
Глава 12. Неопределенный интеграл...................................... 292 § 1. Понятия первообразной функции и неопределенного интеграла...........292 1.1. Понятие первообразной функции (292). 1.2.,Неопределенный интеграл (293). 1.3. Основные свойства неопределенного интеграла (294). 1.4. Таблица основных неопределенных интегралов (295) §2. Основные методы интегрирования......................................297 2.1. Интегрирование заменой переменной (подстановкой) (297). 2.2. Метод интег- рирования по частям (299) § 3. Классы функций, интегрируемых в элементарных функциях...............303 3.1. Краткие сведения из теории алгебраических многочленов (304). 3.2. Разложе- ние алгебраического многочлена с вещественными коэффициентами на произведе- ние неприводимых вещественных множителей (306). 3.3. Разложение правильной рациональной дроби с вещественными коэффициентами на сумму простейших дро- бей (307). 3.4. Интегрируемость рациональной дроби с.вещественными коэффици- ентами в элементарных функциях (310). 3.5. Другие классы функций, интегрируе- мых в элементарных функциях (313) Глава 13. Определенный интеграл ....................................... 318 § 1. Понятие определенного интеграла и достаточные условия его существования . 318 1.1. Понятие интегральной суммы и ее предела (318). 1.2. Верхние и нижние суммы и их свойства (320). 1.3. Необходимое и достаточное условие существования опре- деленного интеграла (324) . § 2. Интегрируемость непрерывных, монотонных и кусочно непрерывных функций. 326 2.1. Интегрируемость непрерывных функций (326). 2.2. Интегрируемость монотон- ных функций (327). 2.3. Интегрируемость кусочно непрерывных функций (328) § 3. Свойства определенного интеграла....................................329 § 4. Существование первообразной у любой непрерывной функции.............335 § 5. Основная формула интегрального исчисления...........................337 § 6. Геометрические и физические приложения определенного интеграла,.....340 6.1. Понятие площади плоской фигуры. Площадь криволинейной трапеции (340). 6.2. Площадь криволинейного сектора (344). 6.3. Вычисление объема тела враще- ния (345). 6.4. Длина дуги кривой (346). 6.5. Физические приложения определенно- го интеграла (351) §7. Понятие о приближенных методах вычисления определенных интегралов. . . .351 § 8. Понятие b несобственных интегралах..................................355 Глава 14. Криволинейные интегралы........................................358 § 1. Определения и физический смысл криволинейных интегралов.............358 § 2. Существование криволинейных интегралов и сведение их к определенным интегралам............................................................... 360 § 3. Условие независимости криволинейного интеграла второго рода от пути интегрирования........................................................... 363 Глава 15. Дифференциальное исчисление функций нескольких переменных. . . 366 § 1. Понятие функции т переменных . .....................................366 1.1. Понятия m-мерного координатного и ти-мерного евклидова пространств (366). 1.2. Множества точек m-мерного евклидова пространства (367). 1.3. Понятие функ- ции т переменных (370) § 2. Предел функции т переменных.........................................371 2.1. Последовательности точек пространства Rm (371). 2.2. Свойство ограниченной последовательности точек RM (374). 2.3. Предел функции т переменных (375). 2.4. Бесконечно малые функции т переменных (377) 590
§ 3. Непрерывность функции т переменных............................'. . . 378 3.1. Понятие непрерывности функции т переменных (378). 3.2. Непрерывность функции т переменных по одной переменной (379). 3.3. Основные свойства непре- рывных функций нескольких переменных (381) § 4. Производные и дифференциалы функции нескольких переменных..........384 4.1. Частные производные функции нескольких переменных (384). 4.2. Дифферен- цируемость функции нескольких переменных (385). 4.3. Геометрический смысл ус- ловия дифференцируемости функции двух переменных (388). 4.4. Достаточные ус- ловия дифференцируемости (390). 5.5. Дифференциал функции нескольких пере- менных (391). 4.6. Дифференцирование сложной функции (392). 4.7. Инвариант- ность формы первого дифференциала (394). 4.8. Производная по направлению. Гра- диент (395) § 5. Частные производные и дифференциалы высших порядков................398 5.1. Частные производные высших порядков (398). 5.2. Дифференциалы высших порядков (403) § 6. Формула Тейлора для функции нескольких переменных................ 408 § 7. Локальный (безусловный) экстремум функции нескольких переменных.....410 7.1. Понятие и необходимые условия локального экстремума (410). 7.2. Краткие сведения из теории симметричных ‘ квадратичных форм (411). 7.3. Достаточные ус- ловия экстремума функции нескольких переменных (415). 7.4. Более углубленное рассмотрение случая двух переменных (419). 7.5. Отыскание максимального и ми- нимального значений функции нескольких переменных (420) § 8. Условный экстремум функции. V......................................421 8.1. Понятие условного экстремума функций (421). 8.2. Метод неопределённых множителей Лагранжа (424). 8.3. Достаточные условия условного экстремума (425) Глава 16. Двойные и тройные интегралы....................................427 § 1. Определение и существование двойного интеграла......................427 1.1. Определение двойного интеграла для прямоугольника (427). 1.2. Существова- ние двойного интеграла для прямоугольника (429). 1.3. Определение и существова- ние двойного интеграла для произвольной области (431). 1.4. Определение двойно- го интеграла при помощи произвольного разбиения области (433) § 2. Основные свойства двойного интеграла................................434 § 3. Сведение двойного интеграла к повторному однократному...............435 3.1. Случай прямоугольника (435). 3.2. Случай произвольной области (437) § 4. Замена переменных в двойном интеграле...............................439 § 5. Тройные интегралы...................................................441 Глава 17. Ряды...........................................................444 § 1. Понятие числового ряда..............................................444 1.1. Понятие о сходящихся и расходящихся рядах (444). 1.2. Критерий Коши и следствия из него (446) § 2. Признаки сходимости рядов с неотрицательными членами............. . 448 2.1. Необходимое и достаточное условие сходимости ряда с неотрицательными членами (448). 2.2. Признаки сравнения (448). 2.3. Признаки Даламбера и Ко- ши (451) § 3. Абсолютная и условная сходимость рядов с членами любого знака.......454 §4. Степенные ряды......................................................458 4.1. Понятие степенного ряда. Теорема Коши—Адамара (458). 4.2. Радиус сходимо- сти степенного ряда, полученного формальным дифференцированием основного степенного ряда (463). 4.3. Непрерывность суммы степенного ряда внутри проме- жутка сходимости (465). 4.4. Дифференцируемость суммы степенного ряда внутри 591
! промежутка сходимости (466). 4.5. Разложение функции в степенной ряд (468). 4.6. Элементарные представления о функциях комплексной переменной (471) § 5. Краткие сведения о рядах Фурье.....................................472 5.1. Понятия ортонормированной системы и ряда Фурье (472). 5.2. Неравенство Бесселя и следствия из него (475). 5.3. Выражение для л-й частичной суммы триго- нометрического ряда Фурье (478). 5.4. Принцип локализаций Римана (481). 5.5. Ус- ловия сходимости тригонометрического ряда Фурье ,(482). 5.6. Заключительные за- мечания (489) Дополнение к главе 17. Формула Стирлинга................................489 Глава 18. Дифференциальные уравнения....................................495 § 1. Понятие дифференциального уравнения................................495 § 2. Дифференциальные уравнения первого порядка.........................496 2.1. Общие сведения (496). 2.2. Уравнение радиоактивного распада вещества (500). 2.3. Уравнение первого порядка с разделяющимися переменными (502). 2.4. Одно- родные дифференциальные уравнения первого порядка (504). 2.5. Линейное урав- нение первого порядка (506). 2.6. Уравнения Бернулли и Рикатти (508). 2.7. Метод ломаных Эйлера численного решения обыкновенного дифференциального уравне- ния (509) § 3. Дифференциальные уравнения второго порядка.........................510 3.1. Об обыкновенных дифференциальных уравнениях выше первого поряд- ка (510). 3.2. Три простейших типа уравнений второго порядка, допускающих ин- тегрирование в квадратурах (512). 3.3. Два типа уравнений второго порядка, допус- кающих понижение порядка (514). 3.4. Однородное ?линейное уравнение второго порядка (515). 3.5. Неоднородное линейное уравнение второго порядка (519). 3.6. Однородное линейное уравнение второго порядка с постоянными коэффициен- тами (521). 3.7. Интегрирование линейного уравнения с помощью степенного ряда (523) § 4. Постановки основных задач для уравнений с частными производными....525 Глава 19. Основы теории вероятностей....................................531 § 1. События. Вероятности событий.......................................531 § 2. Условная вероятность. Независимость событий. Теорема умножения вероятностей537 § 3. Формула полной вероятности. Формулы Бейеса.........................540 § 4. Последовательности независимых испытаний. Биномиальное распределение вероятностей........................................................... 542 § 5. Формула Пуассона...................................................544 § 6. Предельные теоремы Муавра—Лапласа..................................546 6.1. Локальная теорема Муавра—Лапласа (547). 6.2. Интегральная теорема Муав- ра—Лапласа (550) § 7. Случайные величины и функции распределения вероятностей............554 § 8. Математическое ожидание и дисперсия................................558 8.1. Определение математического ожидания (558). 8.2. Свойства математическо- го ожидания (560). 8.3. Определение дисперсии случайной величины (561). 8.4. Основные свойства дисперсии (563). 8.5. Среднее квадратичное уклонение слу- чайной величины (564). 8.6. Закон больших чисел в форме Чебышева (565) Приложение..............................................................567 Глава 20. Краткие сведения о задачах линейного программирования.........568 § 1. Постановка задачи линейного программирования.......................568 1.1. Задача оптимального планирования производства (569). 1.2. Транспортная зада- ча (570). 1.3. Задача об оптимальном использовании посевной площади (570) § 2. Геометрическая интерпретация задачи линейного программирования.....571 § 3. О методах решения задач линейного программирования.................574 Алфавитно-предметный указатель........................................ 577