Text
                    ОЖМантуров, НММатвеее
КУРС
ВЫСШЕЙ
МАТЕМАТИКИ
ЛИНЕЙНАЯ АЛГЕБРА
АНАЛИТИЧЕСКАЯ ГЕОМЕТРИЯ
ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ
ФУНКЦИЙ ОДНОЙ ПЕРЕМЕННОЙ
Допущено
Министерством высшего и среднего
специального образования СССР
в качестве учебника для студентов
высших технических учебных
заведений
МОСКВА «ВЫСШАЯ ШКОЛА» 1986


ББК 22.11 М23 УДК 51 Рецензенты: кафедра математики Всесоюзного заочного института пищевой промышленности (зав. кафедрой проф. Смирнов М. С); проф. Н. А. Панькин (Московский институт инженеров железнодорожного транспорта) Мантуров О. В., Матвеев Н. М. М23 Курс высшей математики: Линейная алгебра. Аналитическая геометрия. Дифференциальное исчисление функций одной переменной: Учеб. для студентов втузов.— М.: Высш. шк., 1986.— 480 с: ил. Учебник представляет собой первый том курса высшей математики и предназначен для студентов-заочников инженерно-технических специальностей вузов. Он написан в соответствии с программой по математике для указанных специальностей. Изложение ведется на двух уровнях — основном и повышенном. Большое внимание уделено раз* бору примеров и задач. Имеются задачи для самостоятельного решения. 1702010000—548 ББК 22.11 М 001(01)—86 74—86 51 Учебное издание Олег Васильевич Мантуров, Николай Михайлович Матвеев КУРС ВЫСШЕЙ МАТЕМАТИКИ ЛИНЕЙНАЯ АЛГЕБРА. АНАЛИТИЧЕСКАЯ ГЕОМЕТРИЯ. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ ФУНКЦИЙ ОДНОЙ ПЕРЕМЕННОЙ Зав. редакцией Е. С. Гридасова. Редактор А. М. Суходский. Мл. редакторы С. А. Доровских, Н. П. Майкова. Оформление художника Ю. Д. Федичкина. Художественный редактор В. И. Пономаренко. Технический редактор Э. М. Чижевский. Корректор Г. А. Чечеткина ИБ № 4764 Изд. № ФМ-814. СданЪ в набор 14.03.86. Подп. в печать 24.10.86. Формат 60x90/te. Бум. тип. № 1. Гарнитура литературная. Печать высокая. Объем 30 усл. печ. л. +0,25 усл. п. л. форзац 30,5 усл. кр.-отт. 29,90 уч.-изд. л.+ 0,31 уч.-изд. л. форзац. Тираж 70000 зкз. Заказ № 2636. Цена 1 р. 3 0 к. Издательство «Высшая школа». 101430, Москва, ГСП-4, Неглинная ул., д. 29/14 Ордена Октябрьской Революций и ордена Трудового Красного Знамени МПО «Первая Образ-» цовая типография» имени А. А. Жданова Союзполиграфпрома при Государственном комитете СССР по делам издательств, полиграфии и книжной торговли. 113054, Москва, Валовая, 28. © Издательство «Высшая школа», 1986
ОГЛАВЛЕНИЕ Пер- Вто- вый " рой уро- уровень еень Предисловие 7 Глава L Линейная алгебра с элементами аналитической геометрии . . 9 287 § 1.1. Трехмерное пространство. Линейные операции над векторами. Линейные пространства. Линейно независимые системы векторов. Базис линейного пространства 9 287 § 1.2. Скалярное произведение векторов в R3 и его свойства. Аксиоматическое определение скалярного произведения в линейном пространстве. Длина вектора. Расстояние. Неравенство Коши — Буняковс- кого. Угол между векторами. Пространство Rw. Ортогональный базис. Разложение вектора по базису 21 305 § 1.3. Уравнение плоскости в R3 (векторная и координатная формы). Уравнение гиперплоскости в R" (векторная и координатная формы). Прямая в R" (векторная и координатная формы) ......... 30 311 § 1.4. Линейные операторы и матрицы. Линейный оператор и матрица оператора в заданном базисе пространства R2. Сложение операторов, умножение операторов на число, произведение операторов и соответствующих матриц. Линейные операторы в Rw. Сложение операторов, умножение операторов на число, произведение операторов и соответствующих матриц 34 316 § 1.5. Сопряженный оператор. Сопряженная матрица. Самосопряженные операторы и симметрические матрицы. Ортогональные матрицы 45 322 § 1.6. Определители второго, третьего порядков. Основные свойства. Определители п-то порядка, их свойства о . . 52 327 § 1.7. Ранг матрицы. Теорема о базисном миноре 62 339 § 1.8. Векторное произведение. Основные свойства. Смешанное произ-. ведение и его свойства 70 342 § 1.9. Системы линейных уравнений. Метод Гаусса. Теорема Кронеке- ра — Капелли . . 77 346 § 1.10. Формулы Крамера. Обратная матрица. Решение матричных Уравнений ' 87 352 § 1.11. Ядро и область значений линейного оператора. Альтернативы Фредгольма для линейного оператора в R" 96 354
4 Оглавление Пер- Вто- вый рой уро- уровень вень § 1.12. Собственные векторы и собственные значения линейных операторов 102 358 § 1.13. Собственные векторы и собственные значения самосопряженных операторов. Теорема о полноте собственных векторов ..... 111 367 § 1.14. Преобразование матрицы линейного оператора при переходе к новому базису. Канонический вид самосопряженного оператора ... 116 370 § 1.15. Квадратичная форма. Матрица квадратичной формы. Приведение квадратичной формы к каноническому виду с помощью ортогональной матрицы 122 372 § 1.16. Евклидова классификация кривых и поверхностей второго порядка 132 380 Глава II. Введение в математический анализ 153 388 §2.1. Множества и функции. Логические символы 153 388 § 2.2. Предел числовой последовательности. Предел функции в бесконечности. Предел функции в точке. Свойства функций, имеющих предел 161 391 § 2.3. Непрерывность функции. Непрерывность основных элементарных функций 170 399 § 2.4. Бесконечно малые функции и их свойства 174 404 § 2.5. Бесконечно большие функции и их свойства. Связь между бесконечно большими и бесконечно малыми функциями ........ 175 405 § 2.6. Сравнение бесконечно малых. Эквивалентные бесконечно малые. Их использование при вычислении пределов 176 406 § 2.7. Свойства функций, непрерывных в точке. Непрерывность суммы, произведения и частного. Предел и непрерывность сложной функции 180 409 § 2.8. Односторонние пределы. Односторонняя непрерывность. Точки разрыва функции и их классификация , 181 410 § 2.9. Свойства функций, непрерывных на отрезке: ограниченность, существование наибольшего и наименьшего' значений, существование промежуточных значений 186 411
Оглавление 5 Пер' Вто- еый рой уро~ уровень вень Глава III. Дифференциальное исчисление функций одной переменной 189 414 §3.1. Производная функции, ее геометрический и механический смысл. Производная суммы, произведения и частного (обзор теорем школьного курса) 189 414 § 3.2. Производная сложной функции. Производная обратной функции. Производные обратных тригонометрических функций 197 419 § 3.3. Гиперболические функции, их свойства и графики. Производные гиперболических функций 201 421 § 3.4. Дифференцируемость функции. Дифференциал функции. Связь дифференциала с производной. Геометрический смысл дифференциала. Линеаризация функции. Дифференциал суммы, произведения и частного. Инвариантность формы дифференциала 203 421 § 3.5. Производные и дифференциалы высших порядков. Формула Лейбница. Неинвариантность формы дифференциала порядка выше первого • 209 423 § 3.6. Теоремы Ролля, Лагранжа, Коши, их применения. Правило Лопиталя 213 424 § 3.7. Формула Тейлора с остаточным членом в форме Лагранжа. Представление функций е*, cos*, sin*, In (1 +лг), (1+#)а по формуле Тейлора. Понятие главной части функции. Приложения формулы Тейлора. Применение дифференциала в приближенных вычислениях 223 428 Глава IV. Исследование функций с помощью производных 232 432 § 4.1. Условия возрастания и убывания функций. Точки экстремума. Необходимое условие экстремума. Отыскание наибольшего и наименьшего значений непрерывной на отрезке функции 232 432 § 4.2. Исследование функций на экстремум с помощью производных высшего порядка. Исследование функций на выпуклость и вогнутость. Точки перегиба. Асимптоты кривых. Общая схема построения графиков функций о. 237 435 Глава V. Векторные и комплексные функции действительной переменной • 249 441 § 5.1. Векторная функция скалярного аргумента. Производная, ее механический смысл 249 441 § 5.2. Параметрические уравнения кривой на плоскости и в пространстве. Функции, заданные параметрически, их дифференцирование 254 444
6 ..*..-- Оглавление Пер- Вто- еый рой уро~ уровень вень §5.3. Комплексные числа, их изображение на плоскости. Модуль и аргумент комплексного числа. Алгебраическая, тригонометрическая и показательная формы комплексного числа. Операции над комплексными числами. Формула Муавра 257 445 § 5.4. Комплекснозначные функции действительной переменной, их дифференцирование. Многочлены в комплексной области. Теорема Безу. Условие тождественности двух многочленов. Корни многочлена. Основная теорема алгебры. Разложение многочлена с действительными коэффициентами: на линейные и квадратичные множители .... 262 447 Глава VI. Функции нескольких переменных 266 452 §6.1. Функции нескольких переменных. Область определения. Предел функции. Непрерывность . „ » 266 452 § 6.2. Частные производные. Дифференциал, его связь с частными производными. Инвариантность формы дифференциала. Геометрический смысл дифференциала 269 454 § 6.3. Частные производные и дифференциалы высших порядков. Формула Тейлора 275 459 § 6.4. Неявные функции. Теорема существования. Дифференцирование неявных функций 280 464 § 6.5. Экстремумы функций нескольких переменных. Необходимое условие. Достаточные условия 282 467 § 6.6. Условный экстремум. Метод множителей Лагранжа. Абсолютные экстремумы , о 285 469 Ответы к упражнениям 471 Литература 475 Предметный указатель 476
ПРЕДИСЛОВИЕ Настоящая книга представляет собой первый том учебника по высшей математике для студентов-заочников инженерно-технических специальностей вузов, изучающих курс высшей математики по программе на 510 часов, утвержденной Минвузом СССР. Содержание учебника отвечает указанной программе, причем названия глав и параграфов почти дословно повторяют соответствующие пункты программы. В учебнике дано систематическое изложение курса высшей математики на современном уровне, разобраны примеры, приведены упражнения для самостоятельного решения. Интенсификация народного хозяйства, повышение роли фундаментальных наук в развитии техники требуют поиска новых форм передачи учебной информации. Несмотря на огромный и все возрастающий объем учебного материала, математика, как и другие науки, содержит сравнительно небольшое количество фундаментальных идей, конструкций и алгоритмов. Авторы исходили из того, что именно таким вопросам следует уделить главное внимание, и эта мысль была взята в качестве методической основы учебника. Среди фундаментальных математических идей, понятий и алгоритмов, изложенных в учебнике, подробно описаны: понятия линейного пространства, базиса, линейного отображения, собственного вектора и собственного значения, матрицы линейного преобра: зования и квадратичной формы, определителя, ранга матрицы; изменение матрицы квадратичной формы при изменении базиса; алгоритм Гаусса; понятия предела и бесконечно малой; понятие производной, ее геометрический и механический смысл; техника дифференцирования (в частности, дифференцирование сложной функции); приложения производных к исследованию функций; формула Тейлора; вектор-функция скалярного аргумента; понятие комплексного числа. Описанный выше методический замысел обусловил особую форму построения книги, примененную, по-видимому, впервые в учебной литературе. Учебник написан «на двух уровнях». Первый уровень содержит описание «наводящих соображений», мотивацию вводимых понятий, формулировки основных
8 Предисловие фактов (часто—в предварительной редакции, т. е. не в самой полной строгости и общности), комментарии к понятиям, определениям, свойствам и теоремам, примеры и некоторое количество упражнений. Здесь приводятся и доказательства, но только в том случае, если они кратки и содержат яркую и глубокую идею. Все же большая часть доказательств и уточнений приводится во втором уровне книги. Второй уровень включает строгие формулировки, определения, доказательства. Главы и параграфы первого и второго уровней носят (за очень небольшими исключениями) одинаковые названия, причем нумерация глав и параграфов второго уровня отмечена звездочкой. Если рассматриваемое понятие обсуждается на втором уровне в более глубоком смысле, а также в тех случаях, когда строгое доказательство утверждения приведено только во втором уровне, используется крупная жирная цифра, указывающая на соответствующее место во втором уровне книги. Отметим, что значительная часть программного материала может быть изучена по первому уровню книги. Вместе с тем помещение «доказательной части» во второй уровень позволило дать строгие доказательства всех теорем программного материала. Такое построение учебника дает возможность студенту самым прямым и экономным образом подойти к изучению главных математических идей и методов в процессе работы над материалом первого уровня. В случае необходимости после усвоения в главных чертах основных фактов и понятий можно обратиться за уточнениями и доказательствами ко второму уровню. По мнению авторов, такая форма изложения материала будет особенно полезна для студентов-заочников высших технических учебных заведений. При написании книги был использован курс лекций, прочитанных О. В. Мантуровым по учебной программе Центрального телевидения в 1975—1981 гг. Главы I—VI первого уровня и главы I, II и VI второго уровня написаны проф. О. В. Мантуровым, а главы III—V второго уровня — проф. Н. М. Матвеевым. Авторы выражают искреннюю признательность чл.-кор. АН СССР Л. Д. Кудрявцеву за полезное обсуждение ряда вопросов, а также благодарят кафедру высшей математики ВЗИППа и проф. Н. А. Панькина за ценные замечания, сделанные при рецензировании рукописи. Авторы
Глава I ЛИНЕЙНАЯ АЛГЕБРА С ЭЛЕМЕНТАМИ АНАЛИТИЧЕСКОЙ ГЕОМЕТРИИ § 1.1. Трехмерное пространство. Линейные операции над векторами. Линейные пространства. Линейно независимые системы векторов. Базис линейного пространства 1°. Векторы и линейные операции над ними. Из школьного курса геометрии известно, что если в плоскости дана система координат, то каждая точка Р плоскости однозначно характеризуется двумя числами (х, у)—координатами точки Р. Аналогично, каждой точке Р трехмерного пространства (рис. 1) в заданной системе координат соответствует упорядоченная тройка чисел (х, yt z), называемых координатами точки Р. Во многих математических и прикладных задачах приходится рассматривать направленный отрезок, т. е. множество точек, заключенных между точками А и В прямой с указанным направлением (рис. 1). Отметим, что направление такого отрезка может быть полностью определено порядком точек А и В: именно, будем обозначать через АВ направленный отрезок с концами А и В и направлением от первого конца А ко второму концу В. По многим причинам удобно не различать между собой два любых направленных отрезка, если они лежат на параллельных прямых, направлены в одну сторону и имеют одинаковые длины (условие А). Дело в том, что два таких направленных отрезка означают одно и то же с физической или геометрической точки зрения, которая определяется конкретной рассматриваемой задачей (см. § 1М, )• Определение 1. Будем говорить, что всякий направленный отрезок АВ задает вектор (обозначаемый также АВ), причем два направленных отрезка задают один и тот же вектор, если они удовлетворяют условию Л, и наоборот.
10 Глава I. Линейная алгебра с элементами аналитической, геометрии ;-" Рис. 1 Смысл определения можно выразить и так: направленные отрезки считаются равными, если они удовлетворяют условию Л. Всякие равные направленные отрезки задают один и тот же вектор, а неравные направленные отрезки — различные векторы. Если направленный отрезок перенести параллельно самому себе, то очевидно, что получится направленный отрезок, равный исходному (рис. 2). Всякий направленный отрезок АВ можно перенести параллельно самому себе так, чтобы его начало совпало с началом координат. Понятно, что всякому вектору АВ соответствует один и только один направленный отрезок ОС с началом в начале координат; поэтому заданный вектор полностью определяется этим направленным отрезком. Определение 2. Пусть АВ — вектор, ОС — направленный отрезок, начало которого совпадает с началом координат, АВ и ОС удовлетворяют условию Л. Координатами вектора АВ называются три числа (х, у, г) — координаты точки С. Комментарий к определению 2. Чтобы найти координаты вектора АВ, достаточно перенести его параллельно самому себе так, чтобы его начало совместилось с началом координат, а затем найти координаты конца перенесенного вектора. Можно убедиться в том, что равные направленные отрезки определяют векторы с одинаковыми координатами (см. § 1М, 2). Вектор АВ с координатами (х, у, г) будем обозначать АВ = — (х, у, г). Лемма 1. Если х0, у0, г0 и х±, у19 гх—соответственно координаты точек А и В (рис. 3), то АВ = (х1—х0, уг—у0, zx—zQ). Доказательство приведено в § 1М, 3. Комментарий к лемме 1. Координаты вектора АВ равны разностям координат конца и начала вектора (вместо слов «конец вектора» правильнее было бы сказать «конец направленного отрезка, порождающего вектор»).
§ 1.1. Трехмерное пространство. Линейные пространства. Базис И *4. i i У /Р\ л^^» г \ ^ я ^"^ -^ V \ \ \ ' \ 5^/? Рис. 3 Рис. 4 Векторы трехмерного пространства (а также векторы плоскости, определяемые аналогично) можно складывать между собой и умножать на числа. Определение 3. Суммой векторов АВ и CD называется третий вектор EF, получаемый по следующему правилу: направленные отрезки А В и CD следует перенести параллельно самим себе так, чтобы начало второго совпало с концом первого; тогда направленный отрезок, соединяющий начало первого вектора с концом второго, и есть EF==~AB + CD (рис. 4). Комментарий к определению 3. Правило вычисления суммы векторов, данное в определении 3, называется правилом треугольника. Правило параллелограмма, изучаемое в некоторых школьных учебниках, отличается от рассмотренного правила треугольника лишь незначительными деталями. Можно убедиться в том, что при замене направленных отрезков АВ и CD соответственно равными им направленными отрезками А1В1 и C1D1, а также при другом выборе параллельного переноса, совмещающего конец и начало слагаемых векторов, результат сложения— вектор EF не изменится, хотя направленные отрезки, задающие сумму векторой AB + CD и A1Bi + C1Dlf будучи равными, могут быть геометрически различными. Проверку корректности определения суммы векторов см. в § 1М, 4-. Определение 4. Произведением вектора АВ на вещественное число X называется вектор ХАВУ удовлетворяющий следующим условиям: 1) отрезки АВ и ХАВ параллельны; 2) направление отрезка ХАВ выбирается так, чтобы при Я > О оно совпадало с направлением АВ, а при X < 0 было противоположно направлению АВ;
12 Глава J. Линейная алгебра с элементами аналитической геометрии 3) длина отрезка ХАВ равна длине отрезкаЛБ, умноженной на \Х\ (рис. 5). Можно убедиться в том, что вектор ХАВ условиями 1—3 опре- ' /Л? *Аав(а<о] Делен однозначно и что результат 2 Z \АТвг\ ' умножения вектора на число не "]Щ*Л зависит от того, какой из равных направленных отрезков был взят Рис. 5 -—* для построения ХАВ (проверку корректности определения умножения вектора на число см. в § 1М, 5). Действия над векторами (сложение векторов и умножение вектора на число) обладают естественными свойствами, перечисленными в § 1*.1, В. Лемма 2. Если векторы А В и CD имеют соответственно координаты (xlf уи z±) и (x2t у2, z2), то вектор AB + CD имеет координаты (х!+у19 х2-\-у2, х3 + у3), а вектор ХАВ—координаты (Xxi9 Хх2, Хх3). Доказательство приведено в § 1*.1, 7. Комментарий к лемме 2. В лемме 2 утверждается, что при сложении векторов их координаты складываются, а при умножении вектора на число X каждая координата вектора умножается на число X. При вычислениях, связанных с векторами, часто можно полностью отвлечься от геометрического смысла векторов и иметь дело лишь с координатами векторов. При этом мы будем рассматривать множество всех троек чисел (х, у, z) (однозначно соответствующих векторам трехмерного пространства в силу леммы 1). Сложение векторов и умножение векторов на число будем производить чисто алгебраически, пользуясь леммой 2. Тем самым по данному трехмерному пространству мы построим модель его множества векторов вместе с операциями сложения векторов и умножения вектора на число. В этой модели вектор есть упорядоченная тррйка чисел, а сложение векторов и умножение вектора на число определено правилами леммы 2. По аналогии с описанной моделью множества векторов трехмерного пространства можно рассмотреть понятие n-мерного координатного линейного пространства (имеющее весьма важное значение). Определение 5. Говорят, что множество упорядоченных наборов из п чисел (хи х2, ..., хп), называемых векторами, образует n-мерное координатное линейное пространство, если при этом определена сумма двух векторов (хи х2У ..., хп) + (у19 у2, ..., уп) =
/./. Трехмерное пространство. Линейные пространства. Базис 13 =s(Xl+xt, yi + Угу •••» Хп + Уп) и произведение вектора на число K(xlt х2, ..., x„) = (telf Kxt9 ..., Ххп). Комментарий к определению о. Фундаментальным математическим понятием, обобщающим понятие множества векторов трехмерного пространства, является линейное пространство,—по-4 нятие более общее и абстрактное, чем /г-мерное координатное линейное пространство. Однако при первоначальном изучении полезно иметь дело с /г-мерным координатным линейным пространством, поскольку это понятие, с одной стороны, проще и, с другой стороны, достаточно для исследования широкого круга проблем. Определение понятия линейного пространства дано в § 1*.1, 8. В дальнейшем мы будем иногда вместо слов «д-мерное координатное линейное пространство» говорить просто «линейное пространство». Пусть задано л-мерное координатное линейное пространство L и конечная система векторов аи а2> .. 1, ап из L: ах == (ап, а12, ..., aln)f -» -► #2 == (fl2l» ^22» • ' ' у а2п)> ' * * » ат == (^/Я1> ^/Й2> ' * ' » ^/ЯЛ/' Определение 6. Говорят, что система векторов аи а2У --.,ат линейно зависима, если какой-либо вектор этой системы линейно выражается через остальные. В противном случае система называется линейно независимой. Комментарий к определению 6. Термин «линейно выражается» означает «равен сумме остальных векторов, умноженных ->■->-> -> на некоторые коэффициенты». Например, если а1 = 3а2—5а4—(1/3) а5, * -> ->->->• то вектор аг линейно выражается через а2, а4, аъ. Примером линейно зависимой системы векторов может служить система ^ = (1, 2, 4), а2 = (—3, 10, 21), а3 = (—4, 8, 17). Здесь а2 = = Ьах + Ьдв- Примерами линейно независимых систем векторов могут слу- -►-»-»• жить системы: 1) ^ = (1, 0, 0, 0), а2 = (0, 1, 0, 0), а3 = (0, 0, 1, 0), а4 = (0,0,0, 1); 2) ^ = (5, 2, 3, 1), at = (09 4, 7, -2), а3=(0, 0, 3,-1), а4 = (0, 0, 0, 8). Ни один из векторов систем 1) и 2) не выражается линейно через остальные векторы этой же системы. Доказательство этого (полезное упражнение для самостоятельной работы) приведено в § 1*.1 II. Если для некоторых чисел с19 с2, ..., сп, не равных нулю од- ->• -* -*■ -> новременно, выполняется равенство сгаг -\-с2а2-\-... -{-спап= 0, то -> ->■ ->• система векторов аи а2, ..., ап линейно зависима. Действительно, пусть, например, с8ф0\ тогда
14 Глава I. Линейная алгебра с элементами аналитической геометрии т. е. вектор а3 линейно выражается через остальные векторы. При -> ->■ -> -> сх = с2 = ... = сп = О выражение с1а1 + с2а2 + ... + спап = 0 для лю- ,бых векторов alf а2, ..., ап, поэтому такое равенство не содержит никакой информации о линейной зависимости или независимости системы векторов. Выражение c1ai + c1a2+ ... +спап называется линейной комбина- цией векторов alf a2J ..., ап (с коэффициентами с19 с2, ..., сп). Если сг = с2 — ... = сп = 0, то соответствующая линейная комбинация называется тривиальной, в противном случае—нетривиальной. Таким образом, выражение 0^ + 0^+ ... +спап является нетривиальной линейной комбинацией, если хотя бы одно из чисел с19 с2> ..., сп не равно нулю. Если среди векторов системы имеются два коллинеарных вектора, то такая система линейно зависима. В самом деле, пусть ах и а2 коллинеарны, т. е. а1 = Ка2. Отсюда а1 = Яа2 + 0-а3+... + 0'ЯЛ> T- e- <*i линейно выражается через остальные векторы. Если к линейно зависимой системе векторов добавить еще некоторое количество векторов, то новая система по-прежнему останется линейно зависимой. В самом деле, в старой системе векторов один вектор линейно выражался через остальные. В новой, расширенной системе этот же вектор будет по-прежнему линейно выражаться через векторы старой системы, а значит, и через векторы новой системы, поскольку в прежнее выражение вектора можно включить добавленные векторы с коэффициентами, равными нулю. Если для доказательства линейной зависимости системы векторов достаточно указать какую-либо нетривиальную линейную комбинацию векторов системы, равную нулю, то доказательство линей- ной независимости системы векторов аи я2, ..., ап состоит в доказательстве такого утверждения: единственная линейная комбинация -> ->• ~-> ->->->• ЗД + ЗД+ • • • Jrcnan векторов alf а2, ..., ап, равная нулю, тривиальна, т. е. d = ca= ... =сп = 0. Иными словами, для доказательства линейной независимости системы векторов а1У а2, ..., ап достаточно показать, что из с^ + -» -> -> + с2а2 + ... + спап =± 0 вытекает, что сг = с2 = ... = сп = 0. Как установить, существует или не существует нетривиальная линейная комбинация заданной системы векторов, равная нулю (т. е. является ли система векторов линейно зависимой или нет). В простых случаях иногда можно решить такую задачу элементарными средствами (см. ниже решения примеров 4д) и 4е), которые сводятся к исследованию системы линейных однородных уравнений). В § 1.7 будет дан общий метод решения такой задачи, в которой используются понятия определителя и ранга матрицы.
§1.L Трехмерное пространство. Линейные пространства. Базис 15 Рис. 6 2°. Линейные пространства. Определение 7. Пусть Ln есть я-мерное координатное линейное пространство. Подмножество MdL векторов из L называется линейным подпространством простран- -»■ -> ства L, если: 1) для всяких a, b£M сум- -> ~* ма а + b принадлежит М\ 2) для всяко- -»• -»• го вектора а £ Л1 и числа X вектор %а принадлежит М. Комментарий к определению 7. Полезно иметь в виду, что для (геометрического) трехмерного пространства всякое подпространство является либо прямой, либо плоскостью, проходящей через начало координат (рис. 6), за тривиальным исключением, связанным с несобственными подпространствами (см. § 1*.1, 10). Линейное подпространство М (м-мерного координатного пространства Ln) является линейным пространством в смысле, описанном в § 1*.1, 9, оно представляет собой конкретную модель линейного пространства. В самом деле, если векторы абстрактного линейного пространства—элементы произвольной природы, то векторы М, как и все векторы из Ln, являются упорядоченными наборами (х19 x2f ..., хп) из п чисел. Описание линейных подпространств в Ln дается в следующей теореме. Теорема 1. Пусть дана система линейных уравнений [ an*i + 012*2 + • • • + а1пхп = О, 0*1*1 +я22*2 + ... + а2пхп = О, V а/я1*1 + ат2Х2 + • • • + атпХп — О- (1) Тогда множество М всех ее решений является линейным подпространством в Ln. Обратно, всякое линейное подпространство в Ln есть множество наборов (хи x2J ..., хп)у удовлетворяющих некоторой системе линейных однородных уравнений. Доказательство. Пусть (х19 х2, ...,х„) и (уи у2, ...,#„) — два элемента из М, т. е. два решения системы (1). Это значит, что 011*1+012*2 + 021*1 + 022*2 + + а1пхп = 0, + 02Л = О, 0*u*i+0*2*2 +. • • + 0*»*«=0; 0цУ1 + 012У2 + • • • + а1пуп = О, ЯггУг + аг<ёг + • • • + агпуа = О, ат1Ух + ат2у2-+ ... + атпуп = 0.
16 Глава I. Линейная алгебра с элементами аналитической геометрии Складывая построчно соответствующие равенства, имеем «ii(*i + yi) + «i2(*2 + y2)+---+«i^ + ^) = 0, «21 (*1 +Уд + «22 (*2 +У2) + • • • + «2л (*« + Уп) = О, «•1 (*i + 0i)+«*2 (*2 + У2) + • • • + атп (ха + уп) = 0. Таким образом, набор (хг + уи х2 + у2, ..., хп + уп) удовлетворяет системе уравнений (1) и является вектором из М. Аналогично, из равенств «11*1 + «12*2 + • • • + «1/Л = 0, «21*1 + «22*2 + • • • + «2я*« = 0, «^1*1 + «/«2*2 +"-КЛ = 0 следует, что «iA*i + «12^*2 + • • • +«i«^*n = 0. а2ХХхх + а22Хх2 + ... + a2nhcn = 0, amlkXi + ат2Хх2 + ... + аяпкхп = 0, т. е. h(Xi, х2, ..., *я) принадлежит М, если (х1э лс2-, ..., хп)£М. Доказательство обратного утверждения теоремы приведено в § 1*л, 13. Комментарий к теореме 1. Множество решений системы линейных уравнений (будучи в силу теоремы 1 линейным подпространством в n-мерном координатном линейном пространстве) является линейным пространством (см. § 1*.1, 8). 3°. Базис линейного пространства (подпространства). О пред еле- ние 8. Пусть М—линейное подпространство в Ln и (аи а2, ..., ат) — упорядоченная система векторов из М. Эта система векторов называется базисом подпространства М, если: 1) она линейно незави- сима; 2) всякий вектор из М линейно выражается через ах, а2, ..., ат. Комментарий к определению 8. Базисом называется ->• -> -* всякий набор (aif а2, ..., ат)у удовлетворяющий условиям 1 и 2. Существует бесконечное множество базисов данного линейного подпространства. В определении не требуется, чтобы базис состоял из заданного числа векторов. Однако справедлива следующая теорема. Теорема 2. Количество векторов в базисе линейного подпространства не зависит от выбора базиса. Доказательство приведено в § 1*.1, 12. Комментарий к теореме 2. Количество векторов в базисе заданного подпространства зависит только от самого подпространства, а не от того, какие конкретные векторы выбраны в качестве
/ Трехмерное пространство. Линейные пространства. Базис 17 базисных; количество векторов в каждом базисе линейного подпространства одно и то же. Определение 9. Пусть М — линейное подпространство в Ьп и (Г, /г> •••>?/•)—базис в М. Число г, равное количеству векторов в базисе М (безразлично, в каком именно), называется размерностью линейного подпространства М. Комментарий к определению 9. Само Ln является своим линейным подпространством и имеет размерность п. В этом можно убедиться, рассмотрев систему векторов ^ = (1, 0, 0, ..., 0), е2 = = (0, 1, 0, ..., 0), ..., вй = (0, 0, 0, ..., 1). Легко установить, что эта система векторов является базисом в Ln\ она линейно независима и всякий вектор из Ln линейно выражается через ei9 72J ..., 7п. Линейные подпространства в L„, не совпадающие с самим Ln, имеют размерность меньшую, чем /г. 4°. Примеры 1. В трехмерном пространстве заданы четыре точки Л (1, 2, 4), 5(3, 1, 5), С(—2, —1, —3), D(5, 0, 6). Найти координаты векторов АВ, АС, СВ, AD. Имеются ли среди направленных отрезков АВ, ACr СВ, AD параллельные? Как связаны координаты векторов, соответствующих параллельным направленным отрезкам? Доказать, что если направленные отрезки параллельны, то соответствующие им векторы имеют пропорциональные координаты, т. е. если AB\\CD и АВ = (хи уи zx), CD = (x2J y2 za), то x1/x2 = y1/yft = z1/zi или (#2, t/2, z2) = X(xly yu zx) (такие векторы называются коллине- арными). Доказать также; что если точки Аи Л2, ..., Ап лежат на прямой, то всякие два вектора вида А{А/у AkAt коллинеарны. Решение. Согласно лемме 1, ЛВ=-(2, —1, 1), АС = (—3„—3, —7), СВ = (5, 2, 8), ЛЬ=(4, —2, 2). Из определений 2, 5 и леммы 1 следует, что ЛЯ = (4, —2, 2) = 2 (2, —1, 1) = 2ЛВ и направленные отрезки А В и AD параллельны. Множество {ЛВ, ~АС, СВ, AD] не содержит другой пары параллельных направленных отрезков. Два направленных отрезка параллельны тогда и только тогда, когда координаты соответствующих им векторов пропорциональны. Действительно, если направленные отрезки PQ и RS параллельны, то после умножения одного из них (для определенности PQ) на подходящее число X эти отрезки будут удовлетворять условию Л определения 1 и будут задавать один и тот же вектор. Следовательно,
18 Глава I. Линейная алгебра с элементами аналитической геометрии исходные отрезки PQ и RS определяют векторы PQ и RS такие, что XPQ = RS; отсюда следует, что координаты векторов PQ и RS пропорциональны. В приведенном рассуждении использован тот факт, что координаты вектора и операция умножения вектора на число однозначно и корректно определены леммами 1 и 2. В частности, если точки Аи Л2, ..., Ап лежат на одной прямой, то все направленные отрезки вида A(Aj, AkAt параллельны и векторы A{Aj, AkAt коллинеарны. 2. Дано пятимерное координатное пространство L5. Установить, являются ли векторами этого пространства: а) (0, 0, 0, 0, 0); б) (1, I 2, 3, -4, 5, 6); в) (х, у, z, 1, 3); г) (1, -3, 2, 4, 7); д) 2хг + + Зх2 + \3х3— 4х4—хъ. Решение. Векторами пространства L5 являются векторы а), г). 3. Пусть а = (1, 0, 0, 0, 0) &=(2, 0, 0, 0, 0). Описать все век- -» —> торы вида Аа-\-ВЬ, где А и В — произвольные действительные чис- ->• -> ла. Решить ту же задачу для векторов а = (1, 0, 0, 0, 0), & = (0, 1,0, 0, 0). Решение. Общий вид векторов Аа-\-ВЬу где а = (1, 0,0, 0,0) и Ь=(2, 0, 0, 0, 0), а Л и В — произвольные вещественные числа, таков: (С, 0, 0, 0, 0), где С — произвольное вещественное число. Для векторов я = (1, 0, 0, 0, 0) и fc=(0, 1, 0, 0, 0) множество -> —> Аа + Bb состоит из векторов вида (С, Д 0, 0, 0), где С и D — произвольные вещественные числа. 4. Даны следующие системы векторов в L5: а) ^ = (1,8,-8, 8,-5), а2 = (1,3, -4,2,0), а3=(-1,2,0, 4, -5); б) £ = (1,8,3,0,0), £ = (1, 2, 0, 1, 3), а, = (—2, -4, 0, -2, -6); в) £ = (-3/2, -7/2, -7/2, -2, 0), £ = (1, 1, 1, 1, 0), £ = (0, 1, 1, 1/4, 0); г) £ = (1, 0, 0, 0, 0), £ = (0, 1, 0, 0, 0), £ = (0, 0, 1, О, О); д) £ = (1, 2, -3, 4, 5), £ = (3, 7, 1, 2, 4), £ = (1, 1, -1, 0, 0); е) £ = (1, 2,5, 0), £ = (0, 1, 2, 3), £ = (1, 3, 5, 3), £=(2, 5, | 8, 3). Проверить, что для систем а), б), в), г) выполняются соответственно соотношения а1 = 2а2 + а3> а3=—2а2, 2аг--\- За2 + 4а3 = 0, 0^+0^= = 0. Являются ли эти системы линейно зависимыми? Выяснить, являются ли системы векторов д) и е) линейно зависимыми. Решение. Проверку выполнения указанных для систем а)—г) соотношений можно провести непосредственно по определению 5.
§1.1. Трехмерное пространство. Линейные пространства. Базис 19 Системы векторов а), б), в) являются линейно зависимыми, по- скольку в соотношениях аг= 2а2 + а3 и а3 =—2а2 один вектор си- стемы линейно выражен через остальные; из 2ах + Зя2-f-4а3 = О вы- текает соотношение аг = —(3/2)а2—2а3, выражающее аг через осталь- ные векторы системы. По соотношению 0-а1 + 0-^2 = 0, которому удовлетворяет система векторов г), нельзя сделать вывод о линейной зависимости или линейной независимости системы, поскольку это соотношение справедливо для любой системы векторов (та^ое соотношение представляет собой тривиальную линейную комбинацию). Впрочем, легко установить, что система векторов г) линейно зависима. Рассмотрим теперь систему векторов д). Пусть с19 с2, ..., с3 таковы, что линейная комбинация c^i + с2аа + с8а3 РаВна нулевому вектору, т. е. с1а1 + сяаа + с8а3 = 0. (*) Координаты левой части линейной комбинации (*), записанные в столбец, имеют вид или ' 1) 2 —3 4 5; + с2 Гзч 7 |1 2 Л 1 + cs 1 Сг + -3Cl + 4с, + 5<а + г г 1 —1 0 . °J Зс2- 7<V С-г- 2с2 4са i = ( с1 + 3с2+с3> 2ci + 7c2+c8i —Зсх -f- с2 — Сз 4с!+2с2 ^ 5ci+4c2 j f С г -с* = о, = о, = 0, = 0, = 0. Из этой системы легко найти, что с1 = с2 = £3 = 0. Действительно, из четвертого и пятого уравнений имеем сх = —0,5с2, 5(—0,5с2) + -Ь4с2 = 0, 1,5с2 = 0, т.е. с2 = 0, сх = 0 и из первого уравнения получаем с3 = 0. Таким образом, единственная равная нулевому вектору линейная комбинация оказалась тривиальной; значит, данная система векторов линейно независима. Рассмотрим, наконец, систему векторов е). Пусть си с2, с3, с± таковы, что с&г + с2а2 + с3а3 + сАа^ = 0. (**)
20 Глава I. Линейная алгебра с элементами аналитической геометрии Вычислим координаты вектора схаг + с2а2 + с3а3 + с^а^: Ci + с3 + 2с^\ 2сг + с2 + 3с3 + 5с4 Зс2 + 3с3 + 3с4/ Из равенства (#*) получаем систему уравнений ( Сг+ + с3 + 2с, = 0, J 2сг+ c2 + 3c3 + 5c, = 0f I Зс2 + 3с3 + 3с, = 0. Остается выяснить, имеет ли эта система уравнений нетривиальные решения. Если можно найти все решения системы, то легко ответить на поставленный вопрос. В рассматриваемом случае, не вычисляя всех решений, укажем лишь одно из них: с1 = 3, с2=1, с3=1, с4=— 2. Таким образом, данная система векторов линейно зависима. Возникает вопрос о том, как найдено это решение. Существуют ли общие методы решения систем линейных однородных уравнений? Такие методы существуют, они будут рассмотрены в § 1.9. 5°. Упражнения 1. Докажите, что векторы fi = (an, a12) и /2 = (<22i, а22) образуют базис в координатном пространстве L2 тогда и только тогда, когда аца22 — а12а21 Ф 0. в 2. Докажите, что множество многочленов х2, х(х-\-\), л: (л: — 1)-f-1, х + 2 линейно зависимо. 3. Даны векторы h = (\, 1, 1), h = (0, 2, 3), /J=(0, 1, 8). Докажите, что они образуют базис в координатном пространстве L3. —> —> 4. Докажите, что система векторов /i = (l, 1, 1, 1), /2 = (0, 0, 0, 0) линейно зависима. 5. Докажите, что система векторов /i = (l, 0, 0), /2 = (0, 1, 0), /3 = (0, 0, 1), /4 = (5, 6, 7) линейно зависима. 6. Покажите, что следующие системы векторов линейно зависимы, и выясните, является ли вектор Ь линейной комбинацией векторов alf а2 и а3: a) ai = (l, 0, 0), a2 = (0^2t 1), а8 = (0,_1, —1), ?=(0, 1, 0); б) ^ = (1, 0, 0), a2 = (0, 2, l),aa = (l, 2, 1), ?=(0, 0, 1); в) ai = (l, 1, 1, 1, 1„_1), £ = (-2, -2, -2, -2, -2, -2), Ь = = (1, 0, 0, 0, 0, 0); г) fli = (0, 0, 0, 1), a2=(0, 0, 1, 2), a3 = (0, 1, 3, -5), а4 = (1, —2, 0, 0), ?=(!, —1, 4, —2).
/ 2. Скалярное произведение векторов в R* и его свойства 21 § 1.2. Скалярное произведение векторов в R3 и его свойства. Аксиоматическое определение скалярного произведения , в линейном пространстве. Длина вектора. Расстояние. Неравенство Коши — Буняковского. Угол между векторами. Пространство R". Ортогональный базис. Разложение вектора по базису 1°. Скалярное произведение векторов в R3 и его свойства. Для удобства дальнейшего изучения курса линейной алгебры приведем краткие сведения из школьного учебного материала, относящегося к этой теме. Если в пространстве задана декартова прямоугольная система координат, то единичные векторы f, /, k, направленные вдоль положительных направлений осей Or, Оу, Oz, взаимно перпендикулярны и составляют базис пространства. Вычисление длины вектора и величины угла между векторами легко осуществить, используя понятие скалярного произведения двух векторов. По определению, ска- лярное произведение (ау Ь) двух векторов а и b есть число, равное произведению длин \а\, \Ь\ этих векторов на косинус угла ф между ними. При этом, очевидно, -> -> |а|2 = (а, а), созФ=: (*'Q . (1) \а\\Ь\ Самым главным свойством скалярного произведения является то, что (а, Ь) очень просто выражается через координаты векторов а -> ->-»-» „ —> -» и Ь в базисе (/, /, k). Именно, если a = (aly а2, а3), b — (bu b2, Ь3), то (a, b) = axbx + a2b2 + a3b3 (2) и равенства (1) можно записать в виде \a\ = yr(aya) = Val + al + al созФ^ «*р^* + «** . (3) V at + al + al V ь\ + Ь\ + Ъ% Таким образом, многие геометрические задачи можно решать, зная лишь координаты исходных векторов. Из соотношения (2) вытекают следующие свойства скалярного произведения: 1°. (ау b) = (b, a) Va, 6gR3 (симметричность). 2°. (а + £ с7=(^ J + (£ с) Va, £ eg R3. 3°. (2^ $ = к(а9 с) Va, cgR8, V^gR. Свойства 2° и 3° означают линейность по первому множителю.
22 Глава I. Линейная алгебра с элементами аналитической геометрии 4°. (а, а)>0 VagR3. 5°. (а, а) = 0&~а = 0. 2°. Скалярное произведение векторов в R". По аналогии с трехмерным случаем определим скалярное произведение в R". Определение 1. Скалярным произведением (а, ft) двух векто- ров a, ft£ R", где а = (аи а2, ..., aj, b=(blf ft2, ..., ftj, называется число (а, ft) = аА + a2ft2 + ... + anbn.. (4) Комментарий к определению 1. Так как формулой (4) определено скалярное произведение двух любых векторов, то можно считать, что скалярное произведение есть функция от двух векторов, принимающая числовые значения. Легко проверить, что скалярное произведение обладает свойствами, аналогичными свойствам 1°—5° в случае трехмерного пространства, а именно: 1о. (J, ft) = (6, а) Va, b£ R". 2°. (а + ft, с) = (а, ?)+(ft, ~c) Va, ft, ?€ Rrt- 3°. (Яа, с) = Я(а, с) Va, (Tig R", VX^R. 4°. (a, a)>0 Va£R". 5°. (а, а) = 0ф>^=0. По аналогии с трехмерным случаем определим длину \а[ вектора a = (al9 a2, ..., ап) формулой |а\ = |/"(а, а) = Va\+a\+... +а„2, ' (5) а величину угла <р между векторами а = (аи а2, ..., aj и b—(blf К •••> *я) — формулой cosф = (а> &) = аА+аА+...+^в /бч (а, а) (£ А) V а\ + а\+...+а% V b\ + b\+ ... +b2n ' Разумеется, речь идет лишь о некоторых условных понятиях, аналогичных по своим свойствам длине вектора трехмерного пространства и углу между векторами в трехмерном пространстве. Определение coscp по формуле (6) требует, чтобы правая часть этой формулы была равна числу, по модулю не превосходящему единицы. Оказывается, что для любых (а1? а2, ..., ап) и (bif ft2, ..., bn), где а£, ftf£ R (/ = 1, 2, ..., п), дело обстоит именно так в силу неравенства Коши — Буняковского [см. ниже формулу (10)].
§1.2. Скалярное произведение векторов в № и его свойства 23 Отметим, что система векторов £ = (1, 0, 0, ...,0), <Г2=(0, 1, 0, ...,0), ..., ^ = (0, 0, 0,..., 1) (7) обладает следующими свойствами: ( 1 при t = /, l«i|-l. <«,. */) = |0 при 1ф\; *'' /=1< 2 »■ <8> Формулы (8) можно истолковать так: каждый из векторов е{ (/=1, 2, ..., п) имеет единичную длину и векторы системы взаимно орто- -> -> -» ->• тональны, т. е. cos (et, ej) = 0, *' Ф /, где е£, ey означает угол между et и ву. Расстоянием между двумя точками Л, В в R" по аналогии со случаем R3 будем называть длину вектора АВ. Пусть координаты точек А и В равны соответственно (хи х2, ..., хп) и (у19 у2, ..., уп). Координаты вектора АВ в соответствии с леммой 1 § 1.1 таковы: {У\—xiy #2—*2> •••>#«—хп)- Длина вектора АВ, т.е. расстояние р(Ау В) между точками А и S, есть р(Л, B) = }f{AB, АВ) = ^(у1-х1Г + (у2-х2Г+...+(уп-хпГ. (9) 3°. Неравенство Коши — Буняковекого. При любых вещественных aif b( (/= 1, 2, ..., п) справедливо неравенство j <- ^1+^2+ . ..+ДА <* J /iqv ^ Val + a\+...+alVb\+bl+...+b* ^ ' называемое неравенством Коши — Буняковского. Доказательство. Рассмотрим следующую функцию / от переменной /: f(t) = (a1 + b1t)2 + (a2 + b2t)*+ ... +(an + bnt)\ (11) Очевидно, что / (t) !> О при любом t g R, поскольку правая .часть равенства (11) есть сумма квадратов вещественных чисел; преобразуя /(/), имеем f(t) = (al + al+ ... +afl) + 2(a1b1 + a2b2+ ... +anbn)t + + (« + «+.. •+«)*% откуда видно, что /(£)—квадратный трехчлен относительно переменной t. Как известно из школьного курса алгебры, квадратный трехчлен с вещественными коэффициентами принимает неотрицательные значения при каждом вещественном значении t только тогда, когда его дискриминант неположителен, т. е. («А + 4+ .. • +аяЬя)* — (а\ + а\+... +а») ф\ + Ь\-\-... + &*) <0. (12) Формула (10) непосредственно вытекает из (12).
24 Глава I. Линейная алгебра с элементами аналитической геометрии 4°. Ортогональный базис. Выше мы рассматривали систему (7) век- торов е19 е2у ..., е„ в R", обладающих свойствами (8). Существуют другие системы векторов, обладающих аналогичными свойствами. Пусть дана система из п векторов пространства Ln: 7и /„..■,?» о3) такая, что ( 1 при / = /, Ч"Ч>- to „p„w. <14> Эта система векторов является базисом в R". Действительно, во-первых, система (13) линейно независима. Если бы это было не так, то существовала бы нетривиальная линейная комбинация векторов (13), равная нулевому вектору: Cvh + CJt+...+cJn = Q. (15) Пусть коэффициент ck в (15) не равен нулю. Тогда, умножив ра- венство (15) скалярно на ffe, получим ck(fh, /ft) = fy = 0, т.е. ck = 0t .что противоречит предположению. Во-вторых, любой вектор g£Rn линейно выражается через векторы (13). Действительно, всякий базис в R" состоит из п векторов и к системе (13) нельзя добавить еще один вектор так, чтобы она оставалась линейно независимой (в этом случае базис R" состоял бы более, чем из п векторов). Поэтому добавление любого вектора g к системе (13) приводит к линейно зависимой системе fu /2, ..., fn, g. Это означает, что существует нетривиальная линейная комбинация cji + cft+ ... +cjn + cn+1g, равная нулевому вектору: Cih+cJ2+ ... +cjn + cn+1g = 0. Здесь сп+1ф0, иначе получится нетривиальная линейная комбина- ция векторов fu /2, ..., /„, равная нулю, чего по доказанному не может быть. Так как сп+1Ф0, то G Cl S. С2 Г. ЬП £ Ln + 1 Ln 1 Ln + 1 Определение 2. Система (13) из п векторов в R", удовлетворяющая условиям (14), называется ортонормированным базисом в R". Иногда вместо термина «ортонормированный» употребляют термин «ортогональный». Каждый вектор g в Ln можно представить в виде линейной ком- бинации векторов базиса /lf /2, ..., fn: ■ g = cjx + cj% + .. .+cjn. (16)
, § 1.2. Скалярное произведение векторов в R3 и его свойства 25 5°. Разложение вектора по ортонормированному базису. Отметим, что в случае, когда базис (fu /2, ..., /„) ортонормирован, коэффициенты с19 с2У ..., сп в равенстве (16) можно легко найти, а именно Сг = (J, h), С2 = Q, /2), ...,Cn = (g, fn). (17) Действительно, умножая обе части равенства (16) скалярно на f. (/ = 1, 2, ..., п), получим соотношение (17). Таким образом, с помощью формул (17) решается задача разло- жения вектора g по (ортонормированному) базису (/1э /2, ..., /„). Если базис не ортонормирован, то эта задача значительно усложняется и требует решения некоторой системы линейных уравнений. Отметим, что с помощью скалярного произведения можно вычис- лять проекции одного вектора g на другой вектор /. Если /—век- тор единичной длины, т.е. |/| = |/ (/, /) = 1, то вектор (g, /)/есть -» —> ->-*■->-> проекция g на / в том смысле, что разность g—(g, f)f ортого- нальна /: это означает, что (g—(g, /)/, /) = 0 (проверьте!). Сказанное поясняет рис. 7. -*■ В силу сказанного разложение (16), (17) означает, что вектор g есть сумма своих ортогональных проекций на векторы ортонорми- -> -> -> рованного базиса (fu /2, ..., /„). Если вектор / имеет длину, не равную единице, то //|/|—век- -> ->■ ~> тор единичной длины, и проекция g на / (она равна проекции g -> -> на //|/|) имеет вид т ^? -(!,?)-i-. OS) 1П У 1/1 (/, /) Пусть (/х, /2, /3)—ортонормированный базис в R3 относиуельно скалярного произведения (2) и g—произвольный вектор из R3 единичной длины. В соответствии с формулами (16), (17) разложение вектора g по базису (/lf /2, /3) имеет вид g^c^ + cJt + cJt, с, = (£, fty9 f = lf 2, 3. Как было отмечено выше, векторы cjly cj2, c3f3 являются про- екциями вектора g (единичной длины) соответственно на fl9 /2, /3. Поскольку длина проекции равна длине проектируемого вектора g, -* -» умноженной на косинус угла у{ между векторами g и ft (в данном -*■->-*.-► случае ct = cos yt), имеем g = cos ух ft + cos y2 /2 + cos y3 /3. Таким
26 Глава 1. Линейная алгебра с элементами аналитической геометриц Рис. 7 с, х -cosг,, с2=со$Гг? CrC0STs Рис. 8 образом, координаты единичного вектора в ортонормированном базисе являются косинусами углов между проектируемым вектором и векторами ортонормированного базиса. Они называются направляющими косинусами (рис. 8). Аналогичное утверждение имеет место и для пространства R" со скалярным произведением (4). В некоторых задачах требуется найти проекцию вектора на подпространство в Rrt, в котором задан ортонормированный базис (см. § 1*-2, 2). Если же в подпространстве задан базис, не являющийся орто- нормированным, то его можно преобразовать в ортонормированный с помощью процесса ортогонализации (см. § 1*.2, 3)- В заключение вернемся к вопросу о вычислении длин векторов и углов между ними в n-мерном линейном координатном пространстве R". Мы приняли за аксиому (см. определение 1) формулу (4), с помощью которой в конечном счете производилось вычисление длин и углов. Эту формулу мы ввели по аналогии с формулой (2) из школьной геометрии. Каким образом получилась формула (2), позволяющая вычислять произведение длин векторов на косинус угла между ними? Известно, что такая функция от двух векторов а и b должна удовлетворять свойствам 1°—5°. Верно ли утверждение о том, что единственной функцией от двух векторов, удовлетворяющей этим свойствам, является (2)? Нет, не верно. Чтобы прийти к формуле (2), нужно дополнительно предположить, что векторы е1==(1, 0, 0), £2 = (0, 1, 0), ея = (0, 0, 1) взаимно перпендикулярны и имеют единичную длину. В школьном курсе упомянутые свойства векторов ей е2, е3 сами собой подразумевались в связи с тем обстоя- тельством, что еи e2J es—орты прямоугольной декартовой системы координат. Однако в случае абстрактного линейного пространства нет никаких оснований для того, чтобы некоторую систему векторов считать естественным ортонормированным базисом. Все базисы, так сказать,,
§1.2. Скалярное произведение векторов в /?3 и его свойства 27 равноправны между собой. Поэтому для измерения длин и углов нужно выбрать некоторый базис (все равно—какой), по определению считать его ортонормированным и принять свойства 1°—5° за аксиомы, тогда скалярное произведение двух векторов, т. е. произведение длин векторов на косинус угла между ними, будет определено однозначно. Предыдущим рассуждением мы в общих чертах мотивировали и описали некоторый подход к аксиоматическому определению скалярного произведения в абстрактном линейном пространстве. Точное аксиоматическое определение скалярного произведения приведено в § 1*.2, I. Там же дано строгое определение одного из важнейших понятий линейной алгебры—евклидова пространства. Для многих математических и прикладных задач удобен следующий частный случай общего понятия евклидова пространства. Определение 3. Пусть в n-мерном координатном линейном пространстве по формуле (4) определено скалярное произведение векторов. Тогда это пространство называется n-мерным координатным евклидовым пространством. 6°. Примеры 1. В трехмерном пространстве с декартовой прямоугольной системой координат рассмотрим 8 точек, лежащих в вершинах куба: А (0, 0, 0), Л' (0, 0, 1), В (0, 1, 0), В' (0, 1, 1), С (1, 0,_0), (Tjl, 0, 1), D (1, 1, 0), U (1, 1, 1). Найти: длины векторов AD\ DA'\ расстояния от точек Л, 5, С, D соответственно до точек В\ D', С, Л'; угол между векторами АС и С А. Решение. Пользуясь формулой (9), имеем | AD' | = V( 1 — О)2 + (1 — О)2 + (1 — О)2 = V 3, \DA'\=VW^)2 + (Q-i)2 + (r^=--V3t р(Л^)^К(0-0)2+(1-0)2 + (1-0)2^1/2, р (BD') = К(1 -О)2 + (1— I)2 + (1-0)2 = /2, р(СС/) = ]/(1-1)2+(0-0)2 + (1-0)2-1, р(ОЛ/) = И(0—1)2 + (0 —1)2 + (1— 0)2 = КЗ. На основании формулы (6) получаем 1(_1) + 0.0 + 0(-1) 1 СОЭф=- }Al2 + o2 + 02 V(— l)2 + 02 + (— 1)2 У 2 где ф —угол между векторами АС и С А, ф=135°. 2. В пространстве R4 даны 16 точек—вершины «четырехмерного куба»: Л (0, 0, 0, 0), Л' (0, 0, 0, 1), В (0, 0, 1, 0), В' (0, 0, 1, 1), С (0, 1, 0, 0), С (0, 1, 0, 1), D (1, 0, 0, 0), U (1, 0, 0, 1), Е (0, 1, 1, 0), Е' (0, 1, 1, 1), F (1, 0, 1, 0), F (1, 0, 1, 1), G (1, 1, 0, 0), С (1, 1, 0, 1), Н (1, 1, 1, 0), Я' (1, 1, 1, 1). Найти: длины диаго-
28 Глава I. Линейная алгебра с элементами аналитической геометрии налей BG' и GB'\ угол между диагоналями CF' и DE'\ проекцию вектора АН' на векторы ВВ\ CD', EG. Решение. Используя формулу (9), получим Р(в, G/)=KoTZoy2+(i-o)2+(Q-i)2+(i-o7=2, p(G, B')==j/(0-l)2 + (0-l)2 + (l-0)2+(l-0)2 = 2. По формуле (6) находим 1 (—1) + (—1).1 + Ы + Ы А cos ф = , \ f * к > rr i = о |/^12-Ь( —1)2+ 12+ I2 ^(—1)2+12+12+12 и угол ф между векторами CF' и DE' равен 90°. Вычислим координаты вектора АН'\ имеем АН' = (1, 1, 1, 1). Теперь с помощью формулы (18) находим проекции вектора АН' на векторы ВВ', CD' и £G: (^Б?ч^-ьо+1'0+ьо+м(о, о, о, !) = «>, о, о, 1), (вв\ вв') о.о+о.о+о.о+ы (АН',СВ')СЪ^ Ы + Ч-О+ЬО+Ы (1> _1( 0> 1) = \CD\ CD') Ы + (—1)(—1) + 0.0+ Ы = 1(1,-1,0, !) = (+-!, 0.1). №,5?)^ ы + 1.0+1 (-D+1.Q 0> 0> _lf 0) = \EG, EG) ы+0.0 + (— 1)(—1) + 0.0 = 0(1, 0, —1, 0) = (0, 0, 0, 0). 3. Проверить, что векторы £ = (1/КЗ, 1//3, 1/КЗ), £=(l/j/"2, —1/|/"2, 0), /3 = (l/l/l>, l/Кб, — 2/К6) образуют ортонормирован- ный базис в R3 относительно скалярного произведения (2). ->■->• -» Решение. Векторы f19 /2, /3 имеют единичную длину и попарно ортогональны; действительно, (К, £) = (1/КЗ)* + <1/Кз)* + (1/Кз)*=1, С f2) = (l/K2)* + (l/K2)' + 0*=l, (Г.. Гз)=(1/Кб)^+(1/Кб)^+(-2/Кб)==1, ft, f2)-(l/K3).(l/j/2) + (l/K3).(-l/|/2) + (l/^3).0 = 0, ft, Га) = (i/Кз)• (1/Кб) + (1/Кз)• (1/Кб) + од/з)• (-2/К6) = о, ft, /;) = (1/К2).(1/Кб) + (-1/К2)-(1/Кб) + 0.(-2/Кб) = 0.
§ 1.2. Скалярное произведение векторов в № и его свойства 29 Таким образом, система векторов fu /2, /3 удовлетворяет свойствам (14) при п = 3 и является базисом в R3. 4. Пусть Г=(/ц, Л., ..., /i„), Г. = (/.1, /22, • •, Ля). •••>/* = =(/»i» /«2» •••» /««) — ^-векторов в n-мерном координатном линейном пространстве R", которые образуют ортонормированный базис R" относительно скалярного произведения (4). Проверить, что в этом случае 2^. = i (i=i, 2, .... п), 2/„/*,=<> (1фк). / = 1 / = 1 Решение. Так как по условию -* -+ ( 0 при t =#=/, ^ W-U при/ = / С/-1' 2. ""»>• то -* -> " ГО при i =£ /, (ft* fi)-ZJikfjk-[ 1 при f==/> что и требовалось установить. 7°. Упражнения 1. В пространстве R4 со скалярным произведением (4) найдите длины следую- -> ->• -> ->• щих векторов: ^ = (1, 2, 3, 0), а2 = (—1, 1, —1, 1), а3 = (1, 1> 0, 0), а4 = = (1, —1, 0, 0). 2. В пространстве R5 со скалярным произведением (4) найдите углы между векторами #i и а2, ах и а3, #i и а4, #2 и а4> если: а^ —(1, —1, 0, 0, 0), а2 = (0, U —1, 0, 0), аз = (0, 0, 1, —1, 0), ^ = (0, 0, 0, 1, -1). 3. Проверьте, что система векторов аг, а2, а3, а4 образует ортонормированный базис R4 [относительно скалярного произведения (4)], если ai = (l/2, 1/2, 1/2, 1/2), ?а = (1/2, 1/2, —1/2, -1/2), а%(1/2, -1/2, 1/2, —1/2), ^t=(l/2, —1/2, —1/2, 1/2). 4. Найдите проекции вектора / = (5, 4, 3, —1) на векторы а1у а2, а3, а4 из упр. 3. -> ~> 5. Разложите векторы / = (5, 4, 3, —1) и g = (3, —3, —3, 3) по базису из упр. 3. 6. Пусть в пространстве R72 выбран ортонормированный базис (е1г е2, ..., ert). -* -» ->-> -»■ ->-»•->•-> Вычислите длины векторов ai = 2ei + 3e2t а2 ——Зе1-\~2е2, аз = е1—ез, а также косинусы углов между этими векторами. 7. Даны векторы е1э в2, е3, образующие ортонормированный базис. Найдите значение скалярного произведения векторов х и у, если: а) * = е1 + 4е24-£з> У = -> -> ->->-»-»■ — вх — е3; б) x = elt y = e2. —> —> —> —»■ 8. В условиях упр. 7 найдите углы между векторами хну, если: а) х = е1 + -»->-»■-»■ -»->-»->->-»■
30 Глава Iг Линейная алгебра с элементами аналитической геометрии 9. Найдите многочлены вида fi(x) = x2--\-px+qy ортогональные многочлену 1 /2 (х) =х относительно скалярного произведения (flf /2)= С fx (х) /2 (х) dx. 10. В условиях упр. 9 среди многочленов вида h(x) = x2+px-\-q, ортогональных многочлену /2 (*) = *, найдите такие, что (/ь /i) = l. § 1.3. Уравнение плоскости в R3 (векторная и координатная формы).; Уравнение гиперплоскости в R" (векторная и координатная формы). Прямая в Rn (векторная и координатная формы) 1°. Уравнения гиперплоскости и прямой в R". Пусть в трехмерном пространстве R3 даны точка Р0(х0, yQ, zQ) и вектор а=(Л, В, С). Эти данные однозначно определяют плоскость, содержащую Р0 и перпендикулярную вектору а. Найдем уравнение этой плоскости. Пусть Р (х, у, z) — координаты текущей точки плоскости. Рассмотрим вектор Р0Р\ его координаты таковы: РР0 = (х—х0, у—у0, z—z0). По условию всякий вектор Р0Р перпендикулярен (ортогонален) вектору а, что эквивалентно равенству (а, /у>)=0, (1) откуда, учитывая соотношение (4) § 1.2, получим A(x-x0) + B(y-y0) + C(z-zo) = 0. (2) Обратно, если для точки Р (х, у, z) выполняется условие (1) или (2), то она принадлежит рассматриваемой плоскости. Таким образом, уравнению (1) [а также уравнению (2)] удовлетворяют все те и только те точки, которые лежат на плоскости, содержащей точку Р0 и перпендикулярной вектору а. Следовательно, каждое из равенств (1) и (2) является уравнением рассматриваемой плоскости. Уравнение (1) называется уравнением плоскости в вектор- ной форме, а (2)—уравнением плоскости в координатной форме. Аналогичную задачу можно поставить и для n-мерного пространства R". Пусть в R" дана точка Р0 (х°1у х\, ..., х°п) и вектор а = = (А19 Л2, .. *, Л„). Рассмотрим множество S точек Р (хи х29 ..., хп) пространства Rn таких, что вектор Р0Р перпендикулярен вектору а. Множество S называется гиперплоскостью и может быть задано уравнениями (а, Р>) = 0, (3) Аг (x.-xl) + Л2 (*,-*» + ... + Ап (хп-х°п) = 0, (4) аналогичными уравнениям (1) и (2).
§ L3. Уравнения гиперплоскости и прямой в Rn 31 Комментарий к формулам (3), (4). Пространство R", рас- ' смотренное в § 1.2, введено по аналогии с «реально существующим» пространством R3. Естественно, что при этих условиях свойства R" и связанные с ним понятия имеют (в большей или меньшей степени) аналогии в R3. В то же время некоторые свойства R" требуют (при наглядном геометрическом осмысливании) известной доли фантазии и абстрактного мышления. Например, в R", как и в R3, можно говорить о прямых, плоскостях, длинах отрезков, углах между векторами и др. При этом в Rrt при /г>4 существуют четыре взаимно перпендикулярные прямые, чего не существует (а потому нельзя и наглядно представить себе) в R3. В R", кроме прямых и плоскостей (т. е. линейных многообразий размерности 1 и 2) имеются и аналоги прямых и плоскостей размерности 3, 4, ..., п—1 (см. § 1*.3, I). Формулы (3) и (4) задают уравнения гиперплоскостей—линейных многообразий в R" размерности п—1 (максимально возможной размерности, если не считать размерности п самого пространства R71). Пусть в R" даны точка Р (х°1У х\, ..., х°п) и вектор а = (А1У Л2, •.., Ап). Эти данные определяют прямую в R", т.е. множество точек Р (х19 х2, ..., хп) таких, что вектор Р0Р коллинеарен век- -> тору а. Пусть Р (х1у х2, .♦., хп) — текущая точка прямой. Координаты вектора Р0Р имеют вид (хг—х\, х2—х%, ..., хп—х%). По условию —>■ -> векторы Р0Р и а коллинеарны; это значит, что числа хг—х°и х2— — х\> ..., хп—х% и Аи А2) ..., Ап пропорциональны: (x.-xD/A, = (x2-xl)/A2= ... = (хп-х»п)/Ап. (5) Обозначив общее значение дробей (5) через t, перепишем уравнения (5) в виде x^AJ + xl x2 = A2t + x°2, ..., xn = AJ + x0n. (6) Уравнения (5) являются уравнениями прямой в R": этим уравнениям удовлетворяют точки прямой, проходящей через точку Р0 в направлении вектора а, и только они. Уравнения (6) представляют собой уравнения прямой в параметрической форме: для любого —оо< £<-foo они определяют п чисел—координат текущей точки прямой. Если t изменяется от — оо до +оо, то соответствующая точка пробегает всю прямую. 2°. Примеры 1. Пусть: а) Р0(1, -2, 3),^а = (4, 3, -5); б) Р0(2, -7, 4), а = (3, 0, —4); в) Р0 (1, 1, 1), а = (2, —5, —8). Найти уравнение плоскости, проходящей через точку Р0 и перпендикулярной вектору
32 Глава I. Линейная алгебра с элементами аналитической геометрии а. Найти уравнения прямой, проходящей через точку Р0 и парал- лельной вектору а. Решение. Используя формулу (4), находим искомые уравнения плоскостей: а) 4(*-l) + 3(*/ + 2)-5(z-3) = 0; б) 3(*-2) + 0(*/ + 7)-4(z-4) = 0; в) 2(х— 1) — 5(у— 1) — 8(z—1) = 0. По формуле (5) находим уравнения прямых: а) (*-l)/4 = (y+2)/3=(z-3)/(-5); б) (Х_2)/3 = (у + 7)/0 = (г-4)/(-4); в) (х—1)/2 = (г/—1)/(—5) = (г—1)/(—8). По заданным уравнениям плоскостей и прямых можно определять углы между плоскостями, между прямыми, между плоскостями и прямыми. По заданному уравнению плоскости можно определить вектор, перпендикулярный этой плоскости, а именно, если уравнение плоскости имеет вид Ах-\- Ву+Cz + D — O, то вектор а = (Л, 5, С) является вектором, перпендикулярным плоскости (он называется нормальным вектором плоскости). Это вытекает из формулы (2). Угол между плоскостями, как легко видеть, равен углу между нормальными векторами этих плоскостей. 2. Найти угол между плоскостями Зх + ty—12z—24 = 0 и х + + y + z-8 = 0. Решение. Найдем нормальные векторы данных плоскостей -> -» я£ = (3, 4, —12) и а2=(1, 1, 1). Координаты этих векторов равны соответствующим коэффициентам уравнений данных плоскостей. Следовательно, угол ф между плоскостями определяется из равенства Qi,ai) 3.1+4.1 — 12.1 5 cos ф = - ■■ - ■ — ^ — \ai\\a2\ /з2 + 42 + (-12)2 Kl2+12+12 13К"з" Чтобы найти угол ф между прямой и плоскостью, надо вычислить угол 0 между направляющим вектором прямой и нормальным вектором плоскости, при этом Ф = -9"—6- 3. Найти угол между прямой (х—2)/1 = (г/—3)/2 = (г + 5)/(2 V 5) и плоскостью 3x + 5y + V\5z— 8 = 0. Решение. Направляющий вектор ах прямой и нормальный вектор а2 плоскости имеют вид ai = (l, 2, 2 К 5), а2 = (3, 5, К 15).
§ 1.3. Уравнения гиперплоскости и прямой в Rn 33 Следовательно, (of, аа) L3 + 2.5 + 2l/""5l/"T5 _ 13+10'VI COS0: |fli||flal Kl? + 2? + 20 /з2 + 5? + 15 5-7 л , я . 13+Ю1/"3 Так как 9 + ср = у, то smq> =—Ц^р—. Наконец, угол между прямыми можно вычислить как угол между направляющими векторами прямых. В качестве упражнения рекомендуем найти угол между прямыми (х—1)/2 = *//3 = (г+ 1)/(—4) и (х + !)/(—!) = (у—!)/( — 4) = (г + 3)/(—5) и убедиться в том, что с05ф=6/1/"29^42. Заметим, что иногда прямую в R3 задают как линию пересечения двух плоскостей. В таком случае, зная нормальные векторы пересекающихся плоскостей, можно вычислить направляющий вектор прямой. О том, как это делается, см. § 1.8. Аналогичные задачи можно рассматривать и в R72. Пусть а1х1 + а2х2+ .. .+апхп+ап+1 = 0 (а); ^ = ^= .. . = *JL=£(my9 — уравнения двух плоскостей и двух прямых. Обозначим через ф, г|), % соответственно углы между плоскостями а и р, между плоскостью а и прямой т, между прямыми т я L Тогда справедливы следующие формулы: /-» -*\ cosq)= :i\.!i\ , где 2 = (аь а2, ..., а„), £ = (&1? Ъг, ..., 6„); UN sin^cosf-f—ф)= ,J;.?. , где Л = (<*!, а2 а„), \2 I \а\\р\ cosx= ,^;Д| > где'?=(/>!, ря, ..., /?„), Q = (^7i, ?2, ..., ?*)• В аналитической геометрии евклидова пространства часто рассматривают задачу о расстоянии от точки до плоскости. Решение этой задачи см. в § 1*.3, 2. В пространстве R3 рассматривают задачу о расстоянии между двумя скрещивающимися прямыми. Ее решение приведено в § 1*.3, 3. 3°. Упражнения 1. Найдите угол между плоскостями Atx+Е\у+Ci2+Z>i —0 и А2х + В2у + + C22 + D2 = 0, если: а) Л1==1, Bi=l, C1==l, L>i = 5, А2 = 2, В2 = —1, С2=—lt ^2 = 0; б) Лх = 2, Я1=1, С! = 0, £>i=l, Л2=1, В2 = 2, Ci=l, £>2 = 3. 2 № 2636
34 Глава I. Линейная алгебра с элементами аналитической геометрии 2. Найдите угол между прямыми (x—x0)/pi = (y—y0)/p2 — (z—z0)/p3 и х = = qit + xit y = q2t + yi, z = q3t + z1, если x0 = y0 = z0=l, pi=l, p2 = 2, p3 = 3, *i = #i = Zi = 3, ?i = —1, ^2 = 0, ?з = —4. 3. Найдите углы между плоскостями из упр. 1 и прямыми из упр. 2. 4. Прямая задана системой уравнений ( 2х+3у — 5 = 0, \ у-г + 4 = 0, Составьте ее параметрические уравнения. § 1.4. Линейные операторы и матрицы. Линейный оператор и матрица оператора в заданном базисе пространства R2. Сложение операторов, умножение операторов на число, произведение операторов и соответствующих матриц. Линейные операторы в R71. Сложение операторов, умножение операторов на число, произведение операторов и соответствующих матриц 1°. Линейные операторы. Одним из фундаментальных понятий линейной алгебры является понятие линейного оператора. Определение 1. Линейным оператором А в линейном пространстве L называется такая функция, что: 1) область определения А есть линейное пространство L; 2) множество значений А принадлежит линейному пространству L; 3) выполняются условия А(х + у) = А(х) + А(у) у*, y£L\ А(Хх) = ХАх v^€R, vx£L. Комментарий к определению 1. Вместо термина «функция» в определении 1 часто употребляют эквивалентный термин «отображение». Как следует из определения 1, каждому вектору х £ L линейный оператор А сопоставляет некоторый вектор А (л:), причем соблюдаются свойства (1). Можно сказать и так: линейный оператор преобразует L в себя. Оператор называется линейным потому, что в силу свойств (1) линейно зависимые векторы под действием этого оператора переходят в также линейно зависимые векторы. ->•->• -> Действительно, если система векторов giy g2, *- -, gm линейно -»■->■ ->■ -» зависима, т. е. с& + c2g2 + ... + cmgm = 0, причем не все с{ равны -> -> -» нулю, то система векторов Aglf Ag2, ..., Agm также линейно зависима, поскольку A (dft + c2g2 + ... + Cgm) = АО = 0 (2) и в силу равенств (1) имеем CiAgi+c2Ag2+...+cmAgm = Q. (3)
$ 1.4. Линейные операторы и матрицы 55 Ч fc—p' / ~т VJitJp} ^Г~ ,х Qn«ctQPvQK*CiQP Ш*с%оргит'«с1оР1 Рис. 9 Таким образом, существу- />/ ет нетривиальная линейная комбинация векторов kgly Ag2, ..., Ag„, равная ну- левому вектору, что означает линейную зависимость этих векторов. В формуле (2) использова- ->• ~> но равенство А0 = 0, справедливое для любого линей- ного оператора. Приведем его доказательство: пусть A0 = g; рас- смотрим А (0-0) = АО, где 0—вещественное число нуль; в силу свойств (1) имеем А(0-0) = 0-А0 = 0-£=0. Из доказанного свойства линейного оператора вытекает, что под действием линейного оператора прямые переходят в прямые, плоскости— в плоскости и т. д. Более общее понятие линейного оператора, как отображение одного линейного пространства в другое, приведено в § 1*.4, I. Рассмотрим линейные операторы в пространстве R2, точнее сказать— в двумерном координатном линейном пространстве L2. Дело в том, что в строгом смысле слова линейные операторы определены в линейном (векторном) пространстве L, что же касается плоскости R2, то ее элементами являются точки, а не векторы. Напомним, что R2 (как и R72) играет роль исходного объекта при построении Ц (соответственно Ln). При этом L2 можно считать вложенным в R2. Как известно, пространство упорядоченная пара точек из который в свою очередь порождает вектор в L2. Если начальную точку направленного отрезка, порождающего вектор а, совместить с началом координат, т. е. с точкой (0, 0), то конец направленного отрезка определит некоторую точку Р. Тем самым определена вложение L2—>R2, которое вектору а сопоставляет точку Р. Все сказанное означает, что, говоря о линейном операторе в R2, мы будем вместо точки (х9 у) G R2 иметь в виду вектор (х, у) £ L2, характеризуемый направленным отрезком, начало которого совпадает с точкой (0, 0), а конец—с точкой (#, у). Итак, рассмотрим линейный оператор А в R2. Опишем, как оператор А преобразует R2 в себя. Возьмем две точки Р± и Р2, не лежащие на одной прямой с точкой 0(0, 0) (рис. 9). Пусть точки Рг и Р2 под действием линейного оператора А перейдут в точки Р'г~АРи Р'2 = АР$ (т.е., строго говоря, векторы OPf и ОР2 перейдут в ОР'г и ОР'2; напомним, что нулевой вектор при линейном отображении переходит в нулевой вектор, и при установленных L2 было построено с помощью R2 R2 определяет направленный отрезок, 2*
36 Глава I. Линейная алгебра с элементами аналитической геометрии \0Р'\ = Urt 1 ' |^1 \0С[ Рис. 10 соглашениях начало координат переходит в начало координат). В какую точку перейдет под действием линейного оператора А произвольная (текущая) точка P£R2? На этот вопрос можно дать (однозначно определенный) ответ. Пусть вектор ОР представлен в виде OP^cJOPi + cfiPi (4) (такое представление существует и определено однозначно в силу предположения о том, что три точки О, Р19 Р2 не лежат на одной прямой, и, следовательно, векторы ОР± и ОР2 образуют базис в L2; с геометрической точки зрения разложение (4) можно получить построением параллелограмма с вершинами О и Р и сторонами, параллельными OPi и ОР2). Далее, в силу свойств (1) имеем А (ОР) «= сгА (ОЛ) +с2А (ОР2) = с, (ОРд + с2 (О/д. (5) Таким образом, вектору А(ОР), в который переходит вектор ОР под действием А, соответствует вектор, разложение которого по ОР[ и ОР2 имеет те же коэффициенты сг и с2, что и разложение ОР по OPi и ОР2. Учитывая соотношение (5), легко показать, что под действием линейного оператора прямые переходят в- прямые, параллельные—в параллельные, сохраняется простое отношение трех точек. При этом длины отрезков, величины углов, вообще говоря, не сохраняются. Примерами линейных операторов в R2 являются: поворот № вокруг начала координат, растяжение или сжатие в направлении какой-либо прямой, проходящей через начало координат (рис. 10). Как видно из вышесказанного, действие линейного оператора А в L2 полностью определяется двумя векторами А(ОРг) и А(ОР2), т. ё. образами векторов базиса OPt и ОР2 под действием А.
§ 1.4. Линейные операторы и матрицы 37 2°. Матрица линейного оператора. Линейный оператор А в L2 удобно изучать с помощью важного математического понятия, подробное описание которого приводится ниже, а именно—матрицы линейного оператора А в заданном базисе пространства L2. Определим сначала понятие матрицы. Матрицей размера тхп называется прямоугольная таблица чисел, состоящая из т строк и п столбцов. Используется обозначение А = (а:/), i = 1, 2, ..., m; /=1,2, ... .Г., п, задающее матрицу А размера тхп такую, что на пересечении ее i-й строки и /-го столбца находится число %. Пусть в L2 задан базис (0Plf 0Р2). Рассмотрим векторы А(ОРг) и А(ОР2) и разложим эти векторы по данному базису: А(0>1) = ^-01)1 + Ь-0Р2, — _* _* (6) А(ОРА=с.ОРг + <1-ОР2, где а, Ь, с, d—некоторые вещественные числа. Коэффициенты разложения (6), т. е. числа я, Ь, су d, запишем в матрицу размера 2x2, поместив коэффициенты 1-й строки равенств (6)—в 1-й столбец, а коэффициенты 2-й строки — во 2-й столбец: \ь <*/' (7) построенная матрица (7) и называется матрицей линейного оператора А в базисе (ОРи ОР2). Обобщение понятия матрицы линейного оператора в заданном базисе пространства L2 формулируется так: Определение 2. Пусть А — линейный оператор в линейном пространстве Lm и (fi, /2, ..., /J—базис в Lm. Рассмотрим векторы A/i, А/2, ..., kjm и разложим их по базису (/*, /2, ..., fm): A/i = fliJi + «2i?2 + • • • + <W*» Д = «iJi + aJ\ + ... + auJm% (8) A/m = «ie/i + ct2mf2 + ... + aeя/ш. Матрицей линейного оператора А в базисе (fu /2, ..., /^.называется квадратная матрица размера тхт, в &-м столбце которой записаны коэффициенты разложения kfk по базису (flt /2, ..., /„,), 6=1, 2, ..., /п. Если А/^^ах^ + ^^+.-.+а^е^, то числа а1ъ a2k, ..., a„ft следует поместить (в естественном порядке) в ft-м столбце матрицы А.
38 Глава L Линейная алгебра с элементами аналитической геометрии С помощью матрицы линейного оператора А легко вычисляется результат применения оператора А к любому вектору из L. Кроме того, матрицу линейного оператора А удобно использовать при нахождении произведения линейных операторов, их суммы, при умножении оператора А на число Я и т. д. 3°. Действия над линейными операторами и матрицами. О преде- ление 3. Суммой двух линейных операторов А и В в линейном пространстве L называется линейный оператор, обозначаемый А + В и определяемый формулой (A + B)^ = a1 + b! y~g£L. (9) Определение 4. Произведением линейного оператора А на число X называется линейный оператор, обозначаемый ХА и определяемый формулой {%k)g = X(Ag) y~g£L. (10) Определение 5. Произведением {суперпозицией) линейных операторов А и В называется линейный оператор, обозначаемый АВ и определяемый формулой (АВ)* = А(В*) yg£L. (11) Комментарий к определениям 3—5. Формулы (9), (10), -► -* (11) определяют, строго говоря, лишь отображения g—-»(A + B)g, -*. -» ->• -* g—>(kA)g, g—*(AB)g. Тот факт, что эти отображения линейны, проверяется без труда. Следующие определения связаны с действиями над матрицами. С помощью этих понятий будут описаны матрицы суммы двух линейных операторов, матрица произведения линейного оператора на число, матрица произведения линейных операторов. Определение 6. Суммой матриц А = (а(/) и B = (bi;) размера пхт называется матрица С = (с|7) размера пхт, определяемая формулами Ci/ = ai/ + bi/ (i==l> 2, ..., /z; /=I, 2, ..., m). (12) Определение 7. Произведением матрицы A = (a{f) размера пхт на число Я^К называется матрица 1С = (си) размера пхт, определяемая формулами Сц = Ыц (**=1, 2, ..., п; / = 1, 2, ..., /и). (13) Определение 8. Произведением матрицы А = (аи) размера nxk на матрицу В = (btj) размера kxm называется матрица С = {су) размера пхт, определяемая формулами k %=S^A/ <'=!* 2, ..., л; / = 1, 2, ..., т). (14) S = l
§ 1.4. Линейные операторы и матрицы 39 Сумма матриц А и В обозначается через А + В, произведение матрицы А на число К—через ХАГ произведение матрицы А на матрицу В—через АВ. Комментарий к определениям б—8. Три операции над матрицами, определенные выше, связаны между собой естественными свойствами, похожими на свойства сложения и умножения чисел, тгкиыиукакА + В = В + А\К(А-\гВ) = КА + ХВ\ А(В + С) = АВ + АС; (В + С)А = ВА+СА (см. подробнее § 1*.4, 2). Однако произведение матриц, вообще говоря, зависит от порядка, в котором матрицы перемножаются, т. е., как правило, АВфВА. Формула (14) умножения матриц не имеет аналога в школьном курсе математики. В дальнейшем эта формула будет часто использоваться в различных вопросах. На ее изучение следует обратить особое внимание. 4°. Теоремы о матрицах линейных операторов. Операциям над линейными операторами соответствуют операции над матрицами. Точная формулировка такого соответствия приведена в следующей теореме. Теорема 1. Пусть А, В—два линейных оператора в линейном -> -► -> пространстве L\ X—произвольное число\ (fif f2, ..., fm)—базис пространства L; Л = (а/;), fi = (bfy.)—матрицы линейных операторов А, В в заданном базисе. Тогда в этом базисе: 1) матрица линейного оператора А + В есть А-\-В\ 2) матрица линейного оператора ХА есть ХА\ 3) матрица линейного оператора АВ есть АВ. Доказательство утверждений 1 и 2 теоремы 1 легко вытекает из определений. Проверка утверждения 3 связана с некоторыми выклад-. ками. Все необходимые рассуждения приведены в § 1*.4, 3. Как отмечалось выше, с помощью понятия матрицы линейного оператора А в заданном базисе (/lf /2, ..., fm) легко вычислить образ любого вектора g£L под действием отображения А. Следующая теорема сводит рассматриваемую задачу к простым алгебраическим вычислениям (сложению и умножению чисел). Теорема 2. Пусть А—линейный оператор в линейном прост- -»■-»-» ранстве L; (fif /3, ..., fm)—базис в L; А = (а{Л—матрица линей- -> -> -> -> -> -> ного оператора А в базисе (flf /2, ..., fm)\ g—вектор U3b\g = c1f1 + -» -*■ + £2/2+ • • • + cmfm—разложение этого вектора по базису. Тогда если разложение вектора kg по базису (fl9 /2, ..., fm) имеет вид Ag = fti/i + HJ%+...+ hjm, (15) tno коэффициенты этого разложения выражаются через с±, с2, ... •.., ст и atJ следующим образом: т ht= S atfj V = !> 2» • • м m)- (16)
40 Глава L Линейная алгебра с элементами аналитической геометрии Комментарий к теореме 2. Можно привести более краткую и запоминающуюся формулировку теоремы. Именно, если записать коэффициенты ci и ht в столбцы, то получим две одностолбцовые матрицы. Обозначим их соответственно через с и Л. Теорема 2 утверждает, что Ac = h. (17) Иными словами, для того чтобы найти коэффициенты разложения Ас, следует (по матричным правилам умножения) умножить матри- цу А на матрицу-столбец с (иногда говорят и так: «умножить матрицу А на вектор о>). Доказательство теоремы 2 приведено в § 1*4,4. 5°. Примеры 1. Дано /г-мерное координатное евклидово линейное пространство Ln; 5 = 0, 0, ..., 0);?2 = (0, 1, ..., 0), ..., ^ = (0, 0, ..., 1)- его базис. Рассмотрим следующие линейные операторы: А—умножение каждого вектора на —2; В — перестановка векторов базиса в циклическом порядке: e1—^e2J e2 ^п — 1 * €п, в п et\ С—проектирование любого вектора на вектор (1,1, ..., 1). Построим матрицы Л, 5, С этих операторов в данном базисе. Для этого, как требует определение 2, надо вычислить образы базисных векторов под действием линейного оператора, разложить полученные векторы по базису, а коэффициенты записать в столбцы. Оператор А переводит вектор е{ в вектор —2et. Разложение Aei по базису (еи е2, ..., еп) имеет вид а5 = —25 = 0-5 + 0-5 + - • • +0-^i—25 + 0-5+1 + .. - +0-5,. Следовательно, коэффициенты разложения Aet таковы: (0, ..., 0, —2, О, ..., 0), где —2 стоит на f-м месте (/=1, 2, ..., л). Записав коэффициенты в соответствующие столбцы, получим л= —2 о . о —2 или Л = (%), где аи=( ~2 при '='• Ч 0 при 1ф\. Линейный оператор В переводит вектор et в ei+i (/=1, 2, ..., п— 1), а вектор еп—в ех. Разложение Ве£ по базису (5,"5, ..., 7п)
§ 1.4. Линейные операторы и матрицы 41 имеет вид в7/^^+1=о.Г1+о.в2+...+о-^+ь^+1+о.^+2+...+о.е„ (t = l, 2, ..., л—1), в1я = ь£+о-£+...+о.*я. Записывая коэффициенты разложения в соответствующие столбцы, получим матрицу J5 = П 0 1 0 Линейный оператор С проектирует каждый вектор g на вектор /t = (l, 1, ..., 1). Вычислим Cei как проекцию вектора е£ на вектор (1, 1, ..., 1). Для вычисления проекции удобно воспользоваться формулой (18) § 1.2: О/ (л, л) Л: q.i+o.i + ...+o-i + i.i+q.i + ...+o-i __ JL Z _ Ы + Ll + ... + l.l л л~" =v^l+v^+--- + 1 е„. (18) Коэффициенты разложения С^, как оказалось, не зависят от et. Построим матрицу С, записав коэффициенты последнего разложения (18) в каждый из п столбцов матрицы: С = '1/л 1/п ... 1/гГ 1/я 1/л ... 1/л к\1п 1/п ... 1/л (19) 2. Рассмотрим линейный оператор D в L2 (см. п. 2°), преобразующий каждый вектор ОР поворотом его на угол ф против часо- -> -* вой стрелки; в качестве базиса в L2 возьмем е1 = (1> 0), еа = (0, 1). Построим матрицу D линейного оператора D в этом базисе (рис. 11). Как видно из чертежа, -* ->• -> D^ = et cos ф + еа sin ф, De2 = ^ (—sin ф) + е2 cos ф.
42 Глава I. Линейная алгебра с элементами аналитической геометрии Таким образом, /coscp —sinqA ~~\sin<p cosqv 3. В рассмотренных выше примерах найдем результат применения линейных опера- l» >f торов А, В, С, D соответственно к векторам ft = (2, 3, 7, 0, ..., 0), & = (0, 0, ..., 0, Рис. И _i, 1), g8 = (4, -1, 1,0,..., 0), £4=(1,1, 0, ..., 0). Задачу будем решать с помощью матричного умножения, а также используя теорему 2. Коэффициенты разложения векторов glf g2, g"3, g4 no базису (elf е2, ..., ел) совпадают с координатами векторов, т. е. ft = 2?1 + 3?a + 7e8, g2 = — b^-i+ !•?„> Следовательно, Г—2 Afo = 0 В&~ го 1 0 1 S о о —2) 1 Г2 ! 3 7 0 1 0 0 ) о ^ о —1 1 —4 ^ —6 —14 0 0 1 ^ 0 Cft ri/n 1/л ,: 1/л 1/л *. *!/* / 4 ] 1—1 1 0 i ° = f4/rt1 4/Л 4/n 4/n 4/я -» /совф —sin<p\ /1 \ /соБф — sinqA ^4""\§Шф jcosqy \1 /~~ \соБф +sin9/
$ 1.4. Линейные операторы и матрицы 43 В соответствии с теоремой 2 столбцы Agi9 Bg2, Cg3, Dg4 состав- ->• -► ^* ляют коэффициенты разложения этих векторов по базису (ei9 e2i .. м е„)- Как отмечалось выше, в базисе (^, е2, ..., еа) коэффициенты разложения вектора совпадают с координатами вектора. Это значит, что Aft«(-4, -6, -14,0, .... 0), В& = (1,0, ...,0,-1) С^3 = (4/л, 4/л, ..., 4/д), Dg4 = (cosq) —sincp, coscp+sincp). -> -> -» 4. В базисе (ei9 е2, ..., еп) найдем матрицу линейного оператора (2А—В) С, где операторы А, В, С определены в примере 1. Сначала найдем матрицу оператора 2А—В. Очевидно, 2А—В = ;=2-А + (—1)В; согласно теореме 1 эта матрица такова: /—2 ГО —2 0 0 —2 + (-») 0 1 <У '—4 —1 0 —4 —1 »■> * —4 ... 0 0 0 —1 0 0 (20) — 1 —4> Матрица оператора (2А—В) С в силу теоремы 1 равна произведению матрицы (20) на матрицу (19): •—Ъ/п —Ъ/п ... ж / —Ъ/п —Ъ/п ... \_ 5/д —Ъ/п ... — 5/л. 6°. Упражнения 1. Установите, являются ли указанные преобразования линейными: а) преобразование f, переводящее вектор (a*, a2, а3) в (а3—а2, аг-\-а3, 0); б) преобразование f, переводящее вектор (а*, а2, а3, а4) в (аь а!» <&> 0)» в) преобразование /, переводящее каждый многочлен в его производную.
44 Глава 1. Линейная алгебра с элементами аналитической геометрии 2. Найдите матрицу линейного преобразования /, переводящего всякий вектор в себя. 3. Вычислите А + 2В — ЗС, если „ /° 1 0\ „ /1 2 0\ „ /—1 —1 0\ Л = (2 3 l)' В=(з 1 -l)' C = ( 2 0 -,)• 4. Вычислите произведения ВС, ВЛ, СВ, если HI i ?)• '-U "!)■ С-С i> /О 1\ /1 0\ 5. Сравните ЛВ и ВЛ, если Л = ( J 5 = f J. ->->-> •+ -* -► ->->-► 6. Пусть (el9 е2, е3), (fi, |/2, /з), (gi, £2, £з) — ТРИ базиса в координатном про- ->■-»-»-»-»■-» странстве L3. Линейное преобразование А переводит ег в /ь £2 в /г» £з в /з> а ли- _ ->->->->._>-► неиное преобразование В переводит ег в glt е2 в g2, ^з в g3. Найдите матрицы линейных преобразований А, В, ВА в базисе (еъ е2, е3), если /х — 3et + 2е2 + е3, А2 = ^1 — ^2 + ^з, /з = 2^—^2 + 9^3 и g1 = 2e1-+e2, g2 = e2 + e3, ga = *i. Проверьте, что линейному преобразованию ВА в базисе (еъ е2, е3) соответствует произведение матрицы линейного преобразования В в базисе (еъ е2, е3) на матрицу линейного преобразования А в том же базисе. 7. Матрица линейного преобразования А в базисе (еъ e2i e3i e&) координатного пространства L4 имеет вид (\ 2 0 0\ 2 0 10 0—103 (о о 1 а) Вычислите Ах, если: a) x=^3e1 + 2e2~e3 + Se^ б) х = Х1е1-\-х2е2-}'Х3е3-\-х^е4:} ~» ->->■->-> в) л: в базисе (£ь е2, е3, е4) имеет координаты (2, 0, 1, —3). 8. Вычислите произведение Л В, если: а)Л = ( в) Л = т)А = ( f2 0 0v 0 3 0 ^0 0 5' ,1 0 \ (о 1 о ^0 0 U /aii ai2 #21 а22 ^«31 ^32 .н )• «23 )» йзз'7 (\ 8 7 0 ^2 1 ч в-( 4\ 3 ;б)Л = -2/ / ^11 ^12 ^13 \ &21 ^22 ^23 )\ ^^31 ^32 &3з' ^1 0 L 0 1 0j. ^0 0 U А Ч ^2 8 0 1 \ 3) •V . в= А 0 ^0 0 3 0 0 0 5 9. Найдите матрицу ортогонального проектирования на вектор ei в базисе -V -> -> (е*, #2> *з)- ^ /^ 0\ „ / 0 1Д л /0 1\ 10. Проверьте, что матрицы £=f J, "=( i 0J> ^ Vi О/9
& 1.5. Сопряженный оператор. Сопряженная матрица Ц ч; -?) обладают следующими свойствами: Е2 — Е, Р2 —— £, Q2 = E, R2 = E9 ЕР=РЕ=Р:EQ=QE=Q, ER=RE=Rt PQ + QP = 0, PR + RP=0, QR + RQ=0. 11. Покажите, что /A 0\/C 0 \ /ЛС 0 \ VO яДо d)\ 0 BD/* где Л, С, Б, D—матрицы размеров mx&, &Xn, px/, /Х<7 соответственно. /О Л\/0 А\ л , 12. Докажите, что f л Мл л ) (нулевая матрица), если матрица имеет размер тХт, а матрица А — размер рх(т—р), где р < т. 13. Проверьте, что Со) 0 0 ю 1 <к 0 0) 0 (К /° * (о о ^0 0 /° ! (о о \о о (У °\ 0< о/ ,0 1 'о 0 ^0 0 /° 1 0 0 ^0 0 °\ > 0^ °\ р 0^ /° ° Ч )= 0 0 0 чо о (к = 0 (нулевая матрица) § 1.5. Сопряженный оператор. Сопряженная матрица. Самосопряженные операторы и симметрические матрицы. Ортогональные матрицы 1°. Сопряженный оператор. В этом параграфе мы будем рассматривать линейные операторы А в n-мерном линейном координат- ком пространстве Lny в котором определено скалярное произведение [см. формулу (4) § 1.2], т. е. в n-мерном координатном евклидовом пространстве Еп (см. определение 3 § 1.2). Напомним необходимые для дальнейшего понятия: элементы пространства Еп называются векторами и представляют собой упорядоченные наборы из чисел: а = (ах, а2, ..., ап). Векторы в Еп можно складывать между собой и умножать на числа по естественным правилам. Кроме того, в Еп для любой пары векторов а, Ь£Еп определено скалярное произведение (я, 6) = аАЧ-аА+ ... +апЬп, (1) где а=*(а19 ая, ..., ая), & = (&ь 6„ ..., Ьп). Для всякого оператора А в Еп можно определить так называемый сопряженный оператор А*, действующий в Еп. Введение понятия оператора, сопряженного оператору А, является удобным и полезным в некоторых задачах аналитической геометрии, теории Дифференциальных уравнений и во многих задачах функционального
46 Глава /. Линейная алгебра с элементами аналитической геометрий анализа. Определение 1 описывает лишь некоторый частный случай общего понятия сопряженного оператора—простой и в то же время достаточный для решения прикладных задач. В § 1*.5 дано общее понятие сопряженного оператора и рассмотрены связанные с этим понятием вопросы. Определение 1. Пусть А—линейный оператор в Еп. Линейный оператор А*, удовлетворяющий условию (А% у) = £, Ау) (2) для любых х, у £ Еп, называется линейным оператором, сопряженным исходному линейному оператору А. Комментарий к определению 1. Разумеется, после введения определения 1 должны быть даны доказательства существования и единственности оператора А*, удовлетворяющего условию (2). Эти доказательства приведены в § 1*.5, I. 2°. Самосопряженные операторы и симметрические матрицы. Среди всех линейных операторов, действующих в евклидовом пространстве Еп, особое место занимают так называемые самосопряженные операторы. Они обладают рядом важных свойств, некоторые из них мы рассмотрим. Определение 2. Линейный оператор А, действующий в евклидовом пространстве Еп, называется самосопряженным, если условие (Ах, у) = (х, Ау) выполняется для всех х, у£Еп. Комментарий к определению 2. Определения 1 и 2 согласованы: действительно, определение 2 утверждает, что сопряженный оператор А сопряжен сам себе, т. е. А* = А. Выясним, как связаны матрицы сопряженных операторов в орто- нормированном базисе. Ответ на этот вопрос дает теорема 1. Отметим, что вопрос о связи матриц сопряженных операторов поставлен лишь для ортонормированного базиса, поскольку в этом случае такая связь является простой, а в случае произвольного базиса ее описание оказывается довольно громоздким. Теорема 1. Пусть А и А*—сопряженные друг другу линейные операторы в n-мерном координатном евклидовом пространстве Еп; -*•-»-► (ft /2» •••»/«)—ортонормированный базис в Еп\ А = (ау) и А* = = (аЬ)—матрицы, соответствующие операторам А и А* в этом базисе. Тогда <*i/ = <*h (*', / = 1, 2, ..., л). (3) Обратно, две матрицы А и Л*, удовлетворяющие условиям (3), задают во всяком ортонормированном базисе операторы А и А* такие, что А* сопряжен к А. . Комментарий к теореме 1. Соотношения (3) означают, что матрица А* получается из А заменой строк матрицы А на соот-
§ 1.5. Сопряженный оператор. Сопряженная матрица 47 ветствующие столбцы, т. е. 1-й столбец матрицы А* совпадает с 1-й строкой матрицы Л, 2-й столбец ^4*—со 2-й строкой Л и т. д. Можно сказать так: матрица Л* получена из Л преобразованием симметрии относительно главной диагонали матрицы (главная диагональ—это элементы axi, a22, ..., апп). Сказанное поясняет рис. 12. Матрица, полученная из матрицы А заменой строк на соответствующие столбцы, называется матрицей, транспонированной к А. Доказательство теоремы 1. Элементы матрицы А (числа atj) в силу определения 2 § 1.4 удовлетворяют равенству А/7 = ajt + a2i% +...+ ajn. (4) Рассмотрим скалярное произведение (А/,-, /Д. Имеем (А/л ?/) = (2**£. SW2** й. ?/)• Так как базис—ортонормированный, то (fk, f/} равно нулю при кф\ и единице при k = j. Отсюда (А/5,5) = аУ|. (5) Вычислим теперь скалярное произведение (/,., А»Ь), выразив его через элементы матрицы А* в базисе (fu /2, ...,/:п). В силу определения 2 § 1.4 элементы матрицы А* удовлетворяют равенству Так как базис (/*, /2, ..., /„)—ортонормированный, то (fh А*/,) - (£, 2 aJ/S) = 2 <*/ ft. Ъ = а?/- (6) Учитывая, что (А/,, /у) = (7/, А*/у) (t, / = 1, 2, ..., п), из равенств (5) и (6) получаем (3). Доказательство обратного утверждения приведено в § 1*.5, 2. Следствие. Если оператор А—самосопряженный, т. е. А и А* -> -»■ ->• совпадают, то в ортонормированном базисе (fiy f2, ..., fn) матрица оператора А совпадает со своей транспонированной (матрицы, удовлетворяющие такому условию, называются симметрическими). 3°. Ортогональные линейные операторы и матрицы. Среди множества всех линейных операторов в Еп особое место занимают так называемые ортогональные линейные операторы. Определение 3. Линейный оператор А в евклидовом про-
4$ Глава /. Линейная алгебра с элементами аналитический геометрии странстве Еп называется ортогональным, если (Ах, АЙ-&1) (7) -» -> для любых двух векторов х, г/ из Еп. Комментарий к определению 3. Условие (7) означает, что ортогональный линейный оператор сохраняет скалярное произведение векторов и, следовательно, все те величины, которые выражаются через скалярное произведение,— в частности длину вектора, угол между векторами. Евклидово (векторное) пространство Еп можно истолковать как точечное пространство R" с декартовой системой координат; для этого каждому вектору (at а2, ..., ап) из Еп надо поставить в соответствие точку (аи а2, ..., ап). При этом ортогональный оператор будет действовать в R", производя поворот этого пространства вокруг начала координат как «жесткого целого» — иначе говоря, ортогональный оператор задает движение пространства R72, оставляющее начало координат неподвижным. Описанное характеристическое свойство ортогональных линейных операторов придает им особое значение в приложениях линейной алгебры к геометрии. Какова матрица ортогонального оператора в ортонормированном базисе? Ответ на этот вопрос дает теорема 2. Отметим, что вопрос о матрице ортогонального оператора поставлен лишь для ортонор- мированного базиса, поскольку в этом случае ответ прост, а для произвольного базиса—довольно сложен. Матрица ортогонального линейного оператора в ортонормированном базисе называется ортогональной матрицей. Теорема 2. Пусть А—ортогональный линейный оператор, задан- -+ -> -> ный в евклидовом пространстве Еп и (fu /2, ..., /„)—ортонормиро- ванный базис. Тогда матрица А = (а^) оператора А в базисе (h> fz> •••» fn) обладает следующими свойствами: п п 2^=1, 2в|*а/* = 0 (* =?*/). (8) у = 1 k-1 Обратно, всякая матрица Л, удовлетворяющая условиям (8), является матрицей некоторого ортогонального линейного оператора в базисе (fu /2 ..., /я). Доказательство. Система векторов базиса (Д, /2, ..., fn) удовлетворяет соотношениям </>,//)= 1 (*'=Ь 2, ..., я); ЙЛу) = 0 (i¥=j\ i, /=l, 2, ..., я). (9) Так как при действии ортогонального линейного оператора скалярное произведение не изменяется, то (Afh А/,) = 1 (/=1, 2, ..., п); (Aft, A//) = 0 (»=jfc/, /, / = 1,2, ...,п). (Ю)
§ 1.5. Сопряженный оператор. Сопряженная матрица 49 Согласно определению 2 § 1.4, элементы а{/ матрицы А линейного оператора А в базисе (fu f2, ..., /„) удовлетворяют равенству Д- = ^11?1 + «2//2+ • • • +<*«/«• (п) Отсюда (A~fh Afj)^{baJk, 2^/7Л= 2 **/**/?*» ?/). \ fe / J k,i Учитывая условие (9), получаем соотношения (8). Обратно, пусть дана матрица А = (а^,)9 удовлетворяющая усло- виям (8). Эта матрица задает в базисе (fu /2, ..., /л) некоторый линейный оператор А. Докажем, что А—ортогональный оператор, т. е. что (Ах, Ау) = (х, у) для любых jc, у£Еп. (12) Заметим, что "достаточно доказать равенство (12) только в слу- чаях x = fh y — fj (t, /=1, 2, ..., /г). В самом деле, если (А/„ А/>) ==(//, /"), (13) то (AJe, Aj) = f А 2 */7/. А 2 у/Л = 2 */У/ (A?/, AJ) = 2 *#* Йг» &= «=(*, у). Равенство (13) легко проверяется: Afi^2dakifkJ kfj~4Jaijfi (CM- определение 2 § 1.4); тогда (А/„ Щ = 2 (ajh9 ajt) = 2 (а*А/) (/*> 7*) = {? ПРИ ! ^{' J k,i k,i \l при t=/. 4°. Примеры -*■ . -»> 1. Линейный оператор А задан в Е2 в базисе £* = (1, 0), £2 = (0, 1) / 2 3\ матрицей Л = ( - ,). Найти матрицу Л* сопряженного к А оператора, исходя из определения сопряженного оператора. Решение. По определению, (Ах, у) = (х, A*J), V*, у€^2. (14) Ь качестве *, у возьмем последовательно (eis ej, (ei9 е2), (е2, £х), (е2, е2). Имеем (A^i, ^2) = (^i, A*e2). В этом равенстве нам известен вектор А^: по определению 2 § 1.4 первый столбец матрицы А
56 Глава I. Линейная алгебра с элементами аналитической геометрии состоит из коэффициентов разложения Аех по базису (elt е2). Итак, ke1 = 2ei— е2. Далее (2е1—е29 е2) = — 1, т. е. —1 = (еи а*12ег + а*22е2). (15) -»> -> -> [здесь А*е2 разложен по базису (е19 е2) с использованием опреде- -»• -> ления матрицы А* оператора А* в базисе (е19 е2)]. Из равенства (15) следует —1 —а*12. Аналогичные выкладки для случая, когда (х, у) в равенстве (14) есть (е2, ег), (elf £i), (е2, е2), дают соответственно ^21 = 3, Яи=2, #22 = 4, т. е. Л* = ( з 4J . Как и должно быть, матрица А* является транспонированной по отношению к Л (и наоборот, матрица А транспонирована по отношению к А*). 2. Показать, что линейный оператор проекции на заданный вектор g в Еп является самосопряженным. Решение. Построим матрицу линейного оператора проекции в некотором базисе и убедимся, что эта матрица симметрична. В силу обратного утверждения теоремы 1 тем самым будет показано, что линейный оператор А самосопряжен. Удобнее всего рассмотреть оператор А в базисе (g, hi9 h2i ..., ft„_i), где g есть вектор, на который этот оператор проектирует каждый вектор, a hiy Л2, ..., Лл_!—векторы, составляющие базис в линейном подпространстве пространства Епу состоящем из векторов, ортогональных к g. В этом случае Ag*=g, АЛ, = 0 (i = l, 2, ..., п—1). (16) Равенства (16) можно рассматривать как разложение векторов Ag и АЛ/ по базису (g, hl9 h2> ..., hn^y откуда в силу определения 2 § 1.4 получаем матрицу оператора А: П о О А = О • { о Матрица А симметрична, следовательно, линейный оператор А самосопряжен. (Это означает, в частности, что матрица линейного оператора А в любом ортонормированном базисе является симметрической.) 3. Пусть (Д, /2, ..-, /„)—ортонормированный базис в Еп. Рассмотрим линейный оператор А, заданный формулами А/| = Я|./:г
§ 1.5. Сопряженный оператор. Сопряженная матрица 51 ({'=1, 2, ..., и), где hit Лз, ..., %п—некоторые фиксированные вещественные числа. Очевидно, что матрица линейного оператора А в базисе (/*, /2,..., /„) имеет вид А* Л = •а, О О я„; (17) Эта матрица является симметрической и более того—диагональной (так называются матрицы Л = (а/у), у которых отличные от нуля элементы находятся на главной диагонали, т. е. такие матрицы, для которых а(/ = 0\ 1ф}). В дальнейшем (см. § 1.14) будет доказано, что для всякого самосопряженного оператора А в Еп можно выбрать такой базис, что матрица линейного оператора будет иметь вид (17). Задача о выборе базиса для данного самосопряженного оператора весьма важна: решение этой задачи позволяет классифицировать кривые и поверхности второго порядка, а также привести уравнение кривой или поверхности второго порядка к каноническому виду. Кроме того, решение задачи о выборе базиса для данного самосопряженного оператора А имеет большое значение при исследовании особых точек функций нескольких переменных, при исследовании экстремалей функционалов в вариационном исчислении и в других важных математических и прикладных вопросах. 5°. Упражнения *->■-*■ 1. Линейный оператор А задан в базисе е1 = (\, 0), е2=(0, 1) матрицей Л = = (l l)' ^айДите матрицу Л* сопряженного к А оператора, исходя из определения сопряженного оператора. 2. Покажите, что для любого линейного оператора А оператор АА* является самосопряженным. 3. Пусть (*"i, |'а, ..., in) — перестановка из чисел 1, 2, ..., п и А = (ац) — такая матрица, что йц1 = а2[2~ ... = ап{ =1, а остальные а/у равны нулю. Докажите, что матрица А является ортогональной. -» 4. Пусть /—вектор единичной длины и А—линейный оператор, переводящий -» -> ->• -»-► всякий вектор х в вектор х—2(x,f)f. Покажите, что матрица линейного оператора А в ортонормированном базисе является ортогональной. 5. Вычислите ПО 0 D = I 0 cos ф — sin ф ^ 0 sin ф cos ф > и убедитесь в том, что D—ортогональная матрица. 6. Докажите» что произведение ортогональных матриц является ортогональной матрицей. ( cos *ф sinip 1 о — sin гр cos г|э 0 0\ 0 1)
52 Глава /. Линейная алгебра с элементами аналитической геометрий ' ш § 1.6. Определители второго, третьего порядков. Основные свойства. Определители п-ю порядка, их свойства 1°. Определители второго и третьего порядков и их свойства. Рассмотрим систему двух линейных уравнений с двумя неизвестными: i апхг + а12х2 = Ьи . \ a21x1 + a22x2=b2. ™ Эту систему несложно решить методом исключения неизвестного. НЬл — (ХлъХь апример, выразив из первого уравнения системы A:1 = -i jL-^ и подставив это выражение во второе уравнение, получим одно уравнение а21 * ~~ а1*х* + ^22*2 = К с одним неизвестным. Окончательные формулы, дающие решение системы, таковы: v — bxa22~~ b2a12 _ a11b2 — a21bj ,g\ 1 ana22 — a12a21 > 2 ana22 — a12a21* {) Аналогично можно решить систему трех линейных уравнений с тремя неизвестными ^11-^1 I ^12*^2 + ^13-^3 s= ^1> #21^1 ~Г &22Х2 ~Г ^23-^3 ~ ^2» ^31-^1 + ^32*^2 + ^33-^3 ~ ^3* Если, используя метод исключения неизвестных, проделать все вычисления, то в результате получим _ ^22^23 + ^13^32 + ^12^23^3 — ^13^22^3 — ^12^2^33 — ^23^32 ^11^22^33 + ^13^21^32 + а\ЪаЪЪаг\ — ^13^22^31 — #l2a21#33 — 0П#23032 Й21^2«33 + «13^21^3 + ^1 ^23031 — «13^2«31 — ^1021^33 ~ 011^23^2 2 021^22033 + #13021032 + 012^23031 — #13022031 — 012021033 — 0Ц023032 __ 011^22^3 + ^1^21032 + 012^2^31 ~ ^1^22031 — Ql2fl21^3 — 011^32 0Ц022033 + 013021^32 + #12^2 3^31 — 013022031 — #12#21а33 — 0Ц023032 (3) Отметим следующую особенность формул (2). Знаменатели в выражениях для хг и х2 одинаковы и выражаются через коэффициенты при неизвестных так: а1га22—а12а21. Иначе говоря, знаменатель формул (2) целиком определен матрицей ( u 12), а именно равен 4^21 «22/ произведению аХ1а22 элементов главной диагонали матрицы минус произведение а21а12 элементов побочной диагонали. Числители выражений (2) можно получить по тому же правилу, что и знаменатели, только из других матриц; для вычисления числителя хг надо взять матрицу» 1, а для вычисления числителя х2—матрицу \^2 с21/ /alt ьл \ап Ь2/ далее найти разности произведении элементов главной
1.6. Определители второго, третьего, п-го порядков 53 и побочной диагоналей. Эти соображения наводят на мысль о том, что выражение апа22—а12а21 должно играть важную роль при изучении свойств системы линейных уравнений и матриц. Перейдем к формулам (3). Здесь имеет место аналогичная картина—знаменатели в выражениях для хг, х2, х3 одинаковы и опре- I #п а12 а13\ деляются матрицей ( #21 «22 «23 ],т. е. выражаются через элементы \ап а32 а33у этой матрицы по некоторому правилу. Что касается числителей, то, как можно убедиться, их можно вычислить по тому же правилу, только из других матриц; для вычисления числителя х± надо взять Ь± CL12 #13 матрицу i Ь2 #22 а23 \ ? ДЛя вычисления числителя х2—матрицу для вычисления числителя х3—матрицу /аа #12 bi г( «2! «22 Ь2 \#з! «зз hj Отмеченные факты дают основания для того, чтобы предположить важность значения выражения а1Ха22а33 + dxza2\az% + а\гаыаг\ — — а13а22а31—а12а21а33—а1га23а32 при изучении свойств системы линейных уравнений и матриц. Определение 1. Определителем квадратной матрицы второго - /«11 «12 \ порядка ( J называется число \«21 «22/ а1га22 ci12a2i. Определителем квадратной матрицы «11 #12 #1з\ «2i «22 «23 1 называется число «31 «32 «33/ третьего (4) порядка аг1а22а33^ а13а21а32-\- a12a23a3i #13^22^31 #12^21^33 ^ц^гз^зг* лу) Комментарии к определению 1. 1) Часто вместо определителя матрицы второго (третьего) порядка говорят об определителе второго (третьего) порядка. 2) Отметим мнемоническое правило для построения выражения (5) с помощью матрицы третьего порядка (рис. 13). На рисунке схематически изображены произведения элементов матрицы, которые берутся с плюсом и с минусом (правило Сар руса). 3) Для определителя матрицы А употребляются следующие обозначения: |Л|, det Л [det—первые три буквы слова «детерминант» (определитель)]. Рассмотренные определители являются простейшими частными случаями общего понятия определителя квадратной матрицы л-го.
54 Глава /. Линейная алгебра с элементами аналитической геометрии % % % Czf $2Z $22 Ъг Ы *д Рис. 13 ш щ щ ш щ щ \ 1 щЩ ш щ т | Рис. 14 порядка. Поскольку определения и свойства этого общего понятия требуют некоторой предварительной подготовки, рассмотрим свойства определителей второго и третьего порядков, чтобы получить некоторые представления о свойствах определителя n-го порядка по аналогии. определителей второго и третьего Свойства пор ядков 1°. Определитель матрицы А равен определителю матрицы, транспонированной к А. 2°. Если какую-либо строку (столбец) матрицы умножить на некоторое число X, то и определитель умножится на то же число. 3°. Если одна строка (столбец) матрицы целиком состоит из нулей, то определитель такой матрицы равен нулю, 4°. При перемене местами двух строк (столбцов) матрицы on ре- делитель изменяет знак. 5°. Если к какой-либо строке (столбцу) матрицы прибавить другую строку (столбец), умноженную на произвольное число, то определитель матрицы не изменится. Все отмеченные свойства легко проверяются непосредственно с помощью формул (4) и (5). 2°. Определители я-го порядка и их свойства. Чтобы обобщить понятие определителя на случай квадратной матрицы /1-го порядка, отметим некоторые характерные особенности формул (4) и (5). В том и другом случае определитель есть алгебраическая сумма членов, каждый из которых [апа22, a12a2i для (4) и апа23азв, ana23a3h 0i2a2ia33> #12^23^31» tfi3#2i#32> ^1з«22аз£ Для (5)] является произведением элементов матрицы, взятых из различных строк (столбцов) так, что в каждом произведении участвуют элементы из каждой строки и каждого столбца, £ каждая строка и столбец в этом произведении представлены одним элементом (примеры членов определителя при п = 5 приведены на рис. 14). Половина членов в формулах (4) и (5) берется со знаком плюс и половина—со знаком минус. Естественно назвать определителем квадратной матрицы п-го порядка алгебраическую сумму членов, каждый из которых есть произведение п элементов матрицы (взятых по одному из каждой строку и каждого столбца). При этом часть слагаемых следует взять
§ 1.6. Определители второго, третьего, п-го порядков 55 со знаком плюс и часть—со знаком минус. Нижеследующее определение соответствует в общих чертах изложенным предварительным соображениям. В этом определении предварительные соображения уточняются и доводятся до строго логического уровня. Некоторые трудности здесь связаны с правилом выбора знака члена определителя. Для описания этого правила предварительно рассмотрим понятие подстановки из п символов и некоторые понятия, связанные с подстановками. Строгие определения понятий «подстановка», «транспозиция», «четность подстановки» см. в п.1° § 1*.6. Для ближайших целей достаточно будет следующего описания этих понятий. Подстановка из п символов 1, 2, ..., п есть множество элементов 1, 2, ..., п, взятое в некотором порядке. Подстановка обозначается так: (. . "' ) или проще (il9 t2, ..., in). Здесь каждое из ik(k= 1,2, .. .\ п) является одним из чисел 1,2, ,,,,пи среди /1 2 3 4\ ik нет одинаковых. Например, ( 3 2 j ) — подстановка 4 = 3, f2=2, t3 = 4, f4=l; (5, 2, 3, 4, 1) — подстановка из пяти символов 1, 2, 3, 4, 5, где i\ = 5, t2 = 2, t3 = 3, t4 = 4, i6=l. Одну подстановку можно перевести в другую, если в исходной подстановке поменять местами какие-нибудь числа ik и iv Такое преобразование подстановок называется транспозицией. Проделав последовательно несколько транспозиций, можно перевести заданную подстановку а к тождественной подстановке—так называется под- /12 3 ... л\ „ становка I i 2 з / ' **УСТЬ ' (а) означает количество транспозиций, которые, будучи осуществлены последовательно, переводят а в тождественную подстановку. Так как существует много различных способов, позволяющих перевести подстановку а в тождественную, то число t (а) определено неоднозначно. Однако четность числа t (о) не зависит от способа, которым подстановка о переводится в тождественную. Это значит, что если при каком-либо способе t (о) четно (нечетно), то t(o) будет четно (нечетно) и при всяком другом способе. Это утверждение является некоторой теоремой из теории подстановок, которая доказана в § 1*.6, 1. Подстановка сг называется четной, если t(o) четно, и нечетной, если t(o) нечетно. Положим Г 0 при о1 четном, s(o) = { , (6) w ( 1 при а нечетном. ч Понятие подстановки естественно возникает при построении членов определителей матриц n-го порядка. Действительно, каждый член определителя (по предварительным соображениям) есть произведение п элементов матрицы А = (аи) по одному из каждой строки. Если переставить порядок сомножителей, то каждый член определителя можно представить в виде fll/4 #2/, • • • Gntn • (7)
56 Глаза I. Линейная алгебра с элементами аналитической геометрии Здесь первым множителем является элемент 1-й строки матрицы, вторым—элемент 2-й строки и т. д. При этом вторые индексы h> h> • • •» К У элементов а^ (&= 1, 2, ..., п) в записи (7) образуют подстановку. Знак, с которым входит член (7) в определитель матрицы п-го порядка, определяется в зависимости от четности или нечетности этой подстановки. Теперь можно сформулировать следующее определение. Определение 2. Определителем квадратной матрицы А =* s=(a/7) п-го порядка называется число, равное З^Ч-^-Н)8^ (8) где сумма распространяется на все подстановки llt i2, „.., гп из п символов и s(o) определено равенствами (6). Комментарии к определению 2. 1) Количество слагаемых в сумме (8) равно п\9 так как количество всех подстановок из п элементов равно п\ =1-2-3 ... п. 2) Частным случаем определения 2 является определение 1. 3) Очевидно, что определение 1 можно обобщить различными способами. Почему же из этих возможных обобщений выбрано именно определение 2? Дело в том, что если понятие определителя п-го порядка ввести с помощью этого определения, то решение системы п линейных уравнений с п неизвестными выразится через определители по формулам, аналогичным (1) и (2) (формулам Крамера). Однако это еще предстоит доказать. Еще одним аргументом в пользу того, что определение 2 есть естественное обобщение определения 1, является то, что все свойства определителей второго порядка и третьего порядка, сформулированные на с. 54, справедливы и для определителя я-го порядка. Правда, доказательство каждого из свойств определителя произвольного порядка п является делом более тонким, чем непосредственная проверка по формулам (4) и (5). Доказательства приведены в п. 2° § 1*.6. 3°. Примеры 1. Исходя из определений, вычислить определители матриц: а) , ; б) 0 "6 0 0 5 2 0 0 0 0 9 3 0 0 1 0 г) (здесь * обозначает произвольные числа, расположенные выше глав* ной диагонали).
$ 1.6, Определители второго, третьего, п-го порядков 57 Решение, а) Среди множества всех членов определителя имеется единственный не равный нулю: а11а22а33а44 = 3 • 4 • 1 • (—5) = —60. Знак /1 2 3 4\ этого члена определен подстановкой к 2 3 1; очевидно, эта подстановка четная и det Л = 60. б) Единственный ненулевой член определителя имеет вид ал .ААЛз = 5 • (—6) • 1 • 3 = —90. Знак этого члена определен под- становкои (2 j 4 3J, которая требует двух транспозиции для приведения к тождественной, т. е. является четной. Итак, det Л = —90. в) Здесь имеются всего два ненулевых произведения, составленных из четырех множителей — элементов матрицы, взятых из различных строк и столбцов, а именно аг1а22а33аы = Ы • 1 • 1 = 1 и # 14а22азза41 = 5• 1 • Ы = 5. Этим произведениям соответствуют под- /1 2 3 4\ /1 2 3 4\ становки К 2 3 4)и(4 2 3 j), первая из которых является четкой, а вторая—нечетной. Следовательно, det Л = 1 — 5 = — 4. г) Все члены определителя равны нулю (поскольку 2-й столбец состоит из нулей). Таким образом, det Л = 0. 2. Найти знак члена определителя n-го порядка: а1га22а33.. .апп\ а1па2> Л-1* ' 'fl/il» #12^21^34^43^56^65* Решение. Указанным произведениям соответствуют подстановки /12 3 ... п\ /12 3 ... /Л/12 3 4 5 б\ VI 2 3 ... п/; \п л—1 п—2 ... 1/; \2. 1 4 3 6 5/' Первая подстановка—четная, вторая подстановка требует [п/2] транспозиций для приведения к тождественной подстановке ([п/2] означает целую часть числа п/2). Таким образом, произведение аы а2,«-I ••• ani входит в разложение определителя со знаком (_1)[л/а]> в частности, при п = 2, 3, 4, 5, 6, 7 значение (—l)!*/»! равно соответственно —1, —1, 1, 1, —1 —1. /1 2 3 4 5 6\ Подстановка (2 1 4 3 6 5/ — нечетная, так как для приведения к тождественной подстановке требуется три транспозиции. • 4°. Вычисление определителей приведением матрицы к треугольному виду. Один из самых важных методов вычисления определителей основан на применении свойства 5° (см. с. 54). Идея этого метода состоит в том, чтобы с помощью преобразований, указанных в свойстве 5°, не меняя определителя, изменить матрицу, приведя ее к так называемому треугольному виду: о (9)
58 Глава L Линейная алгебра с элементами аналитической геометрии Это название объясняется тем, что ниже главной диагонали (0ц «22 • • • аПп) матрицы стоят нули; звездочкой обозначены произвольные^ числа. Определитель матрицы (9), а также определитель исходной матрицы равен произведению а1± а2 аппг поскольку это произведение является единственным членом определителя, не содержащим нулевого множителя из нижней половины матрицы (9). Следующая система правил гарантирует приведение произвольной матрицы А = (аи) к виду (9) или устанавливает, что det А = 0. 1. Рассмотрим элемент aiv Пусть ацФО; тогда умножая 1-ю строку на подходящие числа и прибавляя ее ко 2-й, 3-й и т. д. строкам, можно добиться того, что матрица примет вид fan 1 ° 0 10 * 1 В ) (10) Действительно, для этого следует выбрать соответствующие числа так: для 2-й строки — a21/aliy для 3-й строки —аъ11а1Х и т. д. Если в начале вычислений элемент ац был равен нулю, то переставим 1-ю строку матрицы А с какой-либо другой так, чтобы у новой матрицы элемент, стоящий на пересечении 1-й строки и 1-го столбца, был отличен от нуля; этого можно достичь всегда, за исключением того случая, когда все элементы 1-го столбца равны нулю. Но в этом случае в силу свойства 3° (см. с. 54) определитель равен нулю. 2. После приведения матрицы к виду (10) рассмотрим квадратную матрицу В^фи), образованную элементами 2, 3, 4, ..., п-го столбцов и 2, 3, 4, ..., n-й строк матрицы Л. Проделаем над этой матрицей все те операции, которые были сделаны выше с матрицей Л, т. е. если элемент Ьг1 в левом верхнем углу матрицы В не равен нулю, то умножая содержащую его строку на подходящие числа и прибавляя ее к следующим строкам, добьемся того, что все элементы матрицы, находящиеся в 1-столбце матрицы В (кроме самого fcn), будут равны нулю. Действия со строками матрицы В распространяются на соответствующие строки матрицы А (т. е. на 2, 3-ю и т. д.). При этом исходная матрица после преобразований пи. 1 и 2 примет вид ац о о 16 * Ьп 0 6 * с J (11)
1.6. Определители второго, третьего, п-го порядков §9 Если элемент Ьп = 0, то переставим 2-ю строку матрицы А (содержащей 1-ю строку матрицы В) с какой-либо строкой матрицы А (3, 4, ..., я-й) так, чтобы у новой матрицы на месте элемента blt было число, отличное от нуля. Это можно сделать всегда, за исключением того случая, когда все элементы 1-го столбца матрицы В равны нулю (в этом случае определитель исходной матрицы равен нулю). 3. Затем рассмотрим матрицу С и проделаем над ней все те же операции, которые ранее были сделаны с матрицей В, и т. д. В результате всех вычислений матрица примет треугольный вид (9) или будет установлено, что определитель исходной матрицы равен нулю. Определитель треугольной матрицы, к которой была приведена исходная матрица, равен произведению диагональных элементов и отличается от искомого определителя не более чем множителем —1 (в связи с возможной перестановкой строк при выполнении произведенных выше операций). Таким образом, выполнив все указанные действия и учитывая изменения знака определителя при перестановке строк, легко вычислить искомый определитель. Изложенный метод вычисления определителя тесно связан с алгоритмом Гаусса, который подробно будет рассмотрен в § 1.9. Пример. Вычислить определитель матрицы 'О 3 л.,29 Решение. Используя описанный выше метод, томутш последовательно матрицы (а), (б), (в), (г), -(д): Поясним, как преобразуется исходная матрица А в матрицы (б), (в), (г), (д). Поскольку ац = 09 переставим 1-ю и 3-ю строки; получим матрицу (б). Умножим теперь 1-ю строку матрицы (б) на —2 и результат
60 Глава I. Линейная алгебра с элементами аналитической геометрии прибавим ко 2-й строке. Получим матрицу (в); последние три строки и три столбца этой матрицы образуют матрицу В, к которой следует применить те же правила, что и к исходной матрице Л. Элемент blt матрицы В равен 1. Умножая 2-ю строку матрицы (в) на —Зи—6 1 и прибавляя полученные результаты соответственно к 3-й и 4-й строкам, получим матрицу (г). Теперь рассмотрим матрицу С (две последние строки и два последних столбца матрицы (г). Ее элемент clt равен 9; с его помощью можно преобразовать матрицу (г) к треугольному виду. Именно, умножив 3-ю строку матрицы (г) на —17/9 и прибавив полученный результат к 4-й строке, получим треугольную матрицу (д). Определитель матрицы (д) равен 19; следовательно, определитель исходной матрицы (а) равен —19, так как в процессе вычислений нам пришлось только один раз переставить местами строки. 5°. Вычисление определителей разложением по строке или столбцу. Широко известен и другой метод вычисления определителей называемый разложением определителя по строке (столбцу). Его сущность состоит в следующем. В формуле (8), выражающей определитель через элементы матрицы, можно сгруппировать все члены, содержащие множителем элемент а1и все члены, содержащие элемент а12, все члены, содержащие элемент а13, ..., все члены, содержащие элемент а1п. Эти группы не имеют общих членов и в совокупности составляют все разложение (8). Таким образом, справедливо равенство det А = altAlt + апА12 + а19А19+...+ а1пА1п, (12) где через Лп, Л12, ..., А1п обозначены числа, которые получаются после вынесения за скобки а1и я12, ..., а1п в соответствующей группе членов. Оказывается, что эти коэффициенты могут быть просто описаны с помощью терминов, связанных с понятием определителя. Введем следующие определения. Определение 3. Минором k-го порядка матрицы А (она может быть и прямоугольной) называется определитель матрицы, образованный пересечением любых k строк и k столбцов матрицы А. Минором элемента aif квадратной матрицы А называется число Ми, равное определителю матрицы, полученной из матрицы А вычеркиванием i-й строки и /-го столбца. Определение 4. Алгебраическим дополнением A{J- элемента ajj квадратной матрицы А называется число Аи=(-1У+Ш„, (13) где Mi;-—минор элемента a{j. Вернемся теперь к вопросу о вычислении определителя разложением по строке (столбцу). Оказывается, что числа Allt Ai2f ..., Aln в разложении (12) являются не чем иным, как алгебраическими дополнениями элементов 1-й строки ап, а12, ..., ain. Справедливы формулы, аналогичные (12), в которых вместо элементов 1-й строки
1.6. Определители второго, третьего, п-го порядков 61; #ii, #12» •••» аы и их алгебраических дополнений входят элементы (произвольной) i'-й строки aiu ah, ...,^i« и их алгебраические дополнения Аи, Л/2, ..., Ain: (1е1Л=2 aik^ik (i' = 1» 2, ..., п). Л=1 (14) Справедливы также формулы разложения определителя по (произвольному) k-щ столбцу: det Л= 2^И«* (£=1,2, ..., п). i=l (15) Доказательство справедливости формул (14) и (15) приведено в § 1*.6, 2. Следует отметить, что формулы (14) и (15) выгодно применять тогда, когда исследуемая матрица имеет строку (столбец), в которой лишь небольшое количество элементов отлично от нуля. В этом случае правая часть формул (14) и (15) содержит небольшое количество слагаемых. Пример. Вычислить определитель 12—1 о 01 л * л V 2 -1 ° detA-L _! 2 Л. [0 0 —1 2| Решение. Используя формулу (14), разложим данный определитель по 1-й строке: detA = 2(—1)1+1 2—1 о —1 2 —1 0—1 2 +(-1)(-1)1+2 -1 —1 0 0 2—1 0—1 2 Здесь определители третьего порядка представляют собой миноры Ми, М12 элементов alU ai2. Определители в правой части последнего равенства можно вычислить по правилу Сарруса. Имеем detA = 2(8 —2 Упражнения 1. Вычислите определители: а) -2) + Ь(—4+1) = 8—3 = 5. 11 2 4 3 ; б>. а 4 6 4 ; в) 1 2 3 4 1 8 5 3 11 ; г) 1 2 31 1 4 9 1 8 27 2. Найдите знаки членов определителей: а) а12а2ва91аиаЬь\ б) ai^a^a^^si^uiis В) «22^33^X1^44; Г) a2iai2«34a43- ,x
62 Глава /. Линейная алгебра с элементами аналитической геометрии 1 3. Исходя из определения, вычислите определители: а) 0 6 0 1 8 2 0 3 1 0 1 О 0 7 0 1 —1 2 2 6 б) О 2 0 1 1 3 О О 4. С помощью разложения по строке (столбцу) вычислите определители: а) 3 4 0—1 2 0 1 2 0 11 О 10 0 2 б) 13 4 1 112 5 0 116 0 0 0 2 5. С помощью приведения матрицы к треугольному виду вычислите определители: а) 1 1 1 3 3 3 9 10 10 б) 2 3 2 1 13 2 1 12 2 1 12 36 40 411 | 1 0 1 1 6. Вычислите алгебраические дополнения A±2f Л4з, Аьь в матрице [10 2 3 4] 2 10 0 1 Л= |о 0 1 2 0 . 1 2 0 0 3| ^0 0 0 0 \) § 1.7. Ранг матрицы. Теорема о базисном миноре 1°. Ранг матрицы. В этом параграфе мы будем рассматривать матрицы как конечную совокупность векторов-строк или векторов- столбцов. При этом будем интересоваться вопросами линейной зависимости таких систем векторов; мы придем к фундаментальному понятию ранга матрицы и установим связь между рангом матрицы и ее минорами (теорема о базисном миноре). Пусть дана некоторая матрица А Ф 0 (т. е. такая, что не все ее элементы равны нулю) размера тхп. Будем рассматривать каждую строку матрицы А как вектор /г-мерного координатного линейного пространства Ln\ всего имеется т векторов git g2, ..., gm. Эта система векторов может быть линейно независимой, а может быть, напротив, линейно зависимой (т. е. какой-либо вектор из этой системы линейно выражается через остальные). Исключив из данной системы векторов (строк матрицы А) тот вектор (ту строку), который выражается через остальные строки, получим систему векторов, состоящую из
& 1.7. Ранг матрицы. Теорема о базисном миноре 63 т—1 векторов (или матрицу с т—1 строкой). Если существует несколько векторов, линейно выражающихся через остальные, то для исключения выберем один из них, безразлично какой. Затем снова поставим вопрос о линейной зависимости и исключим вектор, который может быть выражен через остальные, и т. д. В результате этой процедуры получим линейно независимую систему. Легко показать, что полученная линейно независимая система векторов будет максимальной в том смысле, что после добавления к ней любого (исключенного) вектора она становится линейно зависимой. Следует иметь в виду, что система операций, позволяющая выделять из данного конечного множества векторов линейно независимое подмножество, является неоднозначной: на каждом ее шаге можно выбирать различные векторы для исключения. Однако любое максимальное линейно независимое подмножество векторов состоит из одного и того же числа векторов. Доказательство этого утверждения приведено в § i*.l, 12. Максимальное линейно независимое подмножество нельзя расши- -» -> -> рить за счет векторов множества {gu g2, ..., gm) так, чтобы это подмножество оставалось линейно независимым. Число векторов такого подмножества в дальнейшем будет играть особую роль, его называют рангом исходной системы векторов (исходной матрицы Л). Дадим строгое определение. Определение 1. Пусть АфО—матрица размера тхп и "*■ -* ** gi> #2* -*->ёт—векторы-строки этой матрицы. Максимальное число векторов-строк в линейно независимом подмножестве множества -> -> -> {Su бг» • • •> ёт} называется рангом матрицы (а также рангом системы -+ -* -*• векторов #1, g2, ..., gm). Ранг нулевой матрицы равен нулю. Ранг матрицы А обозначается г (А). Комментарии к определению 1. 1). Напомним, что всякое максимальное линейно независимое подмножество множества -»■ -► -> {gi> g2> •••» 8т) состоит из одного и того же числа векторов. . 2) Очевидно, что ранг ненулевой матрицы есть целое положительное число. 3) Можно рассматривать матрицу А размера тхп как множество, состоящее из п векторов-столбцов m-мерного координатного пространства Lm. По аналогии с определением 1 можно рассмотреть число векторов-столбцов в максимальном линейно независимом подмножестве множества столбцов матрицы А (ранг матрицы А по столбцам). В силу теоремы о базисном миноре (она будет доказана ниже) оба ранга (по строкам и по столбцам) совпадают. Перед тем, как перейти к теореме о базисном миноре, рассмотрим некоторые свойства миноров и определителей. Основные свойства определителей, перечисленные на с. 54, позволяют отметить некоторые условия, при выполнении которых опре-
64 Глава /. Линейная алгебра с элементами аналитической геометрии делитель равен нулю. Самые общие, т. е. необходимые и достаточнее, условия равенства определителя нулю, даны в следующем утверждении. Теорема 1. Определитель квадратной матрицы А равен нулю тогда и только тогда, когда множество векторов-строк этой матрицы является линейно зависимым. Доказательство. Если множество векторов-строк {gif g"2, ... • • • t Sn} является линейно зависимым, то одна из строк матрицы линейно выражается через остальные; пусть для определенности -> 1-я строка g± выражена через остальные: -+-►-* -»• Si = с2£2 + Csg* + • • • + cngn. Очевидно, что если к 1-й строке прибавить 2-ю, умноженную на —с29 затем 3-ю, умноженную на —с3, и т. д., то в результате этих преобразований, не изменяющих определителя, на месте 1-й строки будет стоять строка из нулей; поэтому в случае линейной зависи- мости векторов glf g2, ..., gn определитель матрицы А будет равен нулю. Доказательство обратного утверждения приведено в § 1*.7, I. Здесь мы укажем лишь основную идею доказательства. Пусть определитель матрицы А равен нулю. Будем вычислять определитель с помощью приведения матрицы к треугольному виду. Используя правила, указанные в п. 4° § 1.6, можно привести произвольную матрицу А к виду #22 О (1) Так как определитель матрицы А равен нулю, то я*„ = 0. (2) (Проверьте, что используя указанные правила, на главной диагонали матрицы мы получим числа а1и а22, апп, обладающие тем свойством, что если среди них есть нули, то они занимают последние места вэтом списке.) Условие (2) означает, что последняя строка матрицы(1) целиком состоит из нулей, т. е. некоторая строка исходной матрицы А после прибавления к ней других строк матрицы, умноженных на некоторые коэффициенты, оказались нулевой. Следовательно, строки матрицы А (при условии, что deti4 = 0) линейно зависимы. 2°. Теорема о базисном миноре. Лемма 1. Пусть А—матрица размера тхп (т^п). Если множество ее векторов-строк линейно зависимо, то любой минор т-го порядка матрицы А равен нулю*
§ 1.7. Ранг матрицы. Теорема о базисном миноре \ 65 Доказательство. Выберем произвольные т столбцов матрицы А и рассмотрим квадратную матрицу В из т строк и т выбранных столбцов. Строки этой квадратной матрицы являются «укороченными» строками матрицы А. Ясно, что строки матрицы В линейно зависимы и detB = 0. Лемма 2. Если множество векторов-строк матрицы А линейно независимо, то существует такой минор т-го порядка этой мат- рицы, который не равен нулю. Доказательство приведено в § 1*.7, 2. Из двух вспомогательных предложений вытекает следующая теорема. Теорема 2 (о базисном миноре). Если ранг матрицы А равен г, то среди миноров г-го порядка этой матрицы найдется минор, не равный нулю, а все миноры, порядок которых больше, чем г, равны нулю. Обратно, если существует минор г-го порядка матрицы А, не равный нулю, а все миноры порядок которых больше, чем г, равны нулю, то ранг матрицы А равен г. Доказательство. Пусть ранг матрицы А равен г. Это означает, что существует линейно независимое подмножество из г векто- ров-строк gl9 g2, ..., gr матрицы А, и при этом всякое подмножество из г + 1 строк линейно зависимо. В силу леммы 2 существует минор r-го порядка, принадлежащий множеству строк gu g2, ..., gr и не равный нулю. Всякий минор более высокого порядка, чем г, равен нулю, поскольку всякое подмножество векторов-строк, содержащее более, чем г строк, линейно зависимо, и применима лемма 1. Обратно, пусть существует минор r-го порядка матрицы Л, не равный нулю, а все миноры порядка большего, чем г, равны нулю. Покажем, что ранг матрицы А равен г, т. е. в матрице А найдется г векторов-строк, образующих максимальное линейно независимое множество. В качестве таких векторов-строк мы возьмем г строк матрицы А, составляющих заданный не равный нулю минор. Очевидно, что эти строки линейно независимы — иначе были бы зависимы «укороченные» строки, образующие минор, а это невозможно, в силу теоремы 1, поскольку по- условию минор не равен нулю. Выбранные г строк являются максимальным линейно независимым множеством. Действительно, расширим это множество добавлением еще одной строки (безразлично, какой); при этом получится линейно зависимое множество, так как если бы рассматриваемые векторы-строки (их число есть г+1) были бы линейно независимы, то в матрице, составленной этими строками, в силу леммы 2 наЩелся бы минор порядка г + 1, не равный нулю, что противоречит условию. Комментарии к теореме 2. 1) В формулировке теоремы слова «все миноры, порядок которых больше, чем г» (в прямом и обратном утверждении) можно заменить на «все миноры порядка r-f-1». Действительно, если все миноры порядка г + 1 равны нулю, то будут 3 № 2636
66, Глава I. Линейная алгебра с элементами аналитической геометрии равны нулю и все миноры более высокого порядка: каждый минор порядка г+ 2 равен некоторой линейной комбинации миноров порядка г + 1 (согласно формуле (14) § 1.6) и, следовательно, равен нулю; каждый минор порядка /* + 3 есть линейная комбинация миноров порядка г+ 2 и поэтому равен нулю и т. д. 2) Теорема о базисном миноре позволяет дать другое определение ранга матрицы. Определение 2. Рангом матрицы называется наибольший .порядок отличных от нуля миноров. В силу теоремы о базисном миноре определения 1 и 2 ранга матрицы эквивалентны. 3°. Следствие из теоремы о базисном миноре. Из теоремы о базисном миноре вытекает важное следствие. Рассмотрим матрицу Л*, транспонированную к матрице Л, и ранг этой матрицы, т. е. максимальное число векторов-строк матрицы Л*, содержащееся в каком-либо линейно независимом подмножестве векторов-строк этой матрицы. Так как векторы-строки матрицы Л* являются векторами-столбцами матрицы Л, то ранг матрицы Л* совпадает с рангом матрицы Л по столбцам (см. комментарии к определению 1 на с. 63). Очевидно, что ранги матриц Л и Л* одинаковы, если исходить из определения 2 ранга матрицы. (В самом деле, миноры матрицы Л и Л* находятся в естественном взаимно однозначном соответствии: так как определитель транспонированной матрицы равен определителю исходной матрицы, то и наивысший порядок отличных от нуля миноров в матрицах Л и Л* один и тот же.) Определения 1 и 2, как известно, эквивалентны, поэтому ранг матрицы Л равен рангу матрицы Л* в смысле определения 1. Иначе говоря, ранги матрицы Л по строкам и по столбцам равны. Следствие (из теоремы о базисном миноре). Максимальное число векторов-строк в линейно независимом подмножестве векторов-строк матрицы А равно максимальному числу векторов- столбцов в линейно независимом подмножестве векторов-столбцов матрицы Л. Примеры. 1. Ранг матрицы (12—4 32 1\ 0 3 7 5 1 8 \ 15 3 8 3 9 1 18 10 13 4 17/ равен 2: первые две строки gx и g2 линейно независимы (два вектора могут быть линейно зависимыми только в случае коллинеарности, т. е. тогда, когда их координаты пропорциональны), а векторы g3 и g4 линейно выражаются через ^ и g2: g, = ft+ ftf g4 = £i + 2g2: Таким образом, {gly g2}— максимальное линейно независимое подмно-
§ 1.7. Ранг матрицы. Теорема о базисном миноре 67 жество векторов-строк матрицы А\ число векторов в нем, равное 2, есть ранг матрицы А. Впрочем, пара векторов gu g2 не является единственным максимальным линейно независимым подмножеством векторов-строк. Тако- выми же, например, являются и подмножества {glf g3}, {g2, g3}. (В этом примере всякая пара векторов есть максимальное линейно независимое подмножество, хотя в общем случае так бывает не всегда.) 2. Пусть А — квадратная матрица размера пхп и det А Ф0. В этом случае г (А) = л. Действительно, множество всех строк матрицы А является линейно независимым, и, очевидно, максимальным. Количество векторов в нем, равное л, есть ранг матрицы Л. 4°. Вычисление ранга матрицы приведением ее к ступенчатому виду. Среди различных методов вычисления ранга матрицы особое место занимает метод приведения ее к ступенчатому виду, тесно связанный с методом Гаусса (см. § 1.9). Основная идея этого метода заключается в том, чтобы изменять матрицу А размера тхп с помощью сравнительно простых преобразований так, чтобы сохранялся ее ранг. В конечном результате матрица оказывается приведенной к виду m—r i (<ht «22 0 ' 1 ° * • агг * 0 п—г ; т— г>0, п—г>0 (3) (который и называется ступенчатым видом матрицы). Здесь яп, я22, .. • ..., агг—не равные нулю числа, а звездочками обозначены некоторые числа. Ранг матрицы вида (3) равен г: действительно, минор r-го порядка, составленный из первых г строк и столбцов, матрицы, не равен нулю, а все миноры порядка г + 1, где r+l^min(m, я), равны нулю, поскольку соответствующие матрицы содержат строку, целиком состоящую из нулей. Опишем этот метод подробнее. Назовем элементарной операцией над матрицей А одну из следующих операций: 1) прибавление к одной строке матрицы А другой строки, умноженной на произвольное число; 2) перемену местами двух строк матрицы А\ 3) перемену местами двух столбцов матрицы Л. Эти операции не меняют ранга матрицы (для операций 2 и 3 это очевидно, а для операции 1 это утверждение доказано в § 1*.9, I). 3*
68 Глава I. Линейная алгебра с элементами аналитической геометрий Покажем, что с помощью элементарных операций любую матрицу A — (atj) размера тхп можно привести к ступенчатому виду. Сначала добьемся того, чтобы элемент, стоящий на пересечении 1-й строки и 1-го столбца, был не равен нулю: если в исходной матрице а1± = 0, то, меняя местами столбцы и строки, можно в левый верхний угол поместить любой элемент аи матрицы А. Таким образом, поставленной цели мы добьемся для всякой матрицы Л=^=0 (нулевая матрица уже имеет ступенчатый вид). С помощью элемента аг1фО преобразуем матрицу так, чтобы остальные элементы 1-го столбца оказались равными нулю. Для этого достаточно умножить 1-ю строку на подходящие числа (а именно на — tf2i/tfii> —U3i/tfu, •••, —0«i/fln) и прибавить результат соответственно к 2, 3, ..., т-й строке. На данной стадии преобразований матрица примет вид ( Ull 0 6 \ * в\ (4) Матрицу, образованную 2,3,..., m-й строками и 2, 3, ..., n-м столбцами матрицы (4), обозначим через B = (bi/); i = l, 2, ..., т— 1, /=1, 2, ..., п—1. Можно добиться того, чтобы элемент матрицы В, стоящий на пересечении 1-й строки и 1-го столбца, был отличен от нуля; если исходный элемент Ьп был равен нулю, то переставляя строки и столбцы матрицы S, поместим в левый верхний угол элемент 6iy-, отличный от нуля (если же все элементы матрицы В равны нулю, то матрица (4) имеет ступенчатый вид). Отметим, что под перестановкой строк и столбцов матрицы В мы понимаем перестановку содержащих их строк и столбцов матрицы (4); при этом матрица (4) сохраняет свой вид. Умножая 1-ю строку матрицы В на подходящие числа и прибавляя результаты к 2, 3-й и т. д. строкам, можно добиться того, чтобы в матрице В в 1-м столбце этих строк стояли нули. На этой стадии преобразований матрица имеет вид (5) ( flu 0 0 6 V Ьи 0 6 * 1 с /
§ 1.7. Ранг матрицы. Теорема о базисном миноре . 69 Матрицу, образованную 3, 4, ..., m-й строками и 3, 4, ..., т-и столбцами матрицы (5), обозначим через С. Над матрицей С произведем те же операции, что были выполнены с матрицами А и В и т. д. Очевидно, что конечным результатом всех описанных действий будет матрица вида (3). Пример. Используя метод приведения к ступенчатому виду, найти ранг матрицы Решение. Имеем: (б) 1 1 ° 0 —1 1 0 0 —2 1 0 0 —2 1 1 1 —2 1 1 о о 0 0—2—2 —1 1 1 0 1 0 0 0 0 (в). /1 (о [° \о (д) 1 1 1 1 —2 1 1 0 0 —2 1\ 1 0 0 —2 Г 0 0 —1 0 0—2—2 —1 0 Оу Умножая 1-ю строку матрицы (а) на —2, —3, —2 и прибавляя ее соответственно к 2, 3 и 4-й строке, получим матрицу (б). В матрице (б) переставим 2-й и 5-й столбцы, получим матрицу (в). Умножая 2-ю строку матрицы (в) на —1 и 2 и прибавляя ее соответственно к 3-й и 4-й строке, получим матрицу (г). В матрице (г) переставим 3-ю и 4-ю строки, получим матрицу (д), имеющую ступенчатый вид. Итак, ранг данной матрицы равен 3. 5°. Упражнения 1. Вычислите ранг матрицы и укажите один из ее базисных миноров: /2 3 0> /2 3\ /2 3 0\ / а) ); б) ); в) 1 1 5
70 Глава I. Линейная алгебра с элементами аналитической геометрии 2. Используя метод приведения матрицы к ступенчатому виду, вычислите ранги матриц: 5 13 3 7\ 16 40 10 22 22 54 14 30/ 2 3\ 3. При каких значениях Я матрица 4. Даны матрицы: 15 4 2^ 0 2 7 1 0 0 3 8 уо о о о; 3-Я 1 2 1-Я а) (\ 5 4) 0 2 7 0 0 3 (о о о) > б) 13 0 2^ 0 114 0 0 18 О 0 0 0) имеет ранг, равный 1? 13 0 2 0) 0 114 0 0 0 18 1 .0 0 0 0 2) Равны ли их ранги? 5. Найдите' ранг матрицы '1 2 3 § 1.8. Векторное произведение. Основные свойства. Смешанное произведение и его свойства 1°. Векторное произведение. Понятие векторного произведения, о котором пойдет речь в этом параграфе, является объектом изучения теории трехмерного евклидова пространства Е3. В евклидовом пространстве, число измерений которого отлично от трех, не имеется аналогий этого понятия. С помощью векторного произведения удобно описывать некоторые геометрические свойства поверхностей в Е3\ кроме того, свойства векторного произведения полезны при изучении некоторых вопросов теории поля. Прежде чем дать определение векторного произведения двух век- -» ->■ торов а, Ь из евклидова пространства Е3, отметим одну существенную особенность этого понятия. Векторное произведение двух век- торов а, Ь£Е3 есть некоторый третий вектор с того же простран- -►->-> -> ~> -» ства Е3, обозначаемый c=axb или с = [а\ Ь]. Казалось бы естест-
§ 1.8. Векторное произведение. Смешанное произведение 71 '4 15 Рис. 15 *~ft Рис. 16 венным, что вектор с, будучи результатом векторного умножения а на Ь, полностью определен векторами-сомножителями а и b и евклидовой структурой пространства Е3 и не зависит от случайного выбора базиса в Е3. Однако дело обстоит не совсем так. Вектор- ное произведение двух векторов а и Ъ из Е3, как это будет следо- -> -> вать из определения, зависит от а, 6, от евклидовой структуры в Е3 (т. е. скалярного произведения, заданного в Е3) и еще от того, как выбран ортонормированный базис в Е3—с помощью правой или левой тройки векторов. Наглядное описание понятий левой и правой троек векторов дается ниже. Пусть в Е3 даны три вектора fl9 /2, /3 такие, что /х и /2 не -» ->• коллинеарны, а /3 перпендикулярен плоскости, построенной на /* и /2 (рис. 15). Очевидно, что существуют всего два возможных направ- ления вектора /, (при фиксированных fx и /2). Эти две возможности различаются между собой следующим образом. Если наблюдать из конца вектора /3 поворот от вектора /х к вектору /2 (из двух возможных поворотов выбирается кратчайший), то в одном случае этот поворот будет казаться происходящим против часовой стрелки, а в другом—по часовой стрелке. В первом случае говорят,' что упорядоченная тройка векторов flf /2, /3 является правой, а во втором—левой. С правой тройкой связаны правые винты (большинство шурупов и винтов в технике—правые), а с левой тройкой—левые винты (довольно редкие на практике). Правую тройку легко описывать с помощью «правила правой руки» (рис. 16, а), левую тройку—«правила левой руки» (рис. 16,6). Разумеется, приведенное выше описание связано с понятиями, не являющимися строгими математическими: «наблюдать из конца вектора», «по часовой стрелке», «правило правой руки» и т. д. Тем не менее эти описания полезны, поскольку геометрия трехмерного евклидова пространства с большой степенью точности описывает трехмерное физическое пространство, и в прикладных задачах данные
72 Глава I. Линейная алгебра с элементами аналитической геометрии выше нестрогие описания имеют определенный практический смысл. Можно различать упорядоченные тройки векторов в Е3 без обра- щения к наглядности следующим образом: пусть (/„ /2, /3) и (glf g2f ->• g9)—два базиса в Е3 (т. е. две упорядоченные тройки линейно независимых векторов). Рассмотрим линейный оператор L такой, что L/i = ft, L/,=52f L?3 = g8. (1) Равенства (1) определяют оператор L в£3 однозначно. Рассмотрим матрицу А оператора L в базисе (/х, /2, /3) и ее определитель det A. Будем говорить, что два базиса (/,, /2,/3) и (gu g2, g3) ориентированы одинаково, если det А > 0, и ориентированы различно, если detA<0. Нетрудно показать (это сделано в § 1*.8,1), что описанное отношение (одинаковой ориентации) является отношением эквивалентности и множество всех базисов в Е3 делится на два класса: все базисы, принадлежащие одному классу, ориентированны одинаково, а любые два базиса из разных классов ориентированы различно. (Можно ввести название этих классов, например «правые» и «левые» тройки, и доказать, что «реальные» правые тройки ориентированы одинаково, «реальные» левые тройки также ориентированы одинаково и всякая правая тройка имеет различную ориентацию по отношению к левой тройке.) Теперь можно объяснить, от чего зависит результат векторного -»■->■-> умножения двух векторов: векторное произведение с = ах&двух -> -> -» '-* векторов a, b£E3 зависит от самих векторов ау Ь от скалярного произведения в £3 и от ориентации базиса в Е3. Определение 1. Векторным произведением двух векторов а, •-* b£E3 в евклидовом пространстве Е3 с ортонормированным базисом (еи e2J e3) называется третий вектор c = axb, удовлетворяющий следующим условиям: 1) длина вектора с равца площади параллелограмма, построенно- го на векторах а, Ь, т. е. |e|-=|a||&|sin<p, где \а\9 \Ь\—длины векторов a, b, a ф—угол между ними; 2) вектор с перпендикулярен векторам а и 6: 3) из двух возможных направлений вектора с, удовлетворяющих условию 2, выбирается то, при котором упорядоченные тройки (еи ^2» ^з) и (я> ^ я) ориентированы одинаково. Комментарии к определению 1. 1) Условия 1—3 опре- деляют ах& для любой пары а, Ь и притом однозначно.
§1.8. Векторное произведение. Смешанное произведение 73 2) При замене базиса (е1У е2, е3) другим базисом с противоположной ориентацией вектор с изменится на —с. 3) Для вычисления векторного произведения удобна следующая формула. Пусть b^b^+b^ + b^. Тогда с=ах6= ег е2 е3 аг а2 а3 Ьх Ь% Ь3 (3) Формулу (3) следует понимать так: определитель в правой части раскрывают по правилу Сарруса, несмотря на то, что в 1-й строке правой части равенства (3) стоят не числа, а векторы. Иначе говоря, c = axb = e1 (a2b3—a3b2) +е2 (a3b1—a1b3) + e3 {а^—аф^. (4) Для соблюдения логической строгости можно считать формулу (3) лишь некоторым правилом запоминания формулы (4). Справедливость формулы (4) легко установить прямой проверкой выполнения условий 1—3 определения, что сделано в § 1*.8, 2. ->•-►-»• -* В формуле (3) часто пишут вместо векторов еи е2У е3 векторы i, -*■ ->> /, k—орты положительных направлений координатных осей (задающих декартову координатную систему в R3). Свойства векторного произведения 1°. axb = — bxa. ( 2°.axb = 0 тогда и только тогда, когда векторы а и b колли- неарны. 3°e (toxb) = %(axb). 4°. (a + bx^==(axc) + (bx'c). 5°. (axb,axb) + (a, 1)2 = \~a2\\b2\. Здесь а, Ь> с—произвольные векторы из R3, a X—произвольное вещественное число. Доказательство справедливости этих свойств приведено в§ 1*.8,3. Комментарии к свойствам векторного произведения. 1) Эти свойства означают, в частности, что векторное про- -»■ -> изведение ахb (в данном базисе) есть функция (с векторными значениями), линейная по. первому и второму.сомножителю..
74 Глава I. Линейная алгебра с элементами аналитической геометрии 2) Векторное произведение не обладает свойством ассоциатив- _>_>._> _> _> _> ности, т. е., вообще говоря, (ахЬ)хсфахфхс). -» -»• «■* 2°. Смешанное произведение. Определение 2. Пусть а, Ь, с — три вектора из трехмерного евклидова пространства £3, в котором ->->-»■ задан ортонормированный базис £х, е2, е3. Смешанным произведением ->■->■-> трех векторов а, &, с называется число а, определяемое формулой а=(ах&, 5, (5) где (ахЬ, с) означает скалярное произведение векторов axb и с. ->->-> ->-*-»■ Смешанное произведение векторов a, b и с обозначается (а, Ь, с). Комментарии к определению 2. 1) Заметим, что определение смешанного произведения связано с определенным порядком перемножаемых векторов: а—первый вектор, b—второй, с—третий. 2) Базис (еи е2, е3) фигурирует в определении в связи с тем, что формула (5) содержит векторное произведение axb, которое, как известно, зависит от того, каков базис пространства. Таким образом, для вычисления смешанного произведения, кроме самих векто- ->->-► ров a, bf с, надо знать и базис пространства £3 (точнее—ориентацию базиса)0 3) При вычислении смешанного произведения удобна следующая формула: #1 #2 а3I (а, Ь, с) = (6) Ь± Ь2 Ь3 Сх С2 С3 где аи а2> а3\ biy b2t Ь3\ с19 с2, ^—коэффициенты разложения век- торов а, Ь, с в базисе (е19 е2У е3): а = ахех + а2е2 + а#и 1 b = b1e1 + b2e2 + b3ei, с = сгв1 -\- с2е2 -f- c3e3* Формула (6) вытекает непосредственно из равенств (3), (4) и из выражения скалярного произведения векторов через их координаты в ортонормированном базисе. Свойства смешанного произведения 1°. Смешанное произведение трех векторов а, Ь, с по абсолют* ной величине равно объему параллелепипеда, построенного на векто* -» -> -► pax а, Ь, с. Доказательство видно из рис. 17.
& 1.8. Векторное произведение. Смешанное произведение 75 В частности, смешанное произведение равно нулю тогда и только тогда, когда векторы a, Ь, с лежат в одной плоскости, т. е. компланарны. 2°. При перемене местами двух из трех перемножаемых векторов смешанное произведение изменяет знак. Доказательство вытекает непосредственно из определения. fv*simf ~Рис. 17 3°. Примеры. Рассмотрим некоторые применения изложенной выше теории к задачам аналитической геометрии. Пусть требуется найти параметрические уравнения прямой, заданной как линия пересечения двух плоскостей: 'АгХ + Btf + Ctf + D^O, А2х + В2у + C2z + D2 = 0. (7) Очевидно, что направляющий вектор p=:(piy /?2, р3) искомой пря- мой перпендикулярен двум векторам а1 = (Л1, Ви Сх)и а2 = (А2, Д>, С2)—нормальным векторам плоскостей Л1д; + 51у + С12-|-^1 = 0 и А2х + В2у + C2z + D2 = 0 соответственно (см. с. 32). Поэтому в ка- честве р можно взять ахха2. Если (х09 у0У z0)—некоторое решение системы (7), то уравнения искомой прямой имеют вид (х—х0)/р± = {у—у0)/р2 = (г—*о)/Рз> или x^pj + x» y = p2t + yQi z = p3t + z0. 1. Найти параметрические уравнения прямой ( x + y + z = 0, \2х + у—3=0. (8) (*) Решение. Здесь ах = (1, 1, 1), а2 = (2, I, 0)—нормальные векторы плоскостей (#). За направляющий вектор искомой прямой мож- -> -» -> но взять вектор p — a±xa2J т. е. -> р= i j k \ 111 2 1 0 = — i + 2j—k. Полагая z0 = 0 в системе (*), приходим к системе ( х + у = 0, 2х + у = 3, (**) :
76 Глава I. Линейная алгебра с элементами аналитической геометрии Решение. имеет вид -> а = / / k 1 2 —1 2 3—2 откуда хй — 3, </0 = —3. Итак, искомые уравнения имеют вид (*-3)/(-1) = (у + 3)/2 = (2—0)/(—1)/ Рассмотрим теперь задачу о нахождении уравнения общего перпендикуляра к скрещивающимся прямым {х—x^lfh. = (У—У1УР2 = (г—г1)/р3; {x—x2)/q1=(y—y2)/q2=(z—z2)/q3. (9) В качестве направляющего вектора а общего перпендикуляра к двум скрещивающимся прямым можно взять векторное произведение -» -»■ направляющих векторов р = (р19 р2, р3) и q — (gu q2, q3) прямых (9). Что же касается точки, через которую проходит искомая прямая, то ее можно найти так: сначала составить уравнение плоскости, прохо- дящей через одну из прямых и вектор а, и затем определить точку (х<)*Уо> Zo) пересечения другой прямой с этой плоскостью. Точка (л:0, y0i z0) и вектор а определяют уравнения искомой прямой. 2. Найти уравнения общего перпендикуляра скрещивающихся прямых (^-1)/1=(г/+1)/2 = (г-3)/(-1), (х-4)/2 = (г/+1)/3 = (г+1)/(-2). (*) Направляющий вектор искомого перпендикуляра I = *(—4 + 3) + /(—2 + 2) + А(3—4) = — i—k. Уравнение плоскости, проходящей через первую прямую и вектор а, найдем как уравнение плоскости, проходящей через заданную точку параллельно двум заданным векторам: х— 1 у+\ г—31 1 2 —1 = О, |-1 0 -1 I т. е. —2{х— 1) + (у+1)(1 + 1) + (г—3).2 = 0, или — x+y+z— 1 =0. (**) Найдем точку пересечения этой плоскости и второй из заданных прямых. Из уравнений (х—4)/2 = (у + 1)/3 = (г+ 1)/(—2) следует, что J л: = 2/ + 4, у = 3/— 1, г = —2/—1. (***) Подставляя выражения (***) в уравнение (**), имеем _(2* + 4) + (3f—1) + (—2f—1) —1=0, откуда / = —7, т.е. х0 =—10; #0=>— 22; г0== 13. м
§ 7.9. Системы лин. уравнений. Метод Гаусса. Теорема Кронекера—Капелли 77 Итак, уравнение общего перпендикуляра имеет вид (л;+10)/(—1) = гф + 22)/0 = (*-13)/(—1). Отметим, что объем тетраэдра, построенного на трех заданных векторах alf a2, а3» равен 1/6 объема параллелепипеда, построенного на тех же векторах. Последний объем равен абсолютной величине смешанного произведения трех исходных векторов. 3. Найти объем тетраэдра, построенного на векторах а1=з(—1, —1, 0), а2 = (1, 2, -3), а, = (0, 2, 3). Решение. Имеем 1—1—1 0| = —6—6 + 3 = —9, А = 1 2 —3 0 2 3 откуда У- (1/6) | Д | = (1/6)I —91-3/2. 4". Упражнения 1. Вычислите векторные произведения: а) (2^+зТ+ЩХ(-Т+Г-к); б) (27-~2j + 2k)X(t-T+k); в) (t+j)xf-1). 2. Вычислите смешанные произведения: а) (Г+Т, T+k, k); б) (2/ + Я k, f+k). 3. Составьте уравнения общего перпендикуляра скрещивающихся прямых (х-\)/1 = (у-1)/\=(г-1)/1 и (х-2)/3 = (у+2)/4 = (г-2)/Ь. ->-»->■-» -» -> 4. Вычислите объем тетраэдра, построенного на векторах 2t-\-j, 2j-\-k> 2k-\-i. 5. Составьте параметрические уравнения прямой, заданной пересечением двух плоскостей 2дс+3#—4г = 0, х-\-у-\-г—5 = 0* § 1.9. Системы линейных уравнений. Метод Гаусса* Теорема Кронекера — Капелли 1°. Системы линейных уравнений. Система пг уравнений с л неизвестными х19 х2, ..., хп, имеющая вид а1гхг + а12х2 + '••• + а1пхп = Ьи #2 А ~Г ^22*^2 ~Г • • • ~Т~ а2ПХП == ^2> / 1 \ ** А + А« А + • - • + <*тпХп = Ьт &U € R, Ь% 6 R), называется системой линейных уравнений', если все числа frif &2, ... •••» Ът равны нулю, то система (1) называется однородной, в противном случае—неоднородной. Набор чисел (#J, x\, ..., х?п) называется решением системы (1), если числа х\, х%, ..., х°п, будучи подставлены вместо хи х2У ..., хп в уравнение, обращают эти уравнения в тождества.
78 Глава I. Линейная алгебра* с элементами, аналитической геометрии Рассмотрим задачу об описании множества всех решений системы (1). В этом параграфе мы изложим метод, позволяющий найти все решения системы (или установить, что решений нет совсем),— так называемый метод Гаусса. Будет исследована структура множества решений системы (1) и связь решений системы (1) с решениями соответствующей однородной системы. Отдельно (см. § 1.10) будет рассмотрен такой случай системы (1), когда т = п, а определитель матрицы А = (аи) отличен от нуля (в этом случае решение системы единственно и может быть найдено по формулам Крамера, а также с помощью обратной матрицы). Теорема Кронекера — Капелли устанавливает необходимые и достаточные условия совместности системы (1), а также описывает свойства общего решения системы. 2°. Метод Гаусса решения системы линейных уравнений. В общих чертах метод Гаусса состоит в последовательном исключении неизвестных из уравнений системы (1), так что этот метод называют также методом исключения. Для упрощения изложения мы будем иметь дело не с самой системой (1), а только с матрицами из коэффициентов при неизвестных и свободных членов. Будем называть матрицу <ап а12 ... а1п #21 ^22 • • • ®2'г Кат1 атг • • • ап (2) матрицей системы (1), а матрицу /аг± а12 ..* а1п Ьг* #21 ^22 • • • ®2.ч ®% (3) кат1 ат% лтп ит* — расширенной матрицей системы (1); расширенная матрица (3) отличается от матрицы (2) дополнительным (последним) столбцом, составленным из свободных членов системы. Метод Гаусса состоит в том, чтобы с помощью преобразования матриц [начиная с исходной (3)] по правилам, описанным ниже, получить в результате вычислений матрицу вида (4) ^22 * • * 0 0 * *
* 7.P. Системы лин. уравнений. Метод Гаусса. Теорема* Кронекера — Капелли 79 Матрицей (4) задается система линейных уравнений, эквивалентная исходной (т. е. с тем же множеством решений; см. п. 3 комментария к методу Гаусса на с. 81,82). При этом общее решение системы (4) [или множество решений системы (4)] может быть легко описано. Назовем элементарным преобразованием матрицы каждое из следующих преобразований: 1) умножение одной из строк на произвольное число с последующим прибавлением результата к другой строке; 2) перестановку строк матрицы; 3) перестановку столбцов (без участия последнего). Правила преобразования матриц методом Гаусса. 1. Рассмотрим элемент аг1. Если аХ1 Ф 0, то умножая 1-ю строку матрицы (3) на подходящие числа (а именно на —а21/а11у —а31/а119 ..., —ап1/ац) и прибавляя результаты умножения ко 2, 3, ..., л-й строкам, добьемся того, что матрица примет вид «и 0 • 0 * в * * Если (2x1 = 0, то перед тем как применить указанные выше действия, переставим строки так, чтобы в левом верхнем углу был ненулевой элемент. Если же этого сделать нельзя (1-й столбец целиком состоит из нулей), то поменяем местами 1-й (нулевой) столбец с каким-нибудь ненулевым столбцом, а затем, если необходимо, поменяем местами строки, чтобы поместить в левом верхнем углу матрицы ненулевой элемент. Очевидно, что указанной цели можно достичь всегда, кроме случая, когда исходная матрица имеет вид 0 * * (Напомним, что последний столбец нельзя менять местами с другими столбцами.) Заметим, что матрица (6) имеет вид (4), а это значит, что главная цель преобразования методом Гаусса уже достигнута. 2. Рассмотрим матрицу B = (bl7), составленную 2, 3, ..., п-й строками и 2, 3, ..., т-ы столбцами матрицы (5), и ее элемент 6п; он находится на пересечении 2-й строки и 2-го столбца матрицы (5). Если &п=^=0, то умножая содержащую его строку на подходящие числа и прибавляя затем результаты умножения ко 2, 3, ..., (т — 1)-й
80 Глава /. Линейная алгебра с элементами аналитической геометрии строке матрицы B = (bi/)f можно добиться того, что матрица (5) преобразуется к виду «и * 0 Ь1± о о о о Если же элемент 6П = 0, то перед тем, как произвести указанные действия, переставим столбцы и строки матрицы В = (6/у), чтобы поместить в левый верхний угол ненулевой элемент. Этого можно, очевидно, достигнуть всегда, когда в матрице В = (Ь{;) есть хотя бы один ненулевой элемент. Если же матрица Б = 0, то матрица (5) имеет вид «и о 6 т. е. данная матрица уже приведена к виду (4). 3. Рассмотрим матрицу С [см. (7)] и произведем с ней те же действия, которые применяли ранее к матрицам А и В, и т. д. Следует иметь в виду, что- операции над матрицами и столбцами матриц В, С, ... распространяются и на объемлющие их строки и столбцы матриц (5), (7) и т. д. После того как все вычисления будут выполнены, получится матрица вида (4). Комментарии к методу Гаусса. 1) Для каждой матрицы, которая получается в ходе вычислений, можно однозначно написать соответствующую ей систему (неоднородных) линейных уравнений. Каждая операция, производимая над матрицей, является элементарной. Легко проверить, что две системы уравнений {А} и {В} такие, что {В} получена с помощью элементарной операции из {Л}, эквивалентны, т. е. множества их решений совпадают. Такая проверка состоит из двух шагов: 1) всякое решение системы {А} есть решение системы {В}—это вытекает из известных простейших свойств уравнений; 2) всякое решение системы {В} является решением системы {А}. Дело в том, что переход от системы {В} снова к си- * | С * (7) * 0 * (8)
1.9. Системы лин. уравнений. Метод Гаусса. Теорема Кронёкера— Капелли 81 стеме {А} является элементарной операцией, и утверждение 2 в этих условиях есть утверждение 1. Учитывая сказанное, можно находить множество решений системы (1) [т. е. решать систему (1)], исследуя (решая) систему, соответствующую матрице (4), что не вызывает затруднений. 2) При каждой отдельной операции метода Гаусса сохраняются ранг матрицы и ранг расширенной матрицы. Следовательно, эти ранги сохраняются и после применения всех операций метода Гаусса, т. е. ранги матриц (2) и (3) равны соответственно рангу матрицы (4) без последнего столбца и рангу расширенной матрицы (4). Из этого факта вытекает известная теорема Кронёкера — Капелли (см. § 1.9). 3) Покажем, как можно описать множество решений системы, соответствующей матрице (4). Итак, матрица (4) соответствует системе линейных уравнений вида {1иУ1 + 112У2+- • • +llryr + lu r+1r/r+1+ ... + llnyn = cu I ^22#2 + ' • • "Ь *2гУг ~Ь *2, Г+1Уг + 1 + • • • Н~ ^2пУ п = С2> КгУг + 1Г, г+гУг+1 + • • • + КпУп = сп I 0 = сг+и (9) I . ^===^Г + 2» Следует иметь в виду, что неизвестные уи у2, ..., уп—это старые неизвестные х19 х2, ..., хп, переставленные определенным образом; такая перестановка определяется перестановками столбцов, которые приходилось делать по ходу вычислений методом Гаусса. Поэтому решение системы (9) вместе с данными о том, какой х какому у соответствует, дает решение системы (1). Отметим, что последние п—г уравнений в системе (9) следует понимать как уравнения 0-Уг + 0-У2+ • • • +0-yrt = cr+i, 0-*/i + 0.*/2-f ..>+0-yn = cr+2, 0"'i + 0-#2+ ...+0-yn = cn. Если хотя бы одно из чисел сг+1, сг+2, ..., сп не равно нулю, то мы получим противоречивое равенство и несовместную систему уравнений (т. е. систему, не имеющую решений). Таким образом, для всякой совместной системы (1) числа cr+i, сг+2> •••> сп в системе (9) равны нулю. В этом случае последние п — г уравнений в системе (9) являются тождествами и их можно не принимать во внимание при отыскании решений системы (1).
82 Глава L Линейная алгебра с элементами аналитической геометрии Тогда система (9) примет вид [ lnUi + hjft + • • • + 112Уг + К r+iUr+i +'•••+ кпУп = ci> '22У2 + • • • + hiVr + hi г+гУг+i + • • • + КпУп = сг> (10) к hzUr \ *г, г + гУг + i + •••'!" КпУп —" сгт В этих равенствах перенесем все члены, содержащие yr+lt yr+i, ..., уп, из левой части в правую: 'nf/i+ '12У2+ • • • + 11гУг — с1 *i, г+гУг + г • • • —ппУп> ^ъгУг "Г • • • '1~^2гУг==С2 'г, г+гУг+i • • • 12пУп> п 1\ 1ггУг — сг V, г + гУг+1 • • • КпУп- Разумеется, система (11) эквивалентна системе (10) и системе (1). Отметим следующий важный факт: при любых значениях уг+и Уг+2> • • • t Уп неизвестные уи у2, ..., уг определяются однозначно. Действительно, в последнем уравнении уг можно выразить через yr+i, уг+2, ..., упу поскольку 1ГГФ0. Подставив найденное значение уг в левые части уравнений (И), можно из предпоследнего уравнения найти yr-i, так как коэффициент при уг_г есть lr_i% г_1^=0, и т. д. Можно было бы указать и общую формулу, позволяющую выразить уи у2, .*.,уг через уг+1, уг+2, . ..,#„> однако здесь ограничимся качественным описанием строения множества решений. 3°. Теорема Кронекера—Капелли. В нижеследующей теореме формулируется необходимое и достаточное условие совместности произвольной системы линейных уравнений. Теорема 1 (теорема Кронекера—Капелли). Система линейных уравнений совместна тогда и только тогда, когда ранг матрицы системы равен рангу расширенной матрицы этой системы. Как уже отмечалось, преобразования матриц методом Гаусса сохраняют ранг матрицы и ранг расширенной матрицы. Система (9) совместна тогда и только тогда, когда все сг+1, сг+2, ..., сп равны нулю. В этом случае, как легко проверить, ранг матрицы системы (9) т—г 1 ! hi *22 0' * 'trr 1 ° * 0 П—Г
л / р. Системы лин. уравнений. Метод Гаусса. Теорема Кронекера — Капелли 83, и ранг расширенной матрицы этой системы т—г < 122 * 0 '. ' Irr 0 * 0 1 n — r+l совпадают (оба равны числу г). Строгое доказательство теоремы Кронекера—Капелли приведено в 1.*9, 2. При выполнении условия совместности системы (1) я—г переменным уг+и уг+2, ..., уп можно придавать произвольные значения (эти переменные называются свободными), а остальные переменные Уи #2» • • • у У г однозначно вычисляются по известным значениям переменных yr+u yr+2J ..., уп. Таким образом, общее решение системы (1) зависит от п—г произвольных постоянных (произвольных значений уг+1, уг+2, ..., уп), где п—количество переменных в системе (1), а г—ранг матрицы (3) системы (совпадающий с рангом расширенной матрицы (4) системы). Отметим, что выделение свободных переменных уг+1, уг+2> • • •> Уп производится неоднозначно [систему (1) можно свести к системе с матрицей (4) различными операциями]. Однако не каждое подмножество из п—г игреков состоит из свободных неизвестных. 4°. Структура общего решения системы линейных уравнений. Отметим важное свойство множества решений системы линейных уравнений. Теорема 2 (о структуре общего решения системы линейных уравнений). Пусть х0 = (jcJ, х°2У ..., *£)—некоторое решение системы линейных уравнений \ вц*1 + а12х2 + • • • + а1яхп = Ьи I ааЛ + ЯгЛ + • • • + а2пхп = Ь29 \ат1х1+ат2х2+ ... +атпхп = Ьт, (12) Тогда всякое решение х—(х19 х2У ..., хп) этой системы имеет вид X — Х0 -f- Xi, (13)
84 Глава I. Линейная алгебра с элементами. аналитической геометрии где х1==(х[, х2, ...,х'п)—решение однородной системы уравнений, соответствующей системе (12): ( alxXi + а12х2 + ... + а1пхп = О, I а21Хг + #22*2 + • • • + а2ПХП = О, ,j^4 [<*mi*l + атЛ + - • • + аяпХп = О. Обратно, если x0J хг—соответственно произвольные решения си- стем (12) и (14), то х = х0 + х1 является решением системы (12). Комментарий к теореме 2. Пусть л: в формуле (13) «про- бегает» все решения системы (12). Вектор х0 в правой части (13) при этом остается постоянным (по условию теоремы), а вектор хх «пробегает» множество решений однородной системы уравнения. Утверждение теоремы иногда формулируют (допуская некоторую нестрогость) так: общее решение неоднородной системы уравнений является суммой некоторого (безразлично, какого) частного решения -*■ х0 неоднородной системы и общего решения соответствующей одно- родной системы. -*■ Доказательство теоремы 2. Пусть х—решение системы ->• (12) и х0—произвольное, фиксированное решение системы (12). Обо- ->->-> -»■ значим х—х0 через хг. Проверим, что х1 = (х1—х\, х2—xl, ..., хп—х°п) удовлетворяет системе (14). Для первого из уравнений (14) имеем а1г (*!—4) + я12 (х2—х*) +... +а1п (хп—х°п) =* *=а11х1+а12х2+ ... +а1пхп—(а1гх\ + а12х1+ ... +a2nx°n) = b1 — b1=:0. Здесь учтено, что а1гхг + а12х2 + ... + ^\пхп = h и аих1 + <*>!<& + + . - - +а1пх°п = Ь1, поскольку х и х0—решения системы (14). Аналогичные выкладки можно сделать и для остальных уравне- ний (14), поэтому вектор хг — х—х0 действительно является решением системы (14). Обратно, если х0—произвольное решение системы (12) и хг — произвольное решение системы (14), то их сумма х=^х0 + хг является решением системы (12). Проверим, что x = x0 + Xi удовлетворяет первому из уравнений (12): axi (xl + x[) + а12 (х°2 + х2) + ... +а1п (х*+х'п) = = (hi** + а1гх1 + ... + а1пхЪ + а1гх[ + а12х'2 + ... + а1пх'п = 0 + Ьг = bt. Аналогично можно проверить, что х удовлетворяет и остальным уравнениям системы (12).
$19. Системы лин. уравнений. Метод Гаусса. Теорема Кронекера — Капелли 85 5°. Пример. Методом Гаусса решить систему линейных уравнений Х1+ Х2+ Хн+ *4+ ^5=1, *i + *2 + 4*з + 3*4 + 5*5 = 2, \2xt+ л:2 + 9^3 + 2л:4 + 7л:5 = 3, L 4х± + 4л:2 + 7*з + 6*4 + 8хь = 5. Решение. Выпишем матрицу системы и расширенную матрицу системы: (а) —4 и 1 1 2 4 1 1 1 4 1 4 9 7 1 3 2 6 1 5 7 8 1 2 3 5 Поскольку #1! = 1=^=0, умножим 1-ю строку на —1, —2, прибавим соответственно ко 2, 3 и 4-й строкам; получим 1 0 .—1 о 1 1 3 2 7 0 3 2 1 1 4 5 4 (б) Так как элемент, находящийся на пересечении 2-й строки и 2-го столбца, равен нулю, то переставим строки или столбцы с тем, чтобы на этом месте стоял ненулевой элемент. Можно поменять местами 2-ю и 3-ю строки, а можно переставить 2-й столбец с 3, 4 или 5-м. Поменяем местами, например, 2-й и 4-й столбцы: (1 0 0 U 1 2 0 2 1 3 7 3 1 0 —1 0 1 4 5 4 1 1 1 1 1 ^ Теперь с помощью 2-й строки обратим в нуль щиеся на пересечении 2-го столбца с 3-й и 4-й из них случайно оказался равным нулю, так что в нуль второй элемент). Умножив 2-ю строку на к 4-й, получим 1 0 0 0 1 1 2 3 0 7 0 0 1 0 —1 0 1 4 5 0 1 ^ 1 1 о; Полученная матрица имеет искомый ступенчатый определить ранг матрицы данной системы. Он (в) элементы, находя- строками (первый осталось обратить —1 и прибавив ее (г) вид. По ней можйо равен количеству
86 Глава I. Линейная алгебра с элементами аналитической геометрии, (д) ненулевых строк в матрице (г) без учета последнего столбца (\ 1 1 11 0 2 3 0 4 0 0 7—15 (0 0 0 0 0; а также ранг расширенной матрицы системы; он равен количеству ненулевых строк в матрице (г) с учетом последнего столбца. Как видно из (г) и (д), оба этих ранга равны 3, и система совместна в силу теоремы Кронекера—Капелли. Для нахождения явного вида решения данной системы запишем систему линейных уравнений, соответствующую матрице (г): I Xi ~Г Х\ 4~ Х3 + Х2 ~Ь ХЬ == 1» 2*4 + Зл;з +4л:б=1, Как отмечалось выше, переменным *2, *5 можно придавать произвольные значения, которые однозначно определяют х19 *4, *3 (напомним, что *2, *б называют свободными переменными). Нетрудно явно выразить *i, *4, *3 через *2, *б: _ 1 2. _А #3 — J I J X2 J ХЬ> *4 = *2 \ 5 3'г= ~2 s J [уту^2 — ~f Хъ J ~ ~"~ 9 ^5 ТА 14 ^2+ 14*5— 7 14*2 14*5» 14 14^2 14' 14' 14' 1 _ _ _ __1_ /2 3 13 \ xi — 1 Х2 хь хь хз — 1 Х2 хь I "7 J4 *2 14 *^5 J /11 5>\_113_L9 IT'T^2 7 Хь)~~ 7 14 *2 ' И *5' 6°. Упражнения Выясните, совместны или несовместны системы уравнений: 1. 3, 3*1 + 4*2 = 7, 5*i + 3*2 == 8, *1+ *2 = 2. ( \3*i- f *i~ *2+ *з —2*4=1, -J 6*i — 6*2+10*3 — 8*4 = 5, V 5*1 — 5*2+ 8*3 — 7*4 = 3. 2*2+ х3— 4*4 = 5, 6*2 + 3*3—12*4 = 10. Решите системы уравнений или установите их несовместность: , J *i + 2*2 — #3 = 5, 7 ,# \2*i- ( 2*1 + 3*2— *3 = 5 5' \ 6*! 8. + 9*2 + 2*з = 8. 3*1— *2 + 2*з = 6, 2*1 — 3*2+ *3 = 0, 3*1 — 2*2 + 4*3 = 5, 4*1 — 3*2 + 7*3 = 8. + 2*2 —*3 = 5, *2 =6, ^2*1 + 3*2 + 2*3= 7, 5*1 + 4*2 + 3*з=12, *i+ *2 + *3= 3, \ 7*i + *2 + *з = 9. 1, 3*1 + 4*2 = 6, 5*1 + 6*2 = 8.
§ 7.Ю. Формулы Крамера. Обратная матрица. Решение матричных уравнений 87 Решите системы однородных уравнений, найдите базис в линейном прострав> стве множества решений: (*1 + *2 —3*з =0, Xl— *2 + *3 + 2*4=0, 3Xl + 3xt-9xs =0, *1 + 2лг2 —5*з— *4 = 0. 12. ( —Xi + *4 = 0, ( хг+ *2 + *з = 0, хх—х2— xs — 2*4 = 0, 13. i 2*! + Зл:2 + 3*з = 0, ^ 5*i — *2 — *^*3 — ~*4 == "• ч "*1 — *2 — *3 == ^. § 1.10. Формулы Крамера. Обратная матрица. Решение матричных уравнений 1°. Формулы Крамера. Рассмотрим частный случай системы линейных уравнений (1) § 1.9 при т = я: 011*1 + ^12*2 + • • • + ulnXn = fcl> ^21*1 ~Г #22*2 ~~Г • • • + а2пХП == ^2 > /1 \ #лА "Т" #n2*2 Н~ * • ' + аппХп = *V В этом параграфе будет доказано, что система линейных уравнений (1) при условии detA^O имеет единственное решение и что это решение может быть найдено по так называемым формулам Крамера, аналогичным соотношениям (2) и (3) § 1.6. Теорема 1. Если A = det^=7^0, то система (I) имеет единственное решение хг = Дх/Д, х2 = А2/А, ..., хп = Д„/Д, (2) где Д—определитель матрицы А=(а{/) системы (1), а Д;(* = 1, 2,..., ..., п)—определитель матрицы, полученной из матрицы системы заменой i-го столбца на столбец свободных членов. Формулы (2) называются формулами Крамера. Доказательство. Используем формулы разложения определителя по i-му столбцу: п а = 2 о*А„ (3) &= 1 где Aki—алгебраическое дополнение элемента ан в матрице А = (atJ) системы (1). Из формулы (3) вытекает следующее равенство: о= 2 я*А/ -(**/)• (4) k= 1 Действительно, рассмотрим матрицу А (//), полученную из матрицы А заменой /-го столбца на i-и столбец. Так как в матрице A (ij) есть Два одинаковых столбца (i-й и ;-й), то det Л (t/) = 0. Вычислим этот
gg * Глава I. Линейная алгебра с элементами аналитической геометрии определитель другим способом, а именно, разложив его по /-му столбцу. Заметим, что алгебраические дополнения элементов с номерами kj в матрице Лив матрице А (//) одинаковы; матрицы А и A (ij) отличаются только /-м столбцом, а этот столбец вычеркивается при вычислении алгебраического дополнения. Отсюда следует формула (4). Соотношения (3) и (4) можно сформулировать так: если сложить произведения элементов какого-либо столбца на их алгебраические дополнения, то получится определитель; если сложить произведения элементов какого-либо столбца на алгебраические дополнения соответствующих элементов другого столбца, то получится нуль. Умножив уравнения системы (1) соответственно на числа Аи, Л2/, ..., Ani и сложив результаты, получим *i (а1гАи + a2lA2i + ... +anlAni) + -\-x2(a12Au + a22A2i+...+ + Xt(auAu + auAu+ - • -ciniAni)+ (5) + xn (alnAu + a2nA2i+ ... +annAai) = =b1Au + b%Au+...+bnAni. В силу формул (3) и (4) левая часть (5) равна лг/Д, а правая часть, как легко видеть, есть определитель матрицы, полученной из матрицы А заменой /-го столбца на столбец свободных членов, вычисленный разложением по i-му столбцу. Итак, л;1Л = Д/, откуда л^/уЛ (i=l, 2, ..., п). Комментарий к теореме 1. Формулы (2), описывающие решение системы (1), имеют простой вид и аналогичны формулам (2) и (3) § 1.6. В § 1.6 было дано (довольно громоздкое) определение 2, обобщающее понятия определителей второго и третьего порядков. Теорема 1 подтверждает правомерность обобщения понятия определителя на случай матрицы размера пхп. Действительно, если пользоваться определением 2 § 1.6, то решение системы выражается формулами, аналогичными (2) и (3) § 1.6, так что это определение хорошо обобщает понятие определителя второго и третьего порядков. 2°. Система линейных уравнений в матрично-векторной форме. Формулы (2), а также свойства (3) и (4) определителей допускают интерпретацию в терминах теории матриц. Такая точка зрения удобна и во многих случаях упрощает вычисления. Систему уравнений (1) можно записать в матрично-векторной форме: Ах = Ь. (6) Здесь х=(х1, л-2, ..., #„) — вектор, координатами хг, х2У .'..,-*„ которого служат искомые неизвестные; b= (bl9 b2i ..., bn) — вектор,
J. 10. Формулы Крамера. Обратная матрица. Решение матричных уравнений 89 координатами которого являются свободные члены системы (1); ^ матрица коэффициентов системы. Левая часть равенства (6) есть результат умножения матрицы Л на вектор-столбец х (т. е. на матрицу с одним столбцом); равенство (6) есть равенство векторов Ах и Ь, эквивалентное системе из п равенств координат этих векто-. -+ -»■ ров. (Еще раз отметим, что Ах и Ъ—это векторы-столбцы или, что то же, матрицы, состоящие из одного столбца.) Таким образом, приходим к следующей задаче: даны матрица А ->• -* и вектор-столбец Ь\ требуется найти такой вектор-столбец ху что Ах = Ь. Если бы в уравнении (6) Л и & были бы числами, то, конечно, х = Ь/А, или х==А"гЬ. Оказывается, что решение уравнения Ах = Ь и в случае, когда Л матрица, а Ь—вектор-столбец, можно записать -> -» в виде л: = Л"1Ь, где Л""1—некоторая матрица (она называется матрицей, обратной матрице Л). Чтобы придать предыдущим словам точный смысл, рассмотрим соответствующие определения и теоремы. 3°. Обратная матрица. Определение. Матрицей, обратной квадратной матрице Л, называется матрица, обозначаемая Л""1, такая, что Л""1Л = £', где 1 £ = 1 О (единичная матрица).. О • I л) Пусть для данной матрицы Л существует обратная матрица Л'1. Тогда умножая эту матрицу на векторы Ах и b [см. равенство (6)], получим А-^А^^А-Ч. (7) Умножение матриц обладает ассоциативным свойством: K(LM) = = KL(M), поэтому вместо А"1 (Ах) в равенстве (7) можно написать (А*1 А) х и, далее, по определению обратной матрицы имеем (А'1 А) х= i=Ex = x. В последнем равенстве мы учли, что произведение единичной матрицы и любой матрицы N равно N (проверьте!). Итак, из равенства (7) следует, что х = Л~1Ь. Значит, если известна матрица Л"1, обратная Л, достаточно Умножить А~1 на вектор-столбец bf чтобы получить х. Заметим,
90 Глава I. Линейная алгебра с элементами аналитической геометрии I впрочем, что вычисление обратной матрицы является довольно трудоемким делом. Теорема 2. Справедливы следующие утверждения: 1) если для данной матрицы существует обратная матрица А~*, то она является единственной; 2) А и А"1—взаимно обратные матрицы, т. е. А~1А = АА~1=Е; 3) обратная матрица А~г к матрице А существует тогда и § только тогда, когда det А Ф 0. Доказательство приведено в 1*.10, ■■ Отметим, что некоторые утверждения теоремы 2 вытекают из явного вида обратной матрицы, задаваемого формулой (8). Проверка справедливости этой формулы производится непосредственным вычислением с использованием формул (3) и (4). Теорема 3. Пусть Л = (а/;.)—квадратная матрица размера пхп и detA=£0. Тогда матрица В = det А\ fAii A2i ..» Ап1у А±2 А22 ... Ап2 *in А2п ... Annj (8) является обратной к Л, т. е. А^ — В и ВА = Е. Здесь Аи—алгебраические дополнения элементов atJ- в матрице Л. Комментарий к теореме 3. Следует обратить внимание на то обстоятельство, что алгебраические дополнения Аи расположены в матрице не в естественном, а в «транспонированном» порядке. Так, на пересечении 1-й строки и 3-го столбца находится Л31, на пересечении 5-й строки и 7-го столбца—Л75 и т. д. Доказательство. Вычислим В А по правилам матричного умножения [см. формулу (14) § 1.4]. Имеем ^)"=d5ni(2 Akfik/ /e=l (9) В скобках в правой части формулы стоит сумма произведений элементов /-го столбца матрицы Л на алгебраические дополнения соответствующих элементов /-го столбца. Согласно формуле (3), эта fi сумма равна det Л при / = / и нулю при 1Ф]\ Отсюда ( 1 при t = /, W" Поприщ/, т. е. ВА = Е (единичная матрица) и матрица В является обратной к Л.
» jj0. Формулы Крамера. Обратная матрица. Решение,матричных уравнений 91 40. Решение матрично-векторных уравнений. Теорема 4. Решение системы уравнений Ах = Ь при условии det А Ф 0 является единственным и имеет вид х = А~% (10) где Л"*1—матрица, обратная к А. Комментарий к теореме 4. Существование матрицы А-*, обратной Л, гарантировано теоремой 2, единственность решения утверждается в теореме 1. Доказательство основано на рассуждениях, приведенных на с. 90. Рассмотрим простейшие матричные уравнения: АХ = В(1); ХЛ = Я(И); ЛХ5 = С(Ш). В этих уравнениях Л, В, С—заданные матрицы, X—матрица, подлежащая определению; размеры матриц таковы: в уравнении (I) Л — квадратная матрица размера их м (det Л Ф0), В и X—матрицы размера пхт\ в уравнении (II) Л—квадратная матрица размера nxn(det Л Ф0), Ji и X—матрицы размера тхп\ в уравнении (III) X и С—матрицы размера mxn, Л—квадратная матрица размера тхт (det Л =т^0), В—квадратная матрица размера пхп(detВФ0). Заметим, что указание размеров матриц накладывает на матрицы некоторые ограничения, которые, однако, довольно естественны: размеры матриц должны допускать матричное умножение, и матрица Л в уравнениях (I) и (II), а также матрицы Л и В в уравнении (III) должны быть квадратными (и невырожденными). Решения уравнений (I)—(III) имеют следующий вид: I. АХ^В^Х^А^В. Действительно, если обе части исходного уравнения умножить слева на Л-1, то получим Х = А~гВ. II. XA = B=>X = BA~\ Если умножить обе части исходного уравнения на Л"1 справа, то получим Х = ВА~г. III. Л%В = С=>Х = Л~1СВ-1. Достаточно левую и правую части этого уравнения умножить слева на Л"1 и справа на В*1. 5°. Примеры 1. С помощью формул Крамера решить систему уравнений ( 2хг—х2 =1, I —х1 + 2х2—х3 =0, 1 — х2 + 2х3 — х4 = 0,
92 Глава I. Линейная алгебра с элементами аналитической геометрии Д = = 2 2 —1 0 —1 2 —1 0 —1 2 -(-1) 1 —1 о 2 —1 Решение. Вычислим определитель А, используя разложение по 1-й строке: 2—100 -1 2—1 о 0—1 2—1 0 0—12 =*2(8—2—2) — 1 (4—1) = 8—3 = 5. Составляем определители A,(i = l, 2, 3, 4) и последовательно вычисляем их разложением по i-му столбцу: 1—10 0 о —1 Ai = А2 = 2—1 0 —1 2 -1 0—1 2 2 1 0 —1 0 —1 0 0 2 0 0—1 = 1 2—1 О —1 2 —1 0—1 2 = 1(8—2—2) = 4; —1 —1 2 —1 О —1 = 1 (4 — 1)= 3; Л4 = 2—11 О —1 2 0 0 0-10—1 О 0.0 2 2—1 0 1 —1 2—10 0—1 2 0 О 0—10 —1 = — 1 2 О О —1 —1 0 0 2 — 1 2 —1 0—1 2 О 0—1 = 2; = 1. Следовательно, ^ = 4/5, х2 = 3/5, *3 = 2/5, *4=1/5. 2. Найти обратную матрицу к матрице А = (1 2 0^ 13 2 ,0 1 3) Решение. Имеем det Л = 9—6—2=1. Вычислим алгебраические дополнения:. А1г= 3 2 1 3 ^21 — лЯ1 —- = 9-2 = 7; Л12 = = -6; Л22 = = 4; Л^2 = - 1 2 О з 2 О 1 О 2 О 3 2 1 О О 3 1 О 1 2 = -3; А13 = -3- Л - Г 2 — °у ^23— 0 J —2- A -Г 2 1 3 О 1 = -1; = 1; 1:
$ 1.10. Формулы Крамера. Обратная матрица. Решение матричных уравнений 93 Таким образом, /-7—6 А-* = ± -3 I 1 -1 Проверка: ( 7 -6 4^ л-м = —3 3 —2 1 —1 1 (\ 2 0\ I 1 3 2 10 1 3) 1 0 0\ о 1 о = е. ooi; 3, Методом обратной матрицы решить систему уравнений I %1 + *%2 + 4#з == А < ^ + 3X2 + 6X3=1, I *i ~Ь Зх2 ~f~ 7лг3 = — 3. Решение. Данная система уравнений в матричной форме имеет -> —f видЛя = Ь, где П 2 4 ^ f —2 ^ f *х ^ л = 1 3 6 U 3 7) , ft , X = *2 I Чтобы решить это матричное уравнение, воспользуемся формулой (10). Сначала находим det Л = 21 +12 + 12 —14 —18 —12=1. Затем вычислим алгебраические дополнения: 3 6 3 7 = 21 — 18 = 3; Л12 = 1 3 1 6 1 7 = —7 + 6 = — 1; Л13 = 1 3 = 0; А9Л — 2 4 3 7 1 4 1 7 = — 14+12 = —2; Л22 = 3 + 2 1; = 7—4 = 3; ^23 — " 1 2 1 3 Л31 = Отсюда 2 4 3 6 — 0'» ^32 1 4 1 6 = — 6 + 4=-2; Л33 = 1 2 1 3 = 3—2=1, 3 —2 1 Л-^-М -1 3 -2 ]. V 0 —1 Г
94 Глава I. Линейная алгебра с элементами аналитической геометрии \ \ Проверка: /3—2 ол А-1А = ( -1 з -2 •)[ 1 з б ) = [ о 1 о ) = Я. \ 0 — 1 1 Теперь по формуле (10) имеем 3 —2 0\ / — 2У Х = А-1Ь = [ -1 3 -2 )[ 1 ] = [ О —1 1 Ответ: хг — —8, д:2=11, х3 = —4. Заметим, что метод обратной матрицы особенно удобен, когда нужно решить несколько систем уравнений с одинаковыми левыми частями и различными столбцами свободных членов. Действительно, основная трудность в решении системы линейных уравнений методом обратной матрицы заключается в вычислении самой обратной матрицы. Системы линейных уравнений, отличающиеся лишь свободными членами, имеют одну и ту же обратную матрицу. Если вычислить обратную матрицу для одной системы, то для нахождения решения любой системы из рассматриваемой совокупности достаточно умножить (уже вычисленную) обратную матрицу на столбец свободных членов. 4. Решить матричные уравнения: a>(l l)*-0 4 I)- 6>*С ?) = ■o*o-(j;)- Решение, а) Это уравнение вида АХ = Ву его решение таково} Х = А~1В. Находим det Л == 1, Л ~det Л V—1 3/ — \—1 ЗУ# 3 начит, / 1 -2W1 2 7\_/ 1-6 -9\ л~~ V—1 3/ \0 4 8J~\— 1 10 17/* Проверка: /3 2\ / 1 —6 —9 \_ /1 2 7\ \1 \) V—1 Ю 17/~"V> 4 8/'
IАО. Формулы Крамера. Обратная матрица. Решение матричных уравнений 95 б) Это уравнение вида ХА = В\ его решение записывается так: X = BA~l. Имеем Л~1 = ( __j 3J. Следовательно, (-!>: в) Это уравнение вида АХВ = С\ его решение Х = А~1СВ~г. Находим Поэтому X=r(_l 4j (-2 о) (-2 б)(_То) = 1 / 1 __з\ /—3 —16\ 1 / 3 —64\ /—0,3 6,4\ == ТОV—1 4/ \—2 Ш/^^ТН—5 80/ Л 0,5 —8 /' Проверка: /4 3\ /—0,3 6,4\ /6 8\ /4 3\ / 11 4\ / 5 4\ VI 1/ \ 0,5 -8 )\2\ГVl 1/ V—13 —4^ = V—2 О/' 6°. Упражнения Решите по формулам Крамера системы уравнений: /3* j-jc =3 " ( *i + 2x2 + x3 = 8, ( Заг! + 5л:2 + л:з = 9, 1. I _** ' 2. \ 4jft —2хз = 3, 3. i *i + 2*a + 2x8 = 5, ^ *i *2- • J^ 3jci-4x2 +6x8=10. I 3^ + 4^2-5x3 = 2. 4. Найдите матрицы, обратные следующим матрицам: '2 —1 0\ /4 2 —1\ /3 2 Г а) [ 1 2 -1 ) ; б) [ 1 2 1 ); в) ' Б. Решите матричным методом системы уравнений: ( 4x1 + 3x2 + 7x3=l, ( —2^ — 3*2+ *з = 5, ( *i+x2 = 2, | Хх + лга —л:3 = 0, 6. \ *i + *2 — х3 = 3, 7. j Xi + 2x2 —лг3 = 2, ( 4*!+ 3*а+ 8*8 = — 2. I — *i — 2x2 + x3 = 2. [ 2^ + 3x2 = 5.
$6 Глава /. Линейная алгебра с элементами аналитической геометрии Решите матричные уравнения: 8. АХ = В, если А = (2 *Y Б = ([ ° ?V 9. ХЛ = 5, если А < о- п: j> /5 4 l\ 10. ДХВ = С, если Л = (5 J, В = /. 1 т), C-(J J J), § 1.11. Ядро и область значений линейного оператора. Альтернативы Фредгольма для линейного оператора в R" 1°. Ядро и область значений линейного оператора. Определение]. Ядром линейного оператора А, заданного в линейном пространстве -»•->-► L, называется множество К всех векторов x£L таких, что Ах = 0. Теорема 1. Ядро К линейного оператора А в линейном пространстве L является линейным подпространством в L. Доказательство. Пусть х, у£К\ это значит, что Ах = 0, Ау=0. Отсюда А(х + у) = Ах-\-Ау = 0 и х + у£К. Если дг^/С и X— -» ->• -> -» —> -> произвольное число, то Ах = 0, откуда А (Ях) = X (Ал:) = 0, т. е. Хх £ /С. Итак, множество К удовлетворяет условиям определения 7 § 1.1 и поэтому является линейным подпространством. Определение 2. Областью значений линейного оператора А, действующего в линейном пространстве L, называется множество S -» -> -» -» всех векторов x£L, таких, что х = Ау для некоторого y£L. Теорема 2. Область значений S линейного оператора А, действующего в линейном пространстве L, является линейным подпространством в L. -> -> Доказательство. Пусть хи x2£S. Это значит, что сущест- -» -»• -»->-#•-» вуют г/i, #2£L такие, что А#1 = х1, Ау2=.х2. Отсюда следует, что ^i + ^2€5, поскольку хг + х2 = А (уг + у2). Пусть x£S и К—произ- -> -» ->. вольное число. Так как существует y£L такой, что Ay = xf то Ъ; = А(А*/) и Xx£S. Итак, 5 удовлетворяет условиям определения 7 § 1.1 и поэтому является линейным подпространством. в 1*Л1, S дано определение ядра и области значений линейного оператора А, действующего из одного линейного пространства Ьг в другое линейное пространство L2. При этом оказываются справедливыми теоремы, аналогичные теоремам 1 и 2.
§ 1.11. Я^ро и область значений лин. оператора. Альтернативы Фредгольма 97 2°. Невырожденные и вырожденные линейные операторы. Среди всех линейных операторов, действующих в конечномерном линейном пространстве L, особое место занимают так называемые невырожденные линейные операторы. Определение 3. Линейный оператор А, действующий в конечномерном линейном пространстве L, называется невырожденным, если он задает обратимое отображение A: L—+L. Если отображение A: L-+L не имеет обратного, то линейный оператор А называется вырожденным. Комментарий к определению 3. Очевидно, что обратимость оператора А, т. е. существование обратного оператора, означает, что оператор А осуществляет отображение L на все L и при этом различные векторы под действием А переходят в различные векторы. Теорема 3. Справедливы следующие утверждения: 1) ядро невырожденного линейного оператора, действующего в конечномерном пространстве, состоит из одного нулевого вектора; 2) областью значений невырожденного линейного оператора, действующего в конечномерном линейном пространстве L, является все пространство L; 3) определитель матрицы невырожденного линейного оператора А в произвольном базисе пространства L не равен нулю; 4) обратно, если определитель матрицы некоторого линейного оператора в некотором базисе не равен нулю, то такой линейный оператор невырожден. Доказательство. Первые два утверждения теоремы вытекают из комментария к определению 3. Векторы-столбцы матрицы невырожденного линейного оператора линейно независимы (иначе образ линейного оператора не совпадает со всем пространством). Векторы- столбцы матрицы вырожденного линейного оператора линейно зависимы (иначе ядро оператора будет состоять из одного нуля, а образ совпадает со всем пространством, из чего следует обратимость, т. е. невырожденность линейного оператора). Последние два утверждения теоремы в силу сделанных замечаний являются следствиями теорем 1 и 2 § 1.7. * Теорема 4. Справедливы следующие утверждения: 1) множество решений всякой однородной системы из т линейных уравнений с п неизвестными является линейным подпространством 2) если х =(х[, х"2, ..., х'п) и х"=(х*1, х\, ..., д£)—два решения (неоднородной) системы линейных уравнений ( auXf + ai2x2 +...+alnxn = bi9 J a2lXt ~Г ^22*^2 "Ь ' * * ~T а2ПХП — ^2> /1 \ I aulXi + am2x2 +...+ amnxn = bm, 4 Jfc 2636
9& Глава I. Линейная алгебра с элементами аналитической геометрии то разность х'—х!'=(хх—х\, х2—х'2\ ..., х'п—л£) есть решение {однородной) системы уравнений ( anxt + ai2*2 + ... + а1пхп = О, J 0>%\%1 ~Г ^22-^2 I • • • Н~ а2П^П == *Л /Л\ 1 ая1Хг + ат2х2 +...+ атпхп « О. Комментарий к теореме 4, Система (2) называется однородной системой, соответствующей (неоднородной) системе линейных уравнений (1). Утверждение 2 означает, что всякое решение неоднородной системы (1) может быть представлено в виде суммы некоторого решения системы (1) (произвольного, но фиксированного) и подходящего решения однородной системы (2), соответствующей системе (1). Смысл утверждения 2 можно выразить еще так: если взять множество всех решений однородной системы (2) (а это есть линейное подпространство в силу утверждения 1) и прибавить к каждому решению некоторое (произвольное, но фиксированное) решение неоднородной системы (1), то эти суммы дадут решения системы (1), и этими суммами исчерпывается все множество решений системы (1). Таким образом, если известно одно решение системы (1) и все решения системы (2), то можно построить все решения системы (1). Доказательство. 1) Пусть х =(х'и х2, ,м,^)и/ = (^ #2> •••, *п)—два ранения системы (1). Это значит, что 0ii*i + ап*1 + • - + а>ы*'п = 0* au*'t + a%*xl + • * • + aiax^ = О, апх[ + а22х, + ... + а2пхп = 0, (а) а#& + а224 + •. • + а1я& = О, (б) ««А + ая9х'9 + • • - + *«»** = 0; атх\ + ат2х\ +...+. аяпХп - 0. Складывая построчно соответствующие равенства, имеем аа (xl+x'i)+ai2 (x'2 + xl) + ... +аи (х'п+х'п) ==0, «21 (x'i+jQ+*k (4+**)+ * • • +щп (4+4)=о, ami (x'i + *d + am2 (4 + 4) + • • • +втп (Хп + х"п) = 0, -► -> т. е. х' -\-х" есть решение системы (1). Аналогично, из равенств (а) при любом Я вытекает, что a11%x[ + al2Xxl+ ... + а1п%х„^0, а21кхх -\~ а22кх2 + » • • -h&2nXxn = и, атМ!+<*.№+ Н Omntek = °»
1AU Ядро и область значений лин. оператора. Альтернативы Фредгольма 99 т. е. foe' есть решение системы (1). В соответствии с определением 7 ^ 1.1 множество всех решений системы (1) является линейным подпространством. 2) Согласно условию, справедливы равенства а11х[ + а12х,2+ .. - +ai«*n = *i a11xl + a12x"2+ ... +ainXn = bu 02i*I + ад + • • • + а2п*'п = К (а) я2Л + 022*з + • • • + а2пх"п = 6а, (б) аот1л;' + 0„2*2 + • • • + <*тпХп = V» 0Л,х1 + ашх\ + ... + аил^ = 6Я. Вычитая из уравнений (а) соответствующие уравнения (б), получим ап (*;—*!) + «12 W—*?) + • • • + fli„ (**—**) = О, «21 (*i—*i) + ^ (** —*Э + • • • + 02я (**—**) = О, яЯ1 (*i—*i) +0/»2 W—*Э +.•-+«*« (** — **) = О, -*■ -> т. е. х'—хг,= (х[—#i, х2—х\, *..,хп—х"п) является решением (однородной) системы (2), что и доказывает утверждение 2. 3°. Альтернативы Фредгольма, Важную связь между множеством решений двух систем уравнений устанавливает следующая теорема. Теорема 5 (альтернативы Фредгольма). Для всякой системы из т линейных уравнений с п неизвестными 011*1 + 012*2 + • • • + 01*** = Ьи 021*1 ~Н 022*2 ~Т~ • • • ~Г Щп$п == ^2> ^ а»Л + а«Л + • • • + атпхп = Ьа (3) справедливо одно из двух утверждений: либо система (3) имеет решение при любых значениях bit b2, ... Ът и тогда система однородных уравнений апУ1 + a2i</2 + • • • + атхУт =■ О, <hd!i +«2#2 + • • • +аа2ут = О, «i^i + атУг + • • • + атпут = О (4) имеет лишь тривиальное решение {ух = О, у2 = 0, ..., у^ = 0); либо система (3) при некотором наборе bu b2J ..., bm несовместна, и тогда система (А) имеет нетривиальное решение. Комментарии к теореме 5. 1) Матрица коэффициентов в системе (4) получается транспонированием матрицы коэффициентов системы (3). 2) Теорему 5 можно сформулировать в более общих терминах. При этом формулировка становится более естественной (см. § 1М1, 2). 4*
100 Глава I. Линейная алгебра с элементами аналитической геометрии Доказательство теоремы 5. Рассмотрим первую альтернативу: пусть система (3) имеет решение при любом наборе Ьи &2, Ьт. В этом случае ранг г Рис. 18 матрицы системы (3) должен быть равен т, иначе (т. е. если ранг меньше т) при некотором наборе Ъи Ь2, ..., Ьт ранг расширенной матрицы системы (3) окажется больше, чем г, а система (3) в силу теоремы Кронекера—Капелли будет несовместной. При этих условиях ранг системы (4) также равен т, т. е. числу неизвестных в системе (4), и эта система имеет лишь нулевое (тривиальное) решение. Рассмотрим вторую альтернативу: пусть система (3) при некотором наборе Ь1У Ь2, ..., Ът несовместна. Следовательно, ранг матрицы системы (3) меньше т\ ранг матрицы системы (4) также меньше т и, значит, система (4) имеет нетривиальное решение. 4°. Примеры 1. Оператор А ортогонального проектирования на подпространство L0 имеет областью значений подпространство L0, а ядром оператора А является множество «S всех векторов, ортогональных каждому из векторов в L0. Описанное множество S является линейным подпространством. 2. Рассмотрим систему уравнений (2х + у+г = 0, {х—y + 2z = 0. ( ' Решения данной системы—это некоторое множество векторов, которое может быть истолковано как множество точек в Е3: точка соответствует концу вектора, начало которого совпадает с началом координат. Как точечное множество, решения системы составляют прямую /, проходящую через начало координат (рис. 18). Таким образом, как и утверждается в теореме 3, множество решений однородной системы уравнений есть линейное подпространство. Рассмотрим систему уравнений ( 2x + y + z = 5, {x—y + 2z = 2. () Очевидно, что система (5) есть однородная система уравнений, соответствующая (6). В соответствии с утверждением 2 теоремы 4 множество решений системы (6) может быть получено из множества решений системы (5) (а это множество представляет собой прямую, проходящую через начало координат) сдвигом на некоторый вектор (*0, yQ, z0), удов-
$ 111. Ядро и область значений лин." оператора. Альтернативы Фредгольца 101 летворяющий системе (6). Найдем один из таких векторов. Положим г0=*0 в равенствах (6) и решим систему уравнений ( 2х + у = 5, \х—у = 2, откуда х0 = 7/3, */0 = 1/3, г0 = 0. Таким образом, решения системы (6) изображаются прямой, параллельной / и сдвинутой по отношению к / на вектор (7/3; 1/3; 0). 3. Дана система уравнений ( x + 2y + 3z = bf, \2x + 4y + 6z = b2. Является ли она совместной при любых значениях bt и 62? Z1 2 3\ Решение. Ранг матрицы ( 2 4 6 ) данной системы равен 1. Если же к этой матрице приписать справа столбец fQ J, то у расширенной матрицы системы ранг окажется максимально возможным, т. е. 2. Согласно теореме Кронекера—Капелли, система уравнений / * + 2*/ + 3z=l, \ 2* + 4y + 6z = 0 (7) несовместна (это можно установить и непосредственно, без обращения к теореме Кронекера — Капелли). Следовательно, ответ на поставленный вопрос отрицателен. В силу теоремы 5 система однородных уравнений */i + 2*/2 = 0, 2^ + 4^ = 0, (8) должна иметь нетривиальное решение (т. е. не состоящее из одних нулей). Действительно, решением является, например, z/i=2, у2= — 1. [Напомним, что матрица системы (8) является транспонированной по отношению к матрице системы (7).] 4. Дана система уравнений ( x + 2y + 3z = bif \ 3x + 4y + 6z = b2. (9) Является ли эта система совместной при любых Ь± и 62? Решение. Ранг матрицы L 4 А системы (9) равен 2. Ранг расширенной матрицы системы не может быть меньше, чем 2, и не может быть больше, чем 2; следовательно, ранг расширенной матрицы системы (9) при любых Ъ± и Ъ2 равен рангу матрицы системы, и система (9) совместна. Значит, ответ на поставленный вопрос положителен.
102 , Глава /. Линейная алгебра с элементами аналитической геометрии Рассмотрим однородную систему уравнений ( </i + 3*/2 = 0, 2^ + 4^ = 0, (Ю) В соответствии с теоремой 5 система (10) имеет лишь нулевое решение, таю как ранг матрицы системы совпадает с количеством неизвестных. 5°. Упражнения Установите, какая из альтернатив Фредгольма имеет место для каждой из следующие систем уравнений: Ьхг + ь^Ьь ( хг + х2 + хг^Ъъ ( 0Х1 + 2Х2~Хз^ !> 1 х х -Ь ' 1 2х 4~2г Л-9х -h * V 2%~ **+3*i = *i. \ Xl—x2-t>2. \ гх1^гх2-\-гх^~~ь2. у Ъх^+ Х2+2х3=Ь3. ( Xi + 2x2 = bif / Xl + 2x2 + х3=Ьи 4. j| 2xt+ х2 = Ь2, 5. I xt+ л:2 + &%=^^ { 3*!+ д% = &3. ( х1-\-2хг+2хг=*Ь9. § 1.12. Собственные векторы и собственные значения линейных операторов 1°. Определение собственных векторов и собственных значении. Определение 1. Собственным вектором линейного, оператора А, действующего в линейном пространстве L, называется ненулевой -> вектор x£L такой, что для некоторого числа % выполняется соотношение -* -*• Ах = кк* (1) Число X в этом случае называется собственным значением (числом) -**' линейного оператора- А. Говорят, что собственный вектор х принадлежит собственному значению А.. Комментарий к определению к Как утверждает опре- -> деление, собственный вектор х под„действием линейного оператора А переходит в вектор, коллинеарный самому себе. Иными словами, при действии линейного оператора собственный вектор просто умножается на некоторое число. В то же время несобственные векторы под действием оператора А преобразуются более сложным образом. Понятие собственного вектора является оченв полезным и удобным в изучений многих вопросов линейной, алгебры; Пр>н этом главная идея использования собственных вектороа заключается в следующем. Действие оператора А на свои собственные векторы сводится к умножению этих векторов на некоторые числа. Если некоторый вектор представляет собой линейную комбинацию собственных векторов, то
1Л2. Собственные векторы и собственные значения линейных операторов действие линейного оператора А на такой вектор есть умножение каждого слагаемого в этой линейной комбинации на некоторые числа (каждое слагаемое, т. е. собственный вектор, умножается на свое число—собственное значение). Тем самым возникает подход к решению вопроса о том, как действует заданный линейный оператор. —> Очевидно, что если х—собственный вектор линейного оператора А, принадлежащий собственному значению Я, то и всякий вектор, коллинеарный вектору х, также является собственным вектором, принадлежащим тому же собственному значению К: -+ -»• ~» -► -> —► А* = Кх => A (\ix) = \i (Ах) = \i (kx) = X (fxx). Не всякое число, как мы увидим в дальнейшем, является собственным значением данного линейного оператора А: множество собственных значений линейного оператора А, действующего в п-мерном линейном пространстве, состоит в общем случае из п (возможно, комплексных) чисел, среди которых могут быть совпадающие. Как было отмечено в§ 1.4, линейные операторы удобно изучать, рассматривая матрицы линейных операторов (напомним, что матрица однозначно соответствует линейному оператору, если в линейном пространстве, в котором действует оператор, выбран базис). Естественно, что собственные векторы и собственные значения линейного оператора можно исследовать с помощью матриц. 2°. Вычисление собственных значений и собственных векторов. Связь между линейными операторами и матрицами, описанная в § 1.4, состоит, в частности, в выполнении следующих свойств: каждому линейному оператору А в заданном базисе линейного пространства L соответствует матрица. При этом сумме линейных операторов соответствует сумма матриц, произведению линейных операторов—произведение матриц, а применению оператора к вектору—умножение матрицы на матрицу-столбец, составленную из координат вектора в рассматриваемом базисе. Рассмотрим матрицу Л, соответствующую линейному оператору А, -» и вектор-столбец х, составленный из координат собственного вектора в данном базисе. Равенство (1), определяющее понятие собственного вектора линейного оператора, в матричных обозначениях запишется так: Ах = кх, (2) или в развернутом виде / а1гхг +а12х2+ ... +alnxn = facu I ЯгЛ ~\~аъгхг ~Ь • • • ~г а-2пхп — А*2» /о\ { ап1хг + ап2х2 + . •. + аппхп = Kxnt
104 Глава /. Линейная алгебра с элементами аналитической геометрии где aif (iy / = 1, 2, ..., п)—элементы матрицы Л, a xiy х2, ..., хп — координаты вектора х (в заданном базисе пространства L). Равенства (2) и (3) можно рассматривать без всякой связи с линейным оператором, базисом линейного пространства и собственным вектором линейного оператора. В этом случае удобно следующее определение. Определение 2. Пусть А—квадратная матрица размера пхп и х—ненулевая матрица-столбец. Если для некоторого числа А,спра- ведливо соотношение Ах = Хх, то х называется собственным вектором матрицы Л, а X—собственным значением, или корнем; говорят, -> что вектор х принадлежит собственному значению X. Равенства (3) представляют собой однородную систему линейных уравнений относительно неизвестных xif x2, ..., хп при фиксирован- -> ном числовом значении X. Если х—собственный вектор (по определению собственный вектор не равен нулю), то однородная система уравнений имеет (при фиксированном X) ненулевое решение. Из теоремы Кронекера—Капелл и следует, что однородная система линейных уравнений имеет ненулевое решение тогда и только тогда, когда ранг матрицы системы меньше количества неизвестных. Применительно к рассматриваемому случаю, т. е. при условии, что количество неизвестных равно количеству уравнений, однородная система (3) будет иметь нетривиальное решение тогда и только тогда, когда det (Л — Щ = 0. (4) В самом деле, если переписать систему так, чтобы в правых частях уравнений были нули: ( (ali—X)xi + al2x2+ ... +ainxn =0, a2i*i + (^22—^) *■+••• +а*пхп = °» /5) a„i*i + а„А + • • - + (аПп—*) хп = 0 и рассмотреть матрицу этой однородной системы уравнений, т# е. 'aii —Я «12 ••• Чп \ #21 #22 — X ... а2п \ /ох \ani ап2 ••• апп — X/ то можно заметить, что матрица (6) имеет вид А—ХЕ, где £=з "■ °\ I—единичная матрица. Таким образом, условие равен- °" ■./ ства нулю определителя матрицы системы (3) [или, что то же, матрицы системы (5)] имеет вид (4).
12 Собственные векторы и собственные значения линейных операторов 105 Очевидно, что условие (4) выполняется не всегда, т. е. не при всяком X. Соблюдение условия (4) означает, что X является корнем некоторого многочлена, поскольку левая часть (4) представляет собой многочлен относительно переменной X с коэффициентами, зависящими от элементов матрицы Л. /#ii а12\ Пусть Л = ( )—матрица второго порядка. Тогда [#11—X #12 I #2i а22-%Г (flu_X) (^«-^-^Ai - = X2—(аХ1 + а22) X + а1хап —а21а12. (#ц #i2 «13\ a2i #22 #23 J—матрица третьего порядка. Тогда N#3i #32 #33 deb (А— Щ = #11]—X #12 #13 #21' #22—X #23 I #31 #32 #33 — X I 8=5 fan—Я) (^22—^) («88—^) +«lA8«8i +018^81^82—«13 fe ~ ^) ^31 ~ —a12a2i (а33—Х)—(а11—Х)а23а32 = = — Я3 + Я2 (Дц + а22 + «88) —^ (^22088 —023^32 + Яц«88 ~ 013031 + "Т~ 0Ц022 012021/ i 0Ц022033 "Г 013021032 ' 012023031 013022031 012021033 0Ц023032* Определитель третьего порядка был раскрыт по правилу Сар- руса, после чего были приведены подобные члены. / 15 15\ ^ Пример. Пусть Л = ( q _7/" этом слУчае Уравнение (4) имеет вид dzt(A—XE)=det( ^8~Х _^_x) = Jt* + 7A,—I5fc—105 + : 120 = Собственными числами (корнями) матрицы являются Яь 2 = = 4 4: Kl6—15 = 4 ± 1, т. е. Jii = 5, Х2 = 3. Этим собственным числам соответствуют собственные векторы (согласно определению 1). Собственные векторы, принадлежащие данному собственному значению X, можно найти из системы (5). В данном случае для Х = 5 имеем ( (15—S)x1 + lSx2=^0J ( 10^ + 15x2 = 0, 1 — 8*i+ (—7—5)^ = 0^ \ — 8jq — 12х2 = 0, откуда Arx = — (3/2)д:2, и решением этой системы является, например,' вектор (—3, 2) (остальные ее решения пропорциональны найденному). Таким образом, собственный вектор, принадлежащий собст-
106 Глава 1, Линейная алгебра с элементами аналитической геометрии венному значению X = 5, имеет вид х = ( 2 ) или ( 2 J, где \i — любое ненулевое число (см. комментарий к определению 1)^ Уравнение (4), левая часть которого является многочленом от переменного X, играет ключевую роль во многих вопросах линейной алгебры и ее приложений. Определение 3. Для всякой квадратной матрицы А = (а^) уравнение с1е1:(Л—ХЕ) = 0 относительно переменной X называется характеристическим уравнением. Многочлен det (А—ХЕ) называется характеристическим многочленом матрицы А. Очевидно, что характеристический многочлен матрицы я-го порядка имеет степень п: среди всех членов определителя имеется ровно один член, содержащий X в каждом из п множителей, а именно (а1г—X) (а22—X) ... (апп—К). Это произведение является многочленом степени п с коэффициентом (—1)" при Хп, а остальные члены определителя имеют меньшую степень. Из предыдущих рассуждений вытекает следующее утверждение. Теорема 1. Собственные значения квадратной матрицы А=(atj) являются корнями характеристического уравнения матрицы. Теорема 1 мотивирует следующее определение. Определение 4. Корни характеристического уравнения матрицы называются также собственными значениями, собственными числами и корнями матрицы. Комментарии к теореме 1. 1) Так как для квадратной матрицы порядка п. характеристическое уравнение является алгебраическим уравнением л-й степени, то максимально возможное число различных собственных значений для матрицы А равно п. Корни характеристического уравнения могут быть комплексными, а также кратными, т. е. совпадающими. Уточнения и подробности см. в п. 2° §1*.12. 2) Каждому собственному значению X соответствует по крайней ->• мере один собственный вектор х^ (точнее говоря—по крайней мере одномерное линейное пространство, состоящее из всех собственных векторов и нулевого вектора). Однако множество S^ собственных векторов с данным собственным значением, дополненное^ нулевым вектором, может представлять собой более широкое множество, чем одномерное линейное подпространство, причем всегда такое множество есть линейное пространство: следовательно, 5^ может быть одномерным, двумерным, ..., ^-мерным линейным подпространством в L (относительно единичного оператора всякий ненулевой вектор является собственным, принадлежащим собственному значению 1). Теорема 2. Пусть SK и S^—линейные пространства, состоящие из собственных векторов оператора А, принадлежащих соответственно собственным значениям X и \к (Хф\к), и нулевого вектора. Тогда S^nS^={0}. Доказательство приведено в § 1*.12, |.
/ 12 Собственные векторы и собственные значения линейных операторов ДО7 Комментарий к теореме 2. Из теоремы 2 вытекает простое следствие: всякое множество собственных векторов, принадлежащих различным собственным значениям, является линейно независимым. 3°. Подобные матрицы. В теореме 1 утверждается некоторое свойство собственных значений матрицы А. Понятия собственного значения для линейного оператора А и его матрицы в заданном базисе, как видно из определений, совпадают (точнее говоря—соответствуют друг другу). Следует иметь в виду, что одному и тому же линейному оператору в различных базисах соответствуют различные матрицы, и у каждой такой матрицы имеется некоторое количество собственных значений. Возникает вопрос: как связаны собственные значения линейного оператора с собственными значениями матриц, которые соответствуют этому оператору в различных базисах? Оказывается* что множество собственных значений линейного оператора А совпадает с множеством собственных значений матрицы линейного оператора А в любом базисе, так что различные матрицы, соответствующие одному и тому же оператору А (в разных базисах), имеют одно и то же множество собственных значений. Строгое доказательство этого приведено в § 1*.12, 2. Рассмотрим теперь характеристический многочлен к характеристическое уравнение матрицы А. Пусть А—матрица линейного оператора А в некотором базисе. Изменим базис линейного пространства, в котором действует оператор А, при этом изменится и матрица линейного преобразования. Однако характеристический многочлен и характеристическое уравнение этой матрицы не изменятся. Рассмотрим в общих чертах основную прлчину неизменяемости (инвариантности) характеристического многочлена. Как известно, всякий многочлен Р (к) степени п (в поле комплексных чисел) можно разложить в произведение множителей видаХ—КкУ где %k{k~lx 2,...., п) — корни многочлена. Точнее, если Р (к) = а0Хп + а1Хп'1 + ... +ап и Xiy Я2, ..., Хп — корни этого многочлена, то имеет место тождество Р(Х) = а0(Ь-К)(Ь-К) ... (*—Ю- .(7) (Этот факт, т. е. сущестаование м комплексных корней у многочлена я-й степени и разложение (7), является одним из вариантов так называемой основной теоремы алгебры,; ем, § 5Ж) Как отмечалось выше, коэффициент а0 при Хп у характеристического многочлена равен (—1>Л и не зависит ни от оператора А, ни от бааиса. Формула (7) показывает, что все коэффициенты, характеристического многочлена (а значит, и сам многочлен) полностью определяются корнями Xi, Jt2, ..., Хпг т. е. собственными значениями линейного оператора А. Ранее было показано, чте собственные значения ^1, Я2, ..., Хп не изменяются при переходе к другому базису. Следовательно, характеристический многочлен и характеристическое Уравнение не изменяются при изменении базиса линейного про-
103 Глава I. Линейная алгебра с элементами ^ аналитической геометрии странства. Приведенные рассуждения t=2Q'+-'*m позволяют сформулировать следующие г 9i zh определения и теоремы. Определениеб . Две квадратные матрицы называются подобными, если уг 1 каждая из них является матрицей од- Щ/г A3*ZA$t+<?A!k ного и того же линейного оператора А в некотором базисе. Рис* 19 Определение 6. Множество корней характеристического уравнения матрицы А (с учетом их кратности) называется спектром матрицы Л. Комментарий к определению 6. В силу теоремы 1 спектр матрицы состоит из собственных значений матрицы и только из них. Теорема 3. Характеристические многочлены и спектры подобных матриц совпадают. Определение 7. Спектром линейного оператора, действующего в линейном >г-мерном пространстве L, называется спектр каждой из подобных матриц, соответствующих линейному оператору при выборе базиса в L. Характеристическим многочленом линейного оператора, действующего в линейном n-мерном пространстве L, называется характеристический многочлен каждой из подобных матриц, соответствующих линейному оператору при выборе базиса в L. Комментарий к определению 7. Определение имеет смысл (корректно) в силу того, что характеристические многочлены подобных матриц совпадают. 4°. Примеры 1. Рассмотрим в пространстве L2 базис из двух векторов gt и g2. Определим линейный оператор А в L2 условиями Ag1 = 3g1, Ag2 = -> =—2g2. Действие А на другие векторы можно определить «по линейности»: А (с& + c2g2) = dAgi + c2Ag2 = 3^—2^ (рис. 19). В соответствии с определением 1 векторы gx и g2 являются собственными и имеют собственные значения 3 и —2. Есть ли у оператора А другие собственные векторы и другие собственные значения? Можно проверить, что всякий собственный вектор оператора А имеет вид agt или $g2, где а, р—любые не равные -»• -* нулю числа. Собственные векторы agx и pg2 принадлежат собственным значениям 3 и —2 соответственно. Значит, множество собственных значений оператора А состоит только из чисел 3 и —2. - 2. Пусть линейный оператор А есть поворот на угол ф Ф я дву-
& 1 12 Собственные векторы и собственные значения линейных операторов 109 мерного евклидова пространства Е2. Каковы собственные векторы оператора А? Другими словами, каковы те векторы, которые в результате поворота на угол <р становятся коллинеарными самим себе? Очевидно, что таких векторов (кроме нулевого) не существует. Тем не менее'можно выбрать базис в £2, записать матрицу линейного оператора А, а затем систему линейных уравнений (3), которая будет иметь ненулевое решение, если К—корень характеристического уравнения. Кажущееся противоречие (с одной стороны, собственного вектора не существует, а с другой—его можно вычислить) разрешается так: собственные числа оператора А являются не действительными, а комплексными числами, вследствие чего и собственные векторы получаются комплексными. На рисунке могут быть изображены только вещественные векторы. Этот пример показывает, что в определении линейного пространства важно указывать, на какие числа можно умножать векторы (см. определение 7 § 1*.1), или в более точной формулировке—над каким полем рассматривается линейное пространство. 3. Рассмотрим оператор А ортогонального проектирования на ^-мерное подпространство М евклидова n-мерного пространства £?. Каковы собственные векторы оператора А? Заметим, что всякий вектор подпространства М под действием -> -► оператора А переходит в себя («проектируется сам в себя»): Ах = х -> Ух£М. Это значит, что всякий ненулевой вектор из М является собственным вектором оператора А, принадлежащим собственному значению 1. Пусть Мг—ортогональное дополнение М в L, т.е. множество всех векторов из L, которые ортогональны каждому из М. Очевид- -> -► ->• но, что если х£М, то Лл: = 0. Таким образом, каждый ненулевой вектор из Мг является собственным вектором оператора проекции А, принадлежащим собственному значению, равному нулю. Заметим, что из собственных векторов оператора проекции на fe-мерное подпространство можно составить базис всего линейного пространства L. Пусть задан некоторый линейный оператор, действующий в линейном пространстве L. Можно ли выбрать базис линейного пространства, состоящий из собственных векторов оператора А? Ответ на этот вопрос таков: не всегда, т. е. не для всякого линейного оператора. Правда, для «большинства» линейных операторов базис из собственных векторов выбрать можно, и лишь для «меньшинства» линейных операторов (удовлетворяющих некоторым специальным условиям) этого сделать нельзя. Подробнее см. § 1*. 12, 3. 4. Каковы собственные значения и собственные векторы линейного оператора А, матрица которого имеет вид (ь 1\ <*>
110 Глава I. Линейная алгебра с элементами аналитической геометрии где Ъ—некоторое число? Предполагается, что оператор А рассматривается в базисе g1 = (li 0), g2 = (0, 1) (хотя выбор базиса в данном случае не имеет значения). Решение. Координаты собственного вектора (х1у х2), принадлежащие собственному значению Л, удовлетворяют системе (3), т.е. в данном случае ( Ьх±+х2 = Кхи [ Ъх2 = 1х2. (9) Перенося все члены в левую часть, получаем систему |(й_Я)*1 + *2 = 0, \ ф-Х)х2 = 0. (Ш) Для того чтобы X было собственным значением оператора А [или, что то же, его матрицы (8)], необходимо и достаточно, чтобы матрица Ь-Х 1 W* IN/, 0 о £_яу~"\о ь) \о 1 была вырожденной: /Р-* 1 \ det( 1 = 0, откуда ф—Я)2 = 0, т.е. Х = 6. Итак, матрица (8) имеет единственное собственное значение К~Ь. Найдем собственный вектор (или собственные векторы), принадлежащие этому собственному значению. Рассмотрим систему (10) при l = b, т.е. | 0.^1 + х2 = 0, | 0х2 = 0. Этой системе удовлетворяют векторы (хи х2) вида (с, 0), где с—произвольное число, и только они. Следовательно, всякий вектор (с, 0) (сфО) — собственный вектор оператора А, принадлежащий собственному значению Ь, и других собственных векторов нет. Все найденные векторы коллинеарны друг другу и среди них нет двух линейно независимых. Поэтому и базис в L2 из собственных векторов оператора А составить нельзя. 5. Пусть оператор А таков, что из его собственных векторов можно составить базис линейного пространства L, в котором действует А. В этом случае матрица оператора А в базисе, состоящем из собственных векторов, имеет особенно простой вид. Обозначим ->■ -> -» через gi9 g-2, ..., gn собственные векторы оператора А, а через Xlf Я2, ..., Хп—соответствующие этим векторам собственные числа. По- строим матрицу оператора А в базисе (gly g2, ..., gn). Для этого
13 Собств. векторы и собств, значения самосопряженных операторов 111 по правилам § 1.4 рассмотрим Agi$ разложим этот вектор по базису iff i? Sr) и запишем коэффициенты разложения в /-й столиц. По определению собственного вектора имеем Aft = ^ff, (« = 1, 2, л)- (И) Коэффициенты разложения (11) таковы: (0, 0, ..., О, Я,.; О, ... 0), где Х{ стоит на f-м месте. Значит, искомая матрица имеет вид (К 0 0 К 5°. Упражнения Найдите собственные значения и собственные векторы линейных операторов, заданных в базисе (е1? е2, ..., еп) следующими матрицами: п = 4, Установите, существует ли набор из п линейно независимых собственных векторов для каждой из следующих матриц размера пХп: Л 0 2\ / 1 0 0\ /3 1 0 ON 7. (г *} . 8. ( 0 2 Q L 9. ( — I I 3 1. 10. ^2 0 0/ \ ! ° х) '•CD- 0 0 0 3 0 0 1 3 0 б г 3 § 1ЛЗ* Собственные векторы и собственные значения самосопряженных операторов. Теорема о полноте собственных векторов Iе. Теоремы о самосопряженных операторах. В § 1.12 были рассмотрены основные свойства собственных векторов и собственных значений для произвольного линейного оператора А. Теперь рассмотрим
112 Глава I. Линейная алгебра с элементами аналитической геометрии основные свойства собственных векторов и собственных значений самосопряженных линейных операторов. Дополнительное предположение о самосопряженности линейного оператора (см. § 1.5) влечет за собой особые свойства собственных векторов и собственных значений. Важнейшие свойства такого рода сформулированы в следующих теоремах. Теорема 1. Собственные значения вещественного самосопряженного линейного оператора А, действующего в вещественном линейном пространстве, являются действительными числами. Теорема 2. Пусть А—самосопряженный вещественный линейный оператор, действующий в вещественном (конечномерном) линейном евклидовом пространстве Е. Тогда множество Q собственных векторов линейного оператора А обладает следующим свойством (свойством полноты множества Q): в пространстве L существует ортонормированный базис (fu /2, ..., /J, составленный из векторов множества Q. Доказательства теорем 1 и 2 приведены в § 1*.13, I, 2. 2°. Примеры. Пусть линейный оператор А* сопряжен линейному оператору А, действующему в я-мерном евклидовом пространстве, в котором выбран ортонормированный базис. Согласно теореме 2 § 1.5, матрица оператора А* является транспонированной по отношению к матрице оператора А (в заданном ортонормированном базисе). Если оператор А самосопряжен, то его матрица в ортонормированном базисе симметрична. При этом из теоремы 1 вытекает, что симметричная (вещественная) матрица имеет вещественные собственные значения. 1. Найти собственные значения и собственные векторы симметрической вещественной матрицы Решение. det(A—XE) = Составим и решим характеристическое уравнение: 2-х —i о —1 О -X —1 2- = (2—X)3 — (2—X)— (2—Я) = 0; -Х\ (2-Я) (№—4Я + 4 — 2) = 0; Я* = 2; Я2,3 = 2 ± VT=2. Итак, корни матрицы Ях = 2, Я2 = 2 + |/"2, Я3 = 2—V 2. Найдем собственные векторы матрицы Л. В силу теоремы 2 § 1.12 собственные векторы, принадлежащие различным собственным значениям Х19 Х2, Я3, линейно независимы. В теореме 2 утверждается, что эти векторы взаимно ортогональны. Убедимся в справедливости этих теорем для рассматриваемого случая.
& 1 13 Собств. векторы и собств. значения самосопряженных операторов ИЗ Для нахождения собственного вектора матрицы Л, принадлежащего собственному значению X, нужно рассмотреть систему однородных линейных уравнений с матрицей А — ХЕ (система (5) § 1.12). В данном случае при Я = 2 имеем (2—%)хг — *2 =0, Г — х2 = 0, —х1 + (2 —Х)х2— *з = 0, | —xt — *з = 0, — х2 + (2—Х)х9 = 0, т.е. [ —х$ = 0. Определитель этой системы, как и должно быть при Х = 2, удовлетворяющем характеристическому уравнению, равен нулю, а следовательно, система имеет ненулевое решение. Таким решением явля- ется, например, вектор <х1 = (1, 0, —1). При Х = 2 + у 2 система вида (5) § 1.12 примет вид -У"2х1— х2 *=0, - хг — V~2x2— х3 = 0, — x2—V2x3 = 0. Определитель системы равен нулю, нетривиальное решение системы есть а2 = (1, —У2, 1) (остальные решения пропорциональны а2, поскольку ранг матрицы системы равен 2, т. е. на единицу меньше числа переменных). Аналогично находим собственный вектор а3 матрицы Л, принадлежащий собственному значению Х3 = 2 — V2. Этот вектор таков: а3 = (1, V2, 1). Скалярное произведение векторов в ортонормированном базисе равно сумме произведений одноименных координат векторов (см. формулу (4) § 1.2). Очевидно, что (aif а2) =1.1 — 0.^2 — 1.1=0; (alf а3) = Ы+0.1/2-Ь1=0; (а2, а3) = Ь1-К2.К2 + Ы=0. Иными словами, векторы аи а2, а3 взаимно ортогональны. Умножив эти векторы на подходящие числа, можно добиться того, что длина каждого из них будет равна единице (при этом векторы останутся, очевидно, взаимно ортогональными). Имеем |ai| = W, ^ = 1/1.1+0.0 + Ь1=К2, fcl^/fo a2) = /bl+|/2.l/2 + l.l=2> 1«.| = /(«., а3) = /ы+1/2.1/2 + 1-1=2.
114 Глава I. Линейная алгебра с элементами аналитической геометрии А = 1 Следовательно, векторы a1/Ja1| = a1/|K*2, a2/|a2| = a2/2, a3/|a3| = = a3/2 образуют ортонормированный базис исходного трехмерного пространства. 2. Найти собственные значения и собственные векторы матрицы Л) О О Р 0 0 10 0 10 0 ,10 0 0; Решение. Характеристическое уравнение имеет вид —я. о о о —а, 1 о о 1 —я, о 1 о 0 —Я det (Л—*,£) = -0. Раскрывая определитель по 1-й строке, получаем t(A—Щ=-- — к = — Х(—Х3 + Х) —X 1 0 1 —X 0 0 0 —X — 1 (Я2 — 1) = — 1 --%*- 0 —X 1 0 1 — Я. 1 0 0| ■ 2Ji2+l=0, откуда, разлагая на множители, имеем ?w4—2Х2 + 1 =(Я2 — 1)2 = (Я,—I)2 (А,+ 1)2 = 0. Следовательно, корнями характеристического уравнения (т.е. собственными значениями) служат числа ^ = 1, &2=1, Ji8 = —1, Я4 =—1. (Это случай кратных корней: кратности корней 1 и —1 равны двум.) Приступим к вычислению собственных векторов. Система вида (5) § 1.12 для Х=1 в данном случае такова; I —*i -^2 ~Г %Ъ + *4 = 0, = 0, = 0, —х4 = 0. (а) Определитель этой системы равен нулю, что гарантирует существование нетривиального решения системы. Здесь в отличие от примера 1 ранг матрицы системы на 2 меньше числа переменных (из-за кратности корня Я=1). Отсюда следует, что размерность линейного пространства решений системы (а) есть 2. Найдем множество решений системы (а). Общий метод решения систем линейных уравнений, изложенный в § 1.9 (метод Гаусса), состоит в преобразовании данной системы в эквивалентную систему специального вида. Здесь после
S J 13. Собств. векторы и совете, значения самосопряженных операторов 115 выполнения всех преобразований методом Гаусса получим систему —*i +*4 = 0, < 0 = 0, <б> 0 = 0, имеющую вид (9) § 1.9, т. е. фактически состоящую из двух первых уравнений (иначе говоря, два последних уравнения являются очевидными следствиями первых двух, так что они могут быть опущены). Ненулевые уравнения системы ( —хг +*4 = 0, ^ —xt + xs =0 линейно независимы. В данном случае (считаем х3, л:4 свободными переменными) множество решений таково: х3, х4—произвольные числа, при этом *i — x4> x2 = xa. Это значит, что всякое решение системы (а) имеет вид (х4, хЪУ х3, х±), (в) или, что то же самое, х4(1, 0, 0, l)+*,(0f 1, 1, 0). (г) Множество решений представляет собой двумерное линейное пространство Su базисом которого служат, например, векторы (1, 0, 0, 1) и (0, 1, 1, 0). Всякий ненулевой вектор множества (г) является собственным вектором матрицы Л, принадлежащим собственному значению X = 1. Заметим, что не всякие два собственных вектора вида (г) ортогональны друг другу, однако среди таких векторов можно выбрать пару взаимно ортогональных единичных векторов— для этого достаточно выбрать в линейном пространстве Lx какой- либо ортонормированный базис. Аналогично можно найти множество собственных векторов матрицы Л, принадлежащих собственному значению Я =—1. Это множество является двумерным линейным пространством S_l9 состоящим из векторов вида ( %4> «^3» Х3> %4/i (Д) или, что то же, *И-1, 0, 0, 1) + *з(0, -1, 1, 0). (е) Как и в пространстве Su не всякая пара векторов в S_f взаимно ортогональна, однако в этом пространстве можно выбрать ортонормированный базис. Объединив ортонормированные базисы линейных пространств 5j и 5_1э получим четыре вектора, образующих базис Q исходного
116 Глава L Линейная алгебра с элементами аналитической геометрии пространства. В этом базисе все векторы имеют единичную длину. Проиллюстрируем на рассматриваемом примере теоремы 1 и 2. Исходная матрица А является симметрической. На основании теоремы 2 § 1.5 можно считать, что А есть матрица линейного самосопряженного оператора А в ортонормированном базисе; при этом пространства Sx и S_t состоят из собственных векторов, принадлежащих соответственно собственным значениям Я=1 и Л =—1. Базис Q, объединяющий ортонормированные базисы Sx и S_u является ортонормированным, так как векторы из Q, принадлежащие Si(S-i), ортогональны между собой в силу сделанного выбора, а ортогональность каждого вектора из S^ каждому вектору из S_f вытекает из теоремы 1. Последнее непосредственно видно из (в), (г) и (д), (е). Действительно, (1, 0, 0, 1), (0, 1, 1, 0) в (г) и (—1, 0, 0, 1), (0, —1, 1, 0) в (е) означают в подробной записи соот- ветственно ег + е^е2 + е3 и—е1 + е^ —е2 + е3, где (еи е2, еь> е4)—ор- тонормированный базис (тот, в котором симметрическая матрица А задает самосопряженный оператор А). В ортонормированном базисе скалярное произведение двух векторов есть сумма попарных произведений одноименных координат, так что скалярное произведение вектора (л:4, лг3, x3t х4) на вектор (—х'^ —х3, % х^ равно нулю: 3°. Упражнения Найдите собственные значения и собственные векторы следующих симметрических матриц. Убедитесь в том, что собственные fзначения являются вещественными, а из собственных векторов можно составить ортонормированный базис (предполагается, что данные симметрические матрицы задают линейный оператор в ортонормированном базисе). \ /1 2 3 4\ / 8. -408 240^ / \ 4.-408 3.9 18о). 5. . \ 24° 18° -400/ \4 8 12 1б/ § 1.14. Преобразование матрицы линейного оператора при переходе к новому базису. Канонический вид самосопряженного оператора 1°. Преобразование матрицы линейного оператора при переходе к новому базису. Линейные операторы, действующие в линейном пространстве, удобно изучать с помощью матриц. Как было отмечено в § 1.4, если задан линейный оператор А, действующий в пространстве L, и базис Q в пространстве L, то этим двум объектам (линейный оператор плюс базис) однозначно соответствует матрица линей-
/ 14. Преобразование матрицы лин. оператора при переходе к новому базису 117 ного оператора А в базисе Q (см. определение 2 § 1.4). При этом указанное соответствие обладает рядом важных свойств (см. теорему 1 § 1.4). В этом параграфе мы исследуем, как изменяется матрица А линейного преобразования в зависимости от изменения базиса. Главный результат будет сформулирован в теореме 1. Однако сначала рассмотрим некоторые вспомогательные понятия. Пусть даны два базиса в линейном пространстве L — исходный базис Q: е19 е2, ..., еп и новый базис Q': е'и е2, ..., е'п. Для описания перехода от базиса Q к базису Q' введем понятие матрицы пересечения С (Q, R') базисов Q и Q\ По определению, C(Q, О') = (*„), (l) где г..—коэффициент разложения вектора е\ из базиса Q' по векто- рам е19 е29 ..., еп базиса Q, т. е. el = спех + спе2 + ... + cnien. (2) Легко показать, что матрица C(Q, Q')— невырожденная, т.е. det^^=0, в противном случае один из столбцов матрицы С (пуеть i-й) линейно выражается через остальные, а вместе с ним (с теми же коэффициентами) вектор е\ линейно выражается через е[, е2,... ... , е\_х, gj+l, ..., ^, что противоречит определению базиса. Итак, два базиса Q, Q' линейного пространства L порождают матрицу пересечения С (О, Q'), определенную равенствами (1) и (2). Заметим, что матрица пересечения базисов Q' и Q, т.е. C(Q\ Q), является обратной к матрице C(Q, Й'). Действительно, элементы Сц матрицы C = C(Q', Q) по определению являются коэффициентами разложений «/=2j^;. (/ = 1, 2, ..., л). Подставляя в правую часть этого равенства ej из (2), получаем - i - - */ = 2i ouckiek. /e = i Разложение £.• по базису (^, £2, ..., en) единственно, т.е. е.- ==- =:0-e1 + 0.e2+ ... + 0-eJ„1 + l-ej + 0-ej+i+ ... +0-еп, так что 0 при \фк, при / = &.
118 Глава I. Линейная алгебра с элементами аналитической геометрии Это и означает, что произведение матриц Си С есть единичная матрица, т. е. матрица С—обратная к С. Обозначим матрицу линейного оператора А в базисе Q через A (Q), а в базисе Q'—через Л(Й'). Матрицу пересечения базисов йиЙ' обозначим через C(Q, Й'). Теорема 1. Справедливо матричное равенство , A(Q') = C~l(Q, Q')A(Q)C(Q, Q'). Комментарий к теореме 1. Утверждение теоремы можно сформулировать следующим (нестрогим) образом: если базис меняется с матрицей С, то матрица линейного преобразования А при переходе к новому базису изменяется по закону А—*С~МС, где С"*1—матрица, обратная к матрице С (С~х существует в силу условия d£tC=^Q). Доказательство. Матрица A(Q) определена элементами^— коэффициентами разложения Aet = 2 apiep (i = 1, 2, ..., п) (3) /3=1 (в соответствии с определением 2 § 1.4). Матрица А (£У) в силу того же определения задается числами а(/—коэффициентами раз* ложения М = 2^' (* = 1, 2, ..., п). (4) *=i Учитывая, что *г= ЪсяХеч (* = 1, 2, ..м «) (5) •-.1 **"' [именно так определяются числа cqi—элементы матрицы C(Q, Q')], имеем ер~2*Сгр0г' (6) г=1 Действительно, коэффициенты сг/? правой части равенства (6) образуют матрицу пересечения базисов Q' и Q, т. е. С (Q', Q), которая, как было показано выше, является обратной к матрице С = С (Q, Q'). -*■ Подставляя найденные для ek выражения в равенство (4) и используя соотношение (3), получаем Ae'k = A ^clket = 2 с«я,|*/> (* = 1. 2, ..., я). (7) Подставляя в правую часть соотношения (7) ер из равенства (6), имеем Ae'k= 2 Cii&pfrper^ 2 cqkaPqciPei- (8) /. Р, Г Р> Q, I
в 1 14. Преобразование матрицы лин. оператора при переходе к новому базису 119 Сравнивая соотношения <8) и (4), находим alk== 2jCqkapqClf Сумма %clpap{Jcgk есть элемент матрицы С-1 АС с номером Ik. Следовательно, матрица A (Q') оператора А в новом базисе Q' имеет вид Лф') = С-МС. (9) 2°. Понятие о каноническом виде линейного оператора. Одно и то же линейное преобразование в разных базисах имеет различные матрицы. Эти матрицы связаны между собой формулами (1) или (9). Естественно поставить вопрос о том, какому базису соответствует «наиболее простая» матрица (канонический вид линейного оператора). Эта задача является довольно сложной, и ее решение описывается с помощью нормальной жордановой формы. Точная формулировка соответствующей теоремы приведена в § 1*. 14, I. В то же время для многих важных в практическом отношении линейных операторов «наиболее простая» матрица может быть вычислена сравнительно просто. (Сложность теоремы о нормальной жордановой форме матрицы объясняется как раз тем, что она описывает «наиболее простую» матрицу для произвольного линейного оператора—иначе говоря, для всех линейных операторов. Если же задачу рассматривать лишь для некоторых видов линейных операторов, то она сильно упрощается.) Теорема 2. Пусть линейный оператор А, действующий в линейном пространстве L, обладает тем свойством, что из его собственных векторов можно составить базис линейного пространства. Тогда в этом базисе матрица оператора А имеет вид (h *2 О л = о к) (10) Доказательство. Пусть (fu /2, ..., /„)—базис пространства L, составленный из собственных векторов оператора А. Тогда Afi = 4i (/ = 1, 2, ..., л), (11) где %-—собственные значения оператора А. В соответствии с определением 2 § 1.4 f-й столбец матрицы А в базисе (/lf /2, ..., /„) образуют коэффициенты разложения (14), т. е. числа (0, 0, ..., Xh 0, ..., 0) (где Я,- находится на t'-м месте), поскольку Таким образом, матрица А имеет вид (10).
120 Глава I. Линейная алгебра с элементами аналитической геометрии Следствие. Пусть в n-мерном линейном пространствеLзадан линейный оператор А, характеристическое уравнение которого имеет п различных корней %и Х2, ..., Хп. Тогда в L существует базис, в котором матрица оператора А имеет вид (10). Доказательство. Каждому собственному значению % соответствует собственный вектор. В силу следствия из теоремы 3 § 1.12 -* -» -» собственные векторы fly /2, ..., /„, принадлежащие различным собственным значениям Хи Я2, ..., Хп, линейно независимы. Совокупность -> ->■ -> векторов fu f2, ..., fn образует базис Q в пространстве L. Тогда согласно теореме 2 матрица А имеет вид (10). 3°. Канонический вид самосопряженного оператора. Утверждения теоремы 2 применимы к важному частному случаю линейных операторов, а именно к самосопряженным линейным операторам. Теорема 3. Пусть А—самосопряженный линейный оператор, действующий в пространстве L. Тогда в пространстве L существует ортонормированный базис Q, в котором матрица оператора А имеет вид (10), где ki9 Л2, ..., Кп—вещественные числа. Доказательство. В силу теоремы 2 § 1.13 из собственных векторов оператора А можно составить ортонормированный базис пространства L. Согласно теореме 2, в этом базисе матрица А оператора А имеет вид (10). Очевидно, что каждое из чисел Я/ в матрице (13) есть собственное значение оператора А (или, что то же, матрицы Л), поскольку det(/l—JLf£) = 0. В силу теоремы 1 § 1.13 каждое собственное значение самосопряженного оператора А вещественно. Теорема 4. Пусть А—симметрическая матрица. Тогда найдется такая ортогональная матрица С, что матрица В^=С~1АС имеет вид В-. \и. А>2 0 ч 0 hn) (12) где kf, Я2, ..., %п—вещественные числа. Доказательство. В силу теоремы 2 § 1.5 симметрическая матрица вместе с ортонормированным базисом Q евклидова пространства L определяет самосопряженный оператор А, действующий в L. При этом исходная матрица А является матрицей линейного самосопряженного оператора А в базисе Q. Из собственных векторов оператора А можно составить ортонормированный базис Q' (см. теорему 2 § 1.13). При переходе от базиса Q к базису й' матрица А оператора А согласно теореме 1 переходит в матрицу В = С^АС9 (13)
& 1 14 Преобразование матрицы лин. оператора при переходе к новому базису 121 где C = C(Q, Q')—матрица пересечения базисов Q и Q'. В данном случае матрица С—ортогональная, так как базисы йий' ортонор- мированы. Действительно, пусть Й = (/х, /2, ..., /„), &' = (/;, fl • •• .., 7k) • Элементы Сц матрицы пересечения С определяются из разложения ?l = %ctjh (/«1, 2, ..., п). Покажем, что 2% = 1 (/-1, 2, ..., п)9 (14) 2^А/ = 0 (1Ф1). (15) В силу ортонормированности Q' имеем 1 = (ft* ft) = (2с///, ]£см7*) = 2<у/Сн (7/. 7*). Учитывая, что (/у, //) = 1, (//, /^) = 0, при й^/ (в силу ортонормированности Q), далее получаем 1 = (Д:, /0 = 2 fy/fy/= 2 <&» что и /г доказывает равенство (14). Аналогично при 1ф} из ортонормированности й' имеем О = (/;•, Й - ( 2 cjkt 2 **/* ) = 2 ckflf Й, 7*)- В последней сумме ненулевые числа получаются только при & = / (вследствие ортонормированности Q). Поэтому 0 = (ft, f}) = ^ckfk/ k {1ф})> что и доказывает равенство (15). Равенства (14) и (15) означают, что матрица С—ортогональная (см. теорему 2 § 1.5). Вернемся к равенству (12). Матрица В является матрицей линейного самосопряженного оператора А в базисе, состоящем из собственных векторов. Такая матрица в силу теоремы 3 имеет вид (12). Комментарии к теореме 4. 1) Построение базиса, в котором самосопряженный оператор А имеет диагональную матрицу, называется приведением самосопряженного оператора А к каноническому виду. 2) Напомним, что для всякой ортогональной матрицы С справедливо равенство С*1 —С, где С—матрица, транспонированная к С. Таким образом, С^АС^С АС и в формулировке теоремы С'1 АС можно заменить на С АС.
122 Глава I. Линейная алгебра с элементами аналитической геометрии --Щ 4°. Упражнения Линейное преобразование А переводит векторы elt е2, ..., еп, составляющие базис линейного пространства, в векторы flt /2, ..., fn. Найдите, матрицу линей- ного преобразования А в базисе (еь е2, ..., е„). 1. л = 3; 7^ = 2ei—e2+|8» J2 = —^ /\= — в! + &Т- 3. £ = &!+&„ /^ = 3^ + 4?з, /* = (Л+1)в*+(Л + 2)5+1, -., £ = <я + 1)?л. -»•-»■ -> -> -> -> Пусть fa, е2, .. ч еп) и (fl9 f2, ..., /„)—два базиса в линейном пространстве. Найдите матрицу пересечения этих базисов. 4. п = 2; /i = ei + &2, /a = —*i + 2£. 5. л = 3; /1 = ^ + 2^2+3^3, /2 = ^2+^з, /з = ^з- -»• -> -»• Пусть в базисе (гь <?2, . ♦., е„) задана матрица преобразования А. Найдите -> ->■ -»• матрицу преобразования А в базисе (/ь /2, ...., /„). (1 2\ -> ->• ->->■->->' /7 —1\ -*• -+ -»-*-*•-* 7. п = 2; ^ = f j ); /i = 4*i —&я, f2 = e1—e2. ; /i=«s» /a = ^2» /з=^1« 9. п = 3; Л = [ 7 5 1 ); ^=?i-^,+?3T /2 = — «1+з£—2?8, ?з= =—^2 + 2^з; проверьте, что /ь /2, /з—собственные векторы с собственными значениями 1, 2, 3 соответственно. Приведите к диагональному виду матрицы линейных преобразований, которые -» -»• б базисе (elt е2) имеют следующий вид: ■•• с iy «■ с :)• - г: -D- § 1.15. Квадратичная форма. Матрица квадратичной формы. Приведение квадратичной формы к каноническому виду с помощью ортогональной матрицы 1°. Квадратичная форма и матрица квадратичной формы. Пусть в n-мерном (координатном) пространстве Rn взята произвольная точка А = (Х1у Х2, . . . , Хп). Определение 1. Числовая функция вида / (^0 = / (*i> х2> в • • > хп)z=t 2 auxix/> (1)
/ 15. Квадратичная форма. Приведение квадр. формы к каноническому виду 123 где а-—заданные числа такие, что а// = а//, называется квадратичной формой в R". К исследованию квадратичных форм сводятся многие задачи геометрии и математического анализа. В этом параграфе мы будем изучать квадратичные формы средствами линейной алгебры. . . Определение 2. Квадратная таблица, составленная из коэффициентов atj квадратичной формы (1), называется матрицей этой квадратичной формы. Комментарий к определениям 1: и 2. Следует иметь в виду, что в формуле (1) не приведены подобные члены. В; правую часть формулы (1) входят отдельно подобные между собой члены arXiX/ и %*/**. В определении 2 подразумевается,, что элемент матрицы квадратичной формы, находящийся на пересечении t-й строки и /-го столбца (при 1ф[), равен коэффициенту aif при *f*y в разложении (L) (с таким же коэффициентом а^—а^ входит и произведение Х;Х& Если же в формуле (1) приведены подобные члены, то элемент матрицы квадратичной формы с номером ij {1ф}){& также /7) равен половине коэффициента при xtxr. Диагональные элементы ап матрицы квадратичной формы равны коэффициентам при х\ (* = 1, 2, ..., п). Примеры. 1. Матрица квадратичной формы # =~xL -j- *±XiX2 4~ х2х3 имеет вид /1 2 О [20 1/2 \0 1/2 0 2. Матрица квадратичной формы f = x21 + 3x1x2 + 2x1x3 + + Зх2хх + 4x1 + 5*2*з + ~у ^XgXj ~\~~ ОХ'^Х2 *з == *= *& + 4*1 —4 + б*^ + 4***а+ Юх^з такова: /1 з 2\ I*: -7' 2°. Изменение матрицы квадратичной формы при линейном преобразовании переменных. Пусть (хи *2, ..., хп) и (уи у99 ..., Уп) — точки (координатного) пространства R*% координаты которых свя- ■
124 Глава 1. Линейная алгебра с элементами аналитической геометрии заны между собой линейными соотношениями: *i = Сг1уг + ^12^2 + • • • + С1пуп, Уг = Сг1Хг + С12Х2 + . . . +С1пХп, *2 = ^1^1 + с22у2 + • • • + с2пуп, у2 = с21хг + с22х2 + ... + c2w*„, (2) *п = ^1#1 + ^2«/2 + • . . + ^ЯЛУЛ; #я = Сп1Хг + Сп2Х2 + . . . + СлЯ*Л, где (си) и (cl7)—заданные (взаимно обратные) матрицы С и С""1. Рассмотрим функцию g от п переменных уи у2, ..., #„, полученную из (1) заменой переменных xl9 x2i ..., хп на линейные комбинации переменных уи у2У ..., уп по формулам (2): 8 (У'i. У2> • • •. Уя) = / (*ii*i + ^12^2 + • - - + ^iA; /3) ^11^1 + ^22*2 + • • • + С2пХП> ' ' ' Сп1Х1 + £/22*2 + « • • + СпПХп)' Очевидно, что функция (3) является квадратичной формой. Будем говорить, что квадратичная форма g преобразована из квадратичной формы / с помощью матрицы С. Возможно, что матрица квадратичной формы g окажется проще, чем матрица исходной квадратичной формы /. Естественно поставить вопрос о том, какова «самая простая» из матриц квадратичных форм вида (3) и какова должна быть матрица С, чтобы матрица квадратичной формы (3) была «простейшей». Ниже будет показано, что всякая квадратичная форма / с помощью ортогональной матрицы С может быть преобразована (приведена) к виду gQftf я», • • > Уп) = Ку\+Kyi + • • • + Ку% (4) (каноническому виду квадратичной формы). При этом матрица квадратичной формы g такова: В = я2 о о • (5) Ясно, что изучение свойств квадратичной формы f значительно упрощается, если она представлена в виде (4), где связь между уи у2, ... ..., уп и хи х29 ..., хп выражается формулами (2) с известной ортогональной матрицей С. Преобразование квадратичной формы f(xu x2, ..., хп) в квадратичную форму g(yl9 у2у • • •, Уп) полезно записать с помощью матричных обозначений. Для сокращения записей условимся о следующем: поставим в соответствие точке X (хи х2, ..., хп) или Y(y19 #2» •••» Уп) координатного пространства R" вектор х (соответственно у), определяемый направленным отрезком с началом О (О, 0, ..., 0)
1.15. Квадратичная форма. Приведение квадр. формы к каноническому виду 125 и концом X (xlf х2, ..., хп) (соответственно—с началом О (О, 0, ..., 0) и концом Y(yl9 у2, ..., уп)\ такое соответствие уже использовалось нами в § 1-3). При этом квадратичные формы f(xl9 х2, ..., хп) и g(ylf у2, ..., уп) мы будем интерпретировать как функции от векторов х и у (а не от координат xi9 х2, ..., хп и у1э у2, ..., уп точек X и Y координатного пространства). Это позволит переписать уравнения (2) в виде х = Су, у = С~Н (6) (Си, С~гх означают соответственно результат умножения матрицы С на вектор у и матрицы С~\ обратной к С, на вектор х). Зависимость (3) квадратичных форм g(yl9 ..., уп) и f(xu ..., хп) примет вид g(y)=f(Cy) = f(x). (7) Следующая теорема описывает связь матрицы В квадратичной формы g(y):=f(Cx) с матрицей А квадратичной формы f(x). Теорема 1. Справедливо соотношение В = С АС, где С' —матрица, транспонированная по отношению к С. Доказательство. Имеем f(x) = 2%*/*/> ^/ — ^S^fc^*' x/^ ~*2ислУг Подставляя выражения х{ и лу в 2^//***/» получаем / Й = / (Су) = 2 ачСцРлУъУг Коэффициент при ykyt (т. е. элемент bkl матрицы В квадратичной формы f(Cy)=g(y) равен Легко проверить, что элемент с номером Ы матрицы С АС в точности равен ^atjcikcjt и, значит, В = С'АС. Отметим, что матрицы С и С"1, задающие равенства (2), можно истолковать следующим образом. Пусть в пространстве R" заданы -» ->■ -» -► -> -> два базиса Q(elf е2, ..., О и Q'(£i, ё%9 ..., ^), aC==C(Q, Q') = = (cif)—матрица пересечения этих базисов. Всякий вектор в R" можно разложить по этим базисам. Если (хг, х2, ..., хп) и (yif У%, ..., уп)—коэффициенты таких разложений, то x = C(Q, Q')y, где х и у—векторы-столбцы, составленные из чисел Xi, x$, ..., хп; Ун #2> ..., Уп- \
126 Глаза 1. Линейная алгебра с элементами аналитической геометрии % Для доказательства последнего соотношения рассмотрим очевидное равенство 2 *Л = 2 #/4 Учитывая, что е* = 2с*А» получаем 2*А = 2УАА или xi = ^cklyl (*=1, 2 Я), что совпадает с (2). Пример. Пусть квадратичная форма / имеет вид х{4-Ахлх± 4-2x1. /3 1\ 2 а матрица С такова: ^2 } ). Это означает, что *1 = tyi + */2, & = Xj — Х„ •^2 = 2(/1 + z/2; */2 = —2*2 + 3xf. Квадратичная форма / (Су) имеет вид / (СЪ = (3^ + г/2)? + 4 %х +у2) (2*/,+у2) + 2 (2Л + у2У = = %? + ty,ft + £ + 24у * 4- 20г/^2 + 4*/? + 8у\ + 8У1у2 + 2у\ = ~4lyl + 34yiy2 + 7yl Матрицы Л и В квадратичных форм f (х) и g = f(Cy) таковы; /1 2\ /41 17\ А={2 2) В-{п l)- Проверим справедливость теоремы 1 на данном примере. Имеем /3 2\/1 2\ /3 1\ /3 2\/ 7 3\ /41 17\ Vl 1Д2 2Д2 1У = \,1 1Д1О 4y = Vl7 7/в 3°. Приведение квадратичной формы к каноническому виду. При решении вопроса о том, каков «наиболее простой» вид квадратичной формы g = f(Cy)y полученной из квадратичной формы / с помощью матрицы С, полезно воспользоваться теоремой 4 § 1.14. Это можно сделать следующим образом. Пусть /—квадратичная форма и А—ее матрица (матрица А — симметрическая по определению). Согласно теореме 4 § 1.14, найдется ортогональная матрица С такая, что £ = С-МС (8) является диагональной матрицей вида (15) § 1.14. Для ортогональной матрицы С, как известно, С-С-1 (9) (транспонированная матрица равна обратной). Рассмотрим квадратичную форму f(Cy). Матрица этой квадратичной формы в силу теоремы 1 имеет вид В = С'АС, т. е. в силу (9) 1 совпадает с (8). Отсюда вытекает следующее утверждение.
6 1 15 Квадратичная форма. Приведение квадр. формы к каноническому виду 127 Теорема 2. Всякую квадратичную форму f (х) с вещественными коэффициентами можно представить в виде (4) с матрицей (5), причем векторы у и х связаны соотношением х = Су, где С—ортогональная матрица. Теорема 2 играет важную роль в решении задачи о приведении общего уравнения второго порядка к каноническому виду (см. п. 4°). Она позволяет установить, к какому «простейшему» (каноническому) виду можно привести квадратичную форму, используя ортогональные преобразования. Рассмотрим задачу о том, к какому простейшему виду можно привести квадратичную форму с помощью произвольной невырожденной матрицы. Основная идея решения этой задачи состоит в следующем. Пусть f(x)—квадратичная форма. С помощью ортогональной матрицы С в силу теоремы 2 можно добиться того, что f(Cy) примет вид (4) с матрицей (5). Без ограничения общности можно предположить, что Xlt 12, ..., К в (4) и (5) таковы, что в этой записи сначала расположены положительные числа {если они есть), затем отрицательные (если они есть) и затем нули (если они есть). Такого порядка нетрудно добиться, меняя местами соответствующие игреки: заметим, что всякая перестановка игреков является ортогональным линейным преобразованием. Квадратичную форму (4) с матрицей (5) подвергнем преобразованию с помощью диагональной матрицы (йл D = . О О dn ) (10) После выполнения этого преобразования матрица (5) в соответствии" с теоремой 1 перейдет в матрицу См? D'BD = Л2«2 о (11) лпип
128 Глава I. Линейная алгебра с элементами аналитической геометрии Очевидно, что A^d? можно сделать равным 1, —1 или 0, выбрав dt подходящим образом. Именно, если Х( > 0, то 7,^=1 при йг =* = l/KV» если Я;<0, то V' = — 1 при d^l/K^T,; если ^. = 0, то Я^ = 0. Таким образом, матрица (11) примет вид ;* + / + /п = п. (12) Значит, заменяя вектор х на Су, где С—некоторая невырожденная матрица, можно добиться того, что квадратичная форма / (х) перей- дет в квадратичную форму f(Cy) с матрицей (12), т. е. /(С?) = yl + yi+ • • -+у1-у1+1-у1+2- ... -yUi. (13) Ясно, что квадратичная форма / может быть приведена к виду (13) разными способами (т. е. с помощью различных матриц С). Однако, как показано в § 1*.15, I, количество k «положительных» квадратов, количество / «отрицательных» квадратов и количество т нулей на главной диагонали матрицы (12) не зависит от способа приведения квадратичной формы / к виду (13) (т. е. от матрицы С). Поскольку преобразование А-+САС (14) (симметричная матрица А переходит в симметричную матрицу С АС, С невырождена) сохраняет ранг матрицы, то очевидно, что ранг матрицы А равен рангу матрицы (13), т. е. k + L Ранг матрицы квадратичной формы [равный числу ненулевых диагональных элементов в каноническом виде (12)] называется рангом квадратичной формы. Пара целых неотрицательных чисел (&, /), указывающая количество «положительных» и «отрицательных» квадратов в каноническом виде (12) квадратичной формы /, называется сигнатурой квадратичной формы (иногда сигнатурой называют число k—U а иногда — число /). Итогом приведенных рассуждений является следующая теорема. 1 1 —1 ' —1 0 * 0
1 15, Квадратичная форма, Приведение квадр. формы к каноническому виду 129 Теорема 3. Всякую квадратичную форму f (x) (с-вещественными коэффициентами) можно представить в виде (13) с матрицей (12), причем х и у связаны соотношением х = Су, где С—некоторая невырожденная матрица. Теорема 3 играет важную роль в решении задачи аффинной классификации поверхностей и кривых второго порядка. 4°. Приведение общего уравнения второй степени к каноническому виду. Важной задачей является исследование общего уравнения второй степени от п переменных хи х2, ..., хп\ i7W = Sfl/y^y+2^i + c = 0 = Fi + F1 + F0, (15) и i i где F2 = 2 auxix/> ^i = 2&/**> Fq = c. Разумеется, следует предпо- i, j i пожить, что среди коэффициентов аи (/, /=1, 2, ..., п) есть по крайней мере один не равный нулю—в противном случае уравнение (15) является уравнением не второй, а более низкой степени. Если л = 2, то уравнение (15) задает кривую на плоскости переменных х19 х2 (такие кривые называют кривыми второго порядка); если /г = 3, то уравнение (15) задает поверхность второго порядка в трехмерном пространстве R3 переменных хи х2, х9- При п > 3 множество решений уравнения (15) называется (по аналогии со случаями п = 2, 3) поверхностью второго порядка в n-мерном координатном пространстве R" переменных х19 х2> ..., хп (более точное название—гиперповерхность второго порядка). Главная задача, связанная с исследованием уравнения (15), состоит в следующем. В координатном пространстве R" переменных х19 х2> ..., хп (см. § 1.3) прямоугольную декартову систему координат можно выбирать по-разному; каждая такая система координат определяется точкой 0(aif а2, ..., ап)—началом координат и упорядоченным набором из /г векторов, образующим базис линейного пространства Ln векторов в R* (подробнее см. п. 2° §1*.15). Одной и той же точке пространства Rn соответствуют различные наборы координат в различных системах координат (если изменяется система координат, то изменяются и координаты точки). При замене исходной системы координат (старой) на специально выбранную (новую) систему координат уравнение (15) изменится. Мы будем проводить преобразование уравнения (15) с целью его упрощения. Таким образом, задача состоит в том, чтобы за счет удачно выбранной новой системы координат упростить исследуемое уравнение (15), насколько это возможно. Для этого нужно знать, как связаны новые и старые координаты точки и как изменяется уравнение (15) при замене системы координат. Отметим, что преобразование уравнения (15) тесно связано с преобразованием квадратичных форм, о котором было сказано в теореме 2. Применение теоремы 2 и является решающим шагом в решении поставленной задачи. 5 № 2036
130 Глава /. Линейная алгебра с элементами аналитической геометрии Связь старых (xi9 х2У ..., хп) и новых (yiy у2У ..., уп) координат точки при переходе от одной прямоугольной декартовой системы координат к другой прямоугольной декартовой системе координат описывается следующими формулами: *i = Сцуг+с12у2+... +с1пуп + аи у г = СцХг + с12х, + ...+сихп — аи Х2~ С2\У 1П"^22У2"Ь • • • ~\-СгпУп-\-й%, у2 = ^21^1 +^22^2 + • • • ~\~С2ПХП #2» Хп== Сп±Уг + ^«2^2+ • • ' Л~СппУп~^~ап1 Уп~ Сп1Х1~^~Сп2Х2 + • • • -\-СппХп—ап> (16) где (сц) = С—ортогональная матрица; (ci/) = C"1—матрица, обратная к С; (а1у а2У ..., ап)— координаты нового начала координат в старой системе координат. (Разумеется, С*"1—ортогональная матрица и С~Х = С'У где С — матрица, транспонированная по отношению к С.) Как изменяется уравнение (15) при переходе от старой системы координат к новой системе? Это изменение удобнее всего описать следующим образом. Если в уравнение (15) вместо старых переменных xiy х2У ..., хп подставить их выражения через у1у ..., уп по формулам (16), то в этом уравнении старые переменные пропадут, а новые появятся. В результате получится некоторое уравнение от Уй У%, • ••» Уп* Это и есть старое уравнение (15) в новых координатах. Рассмотрим сначала случай, при котором старое и новое начала координат совпадают (так называемый поворот осей координат). При этом все числа а1у а2У ..., ап в (16) равны нулю. Уравнение F (х1у ->• -> xi> •••> *О = 0 запишем в виде F(x) = 09 или, что то же, F2(x) + + F1(x) + F0 = 0. При переходе к новой системе координат это уравнение перейдет в уравнение вида ^.(C?)+Fi(Cy) + fe = 0. (17) Функция F$(x) является квадратичной формой. Вопрос о том, как ее можно упростить с помощью матрицы С [т. е. при переходе от F2(x) к F2(y)]9 решается теоремой 2. Выбрав матрицу С так, чтобы F2(Cy) имела канонический вид, получим F2 (Су) = Kyt + КУ\ + • - • + КУ\ + S Р/Л + Fo = 0. (18) Далее, уравнение (18) можно упростить заменой переменных yl^zi + ab zi'=yi—a{ (i = l, 2, ..., п). (19) Формулы (19) связывают старые (yiy у2У ..., #„) и новые (ziy z«>, ..., zrt) координаты точки при переходе от одной прямоугольной декартовой системы координат к другой прямоугольной декартовой системе коор-
§ 1.15. Квадратичная форма. Приведение квадр. формы к каноническому виду 131 динат, перенесенной параллельно относительно исходной (подробнее см § 1*.15, 2). Формулы (19) представляют собой частный случай формул (16), когда матрица С—единичная, т. е. Л ^ 1 С = О о I и Если Х{фО (t = l, 2, ..., п), то выбрав преобразуем уравнение (18) к виду КА + КА+ ...+^„4 + 7 = 0 и далее, поделив (21) на —у (если 7=^0)> получим г\ = 1 (20) (21) (ТАГ) r (vAS^ '#'_| (vA«)~ * (22) (канонический вид уравнения второго порядка). Исследование свойств поверхности второго порядка гораздо удобнее проводить в новой системе координат, где исходное уравнение принимает простой вид (22). При получении уравнения (22) мы предполагали, что Я*, %$, ..., Хп и 7 не равны нулю. Если же это предположение не выполняется, то вместо формул (20) для упрощения уравнения (18) применяются другие способы. Полная евклидова классификация кривых второго порядка на плоскости и поверхностей второго порядка в трехмерном евклидовом пространстве дана в § 1.16. 5°. Упражнения Квадратичная форма задана в базисе (е±, е2) матрицей Л. Найдите матрицу этой квадратичной формы в базисе (/f, /2). 2?2. h А = {{ _,]: П = Ч + е2, f2 = 3et + (l 4j; h = 2ei' h=Zei- С помощью параллельного переноса приведите к каноническому виду уравнения кривых второго порядка: 4. х* — 8у2-2х + 2у=0. 5. х*+у*-8х = 0. 6- *2 + 4у» + 2х—8*/-4 = 0. 5*
132 Глава /. Линейная алгебра с элементами аналитической геометрии Найдите собственные значения матриц квадратичных форм: 7. y*+4xz. 8. х*+4ху + 4у*. 9. 2*? + 3(/2 + z?—4Xy—2yz. 10. Матрицы 'квадратичных форм из упр. 7—9 приведите к диагональному виду с помощью ортогональных матриц. § 1.16. Евклидова классификация кривых и поверхностей второго порядка 1°. Евклидова классификация кривых второго порядка в R2. Общее уравнение второго порядка от двух переменных хи х2 имеет вид F (Xi, х2) = а1гх\ + 2а12хгх2 + а22х\ + Ьгхг + Ь2х2 + с = 0, (1) или ^(*i, х*) = РЛхи xJ+Fi(*i> x2) + F0f где г2 (#i» х2) = ciiiXi -f~ Zcii2XiX2 -|- ^2-^2» * i (#i> x2) = #i#i -j- o2x2, r0 = c» В соответствии с теоремой 2 § 1.15 квадратичная форма Fz(Cy) при некоторой ортогональной матрице С примет вид Таким образом, заменяя в равенстве (1) х на Су, получаем F (Су) = КУ\ + КУ\ + Ptfi + Р2У2 + Y = 0. (2) Полагая y1=^z1 + aiy y2 = z2 + a2y имеем У г = ^i («1 + аг)*- + К (z2 + a2f + Pi (гг + аг) + р2 (г2 + а2) + v - 0, или V? + К*\ + (2а А + Рх) гх + (2а А + р2) z2 + К*\ + К<*\ + +Ра+Ра+т = о. (3) При Xiy Х2Ф0, а1== — Р1/(2Я1), а2 = — р2/(2Я2) получим Mi + Vi + H = 0. (4) В случае, когда \ьф0, имеем 2 2 21 ■ г* -1. -(f*Ai)^-(fiA2)" Если —|iAi и —ц/Х^ положительны, то, обозначая а2 =— цДя, Ь2 = — цДа, имеем #+#=!• (5)
& Г16 Евклидова классификация кривых и -поверхностей второго порядка 133 < J ^— 0 \TZ ь- —^ -ь V > -.. «а». h \гг ч ^ >>s 1 ч% ^ Л4Г ,УГ ь /X —<f У \м у 4 -а) Их V* У ЧХ NX. ^ч. ^. ^. ^_ S ч >■ Z1 *цу Рис. 20 Рис. 21 При необходимости можно поменять местами zx и г2. Не ограничивая общности, можно считать, что'а>6. Кривая, уравнение которой имеет вид (5), называется эллипсом\ она изображена на рис. 20. Если знаки —|iAi и —цД2 различны, то положим — ^ — а2, —fiA2 = —Ь2, что не ограничивает общности. Тогда 2 2 (6) 2 2 zi ?L—1 а2 б2 ' Кривая, уравнение которой имеет вид (6), называется гиперболой; она изображена на рис. 21. Если —jiAi и —[гД2 отрицательны, то уравнение (5) не имеет решений и кривая не содержит ни одной точки («мнимый эллипс»). В случае, когда ц, = 0 и числа hlf А,2 в уравнении имеют одинаковые знаки, единственным решением уравнения (4) является z1=01 г2 = 0. Тогда говорят о «паре мнимых пересекающихся прямых». В случае, когда jx = 0 и Xlf Я2 имеют разные знаки, уравнение (4) примет вид Чг'+хг20=о и, поскольку X2Af < 0, можно положить —a2 = 5t2Ai, откуда К (z\ +^г2) =К (zi-a*zi) = К (z.-az,) {гг + 0 = 0. и 2t = —az9 и (7) Уравнению (7) удовлетворяют точки прямых z1 = az2 только они. Кривая второго порядка, уравнение которой имеет вид (7), называется «парой пересекающихся прямых» (рис. 22). Пусть теперь одно из чисел Ки Я2 в равенстве (2) (для определенности Хг) равно нулю (оба они не могут быть равны нулю). Выбирая а2 так, чтобы 2а2Я2 + р2 = 0, и ах так, чтобы A,2a2 + p1a1 + + ftA + Y = 0 (это можно сделать при {^=£0), преобразуем уравнение (3) к виду Vi + PA = Of или *1 = —(РА,)**. (8) Без ограничения общности будем считать —Pi/^2 > 0; при необходимости можно заменить z2 на — z2. Полагая —PiAs = 2/;, имеем г\ = 2рг±. (9)
134 Глава /. Линейная алгебра с элементами аналитической геометрии? &*№№} Рис. 22 Рис. 23 Кривая, уравнение которой имеет вид (9), называется параболой; она изображена на рис. 23. Если вместе с Ях = 0 и Pi = 0, то уравнение (3) при условии 2а2Х2 + ^2 = 0 имеет вид или т. е. -2 *2 4А,а Pi При Pi 4Я| *2 * (10) 4Х? •у- > 0 уравнение (10) имеет решения* J/IF*"-"^ 4Я? рис. 24). При 4*! ■Y («пара параллельных прямых»; Л 4Л2 ■J- — 0 решением уравнения (10) является z2 = 0 («пара слившихся параллельных прямых»; рис. 24). При Р! 4Я —Д- < 0 уравнение (10) не имеет вещественных решений («пара мнимых параллельных прямых»). Более подробно кривые второго порядка в R? рассмотрены в п. 2° § 1*.16. 2°. Евклидова классификация поверхностей второго порядка в R3. Общий вид уравнения второго порядка от трех переменных таков: г (Xi, х2У х3) = ацХ1-\-а22х2 \ a33x3-\-2ai2x1x2-\- + 2а13хгх3 -f 2a23x2x3 + bxxt + b2x2 + b3x3 + с = 0, (11) или F = Fi + Fi+F0, где г2 = я^д^ -f- ^22^2 ~Ь ^зз-^з ~h 2a^2xxx2 + 2а13хгх3 -f- 2a23x2x3i Fx = ft^ -f- + 62*2 + 63x3, ^0 = ^.
§U6. J ~~ 0 z2-c z2-0 Zz-c Zf Рис. 24 Рис. 25 В соответствии с теоремой 2 § 1.15 квадратичная форма F2(x)=* t=F2(Cy) при некоторой ортогональной матрице С примет вид Таким образом, заменяя в равенстве (11) х на Су, получаем F (Су) = Kyi + Ml + MS + РхУ* + Р2*/2 + РзУз + V- (12) Полагая y1 = zi + au y2 = z2 + a2J */3 = 23+Яз> имеем К (Zi + a1Y- + Х2 (z2 + а2)? + Я3 (*8 + а3)2 + + Pi(2i + a1) + p2(22 + a2)+p3(23 + a3) + Y = 0, или MJ + Mi + М! + (2fliXi + Px) «i + (2аЛ + Р.) *2 + + (2а3Я3 + Рз) z3 + М! + Mi + Ml + PA + Р2а2 + Рз^з + Y = 0. При %i, Я2, Я3=т^0, выбирая aiy а2, а3 так, чтобы 2a1X1 + Pi = 0, 2a2Ji2 + p2 = 0, 2а3Х3 + рз==0, получим Mi + M! + MS + l* = 0. (14) Здесь и> = М1 + М1 + Мз + р1«1 + р2^2 + Рз«з + ? ПРИ а± = 8=8 —Pi/(2X1)t а2 = -р2/(2Х2), а3 = -рдаз). Если |Jt=^0, то из уравнения (14) следует (13) z2 (-nAi) ' (—ц/^) г(—нАз) zi . = 1. (15) Свойства поверхности второго порядка (15) во многом зависят от знаков чисел —jxAf, —|iA2, —|лД3. Если каждое из этих чисел положительно, то обозначим а2 ——цД^, Ь2 — —|лД2, с2 =—|лД3. Без ограничения общности можно считать, что а^Ь^с. Тогда уравнение (15) примет вид 2 2 2 Zl _L *2 J- 2з 1 (16) Поверхность второго порядка, уравнение которой имеет вид (16), называется эллипсоидом-, она изображена на рис. 25.
136 Глава I. Линейная алгебра с элементами аналитической геометрии Рис. 26 Рис. 27 Если среди чисел —цДь —цД2, —jiA3 два положительных и одно отрицательное (без ограничения общности можно считать, что первые два числа положительны), то положим а2 =—\i/Kl9 h2-=* = —|дД2, —с2 =—|х/Я8. Тогда уравнение (15) примет вид а2 ' № с2 1. (17) Поверхность второго порядка, уравнение которой имеет вид (17), называется однополостным гиперболоидом; она изображена на рис. 26. Если среди чисел —\л/К> —мД2, —\i/X3 одно положительное и два отрицательных (без ограничения общности можно считать, что первое число положительно), то положим а2 = —\i/Klf —Ы = —|лА2, —с2 = —[дД3. Тогда уравнение (15) примет вид 2 2 2 _£i £2 5L_ I а2 Ь\ & ~1# (18) Поверхность второго порядка, уравнение которой имеет вид (18), называется двуполостным гиперболоидом; она изображена на рис. 27. Если в уравнении (14) jli = 0, а К19 Х2 и Я3 отличны от нуля, то поверхность представляет собой конус (возможно, мнимый); если одно из чисел Х19 Х2, Х3 равно нулю, то уравнение задает пару пересекающихся плоскостей (возможно, мнимых); если, два из трех чисел Х1У А,2, Я3 равны нулю, то уравнение определяет пару слившихся параллельных плоскостей. Если все три числа —цД^ —[дД2, —цА3 отрицательны, то уравнение (15) не имеет вещественных решений и соответствующая поверхность не содержит ни одной точки. Говорят, что в этом случае уравнение (15) задает «мнимый эллипсоид». Если одно и только одно из чисел Х1? Х2, Х3 равно нулю (а \х по-прежнему не равно нулю), то, выбирая аи а2 так, чтобы 2#A + Pi = 0, 2a2X2-\-fi2 = 0, получим (считая Я3 = 0, что не ограничивает общности) ^т+р.(-4-)+ (19)
$ 1 16 Евклидова классификация кривых и поверхностей второго порядка 137 Рис. 28 Рис. 29 Если Рз^О» то можно выбрать а3 так, чтобы свободный член в равенстве (19) был равен нулю и тогда оно примет вид ИЛИ 23 = 3 -РаА* + -РзД2 (20) В случае —P3Ai > 0, — р3А2 > 0 положим а? = —p3Ai, № = — рзА2 откуда * 3 а\ ^ № ' (21) В случае —p3Ai > 0, —рзА2 < 0 положим а2 = — p3Ai, Ь2 = Р3А2, т. е. *3 ~Я *2 ?2 6? ' (22) Случай —p3Ai < 0, —р3А2 > 0 сводится к (22) заменой zx на г2, а г2 на z±. Случай —p3Ai < 0, —рзА2 < 0 сводится к (21) заменой г3 на —z3. Поверхности, уравнения которых имеют вид (21) и (22), называются соответственно эллиптическим параболоидом и гиперболическим параболоидом. Они изображены соответственно на рис. 28 и 29. Если Ях^=0, Я2=т^0, ^3 = 0 и при этом рз = 0 в равенстве (19), то Kzl+K*i+v = o, (23) где [а = —Pf/(4X1) —Р1/(4ХЯ) + v. В уравнение (23) входят две переменных zu z2 из трех ги z2, z3. Такое уравнение определяет цилиндрическую поверхность. Действительно, уравнение (23) на плоскости г1э z2 определяет некоторую кривую второго порядка. Пусть точка (zj, z°2) принадлежит этой кривой. Тогда очевидно, что всякая точка трехмерного пространства с координатами (z?, z\, zs) (при любом г3) удовлетворяет уравнению (23). Это значит, что вместе с точкой (zj, z2) плоскости z*, г2 поверхность содержит це-
138 Глава I. Линейная: алгебра с элементами аналитической геометрии ~\ лую прямую, состоящую из точек вида (z?, z\, z3) (эта прямая проходит через точку z\y z\ плоскости г19 z2 и параллельна оси z3). Таким образом, классификация поверхностей второго порядка, имеющих уравнение вида (23), сводится к классификации кривых второго порядка, описанной в п.1°. Исходя из результатов п.1°, легко перечислить все типы поверхностей второго порядка с уравнением (23), т. е. канонические уравнения таких поверхностей. Если (х=й=0, Я^О, Я2=^=0, то уравнение (23) преобразуется к виду 2 2 -H<Ai -иА2 При —цАа > 0 и —цД2 > 0 поверхность называется эллиптическим цилиндром; при —(АД* > 0, —\i/k2 < 0—гиперболическим цилиндром (случай —|jiAi < 0, —[дД2 > 0 сводится к предыдущему заменой z± на z2, a z2 на ziy получается также гиперболический цилиндр); при *—[A/^i < 0» —V'/K < 0 получается «мнимый эллиптический цилиндр». Остается рассмотреть случай [д, = 0. Если при этом Я£ и Я2— числа одного знака (они не равны нулю по предположению), то уравнению (23) удовлетворяют только точки вида (0, 0, z3). Если Ях и Х2— числа разных знаков, то на плоскости zi9 z2 получаем пару пересекающихся прямых, а в пространстве г*, z2, zz — пару пересекающихся плоскостей. Пусть, наконец, из трех чисел Kit A,2, %3 два равны нулю. Без ограничения общности можно считать, что ki^O, Я2 = 0, Я3 = 0. Тогда уравнение (12) примет вид Kyi + Pift + Р2#2 + РзУз + Y = 0. (24) Произведя замену переменных */i —Zi + ai, уг^=22-\-а2> yb = z3JraB и выбрав #! = — Pi/(2Xi), получим Kzt+^+^(z2 + a2) + fi3(z3+a3) + y = 09 (25) или где |i = Y—Pi/(4^i) + p2^2 + P3^3- Если хотя бы одно из чисел Р2, р3 не равно нулю (не ограничивая общности, можно считать, что Р2=й=0), то, выбирая а2 нужным образом, т. е. а2 = (—Y + ^ + "j^)ip > и полагая а3 = 0, получим *i*J + PA + fiA = 0. (26) Уравнение второго порядка (26) можно упростить е помощью ортогональной матрицы. Положим
& 1 16 Евклидова классификация кривых и поверхностей второго порядка 139 Рис. 30 Рис. 31 у'—у ?'— ^2 у Рз 23» 2з = " Kpi+p! 2 Kpi+p! 3' Рз (27) Рз *2 + Р* Kpi + pi 2 Kpi + Pi При этом старые переменные zi9 z2, z3 выразятся через новые г[, z'2y z'z так: у —7' 7 — Ра Рз Kpl+pi 2 Kpi+pi Рз р2 (28) Kpi+Pi 2 Kpi+pi 2о. Переходя в уравнение (24) от старых переменных к новым с по* мощью преобразования (27), получим или г;2 = 2рг'и /29) где р== — KPi + P|/(2A,i). Поверхность второго порядка, уравнение которой имеет вид (29), называется параболическим цилиндром (рис. 30). Если оба числа Р2, рз в уравнении (25) равны нулю, то оно принимает вид М!+|х=о, (30) где ^ = 7—Pi/(4^i), и, очевидно, определяет: при %г\1 < 0 — пару параллельных плоскостей (рис. 31); при ц = 0—пару слившихся параллельных плоскостей (рис. 31); при Я1|1>0—пару «мнимых параллельных плоскостей». Более подробно поверхности второго порядка в R? рассмотрены
140 Глава I. Линейная алгебра с элементами аналитической геометрии 3°. Нахождение канонического вида кривой и поверхности второго порядка. В предыдущем пункте было указано, что всякая кривая или поверхность второго порядка в специально выбранной декартовой системе координат имеет каноническое уравнение. Представляет интерес задача о том, как установить канонический вид уравнения кривой или поверхности второго порядка, не переходя к соответствующей системе координат, т. е. непосредственно по коэффициентам уравнения. Приведем решение этой задачи с помощью двух матриц, связанных с данным уравнением второго порядка от п переменных. Именно, в связи с данным уравнением 2%***/+26Л + £==0, или F2 + F1 + ^o = 0 (31) рассмотрим следующие две матрицы порядков п и п+1: (an ai2 oe. ain\ /a±i я12 ... а1п Ьг/2\ #21 ^22 • • • #2и \ о ___ I 021 #22 • •' • а2п Ь2/2 \ /доЧ ant ап2 ... апп/ \b1/2 b2/2 bn/2 с / Очевидно, что А есть матрица квадратичной формы F2 (см. определение 2 § 1.15). Переход от одной декартовой системы координат х19 х2, ..., хп к другой у19 у29 ..., уп по формулам *1 = СцУг + ^12^2 + • • • + С1пУП9 %2 == C2ll/l "Г ^22^2 ~Г • • • "Т СЧпУю хп = сп1Уг + £/22#2 + • • • + СлпУп> (33) где C—(ci;)—ортогональная матрица, переводит F2 (x) в F2(Cy). Следовательно, в силу теоремы 1 § 1.15, матрица А перейдет в С'АС, или, что то же самое, в С"1 АС (поскольку для ортогональной матрицы С справедливо равенство С = С~1). Как утверждается в теореме 2 § 1.15, для некоторой матрицы С имеет место соотношение А2 С-МС = ( • . О }. (34) Собственными значениями матрицы С'1 АС являются Хь %2У ..., %п9 поскольку характеристический многочлен матрицы С"1 АС имеет вид (A* — X)(k2—К) (Ьп—А,). Согласно теореме 2 § 1.12, спектры (т. е. множества собственных значений) подобных матриц совпадают. По-
81 16 Евклидова классификация кривых и поверхностей второго порядка 141 скольку матрицы Л и С~1АС подобны, собственные значения матрицы А составляют множество {Хи Я2, ..., Хп]. Числа Х1у Х2, ..., Хп играют важную роль в задаче классификации кривых и поверхностей второго порядка. Приведенные выше рассуждения позволяют находить эти числа, не производя сложной замены переменных, которая переводит данное уравнение второго порядка в каноническое, а именно, как уже было сказано, числа Xi9 Я2, ..., Хп являются корнями (собственными значениями) матрицы Л, т. е. матрицы квадратичной формы F2. Переход от одной декартовой системы координат х19 х2, ..., хп к другой уи у2, ..., уп по формулам *i = СиУ± + СпУ* + • • • + сыУп + <к, Х2 == ^21^1 Н~ С22#2 Т" • • • "Т С2пУп Н~ а2> Хп = Сп\У1 + ^«2#2 + • • • + СппУп + ап> (35) матрица С имеет вид /£ii e-h. \cni \ 0 С'ВС, Ci2 •• . Cin С22 • • • С%п Сп2 • • • Спп 0 0 а± «2 Я« i где С = (££/)—ортогональная матрица, переводит, как показано в § 1*.16> 1, матрицу В в матрицу (36) (37) и С'—матрица, транспонированная по отношению к С. Последнее надо понимать следующим образом: под действием преобразования (35) уравнение второго порядка (31) перейдет в новое уравнение, и матрица В, построенная для нового уравнения, будет иметь вид (36). Заметим, что det (С'ВС) = det В (det С)2 = det В, так как detC = ±l. Следовательно, det В и det С'ВС совпадают, если detB^O. Как показано в § 1.*16, 2, ранги матриц В и С'ВС также совпадают. 4°. Таблицы кривых и поверхностей второго порядка. Свойства матриц Л и В, перечисленные выше, позволяют установить канонический вид уравнения второго порядка. Приведем окончательные результаты. В нижеследующих таблицах перечислены все канонические Уравнения кривых и поверхностей второго порядка. Для каждого канонического уравнения указаны матрицы Л и В, их ранги г (А)
142 Глава I. Линейная алгебра с элементами аналитической геометрии и г (В)у а также информация о знаках собственных значений матриц А и В. Можно непосредственно убедиться в том, что различные виды кривых и поверхностей второго порядка задаются различными наборами указанных характеристик. Таблица 1. Кривые второго порядка
/ 16 Евклидова классификация кривых и поверхностей второго порядка 143 Таблица 2. Поверхности второго порядка № Каноническое уравнение Матрица А Х2 Хз Ьл-Г 1,2 ^ С2 = 1 2 2 XI i **2 *3_ 1 Xi Й 2 *2 *3 = 1 Ь* 2 2 2 #1 #2 *3 аа 2 2 а^Ь*" Х* 2 2 а2 А2 ~ /ЛГ3 № ' 2 *2 , Х'3 ~i_L2-4-——О a2 l ^i-c2—u а2 1 &2 ^2—и *1 , *2 a2i-A2 —i / с /и о Матрица г{А) г (В) + Название поверхности + + Ма > О %1%2 < О М, ^2, Лз — числа одного знака Л_, Л,2, Аз —числа разных знаков эллипсоид однополо- стный гиперболоид двуполост- ный гиперболоид мнимый эллипсоид эллиптический параболоид гиперболический параболоид мнимый конус конус эллиптический цилиндр
144 Глава 1. Линейная алгебра с элементами аналитической геометрии 7Яь Продолжение табл. 2 № Каноническое уравнение г(А)\ г\Щ Название поверхности 10 11 12 13 14 15 16 17 £i__£2_1 а? ЫГ~ Х\ Х2 = 1 Ci\ Ь\ xt = 2px3 2 2 a?^b* 2 Xl X2 =0 - ft x £1=1 x? = 0 + + + А,,Д2>0 Xi, Я2<0 + гиперболи ческий ци линдр мнимый эллиптический цилиндр параболический ци линдр пара мнимых пересекающихся плоскостей пара пере- секающихся плоскостей пара мнимых параллельных плоскостей пара параллельных плоскостей пара слившихся параллельных плоскостей
$ 1 16. Евклидова классификация кривых и поверхностей второго порядка И5 5°. Примеры 1. Найти каноническое уравнение кривой х\ + Зад + 2х22 + 4*i — 2х2 == 0. Решение. Имеем /1 3/2N /13/2 2 *-(з/2 2)' 5= 3/2 2 -' 4 \ 2 — 1 О Так как г (Л) = 2, г(Б) = 3, то рассматриваемая кривая имеет каноническое уравнение вида 1, 2 или 3 табл. 1. Далее, числа А* и Х2 определяем из характеристического уравнения матрицы А: №{А—Щ=\\,2 1— X 3/2 2-Я = 0; (l_b)(2-X)-i = 0; 3± 1^9 + 1 Я> = Я2 3+^То ЗЯ-| = 0; ^2=3 f10; ^>0, %2<0. ^1,2— 2 ' /vi— 2 Число [х в матрице В (см. табл. 1) определяем из условия A^p = :=det£. Имеем ЯД2 =—1/4 и 1 3/2 2 ' = —3—3—8 — 1 =—15, detJ5 = 3/2 2 —1 2—1 0 —15 откуда ^ = ——- = 60>0. Значит, Vm,>0, Vh> < ° и канони- (-1/4) ческое уравнение кривой имеет вид *1 = 1. 120(3+1^10) 120(|/"Г0 —3) Следовательно, кривая является гиперболой, для которой а? — = 120(3 +КТО), Ь2=120(К10-3). 2. Найти каноническое уравнение поверхности х\ + 2ад2 + 2*1 + 2x1*3 + 2х2х3 + х§ + 4хх + 3 = 0. Решение. Имеем / \ /1 1 1 2\ V"/ \2 о о з, Так как г (Л) = 2, г (В) = 4, то рассматриваемая поверхность имеет каноническое уравнение вида 5 или 6 табл. 2. Числа Хи Х2 и Х3 найдем из характеристического уравнения матрицы А: 1-Я 1 1 I 1 2-Х 1 =0; 1 1 1-Я det(A—XE):
146 Глава I. Линейная алгебра с элементами аналитической геометрии (1— Я)2 (2—Я,) + 1 + 1— (2—%) — (1— %) — (1— Я) = 0; (1_Я)2(2—X) — 2 + 3^ = 0; — 2A. + 4W —Xs = 0. Отсюда Х3 = 0, Я1; 2 = 2 ± /4—2, Ях = 2 + j/*2, X2 = 2—1^2. Число р в матрице 5 (см. табл. 2) определяем из условия Х^р2 — — detB. Находим ЯхЯ2 = 2 и detB =—4, т.е. /?2 = 4/2, р = \г2. Поэтому каноническое уравнение поверхности имеет вид у\ у\ 2у*. /2+1 У~2-\ Следовательно, поверхность является эллиптическим параболоидом, для которого а2 = V2 +1, Ь2 = ]/"2— 1. Если в уравнении второго порядка от двух переменных отсутствует член с произведением хг-х , то достаточно произвести параллельный перенос, чтобы привести такое уравнение к каноническому виду. Пусть дано уравнение Axl + Cxi + Dx2 + Ex2 + F = 0. Положим Xi — t/i + cii, х2 — у2 + а2, система координат yt, y2 параллельно перенесена по отношению к системе хи х2\ числа аи а2 задают координаты нового начала в старой системе (рис. 32). Перейдем от координат хи х2 в уравнении кривой к координатам уи у2, для чего подставим x1 = y1Jra1, х2 = у2 + а2 в исходное уравнение. Получим Aiyi + a.r + Ciy. + a.r + Diy.+a^ + Eiy. + a^+F^O, или' Ау\ + Су\ + уг {2Ааг + D)+y2 (2Са2 + Е) + Аа\ + Cal+Dat+Ea^+F=0. | Если А Ф0, СфО, то выберем aiy a2 так, чтобы 2Aai-\-D = 0, 2Са2 + £ = 0. Тогда уравнение примет вид Ау\ + Су\ + (Аа\ + Cat + Da, + Ea2 + F) = 0. (38) № №z Это уравнение не содержит членов с первыми степенями уи у2 и без труда приводится к каноническому виду. По знакам коэффициентов Л и С можно судить о виде кривой: если АС > 0, то получается эллипс (возможно, мнимый), причем при А~С—окружность (возможно, мнимая); если АС < 0—гипербола. Если одно из чисел Л или С равно нулю, то одно из чисел 2Ла1 + А 2Са2 + £ можно обратить в нуль благодаря выбору аг и а2У при этом часто бывает возможным сделать равным нулю и свободный член в уравнении (38). В этих случаях кривая является Уг Рис. 32 А/
/ 16. Евклидова классификация кривых и поверхностей второго порядка 147 параболой с каноническим уравнением yf = 2py2. Если Л = 0, £> = 0 или С = 0, £ = 0, то исходное уравнение с помощью параллельного переноса" приводится к виду y22 + v = 0 или ^f + v = 0. В этих случаях кривая является парой параллельных прямых (возможно, мнимых) или парой слившихся прямых (v = 0). 3. Привести к каноническому виду уравнения заданных кривых: а) x21 + xi + 2xi — 4x2 = 0\ б) xl + xi + 2x1 — 4*2 + 5 = 0; в) xl + xl + 2x1 — 4x2 + 6 = 0; г) х21 + 2х1 — 4х2 = 0; д) ^ + 2x1 — 1=0; е) *?—2^+1 = 0; ж) ^—2^ + 2 = 0. Решение, а) Пусть x1 = yi + aif х2 = у2-\-а2. Тогда получим (yi + aiy + (y2 + a2)* + 2(yi + a1)-4(y2 + a2) = 0; yl + yt + y1(2a1 + 2)+y2(2a2-4)+at + al + 2a1-4a2 = 0] (2ах + 2 = 0, 2а2—4 = 0)=>ах = —1, а2 = 2; */? + */!+1+4-2-8 = 0; yl + yl-5 = 0 (окружность). б) Полагая х1 = у1— 1, х2 = у2 + 2, имеем yl + yl = 0 (пара пересекающихся мнимых прямых). в) Полагая снова х1 — у1— 1, л;2 = у2 + 2, найдем #! + #!+1=0 (мнимая окружность). г) Пусть x1 = y1-\-aii х2~у2 + а2. Следовательно, (Уг+а1)2 + 2(у1 + а1)-4(у2 + а2) = 0; У\ + Уг С2аг + 2)+у2 (-4) + а\ + 2а, - 4а2 = 0. Полагая 2аг + 2 = 0, а\-\-2аг—4а2 = 0, получим а±=-—1, а2 =* = —1/4 и уравнение примет вид у\—4//2 = 0 (парабола). д) Полагая х1 = у1 + а1, х2 = у2 + а2, имеем (ifi + a1)* + 2(y1 + a1) — —1=0. При аг = —1 получим у\—2 = 0 (пара действительных параллельных прямых). е) Полагая х1 = у1 + 1, получим r/f = 0 (пара слившихся прямых). ж) Полагая снова *i = !/i + l, имеем r/f +1 = 0 (пара параллельных мнимых прямых). Если в общем уравнении второго порядка от двух переменных Ax21 + 2Bx1x2 + Cxt + Dx1 + Ex2 + F = Q коэффициент 25 не равен нулю, то следует перейти к новой системе координат (уи у2), связанный со старой системой формулами хг = уг cos a—y2 sin а, х2 = уг sin а + у2 cos а (эти формулы означают, что в системах координат Xf, x2 и yi9 y2 совпадают начала и оси у, и у2 повернуты относительно осей хг и х2 на угол а против часовой стрелки). При подходящем выборе угла а
148 Глава I. Линейная алгебра с элементами аналитической геометрии- коэффициент при уху2 в уравнении кривой может быть сделан равным нулю. Далее достаточно применить формулы параллельного переноса осей координат. 4. Привести к каноническому виду уравнение кривой х\ + 4 КЗ хгх2 + Ъх\ + 8х2 = 0. Решение. Имеем Л = 1 2У 3 2^1 5 5 = Перейдем от старых координат хи х2 к новым координатам yif y2 по формулам Хг^СиУг + С^ + а^ Х2 = ^21^1 ~Г ^22#2 I #2» где С = ( Cli Cl2)—ортогональная матрица. Найдем эту матрицу, \^21 ^22/ а также числа ах, а2 в равенствах (#) при условии, что новое уравнение кривой является каноническим. Из теорем 1 и 2 § 1.15 вытекает, что искомая матрица С существует и удовлетворяет условию С'АС где Xiy %2—собственные значения матрицы Л. Найдем их, решив характеристическое уравнение матрицы Л: 1-Х 2УЩ 2»Н* 5-Я 0; det(A-KE) (1 —Я) (5—Я,) —12 = 0; Я2—6Х—7 = 0; Х1 = —1, Х2 = 70 Таким образом, c^-(-J I), „ли c-MC-ft J). Пусть /х и /2— собственные векторы матрицы Л, принадлежащие собственным значениям Хх = —1 и Х2 = 7 (согласно теореме 3 § 1.12) собственные значения матрицы Л совпадают с собственными значениями матрицы С~МС, т. е. с числами —1 и 7). Тогда векторы C'~1f1 и C"1f2 являются собственными векторами матрицы С"1 АС (принадлежащими собственным значениям Xt = —1 и Я,2 = 7), так как c-Mc.c-7i=c-Mf1-c-4(-i)/i]=-i-c-fi,
6 1.16. Евклидова классификация кривых и поверхностей второго порядка 149 С другой стороны, собственные векторы матрицы С~МС = ( 0 7/ имеют вид £i = (.o / и ^ = (i )• 0тС1°Да h = Ceu f2 = Ce2. (#*) Если длины векторов /f и /2 равны единице (что можно предположить, не ограничивая общности), то матрица С, удовлетворяющая условиям (**), является ортогональной. Элементы с(/ матрицы С совпадают с координатами векторов ft = (fiU /21), /2 = (/l2, /22): ^11 =/if, Ci2 = /i2> ^ ^21 /21» ^22 —/22 (см. определение 2 § 1.4). Вычисление собственных векторов матрицы А проводится обычным образом. Так как det (А—Я£) = 0 при А, = — 1 и X = 7, то системы уравнений i2x1 + 2V$'x2 = 0, f —6xi + 21/"3 д:2 = О, \2Vr3xi + 6x2 = 0 и \2j/"3*i—2х2 = 0 имеют нетривиальные решения. Решение первой системы есть вектор (21/^3, —2), решение второй — вектор (2|/*3, 6). Длины этих векторов соответственно равны j/l2 + 4 = 4 и 4^3. Значит, векторы fx = (j/3/2, —1/2) и /2 = (1/2, У 3/2) имеют единичную длину и взаимно ортогональны. В силу равенств (###) искомая матрица С такова: с_/^3/2 —1/2 \ 4-1/2 VbiV Проверка: r^rJV1/2 -l/2Vl *V~A(V-W i/2 ^ Ь W_ Vl/2j\2V2 5 У Ч—1/2 /1/2,/ /3/2 —1/2 V—У 3/2 7/2 \ __/—! °\ 1/2 V"3/2j\\/2 lV1l2) \ ° 7/ Следовательно, новая система координат уи у2 (та, в которой уравнение кривой имеет канонический вид) связана со старой системой хи х2 формулами xt = (V 3/2) Уг + (1/2)у2 + аи x2 = -(l/2)yi + (V3/2)y2 + a2, >
150 Глава /. Линейная алгебра с элементами аналитической геометрии где а± и а2 подлежат определению. Матрица В преобразутся в матрицу С ВС вида (36), где С имеет вид (37); в данном случае УЗ/2 1/2 at С = ( —1/2 /Т/2 я2 О 0 1/ Далее, имеем С'ВС = 2 _^ 2 .«1 '£з 2 2 а2 /1 2^3 О ( 2>/"3 5 4 \0 4 О/ 1^ 2 £3 2 «2 ) f Гз 2 2 2 ГО i 2 2 О ■ 2 2 1,0 0 Т ai #2 -4^ 4 «i + 2/"3a2 _1_ 2 —2 7^3 2^3^ + 5^ + 4 2 V 3 4а2 (|)<ч+(1р)в1+21а (0)ч+ (|)«1+(у)^^+ в1+4^3в1в. + &Й+8в. Выбрав^ и а2 так^ чтобы —(К 3/2) ^ + (1/2)0,-2 = О, (7/2)^ + + (7К3/2) а2 + 2КЗ = 0, получим ах = —8КЗ/7, а2 = 4/7. Следовательно, матрица С'ВС примет вид где n = Q?4-4K"3axa2 + 5ai + 8a2, т. е. '-58-УгЗ 4 16 Н_М.З ,.А»-М 4.. Ш й 4 192—384 + 80 + 224 112 16 49 49
$ L16. Евклидова классификация кривых и поверхностей второго порядка 151 Тогда уравнение кривой запишется в виде -Vi + 7i/5 + £ = 0, илиТ1|7у-^ = 1, т. е. получается каноническое уравнение гиперболы. Этот пример можно решить и другим способом, не прибегая к матрицам. Именно, рассмотрим формулы перехода от старой (декартовой прямоугольной) системы координат xit x2 к новой системе координат г19 z2\ ч х± = Zi cos a—z2 sin а, х2 = zx sin а + z2 cos а (так связаны две системы [координат xif х2 и zi9 z2, из которых вторая система г*, z2 повернута на угол а против часовой стрелки относительно первой xi9 x2). Подставив выражения для х± и х2 в данное уравнение кривой, получим (гг cos а—z2 sin а)? + 4 }/"3 (^ cos а—z2 sin а) (z£ sin а + z2 cos а) + + 5 (zt sin а + z2 cos a)? -J- 8 (г* sin а + z2 cos a) = 0. Далее, раскрывая скобки и приводя подобные члены, имеем z\ (cos? a + 4 УЗ cos a sin a + 5 sin? a) + + 2z±z2 (— cos a sina + 2 V3 (cos? a—sin? a) -f 5 sin a cos a) + (#) + zi (sin? a—4 V3 sin a cos a + 5 cos? a) + 8 (z± sin a+ z2 cos a) = 0. Приравниваем нулю коэффициенты при zxz2: 4 sin a cos a + 2 j/"3"(cos? a—sin2 a) = 0; 2 sin 2a + 2 j/"3"cos 2a = 0; tg2a = — j/*3; 2a = —я/3; a== —jt/6. Так как cos(—я/6) = |/гЗ/2, sin(— я/6) =—1/2, то уравнение (#) принимает вид г!(4_4Кз.^ + 54) + г1(|_+4КЗ. 3? + б4)+ ' + 8(-1г, + ^-3г2) = 0, или —г\ + 7z\—iz1 + 4 K3z2 = 0. (**) Перейдем от координат г19 z2 к координатам yif y2 по формулам ^ — ^i + fli, z2=#2 + 02 (параллельный перенЬс); здесь ах и а2 — числа, которые будут выбраны несколько позже. Подставим выражения для Zi и z2 в уравнение (#*):
152 Глава /. Линейная алгебра с элементами аналитической геометрии ,Jj Далее, раскрывая скобки и приводя подобные члены, получим 1 —У\ + 7у1 +Уг (—2а1—А) + у1 (Ш2 + 4 /З)—о? + 7^-4^+4^3^=0. 1 Выберем аг и а2 так, чтобы коэффициенты при уг и у2 обратились 1 в нуль: I —2^—4^0, 14а2 + 4КЗ = 0=>а1=—2, а2 =* — 2/3/7. 1 Тогда уравнение (**#) примет вид I -^ + 7^1 + ^ = 0 или ^--^-1 I что совпадает с полученным выше уравнением. 1 6°. Упражнения 1] Найдите канонические уравнения кривых второго порядка: щ 1? х2 + 2ху—4у = 0. " I] 2. (х+у)*—4х—2у = 0. 1 3. л:2 + 2х = 2у—уЪ. 1] Найдите канонические уравнения поверхностей второго порядка: I 4. 4*2+#2 + 9г2 — 4xr/—6*/z+12*z — 36 = 0. 1 5. 3x2 + 3y* — 2xy+4xz + 4yz = 0. |] 6. x2__^2_j_2z2 + 2* + 4t/—8z = 0. 7. б*2 —2*/2 + 6z2 + 4xz + 8*— 4*/—8z+1=0. 8- (*+#)2 + 2# + 2z = 0. II
Глава II ВВЕДЕНИЕ В МАТЕМАТИЧЕСКИЙ АНАЛИЗ § 2.1. Множества и функции. Логические символы 1°. Множества. Строгое построение курса математики требует точного определения всех понятий, которые используются при изложении материала. Каждое определение точно описывает, характеризует определяемое понятие (А) с помощью другого понятия (5), которое считается известным или во всяком случае более простым, более «элементарным», чем Л. При этом понятие В должно быть также строго определено, и его определение будет содержать понятие С (более простое, более «элементарное», чем В) и т. д. Ясно, что для разумного построения теории с точным определением понятий необ: ходимо иметь' набор «самых простых», «самых элементарных» понятий, к которым сводятся все остальные и которые сами уже не подлежат определению. Будем называть такие понятия основными. Ответим на вопрос о том, как можно изучать не имеющие определений понятия, о которых с формальной точки зрения ничего неизвестно. Математика, как и другие науки, отражает законы природы и человеческого опыта (здравого смысла). С точки зрения человеческого опыта, основные понятия математики настолько ясны, что не нуждаются в точных' определениях. Смысл основных понятий может быть описан примерами^ (таким образом, оказывается, что об основных понятиях математики известно совсем немало). Рассмотрим следующие основные понятия математики: «множество», «элемент множества», «принадлежность элемента множеству». Как отмечено выше, нельзя требовать точного определения указанных понятий, но можно пояснить их смысл примерами. Косвенное описание этих понятий с помощью примеров является удовлетворительным с точки зрения здравого смысла. Итак, рассмотрим понятие множества. Можно говорить о множестве дней в году, точек на плоскости, студентов в данной аудитории и т. д. В этих случаях каждый день в году, каждая точка
154 Глава II. Введение в математический анализ Ц плоскости, каждый студент в аудитории является (называется) эле- 1 ментом соответствующего множества. щ Существенным обстоятельством при рассмотрении конкретного 1 множества является возможность для всякого элемента дать вполне 1 определенный ответ на вопрос—принадлежит ли данный элемент 1 множеству или нет. Так, для первого из приведенных выше мно- I жеств, 3 июля, 20 мая, 25 мая 29 декабря—элементы рассматри- 1 ваемого множества, но «среда», «пятница», «праздник» не являются 1 элементами множества. Во втором примере элементами множества 1 являются точки заданной плоскости и только эти точки. Если точки I не принадлежат заданной плоскости или рассматриваемый элемент 1 не есть точка, то эти элементы не являются элементами множества. 1 В третьем примере также легко решить вопрос о том, какие эле- I менты принадлежат множеству, а какие не принадлежат. 1 Следует отметить, что для задания конкретного множества необхо- 1 димо четко описать те элементы, которые принадлежат этому мно- I жеству. Нечеткость в таком описании может привести к логическому I противоречию (см. п. 1° § 2*.l). I Приведем теперь некоторые обозначения, применяемые при рас- I смотрении множеств. 1 Если а является элементом множества Л, то пишут а£ Л, в про- I тивном случае а(£Л. 1 Множества Л и В называются равными, если они состоят из 1 одних и тех же элементов. Таким образом, равенство Л = В приме- I нительно к множествам означает, что одно и то же множество обо- 1| значено разными буквами. I Запись Л = {а, Ь, с, ...} означает, что множество Л состоит из | элементов а, 6, с, .... Среди а, Ъ> с, ... в этой записи могут |] быть совпадающие между собой элементы, причем совпадающие II элементы «считаются за один элемент»; например, {1,2, 3, 4,5} ={1, I 1,1,2,2,3,4,5}. 1 Если множество Л состоит из всех тех элементов а множества В, I которые обладают определенным свойством, то пишут Л = {а £ £ |...}, 1 где в фигурных скобках после вертикальной черты записано ука- 1 занное свойство элементов множества Л. Пусть, например, a, b— 1 два действительных числа, удовлетворяющих условию а < Ь, тогда I множество точек отрезка [а, Ь], т. е* множество действительных чи- 1 сел х таких, что а ^ х ^ Ь, может быть записано следующим образом: 1 [a, 6] = {;t€R|a<*<b}, 1 где R означает множество всех действительных (вещественных) чисел. I Если каждый элемент множества Л является элементом множе- 1 ства 5, то говорят, что Л есть подмножество множества В и пишут § Л с В или В з Л. Первое из этих равенств читается так: «множе- I ство Л содержится в множестве В», второе—«множество В содер- I жит множество Л». Нетрудно доказать, что если Л с В и В с Л, | то А^В. ®
§2.1. Множества и функции. Логические символы 155 Ач& Рис. 33 в^А Определение 1. Для любых двух множеств Л, В множество, состоящее из тех и только тех элементов, которые принадлежат хотя бы одному из множеств Л, В, называется объединением множеств Л и В и обозначается через А[) В. Определение 2. Для любых двух множеств Л, В множество, состоящее из тех и только тех элементов, которые принадлежат и Л, и Ву называется пересечением множеств Л и В и обозначается через АПВ. Определение 3. Для всяких двух множеств Л и В множество всех элементов В, не принадлежащих множеству Л, называется разностью множеств Л и В и обозначается через Б\Л. Если множество Л является подмножеством В, то £\Л называется дополнением А в В. Комментарии к определениям 1—3. 1) Определения 1—3 иллюстрирует рис. 33. На рисунке множества Ли В, Af]Bf В\А и дополнение Л в В заштрихованы. 2) Понятия объединения и пересечения множеств естественным образом переносятся на случай трех множеств Л, В, С; четырех множеств Л, J5, С, D; ...; на случай любого множества множеств. Именно, объединение множеств Л, Ву С, ... есть множество, состоящее из элементов, которые принадлежат хотя бы одному множеству Л, В, С, ... . Пересечение множеств Л, £, С, ... есть множество, состоящее из элементов, принадлежащих каждому из множеств А, В, С, ... (рис. 34). Возможно, что множества Л и В не имеют общих элементов. В таком случае Л П В не содержит ни одного элемента. Удобно считать, что А{]В в этом случае является множеством (не содержащим ни одного элемента). Оно называется пустым и обозначается так: 0. Для всякого множества Л имеем AzdA, Л:э0; таким образом, ^ и 0 являются подмножествами в А~ их называют несобственными подмножествами; все остальные подмножества называются собственными. Рис. 34 Ач$иС Дп^лС
156 Глава //. Введение в математический анализ Иногда объединение множеств называют суммой множеств, а пересечение множеств—произведением множеств. Множество всех подмножеств данного множества является алгеброй относительно указанных выше операций суммы и произведения (подробнее см. п. 1° §2*.1). 2°. Функции. Важную роль в математике играет понятие функции. Это понятие не принадлежит к числу основных, поскольку оно может быть определено через понятие множества, прямого произведения множеств, подмножества. Однако для первого знакомства с математическим анализом удобно принять понятие отображения (функции) за основное, пояснив его примерами и сопроводив описаниями, удовлетворительными с точки зрения здравого смысла. Если для каждого х£Х по определенному правилу выбран элемент у £ У, то говорят, что задана функция (отображение) f множества X в множество У, при этом пишут /: X—+Y. Таким образом, функция однозначно определяется правилом, по которому каждому х£Х соответствует у £ Y. Чего же не хватает в приведенном выше описании понятия функции для того, чтобы быть строгим определением? Во-первых, требуется объяснить, что такое правило, во-вторых, следует сказать, что такое соответствие. Можно было бы указать и некоторые другие нестрогости. Однако интуитивно ясно, что значит правило и соответствие. В простых случаях эти понятия не вызывают недоразумений и вполне достаточны для построения на их основе содержательной математической теории. Отметим еще раз то обстоятельство, что правило, определяющее (однозначно) элемент y£Y применимо к любому х^Х. Элемент х £ X называется аргументом функции /, элемент у £ Y— значением функции /, соответствующим элементу х^Х, y = f(x), a сама функция есть, если так можно выразиться, правило, «перерабатывающее» каждый х£Х в y = f(x). Множество X называется областью определения функции, а множество всех элементов y£Y, для которых существуют х € X такие, что f(x)~y,— множеством значений функции /. 3°. Функции действительного переменного с действительными значениями. В этой главе мы будем рассматривать частный случай понятия функции, а именно такие функции, областями определения которых являются некоторые подмножества множества действительных чисел, а множества значений которых также представляют собой некоторые подмножества множества действительных чисел. Иными словами, будем рассматривать функции, сопоставляющие каждому вещественному x£XaR некоторое число */ = /(*) £R. Функции могут быть заданы явным алгебраическим выражением, например: y=x* + 2xt y = l-xl(Vx+2), y=Vl + Yx. (1)
$2 1. Множества и функции. Логические символы 157 Правые части в равенствах (1) содержат правило «переработки» х в и. Первое из выражений (1) связано с таким правилом: данный х следует возвести в квадрат и прибавить к результату удвоенный х. Аналогично можно сформулировать правила, содержащиеся в остальных выражениях (1). Функции могут быть заданы с помощью известных из курса средней школы символов ехр, loga, sin, cos, tg, ctg, а также с с помощью комбинаций этих символов и алгебраических действий. Например, Рис. 35 y=log2Kl+sin*, у = 1 (tgAr)l/2_2^* (2) Очевидно, что при этом правые части равенств (2) определяют правила «переработки» х в у. Функции могут быть заданы с помощью следующего приема, который часто используется на практике. Пусть, например, ft и /2—функции, определяемые выражениями (1) или (2), и а—заданное число. Положим /<*) = ш при х < а, при х^а. (3) Равенство (3) можно истолковать как правило, по которому каждому х (из области определения, которая будет описана ниже) соответствует у. Это правило состоит в следующем: если заданный х меньше, чем а, то соответствующее этому х значение у вычисляется по правилу /у, если же х больше или равен а, то соответствующее значение следует определить по правилу /2. График функции / составлен из графика функции fx на участке ]—оо, а[ и графика функции /2 на участке [а, оо[ (рис. 35). Областью определения Е функции / является, очевидно, множество (Ех{\] — со, а[)и(£яП[я, ох>[). Здесь Е± и £а—соответственно области определения функций ft и /2; ]—со, а[ = {х£ R\x <a} и [ау oo] = {x€R\x^a}. 4°. Сложная функция. Обратная функция. Определение 4. Пусть /• X—►£/, g: U—+Y—отображения множества X в множество U и множества U в множество Y. Для каждого х£ X элемент g(f(x)) принадлежит множеству Y. Соответствие х —>• g(f (x)) задает отображение множества X в множество У, обозначаемое через gof и называемое композицией отображений. Если X, U, Y—числовые множества, то композиция отображений (функций) gof называется суперпозицией Функций, или сложной функцией.
158 Глава II. Введение в математический анализ Комментарий к определению 4. Правило, сопоставляю- 1 щее элементу х£Х элемент g(f(x))> состоит в том, что к х приме- | няется отображение / (при этом получается элемент f(x)£U), а I затем к полученному элементу f(x)£U применяется отображениеg\ I в результате имеем g (f (x)) $Y I Для числовых функций y = g(u), u = f(x) имеем (gof) (x)=g(f (х)). II Например: I если */ = и2, и = sin х, то у == (s'm х)2 = sin2 x\ I если у= tg«, и = х2, то у = tg (х2)\ 1 если y = cosu,u = x/2, то y = cos(x/2)—сложные функции. I ш\ Определение 5. Отображение (функция)/: X-*Y называется I инъективным (инъекцией), если различным значениям аргумента 1 соответствуют различные значения функции. 1 Определение 6. Отображение /: X—>У называется сюръек- | тивным (сюръекцией), если каждый у £Y является образом некото- 1 рого х£Х, т. е. существует х такой, что f(x) = y. i Определение 7. Отображение /: X —> Y называется биектив- 1 ним (биекцией), если оно является одновременно инъекцией и сюръ- I екцией. I Комментарий к определениям 5—7. Инъективное ото- 1 бражение обладает следующим свойством: различным значениям ар- I гумента соответствуют различные значения функции. Примером инъ- II ективного отображения /: R —> R могут служить монотонные функ- I ции—так называются те функции, которые большему значению I аргумента сопоставляют большее значение (монотонно возрастающие 1 функции), или те функции, которые большему значению аргумента I сопоставляют меньшее значение (монотонно убывающие функции). 1 Сюръективные отображения иначе называются «отображениями | на». Например, функция у = sin x является сюръективным отобра- I жением R на множество [—1, 1] и не является сюръективным ото- \ бражением R на все R (для точки у = 2 нет прообраза). I Биективное отображение является взаимно однозначным отобра- § жением /: X —->- У. Это значит, что каждому х £ X соответствует | y = f(x), разным х£Х—разные y£Yy и каждому y£Y соответст- § вует некоторый х£Х [такой, что y = f(x)]\ при этом разным y£Y 1 соответствуют разные х. Сказанное иллюстрирует рис. 36. I Определение 8. Пусть /: X—* К—- f f биективное отображение. Тогда всякому |1 у £ Y соответствует и притом единствен- | ный х такой, что f(x) — y. Соответствие || у —► х определяет отображение Y —+• X, <|| называемое обратным (к f) отображением^ и обозначаемое через f"1. Для числовых f множеств X, Y отображение f~l называ- j Рис. 36 ется обратной функцией. |
2 1. Множестве? и функции. Логические символы 159 Рис. 37 Комментарии к определению 8. 1) Из правила, сформулированного в определении, возникает следующее свойство обратного отображения (обратной функции): f{f~l(y)) = y для всякого у£У- 2) Функции (отображения) / и /-1 взаимно обратны, т. е. (/"-1)"1 = /. 3) Для того чтобы найти функцию, обратную к заданной y = f(x), следует из этого равенства выразить х через у (это возможно, если отображение / биективно). Так, для у = Зх + 2 обратное отображение задается формулой х = (у—2)/3; для у = х3—формулой х=1/у; для #=10v—формулой x = lgy и т. д. По традиции функции, обратные к у = Зх+2, у = х*, у=10*, обозначаются так: у=(х—2)/3, у=у/Гх, y = \gx, что отличается от приведенных выше выражений тем, что переменные х и у поменялись местами. Правило пересчета значения аргумента в значение функции для х=(у—2)/3 и у = (х—2)/3 одно и то же: из аргумента вычитается число 2 и разность делится на 3; различаются лишь обозначения значений функции и аргумента—в первом случае х и у, во втором у и х. Заметим, что графики функций х = (у—2)/3, х = \/у, х = lg у совпадают с графиками # = Злг + 2, у = х3, #=10v; в то же время графики функций у=(х—2)/3, #=£/#, y = lgx симметричны графикам у = Зх + 2, у = х3, у=Юх относительно биссектрисы I и III координатных углов (рис. 37, а—в). В математике часто употребляются выражения «для всякого элемента» и «существует». Для этих выражений приняты особые обозначения: первое обозначают символом V [перевернутая первая буква английского слова Any («любой»)], второе—символ 3 [перевернутая первая буква английского слова Existence («существование»)]. Мы будем использовать также символ =>, означающий «следует», «вытекает». Так, если А и В—два предложения, то А=$>В означает, Что из А следует 5. При этом если Л=>В и В=фЛ, то предложение А я В называют равносильными и пишут А & В (А равносиль-
160 Глава II. Введение в математический анализ Используя введенные обозначения, условие инъективности отображения /: X —>■ Y можно записать в виде Ухих2£Х, хгФх2 =>/(хг)Ф/(х2), а условие сюръективности отображения /: X—>Y — в виде Vy£Y 3x£X\f(x) = y (вертикальная черта перед f(x) — y читается «такой, что»)* def Обозначение А фф В применяют в том случае, когда хотят описать предложение А с помощью предложения В\ его читают так: «А по определению есть В». Например, запись def АаВ & {(ух) (*€ А) => (х6 В)} задает определение А как подмножество множества В: правая часть этой записи читается так: «всякий элемент х из А является также элементом множества 5». 5°. Взаимно обратные и взаимно противоположные теоремы. Всякое математическое утверждение (в том числе и теорема) имеет следующий вид: «если Л, то В», или, что то же самое, «из Л следует 5», Л=>В, где Л—условие, а В—заключение теоремы. Для всякого утверждения Л => В можно построить новое утверждение, поменяв местами Л и В, а именно, записать В=фЛ, т. е. «если 5, то Л», «из В следует Л». Теорема (утверждение) 5=>Л называется обратной по отношению к теореме (утверждению) А-=$>В. Очевидно, что теорема, обратная к обратной, совпадает с исходной, вследствие чего эти две теоремы называются взаимно обратными. Если исходная теорема верна, то обратная теорема может быть как верной, так и неверной. Примеры. 1. Прямая теорема (теорема Пифагора): если треугольник прямоугольный, то квадрат большей стороны равен сумме квадратов двух меньших сторон. Обратная теорема: если квадрат большей стороны треугольника равен сумме квадратов двух меньших сторон, то такой треугольник прямоугольный. В данном случае верна как прямая, так и обратная теоремы. 2. Прямая теорема: если углы вертикальные, то они равны. Обратная теорема: если углы равны, то они вертикальные. Здесь прямая теорема верна, а обратная—неверна. Для всякого утверждения (высказывания) Л обозначим через Л высказывание, состоящее в том, что Л ложно. __ Пример. Если Л — высказывание «7—число четное», то Л — высказывание «Неверно, что 7_ число четное»; если Л—высказывание «Завтра пойдет дождь», то Л — высказывание «Завтра дождя не будет»;.
tf 2.2. Предел числ. последоват. Предел функции в бесконечности и в точке 161 если Л— высказывание «Все пули попадут в мишень», то А — высказывание «Хотя бы одна пуля не попадет в мишень». _ Для теоремы «если Л, то В» утверждение «если Л, то В» называется противоположной теоремой. Теорема, противоположная к противоположной, совпадает с исходной. Пример. Для теоремы «Если в четырехугольнике сумма противоположных углов равна 180°, то около этого четырехугольника можно описать окружность» противоположной является теорема «Если в четырехугольнике сумма противоположных углов не равна 180°, то около такого четырехугольника нельзя описать окружность». В данном случае верна«как исходная (прямая) теорема, так и ей противоположная. / Противоположная теорема эквивалентна обратной теореме. Это означает, что противоположная теорема верна тогда и только тогда, когда верна обратная теорема. 6°. Необходимость и достаточность. Пусть утверждение «если Л, то В» верно. В этом случае говорят, что условие А достаточно для В, а условие В необходимо для Л. Пусть также верна теорема, обратная к данной, т. е. «если В, то Л». В этом случае В является достаточным условием для Л, а условие Л—необходимым для В. Таким образом, в рассматриваемом случае условие Л необходимо и достаточно для В (а условие В необходимо и достаточно для Л). Иначе говоря, условия Л и В эквивалентны: А имеет место тогда и только тогда, когда справедливо В. Пример. Теорема Безу: «Если а—корень многочлена Р (х), то многочлен Р (х) делится без остатка на х—а». Обратная теорема: «Если многочлен Р (х) делится без остатка на х—а, то а—корень многочлена Р (х). Как известно, теорема Безу и обратная к ней теорема верны. Поэтому необходимым и достаточным условием того, чтобы число а было корнем многочлена Р (х) является следующее: «многочлен Р (х) делится без остатка на х—а». Правильно и такое утверждение: «Для того чтобы многочлен Р (х) делился без остатка на х—а, необходимо и достаточно, чтобы число а было корнем многочлена Р (х)». § 2.2. Предел числовой последовательности. Предел функции в бесконечности. Предел функции в точке. Свойства функций, имеющих предел 1°. Предел последовательности. Определение 1. Функция, областью определения которой является множество чисел {1, 2, ..., п, ...} (натуральный ряд), называется последовательностью. Если значение Функции принадлежит множеству R вещественных чисел, то последовательность называется числовой. № 2636
162 Глава II. Введение в математический анализ Комментарий к определению 1. Значение функции (задающей последовательность),, соответствующее аргументу 1, обозначают через а1у аргументу 2—через a2J ..., аргументу л—через ап и т. д. При этом ах называют первым членом последовательности, а2— вторым членом, ..., ап—л-м членом и т. д. Последовательность аи a2J ..., ап, ... кратко обозначают (ап). Задать конкретную последовательность—значит явно указать, чему равен первый, второй, ..., л-й член последовательности и т. д. Другими словами, должно быть задано правило вычисления значения л-го члена последовательности по номеру этого члена при/г=1, 2, ... . Примеры. 1. Пусть an = qn~1, q=£0\ тогда аг = 1, a2 = q,a3 = q2,... ..., an = q"-\ .... 2. Пусть ай= 1/л; тогда ax = 1, а2 = 1/2, az — 1/3, ..., ап = 1/л, .... 3. Пусть ап — л2; тогда аг = 1, а2 = 4, а3 = 9, ..., а„ = л2, .... 4. Пусть яЛ = (—1)"; тогда аг==—1, а2 = 1, «3 = —1, ..., ап =я =(—1)л, .... Итак, г —1 при л нечетном, Л I 1 при л четном. 5. Пусть fl„= ^v2 ; тогда а! = 0, а2=1, а!3 = 0, а4= 1, ... # Итак, г 0 при л нечетном, л ~" I 1 при п четном. Может случиться так, что члены последовательности ап при неограниченном увеличении номера л неограниченно приближаются к некоторому числу С. В этом случае приходим к важному математическому понятию предела последовательности—этим пределом является число С. Необходимо, конечно, уточнить, что означают слова «члены последовательности при неограниченном возрастании номера л неограниченно приближаются к некоторому числу С». Это значит, что какое бы малое число е > 0 мы ни взяли, начиная с некоторого номера N все члены последовательности будут отличаться от числа С меньше, чем на е, т. е. (Ул > N)\an—С|<е. Определение 2. Число С называется пределом последователь* ности (ап), если для всякого числа 8 > 0 найдется такой номер N (зависящий от е), что все члены ап последовательности с номерами л, большими, чем N, удовлетворяют условию \ап—С|<е. В этом случае пишут \ш ап — С (читается: «предел ап при л, стремящемся к бесконечности, равен С»). Комментарии к определению 2. 1) Далеко не всякая последовательность имеет предел. 2) Интуитивно ясно, что в случае, когда последовательность (ап) имеет предел lim an = C, все члены последовательности с большими
S 2.2. Предел числ. последоват. Предел функции в бесконечности и в точке 163 номерами мало отличаются друг от друга — все они приближенно равны С. Точный ответ на вопрос, что значит «мало отличаются» и «приближенно равны», дает определение 2. 3) В некоторых случаях говорят, что предел последовательности равен бесконечности. Это имеет место тогда, когда ап неограниченно возрастает по абсолютной величине при п—^оо. Более точно: если для всякого (сколь угодно большого) числа М > О существует такой номер N, начиная с которого все члены последовательности (ап) обладают следующим свойством: а) | ап | > М\ б) ап > М\ в) — ап > М, то говорят, что предел последовательности ап равен: а) бесконечности; б) плюс бесконечности; в) минус бесконечности и пишут: a) lim ап=оо\ б) lim а„ = +оо; в) lim an = — оо. Отметим следующую особенность терминологии: если предел последовательности равен бесконечности, то это значит, что предел последовательности не существует (бесконечность не является числом). 4) Если lim an = C, то говорят, что последовательность точек ап П -> СО сходится к точке С (числа ап и С отождествляются с соответствующими точками числоеой прямой). Проследим за выполнением всех требований, предъявляемых к пределу определением 2, для последовательности an=ll]/"n. Покажем, что lim а„ = 0. / Действительно, пусть 8 > 0. Рассмотрим неравенство К-0|<8, (1) или |1/|/-д_0|<в, (2) Имеем 1/|/"п < е; \/п < е2, т. е п>1/е2. (3) Положим N = [1/е2] + 1, где [1/е2] — целая часть числа 1/е2. Очевидно, что если п> N, то п > 1/е2 и при всяком п, удовлетворяющем условию (3), выполняется неравенство (2), т. е. (в данном случае) неравенство (1). Заметим, что вычисление номера N по данному 8 для доказательства существования предела—это задача учебного характера. В дальнейшем будем вычислять пределы по другим, более простым и удобным правилам. 2°. Предел отношения многочленов. Пусть последовательность (ап) задана в виде функции an = Pk(n)/Ql(n). Здесь Pk{n) и Qt{ri)—многочлены от п соответственно k-й и Z-й степени: Pk (fl) = Poflk + РгП*-1 +...+pkf Qi (n) = qji* + qxnl-i + ... + ?,; 6*
164 Глава //. Введение в математический анализ Роу Ри •••, Pk> ?o> 4i9 *•*, Qi—некоторые вещественные числа, причем р0фО, <7о=^0. Вопрос о существовании и вычислении предела lim an решается П-+ сю просто. 1. Пусть & = /; тогда lim an= lim W^+Pi»*'^ •■•+/>» (4) Разделив числитель и знаменатель дроби (4) на nk, получим lim а„ = lim : ^-. (5) При больших п числитель и знаменатель дроби (5) близки соответственно к числам р0 и <7о (поскольку l/п, 1/п2, ..., 1/л* при больших п близки к нулю). Таким образом, выражение под знаком предела при больших п близко к pQ/q0. Отсюда lim an — p0/q0. П -*со 2. Пусть k > /; тогда lim а = lim ^*+^я*"1+ -••+*>* (6) Разделив числитель и знаменатель дроби (6) на nk, имеем lim an= lim = : г—. (7) Л-*оо л-* go ~__J i_a 1 L ..4.(7,1 При больших /г числитель и знаменатель дроби (7) близки соответственно к р0 и 0. Отсюда lim an = oo /'точнее, lim an— +°°> если П -> СО V Л -*- СО Po/q<> > 0 и lim ая = — оо, если p0/q0 < 0Y /2 -> оо / 3. Пусть /г < /; тогда, разделив числитель и знаменатель дроби (6) на п1, получим Po—r-r + Pi -ГТ77+ '#' +Pk"T pl—R fll—R+1 fll lim aw= lim — s ? . (8) /i ni При больших п числитель и знаменатель дроби (8) близки соответственно к 0 и q0. Отсюда Jim a„ = 0. п -*• со Итак, в случае, когда ап—отношение двух многочленов, предел lim an равен: отношению старших коэффициентов этих многочле- нов, если их степени совпадают; бесконечности, если степень числи-
2.2. Предел чидл. последоват. Предел функции в бесконечности и в точке 165 теля больше степени знаменателя; нулю, если степень числителя меньше степени знаменателя. Конечно, приведенные выше рассуждения не являются строгими доказательствами, но тем не менее они дают наглядное объяснение сути дела. ч ,. Аг3Н-Зп2— 1 ,. 1+3/л— 1//г3 1 Примеры. 1. Ш^ 2дз_3л + 6 = Дтю 2-3/п? + 6/л» = Т- 2. hm (л + 1)з -*• /г -*■ ее v ' ' 3. Приближенное значение выражения » з_з д-6 ПРИ n==^000 и при п= 1000 000 составляет 1/2. Vi^^^ + l^00' 3°. Предел функции. Пусть дана функция y=f(x), область определения которой содержит множество вида ]а, оо[ при некотором а. По аналогии с определением предела последовательности дадим следующее определение. Определение 3. Число CgR называется пределом функции f(x) при х, стремящемся к плюс бесконечности, если для всякого е > 0 найдется такое число N (зависящее от е), что при всех х, больших N, выполняется неравенство |/(ж)-С|<в. (9) В этом случае пишут lim f(x) = C. Комментарии к определению 3. 1) Можно говорить о пределе функции f(x) при х, стремящемся к минус бесконечности: число С называется пределом функции f (х) при х-+ — оо, если для всякого 8 > 0 существует число М > 0 такое, что для всех х <—М выполняется неравенство (9). В этом случае пишут lim f(x) = C. х- Можно говорить о пределе функции f(x) при х, стремящемся к бесконечности (по абсолютной величине): число С называется ripe- делом функции f(x) при х—*оо (по абсолютной величине), если для всякого е > 0 существует число М, такое, что для всех х, удовлетворяющих условию |л:|>Л1, выполняется неравенство (9). В этом случае пишут lim f(x) = C. В приведенных выше определениях предполагается, что функция f(x) определена в некотором интервале ]—оо, а] для lim f (x) х-> — со и в некоторой области вида ]—оо, а] (J [Ь, оо] для lim f(x). \x\-+ad 2) Интуитивно ясно, что все значения f (х) для «больших» х, т- е. для х > М [в случае lim f(x)], для х <—М [в случае *-* + со
166 Глава II. Введение в математический анализ *" Тс, -™^2 «^ ///77 ОД -С \J^ ///77 ОД=fr Тс2 У ^Т ///77 ОД-С * I |jf|-*o. Рис. 38 Hm f(x)]n для |x|>M [в случае lim f(x)] мало отличаются Х-> - со | х | -*• со друг от друга и «приближенно равны» С. 3) Графики функций f(x), для которых существуют пределы lim / (л:) , lim / (х), lim / (х), обладают следующей особенностью: X -*■ + со X -*• - со | ^ | -> со горизонтальная прямая, уравнение которой// = С, неограничено сближается с графиком функции y = f(x) при х—>• оо, х—►—оо и [ а: | —юо (рис. 38). Например, lim arctgx~n/2 (чем ближе тангенс угла к +оо, Х-+ + 00 тем ближе сам угол к я/2); lim arctg# = — я/2 (чем ближе тангенс X -** - оо угла к —оо, тем ближе сам угол к —я/2). Сказанное иллюстрирует рис. 39. Определение 4. Число CgR называется пределом функции f (х) при ху стремящемся к х01 если для всякого е > О существует такое б > 0, что при всех хфх0, удовлетворяющих неравенству \х—#о|<б, выполняется неравенство |/(я)—С|<б. В этом случае пишут lim f(x) = C* х -+х0 Комментари.и к определению 4. 1) Определение означает, что при значениях х> близких к х0, значения функции }(х) близки к С. Сложность формулировки определения 4 вызвана необходимостью точно указать смысл выражений «значения аргумента л% близкие к лг0» и «значения функции f(x) близки к С». 2) Для большого класса функций (непрерывных функций) выполняется равенство * lim/(*) = /(*„), X-*Xq (Ю) означающее, что предел f(x) при х—+х0 существует и равен значению функции /(х0) в точке д:0. Таким образом, вопрос о существовании и вычислении предела для непрерывных функций (именно
такие функции, как правило, встречаются в прикладных задачах) решается довольно просто. Представляет интерес задача вычисления Jim f(x) для функции f (х), непрерывной в окрестности точки л:0, но не определенной в самой точке х0. В этом случае формула (10) не имеет смысла, и вычисление предела связано с преодолением некоторых математических трудностей (подробнее см. § 2.3). 3) Очевидно, что lim C = C, если С—постоянная. X —> Xq 4) Иногда рассматривают понятия односторонних пределов (справа и слева) Hm f(x) и lim f(x). Подробнее об этом см. § 2.8, п. 1а х-+х0 + 0 х-+хо-0 и § 2*.8. 4°. Теоремы о существовании пределов. Ниже сформулированы некоторые теоремы, устанавливающие (при определенных условиях) существование предела. Теорема 1 (о пределе монотонной ограниченной последовательности). Монотонно неубывающая последовательность, ограниченная^сверху, имеет предел. Доказательство приведено в § 2*.2, I. Комментарии к теореме 1. 1) Теорема 1 сформулирована для монотонно неубывающей (условие ап-^ап+19 /г== 1, 2, ...) и ограниченной сверху (условие М > ап, п= 1, 2, ...) последовательности. Справедлив и другой вариант теоремы: монотонно невозрастающая и ограниченная снизу последовательность имеет предел. 2) Теорема 1 позволяет установить существование предела без предварительной проверки выполнения довольно сложных условий определения 1. Согласно теореме, для существования предела достаточно убедиться в том, что имеют место сравнительно легко проверяемые свойства монотонности и ограниченности. Многие задачи математического анализа связаны со вторым замечательным пределом „'™(i+v)"=<- с» Можно показать (см. § 2*.2, 2), что (1+я)*<(1+^гГ'" (>+!)"<3<» = 1,2,...), (12) т- е, что последовательность с общим членом (1+ —J является монотонно возрастающей и ограниченной сверху (числом 3). Поэтому в силу теоремы 1 предел (11) существует; этот предел и принято обозначать буквой е. Известно, что е = 2,7182818284590452353 Теорема 2А Пусть f(x), g(x), h(x) —три функции такие, что /(*)<*(*)<*(*); (13)
•1|58 . , Глава IL Введение > в математический анализ : пусть, далее, существуют и равны между собой пределы lim f(x) и lim ft (л;). Тогда существует и предел lim g(x), причем X -*• Xq X -> Х0 lim f(x)= lim g(x)= lim ft (л:). X->Xq X -*• X0 X -*■ X0 Доказательство приведено в § 2*.2, 3. Комментарий к теореме 2. Значение теоремы состоит в том, что можно исследовать данную (возможно, сложную функцию g(x)), с помощью (быть может, более простых) функций f(x), h(x), удовлетворяющих условиям (13). Эта идея используется при доказательстве существования и вычисления первого замечательного предела: sin (х) X lim 1. (14) Из рис. 40 видно, что площадь Sx треугольника AOD, площадь S2 кругового сектора OAD и площадь S3 треугольника OCD связаны соотношениями S± < S2 < S3, т. е. sin x < х < tg x. (15) Отсюда при я>0, разделив неравенство (15) на sinx, получим 1 К sin* < (16) 1 1 X Так как jim 1 = lim т^т1^ Ь то в силу теоремы 2 имеем \\т-^^= 1, cos* Х-+0 Х-+0 *-v"* " X-+Q что равносильно соотношению (14). Теорема 3 (критерий сходимости Кош и). Если последовательность имеет предел, то выполняется следующее условие: для всякого г > 0 найдется такое N, что все члены последовательности с номерами р, q > N удовлетворяют неравенству \ар—aq| < 8. Обратно, если последовательность (ап) обладает тем свойством, что для всякого г > 0 найдется такое N, что все члены последовательности с номерами р, q> N удовлетворяют неравенству \ ар—aq | < st то такая последовательность имеет предел. Доказательство приведено в § 2*.2, 4. Комментарии к теореме 3. 1) Теорема устанавливает необходимый и достаточный признак сходимости последовательности (заметим, что теоремы 1 и 2 дают лишь достаточные условия сходимости). 2) Наглядный (но требующий, конечно, уточнения) смысл условий сходимости, сформулированных в теореме 3, заключается в том, что все члены сходящейся последователь-
2 2. Предел числ. последоват. Предел функции в бесконечности и в точке 169 ности ап при больших п близки друг к другу и, обратно, последнее условие гарантирует сходимость последовательности. 5°. Свойства функций, имеющих предел. Ниже сформулированы некоторые свойства функций, имеющих пределы. Доказательства справедливости этих свойств приведены в § 2*2, 5. 1°. Пусть f (л:), g (х)—функции, для которых существуют lim / (х), lim g(x). Тогда: а°) существует lim f(x)+g(x) и X -> Xq 4im [/(*)+£(*)]= lira f(x)+ lim g(x); X ""*• Xq X ""*■ Xq X —► Xq б) существует lim f(x)g(x) и X-* Xq lim f(x)g(x)= lim /(*)• lim #(*); б частностиy для всякой постоянной с lim cf(x) = c lim /(л:); ЛГ —>■ Xq X —*■ Xq в) при lim g-(x)^=0 существует lim f{x)/g(x) и Х-+Ха X -> ДГ0 /(*) lim /(*) #о Нт —т-г- — -г: 7Т • х-+х0 ё(*) Ьт gfW 2°. £Ъш f(x)<g(x), то lim f(x)^. lim g(x). # —► Xq Jf —> Xq 3°. Связь между функцией и ее пределом. £сла lim f(x) = C, то lim /(л:)—С = 0 и, обратно, из lim /(*)—С = 0 Л' ~> Х0 X -+ Xq X -+ Xq следует, что Нт /(л:) = С. 4°. Если lim f (y) = A, lim g (л:) = */0, то Нт / (g (х)) = Л. Комментарии к свойствам 1°—4°. 1) Возможен случай, когда предел произведения существует, в то время как пределы сомножителей не существуют. Пусть, например, f(x) — функция, не имеющая предела при х —+- х0 и не равная нулю в окрестности точки *о- Положим g(x) = l/f(x). При этом lim / (x) g(x)= lim 1 = 1, Х ~^ Xq X —► Xq однако lim f (x) не существует по условию ( lim g(x) также не X —> Xq X —*■ Xq существует).
170 Гла а II. Введение в математический анализ -Щ 2) Следует выделить отдельно задачу о вычислении предела lim / (х) g (х) при условиях lim / (х) = 0, lim g (x) = оо (в этом слу- х -*■ х0 х -+ Хо х -*• х0 чае говорят о раскрытии неопределенности вида 0-оо). 3) Если lim g(x) = 0 и lim / (*) = С =^= 0, то легко установить, х -* х0 х-+х0 что lim / (x)/g (x) = оо. X -> Х0 4) Если же lim g (x) = 0, lim / (х) = 0, то lim f(x)/g (x) может: Х-+ Х0 Х-+ Х0 X -*• Х0 а) не существовать; б) быть равным бесконечности; в) быть равным конечному числу, отличному от нуля; г) быть равным нулю. Исследование предела вида lim / (x)/g (x) при условиях х-+х0 lim / (х) = 0, lim g(x) = О называют раскрытием неопределенности X ""*" Xq X —> Xq вида 0/0. Основные трудности раскрытия пределов как раз и состоят в раскрытии неопределенностей вида 0-оо, 0/0 и других видов (подробнее об этом см. § 3.6, пп. 2°—4° и § 3*.6). 6°. Упражнения Вычислите пределы: п2 + 8п+\ (п + 1)3 !'Л™ 2^-5 ' 2-ЛШоо(2^-1)(* + 8)- (tt + l)*-(ft-l)4 . .. 1-я . .. 2/2*4-5 3'Лт* 3^+5 • 4-.ДШ.ТИ=2- ^Д^-Зп^Г- я3 sin л: cos д: 6. litn о~2—Г • 7. lim —-—-. 8. lim в2я*-1- их+„х*+\' '^» ^2+1' 9. lim ilH^i. 10. lim fi-i-J-Y. И. lim 1/44-2. . § 2.3. Непрерывность функции. Непрерывность основных элементарных функций 1°. Непрерывные функции. Определение 1. Функция /(*), определенная в некоторой окрестности точки х0У называется непрерывной в точке х0, если lim f(x) = f(xa). (1) Определение 2. Функция / называется непрерывной на множестве QcR, если она непрерывна в каждой точке этого множества. Комментарии к определениям 1 и 2. 1) Термин «непрерывная функция» можно пояснить следующим образом. Условие (1) означает, что значения f(x) и / (х0) близки, если близки х и х0. Таким образом, малому изменению аргумента непрерывной функции соответствует малое изменение значений функции. Это свойство согласу-
2.3. Непрерывность функции. Непрерывность основных элементарных функций 171 ется с тем, что график непрерывной функции есть непрерывная (в наглядном смысле) кривая (хотя она может сильно отличаться от обычного представления о такой кривой как о следе, оставленном на бумаге росчерком карандаша). 2) Часто используют следующий вариант определения непрерывности функции f (х) в точке х0: функция f(x) непрерывна в точке х0 тогда и только тогда, когда &y = f (х0 + &х)—/ (дг0) стремится к нулю при Ал: —* 0. Это утверждение легко доказать, основываясь на определении 1. 2°. Непрерывность основных элементарных функций. Как уже отмечалось в § 2.2г многие из функций, встречающихся в прикладных задачах, являются непрерывными. Ниже перечислены некоторые классы таких функций и сформулированы утверждения об их непрерывности. Эти функции называются основными элементарными функциями. Доказательства их непрерывности см. в § 2*.3. Определение 3. Функция вида y = f(x) = Pk(x)/Ql(x), (2) где Рк(х) и Qi(x)—многочлены от х соответственно &-й и /-й сте-_ пени: Pk(x) = р0х* + р^*-1 + ... + pk(Pi£R, t = l, 2, ..., k, РоФО), Ql(x) = q0x'+q1x'-i+...+ql(q/eR, /=1, 2, ..., /, q^% называется рациональной функцией. Лемма 1. Рациональная функция (2) непрерывна во всех точках х, в которых она определена, т. е. при всех х таких, что Qt (x) Ф 0. Определение 4. Функция вида y = f{x)=--a\ (3) где а > 0, аф\, называется показательной функцией. Лемма 2. Показательная функция (3) непрерывна во всех точках области определения, т. е. при всех x£R. On ределение 5. Функция вида y = f(x) = \ogax, (4) где а > 0, аф\, называется логарифмической функцией. Лемма 3. Логарифмическая функция (4) непрерывна во всех точках области определения, т. е. при всех х > 0. Определение 6. Функция вида y = f(x) = xP9 (5) где рфО—вещественное число, называется степенной функцией. Лемма 4. Степенная функция (5) непрерывна при всех х, принадлежащих области ее определения.
172 , Глава IL Введение в математический анализ Область определения Q^ функции (5) при различных р такова: если р — рациональное число, т. е. p — r/s и дробь г Is несократима, то ]—оо, +оо[ при s нечетном и r/s > О, ]—оо, 0[и]0, +оо[ при s нечетном и r/s < О, fi/7 = 1 [0. +°°[ ПРИ s четном и r/s>0, <6) ]0, +оо[ при s четном и г Is < 0; если р—иррациональное число, то Q/? = [0, + оо[ при р>0 и Оя=]0, +оо[ при р<0. Лемма 5. Тригонометрические функции y — s'mx, y = cosxt y—tgx, у — ctg x непрерывны во всех точках х области определения, т. е. при всех x£R в случае z/ = sinx, у = cosx\ при всех *£R, хФя/2 + nk, k£Z, в случае y=tgx и при всех x£R, хфлк, k £ Z, в случае у = ctgx. Лемма 6. Обратные тригонометрические функции r/ = arcsinx, у = arccos x9 y = avctgx, r/ = arcctgA: непрерывны во всех точках области определения, т. е. при х£[—1, 1] в случае arcsin л:, arccos x и при всех x£R в случае # = arctgA:, z/^arcctg*. Определение 7. Функция, получающаяся из основных элементарных функций с помощью конечного числа композиций, операций сложения, умножения и деления, называется элементарной функцией. Например, функция у =[ln(Karccos.x:+ 1)]3/2 — элементарная, а функции # = |л:| и у= lim(cos*) - — неэлементарные. Теорема (онепрерывностиэлементарныхфункций). Элементарная функция непрерывна во всех точках области определения. Доказательство. Теорема является непосредственным следствием лемм 1—6, а также свойств 1 и 4 функций, имеющих предел (см. п. 5° § 2.2).. Комментарий к теореме. Теорема позволяет вычислять пределы вида lim /(#), где f(x)—элементарная функция и х0 при- X —>■ X о надлежит области определения этой функции, а именно, lim/(*) = /(*). (7) Х~> Xq На практике вычисляют значение элементарной функции, стоящей под знаком предела, при х = х0. Если в результате получено некоторое число, то оно и является пределом (это имеет место, когда х0 принадлежит области определения). Если же в результате подстановки значения х0 вместо х получается формальное выражение вида 0/0, оо/оо, О-оо, I00, оо — оо, оо°, 0°, то говорят о неопределенности соответствующего вида. В этом случае исследование предела и его вычисление—более трудная задача, для решения которой следует применять специальные методы (правило Лопиталя, использование эквивалентности бесконечно малых).
§ 2.3. Непрерывность функции. Непрерывность основных элементарных функций 173 3°. Примеры 1. Найти предел lim * "}\ . Х-+ 4 Х ° Решение. Используя формулу (7), получим 2. Найти ^предел lim Х-+ 2Х* Решение. Подставляя х = х0 = 2 в выражение (х2—4)/'(х—2), приходим к неопределенности вида 0/0. Заметим, что (х2-—4)/(х—2) = = х + 2 при х Ф 2. Отсюда lim ^£ = Hjn (x + 2) = 2 + 2 = 4. л; -> 2 * ^ л: -* 2 3. Найти предел lim (1-|—) . Решение. Подстановка п = оо в выражение Г1 -)— J дает (1+0)<х> = 1°°, т. е. неопределенность вида I00. Как известно, lim (14 — ) =е« 2,718 ... (см. комментарии к теореме 1 § 2.2). 4. Найти предел lim (Vx2 + 1— Vx2— 1). Решение. Подстановка х=оо в выражение Vx2+l—]/rx2 — 1 дает неопределенность вида оо — оо. Этот предел можно вычислить с помощью следующего приема: нш (V^+i-V^i) = lim" (Г^^-У^)(У^+У^=Т) л-->оо х-+* Vx2+\+vrx*-\ (числитель и знаменатель умножили на Vx2 + l + Vx2— 1—выражение, сопряженное числителю). Далее, lim (KF+T—Vltf^X) = lim r - - Подстановка #=oo в выражение 21 (Vx2 + 1 + Yx2 — 1) дает 2/оо. Таким образом, lim {Vx2+ 1 —V^jc2 — 1) = 0. X->QO 4°. Упражнения Вычислите пределы: . v *2+1 Л ,. лг2 —Зх+2 1. lim у /, . 2. lim .-—л ' . ж- 0 ,. *2 — 8лг+12 л л xb—x—Z0 3' lim %—л 4* lim T*—ЪыГТГ■ #-►2 X2 — 4 *•-* 2 х —0#-hO
174 Глава II: Введение в математический анализ 5. \im Vx2+x-Vx'-2x. 6. lim L *r- — У x *-> oo X 7. lim In x. 8. lim arcsin x. x->e x-+i л/"хАЛ 9. lim In a:. 10. lim '. § 2.4. Бесконечно малые функции и их свойства 1°. Бесконечно малые функции. Определение. Функция f(x) называется бесконечно малой при х —> х0 (х0 £ R или х0 = ± сх>), если lim /(*) = 0. *-> Хо Например, функции sinx, 1—cosx, tgx, е*— 1, loga(l+*), Y\ +x—1 являются бесконечно малыми при х—>0. Важность понятия бесконечно малой функции во многом определяется известным свойством предела (см. § 2.2, п. 5°): если lim f(x) = C, то lim f(x)—С = 0, т. е. разность между функцией *-**„ х-+х0 f(x) и ее пределом С является бесконечно малой функцией. Некоторые свойства бесконечно малых функций непосредственно вытекают из свойств функций, имеющих предел (см. § 2.2, п. 5°). 1°. Сумма и произведение бесконечно малых функций являются бесконечно малыми функциями, (Отношение двух бесконечно малых функций не является, вообще говоря, бесконечно малой величиной. Исследование отношения двух бесконечно малых функций представляет собой задачу раскрытия неопределенности вида 0/0.) 2°. Если f(x), h(x)—бесконечно малые функции и g (x)—функция,, удовлетворяющая условию f(x)^g (х) < h (x), то функция g (x) является бесконечно малой, В дальнейшем будет использовано следующее свойство бесконечно малых функций. 3°. Пусть f(x) — бесконечно малая функция при х—+х0, a g(x) — ограниченная функция в некоторой окрестности точки х0 (последнее означает, что существует такое число Му что для всех точек из указанной окрестности \g(x)\< M). Тогда произведение f(x)g(x) является бесконечно малой функцией. Доказательство приведено в § 2*.4. 2°. Упражнения Покажите, что следующие функции являются бесконечно малыми: 1. ±-£ti--f2 при х-+0. 0 *2_з* + 2 1 f 2- Х2^4х + 3 -Т ПРИ *-+1-
§2.5. Бесконечно большие функции и их свойства 175 3. • ПОИ X-+QO. Vx+Ъ 4. -— при х —* оо. \пх 1 х2 + Б / § 2.5. Бесконечно большие функции и их свойства. Связь между бесконечно большими и бесконечно малыми функциями 1°. Бесконечно большие функции. Определение. Функция f(x) называется бесконечно большой при х —* х0 (х0 £ R или л:0 = ± оо), если lim /(л:) = оо. х-> х0 Например, функции l/х, 1/х2, ..., 1/хп, ... —бесконечно большие при х-+0; функции \пх, l/sin*, ctg*—бесконечно большие при х—+ 0, а функция y—tgx—бесконечно большая при х—+п/2. Отметим следующие свойства бесконечно больших функций (их доказательства приведены в § 2*.5). 1°. Пусть f (х)—бесконечно большая функция, a g(x)—такая функция, что g (х) > h > 0 в некоторой окрестности точки х0 (h — некоторое вещественное число). Тогда f{x)g(x)—бесконечно большая функция, т. е. lim f(x)g(x) = oo. X —*■ Xq 2°. Пусть f(x)—бесконечно большая функция, a g(x)—функция, ограниченная в некоторой окрестности точки х0. Тогда f(x)+g(x) — бесконечно большая функция, т. е. lim / (x)-{-g(x) = oo. х-+х0 3°. Если f(x)—бесконечно большая функция при х—+х0, то l/f(x)—бесконечно малая функция при х—>х0. Обратно, если}(х) — бесконечно малая функция при х—>х0, отличная от нуля в некоторой окрестности точки х0, за исключением, быть может, самой точки х0, то l/f(x)—бесконечно большая функция. Комментарий к свойствам 1° — 3°. Разность двух положительных бесконечно больших функций может быть бесконечно большой, бесконечно малой или даже функцией, не имеющей предела. В этом случае говорят о неопределенности вида оо — оо. 2°. Упражнения Покажите, что следующие функции являются бесконечно большими: 1. 1/л;3 при х -> 0. 2. In л: при х —у оо. 3. tg х при х —>■ я/2. 5. (1/2)* при *-* — оо.
176 Глава II. Введение в математический анализ § 2.6. Сравнение бесконечно малых. Эквивалентные бесконечно малые. Их использование при вычислении пределов 1°. Сравнение бесконечно малых. Определение 1. Пусть f(x) и g(x)—две бесконечно малые функции при х—+х0 и g(x) отлична от нуля в некоторой окрестности точки х0 (за исключением, быть может, самой точки х0). Тогда: если lim f(x)/g(x) = 0, то f(x) называется бесконечно малой более высокого порядка, чем g(x), a g(x)—бесконечно малой более низкого порядка, чем f(x). В этом случае пишут f(x) = o(g(x)) [«f(x) есть о малое от g(x)»]\ если lim / (x)/g (х) = С Ф О, то / (х) называется бесконечно малой X —*■ Xq одного порядка с g(x)\ если lira f(x)/g(x) — оо, то f(x) называется бесконечно малой х-+х0 более низкого порядка, чем g(x), a g(x)—бесконечно малой более высокого порядка, чем f(x). Комментарий к определению 1. Смысл определения можно наглядно (но нестрого) проиллюстрировать следующим образом. Если f(x)—бесконечно малая более высокого порядка малости, чем g(x), то при х, близких к х0, значения функции f (х) много меньше, чем значения функции g(x). Иными словами, / (х) стремится к нулю быстрее, чем g(x). Аналогично можно проиллюстрировать случаи lim / (x)/g (x) =ч = СфО, lim f(x)/g(x) = oo. х-+х0 Примеры. 1. Пусть / (х) = хп, g (х) = хп\ "т, n£Z, т > п > 0. Тогда если х—*0, то f (х) является величиной бесконечно малой более высокого порядка малости, чем g(x): lim -Щ- = lim ^-= lim хт~п = 0. 2. Функции sin л: и х при х—>0 являются бесконечно малыми одного порядка малости, так как lim SHLf=i (первый замеча- Х-* 0 Х тельный предел). Определение 2. Две бесконечно малые при х —► х0 функции / (х) и g (x) такие, что lim / (x)/g (x) = 1, называют эквивалентными и X—>■ Хо пишут f (х) ~ g (х) при х —> х0. Две бесконечно большие при х—>х0 функции f(x) и g(x) такие, что lim / (x)/g (x) = 1, также называют эквивалентными и пишут *-> х0 f(x)~g(x) при х-+х0. Комментарии к определению 2. 1) Очевидно, что эквивалентные бесконечно малые являются бесконечно малыми одного порядка.
6 2.6. Сравнение бесконечно малых. Эквивалентные бесконечно малые 177 2) Из двух эквивалентных бесконечно малых одна может быть очень простой, а другая—сложной. В некоторых случаях при вычислении пределов можно заменять бесконечно малую величину ей эквивалентной. При этом вычисления упрощаются. Точное утверждение сформулировано ниже. Теорем а-J. Пусть f (х)—бесконечно малая функция при х —>• х0, g(x)—эквивалентная ей бесконечно малая и h(x)—некоторая функция, определенная в некоторой окрестности точки xQi за исключением, быть может, самой точки х0. Тогда lim / (л:) h (х) = lira g (x) h (x). (1) X -> Х0 X -+ Х0 Доказательство. Имеем lim f(x)g(x)=Km fMg(x)h(x)~ X -*• Xq X —> #0 » ^ ' = lim -—-(• lim g(x)h(x)= lim g(x)h(x). X -»• X0 8 W X -*• Xq X-+X0 Здесь использовано свойство предела произведения двух функций и условие lim / (x)/g (x) = 1. х -> ;;0 Комментарий к теореме 1. В соответствии с формулой (1) бесконечно малую f(x) можно заменить эквивалентной ей бесконечно малой g(x) при условии, что f (х)—множитель в выражении, стоящем под знаком предела. При невыполнении этого условия, вообще говоря, было бы ошибкой заменить f (х) на g(x). Разумеется, f (х) заменяют на g(x) в том случае, когда g(x) проще, чем f(x). 2°. Основные эквивалентности. Ниже приведены важнейшие эквивалентности, которые используют при вычислении пределов. 1. sin х ~ х при х—*0, поскольку lim 5HL£ = i (первый замеча- *->о х тельный предел). 2. 1—cosa;~x2/2 при л;—**0. Действительно, lim 1=™£ = иш Щ^ = И* *Щ№ -1. х^о Х 'Z х^О Х lZ x-+Q x >г Здесь в предпоследней части равенства в соответствии с теоремой 1 sin (я/2) заменен на х/2 (эти функции являются эквивалентными бесконечно малыми). 3. 1п(1+*)~* при х—>0. 4. е*—1 ~х при х—+ 0. 5. (1 +x)k— 1 ~ kx при х—*0. 6. ]/\ -\-х—1 ~ x/k при х—*0. 7. tg х ~ х при х —> 0. 8. Бесконечно большая функция а^ + агхп^г + ... +ап (а0=£0)9 при х —> оо эквивалентна функции а0хп.
178 Глава II. Введение в математический анализ Доказательства приведены в § 2*.6, I. Примеры. 1. Найти Jim J^Tg^y Решение. Имеем «. 1 — cos * *. *2 ,. х2 1 iroln(i + te-x) = J»05Tgn = j!»S« = T- Здесь 1—cos л: заменено эквивалентной бесконечно малой х2/2\ ln(l+tg2x) заменено на tg2x, так как 1п(1 + */)~у при у—+0; затем tg2x заменен эквивалентной бесконечно малой х2\ таким образом, In(1 + tg2x) ~х2 при л:—*(Х о тт м 1. tg*—sin* 2. Найти hm ——5 . ► О Xй lim Решение. Имеем u,t&*— sin* |. (1 —cos*) sin* «. *2 * *+o * x-+o a:3 cos* ^o 2 *3cos* ^02cos* 2 Здесь учтено, что 1—cosa:~a;2/2 и s\nx~x при х-^0. Определение 3. Бесконечно малая функция f(x) называется ограниченной по отношению к бесконечно малой g(x), если функция f{x)lg{x) ограничена, т. е. существует такое число М, что в некоторой окрестности точки х0 выполняется неравенство Щ-у < М. В этом случае пишут f(x) = 0(g(x)) [«/ (х) есть О большое от £(*)]• 3°. Выделение главной части. Теорема 2. Пусть f(x), g(x)—две эквивалентные бесконечно малые функции при х—>%• Тогда функция f(x)—g(x) является бесконечно малой более высокого порядка, чем f{x) и g{x), m. е. f (x)—g(x) = o(f (x)); f(x)—g(x)=* = o(g(x)). Доказательство. Имеем lim /W-gW=lim (l_em=sl_^m ^ = 1_1==0. Теорема 2 позволяет представить приведенные выше эквивалентности в следующем виде: *2 s'mx^=x + o(x)\ 1—cos х =-£--{-о (х2); ln(l+x)=x + o(x)\ е*—1=х + о(х); • (2) \/l+x —l=^+o(x)\ tgx = x + o(x). Представление бесконечно малой функции f(x) в виде f(x)=Axk + o(x% (3)
& 2.6, Сравнение бесконечно малых. Эквивалентные бесконечно малые 179 прИ х-+0 называется выделением главной части, а бесконечно малая Axk—главной частью бесконечно малой функции f(x). Пример. С помощью выделения главной части найти предел .. in(l+2*-*2) + sin(*-*2) ,, j™ sin3* + tg3*-(e*-l)2 ' w Решение. Учитывая известные эквивалентности In (1 + Hi) ~ У и siny2~y2, sinУз~Уз, tgx~x, е* — \~х при х-+0 {у1 = 2х—х2, у2 = х—х2> у3 — 3х) и выделяя главные части, по теореме 2 получаем: In (1 + 2х—х2) = 2х—х2 + о {2х—х2)\ sin (х—х2) — х—х2 + о (х—х2)\ (*#) s'm3x = 3x + o(x)\ tg3x = x3 + o(x3)\ (ex — l)2 = (x + o(x))2==x2 + 2xo(x) + o(x2)==x2 + o(x2). В этих равенствах примем во внимание соотношения о (2х—х2) — о(х), о(х—х2) = о(х), (#**) поскольку О = lim ° (2х~х2) = lim ° (2х~х2) х =* х-+о ** * х_^0 х z.x х и о(2х—х2) ,. * 1 ,. о(2х—х2) 0 = iim °Jipp=lim iC£^!)^_ = д-^0 * *' x-+Q X XX «lim ^lz^>. lim -L_2=l.lim ££=£. *-*0 * ^->0^ x x-+Q x Учитывая соотношения (**#), подставим теперь выражения (##) в (*): lim " 2х—х2 + о(х)+х—х2 + о(х) у Зх-\-о (х) у З + о (*)/*« xJl0 Зх + о (х)+х* + о (х*)-х2-о (х2) i™ 3* + о (*) J™ З + о (*)/*" Здесь учтено, что —х2 = о(х), х3 = о(х) и о(дг) + о(*) = о(*) при х-+0. В этом примере части выражения (#) были заменены равными им правыми частями формул (**). Отметим, что замена этих частей эквивалентными им функциями была бы необоснованной, поскольку такую замену можно осуществлять лишь тогда, когда заменяемая функция является множителем в выражении, стоящем под знаком предела (см. теорему 1).
180 Глава II. Введение в математический анализ 4°. Упражнения Используя эквивалентности 1—7, найдите пределы: 4 .. sin(a-\-x) — sina Л ,. cos (а4-х) — cos a 1. lim —■— . 2. lim —■—- « X -+ О X х -*■ 0 * Л в ,. ln(a + *) — In а . ,. еа+*—еа 3. lim —-—■— . 4. lim . л; -► О X х -► О X 5. iira tg(*+*)-tga- 6 Um ^-W, х -*■ о х х -> о х Найдите пределы lim f(x)t предварительно вычислив In lim f(x)=* X —*■ Xq X—*Xq = lim In /(*): 9. lim (cos*)1/sin**» 10. lim (1 +ln (l+x))l/ln{x+l?. x-+Q x-+0 § 2.7. Свойства функций, непрерывных в точке. Непрерывность суммы, произведения и частного. Предел и непрерывность сложной функции Теорема 1. Если функции f (x) и g(x) непрерывны в точке х0, то функции f(x)-\-g (х) и f (x) g {х) также непрерывны в точке х0. Если g(x0)=£0, то функция f(x)/g(x) является непрерывной в точке х0. Доказательство. Утверждение теоремы непосредственно вытекает из свойств функций, имеющих предел (см. п. 4° § 2.2). Теорема 2. Если функция f (х) непрерывна в точке х0и f (х0) > 0, то существует такая окрестность точки х0, в которой f (х) > 0. Доказательство. Общая идея доказательства состоит в следующем. Известно, что малому изменению аргумента непрерывной функции соответствует малое изменение значений функции. Пусть в данной точке х0 значение /(лг0) = а > 0. Рассмотрим столь малые изменения аргумента, чтобы значения функции изменились меньше, чем на а. Тогда эти значения останутся положительными и для рассматриваемых значений х аргумента, т. е. /(л;)>0. Строгое доказательство уточняет общую идею. Положим е = а. Для этого 8 найдется б > 0 такое, что при всех х, удовлетворяющих неравенству | х—х0 | < б, выполняется неравенство | / (х)—/ (х0) |< < е (это возможно в силу определения непрерывности функции / в точке х0). Последнее неравенство означает, что |/(д:)—а\<а, или 0 = а—а < /(#)< а-\-а. В частности, /(л:)>0 для всех х таких, что \х—х0|<б. Теорема 3. Пусть функция y = f(x) непрерывна в точке х0, а функция x = <p(t) непрерывна в точке t0J xQ = q>(tQ). Тогда сложная функция y = f(x(t)) непрерывна в точке tQ.
§2.8. Односторонние пределы. Односторонняя непрерывность. Точки разрыва Ш Доказательство. Общая идея доказательства состоит в следующем. Малое изменение аргумента t вызывает [в силу непрерывности функции ф(0] малое изменение значения х функции х = ф(/). В свою очередь, малое изменение значения х влечет малое изменение значения у функции y = f(x) [вследствие непрерывности функции */ = /(*)]. Таким образом, малому изменению аргумента t соответствует малое изменение значения у сложной функции y = f(x(t)). Это означает, что функция y = f(x(t)) непрерывна в точке tQ. Строгое доказательство, уточняющее описанную выше идею, приведено в § 2*.7. Комментарий к теореме 3. Теорема 3 эквивалентна следующему утверждению, которое удобно использовать при практическом вычислении пределов: пусть функция y = f(x) [непрерывна в точке х0, а функция x = q>(t) непрерывна 'в точке t0* x0 = q>(t0)\ тогда lim у(ф(/)) = lim у (х) (правило замены переменной). t -> t0 Х~+Х0 § 2.8. Односторонние пределы. Односторонняя непрерывность. Точки разрыва функции и их классификация 1°. Односторонние пределы. Определение 1. Число C£R называется пределом функции f при х, стремящемся к х0 слева (левым пределом), если для любого е > 0 найдется такое б > 0, что при всех х, удовлетворяющих условиям | х—х0 | < б, х < х0, выполняется неравенство | / (х)—С | < е. Число С называется пределом функции f при х, стремящемся к х0 справа (правым пределом), если для любого 8 > 0 найдется такое 6>0, что при всех ху удовлетворяющих условиям \х—#01< < б, х > х0, выполняется неравенство | / (х)—С | < 8. Левый и правый пределы функции f (х) обозначаются соответственно lira f(x) и lim f(x). Общее название для левого и пра- вого пределов—односторонний предел. * . Комментарий к определению 1. Как видно из определения 1, понятие одностороннего предела отличается от понятия предела (определение 4 § 2.2) дополнительным условием х < х0 (х > х0). Это по-прежнему означает, что близким к х0 значениям аргумента х соответствуют близкие к С значения, однако рассматриваются только те значения аргумента х, которые лежат слева (справа) от х0. Ясно, что в случае существования предела lim f (x) СуЩеСТ- вуют и совпадают между собой односторонние пределы! lira /(*) = lira /(*). (1) х->хо-0 х-+хо + 0
182 Глава II. Введение в математический анализ Верно и обратное: если существуют lim f(x), lim f(x) и выполняется равенство (1), то существует Ига /(х), причем X -> Xq lim/(x) = lim f(x) = lim f(x). x-+x0 x-+xo-0 x-+x0 + Q По поводу последнего утверждения см. § 2*.8, I. Очевидно также, что если не существует хотя бы один из двух односторонних пределов, то не существует и lim f{x). *-> х0 Возможен случай, когда оба односторонние предела существуют и не равны между собой; тогда lim f(x) не существует. х-+х0 Приведем пример, иллюстрирующий описанный случай. Пусть # = М*)> y = f2(x)—№e функции, определенные в окрестности точки х0 и непрерывные в точке х0, причем /iW^/.(4 (2) Рассмотрим функцию y — f{x), заданную следующим образом: \f2(x) при х > х0. w Используя определение одностороннего предела и равенства (3), имеем lim /(*)= lim h{x), lim f{x) = lim /,(*). (4) x-+x0-0 x-+ x0 x\-*xQ + 0 x-*x0 Таким образом, односторонние пределы (4) существуют и не совпадают между собой в силу условия (2). Следует заметить, что рассмотренный пример носит общий характер: если односторонние пределы существуют и различны, то функция f(x) имеет вид (3) при условии (2) (рис. 41). 2°. Классификация точек разрыва. Определение 2. Функция /, определенная в некоторой окрестности точки х0 при x^xQj называется непрерывной в точке х0 слева, если lim f(x) = f(x0). х -+х0 — 0 Функция /, определенная в некото- jji/ рой окрестности точки х0 при х^х0, ^ ^LL называется непрерывной в точке х0 справа, если lim /(*)=/(*<>). Общее название для функции, непрерывной слева или справа,— односто- -J- *j ронняя непрерывность. Комментарий к определе- Рис. 41 нию 2. Если функция f(x) непре-
§2.8. Односторонние пределы. Односторонняя непрерывность. Точки разрыва 183 рывна в точке х0У то она непрерывна в точке х0 слева и справа (в силу свойств односторонних пределов, изложенных в комментарии к определению 1). Обратно, если функция / непрерывна в точке х слева и справа, то существует lira f(x)t причем lim f(x) = f(x0).X Х° (5) Последнее равенство означает непрерывность функции / в точке х0. Если хотя бы один из односторонних пределов не существует, то не существует и lim f(x). Точка х0 в этом случае является ТОЧАТ->*0 кой разрыва функции, поскольку не выполняется условие непрерывности. Как было показано в комментарии к определению 1, возможен случай, когда существуют оба односторонних предела (не равных друг другу) и не существует lim f(x). В такой точке х0 нарушено X-+XQ условие непрерывности (5) [оно требует, в частности, существование lim /(*)]; точка х0 является точкой разрыва. Такой разрыв назы- х-+х0 вается разрывом первого рода. Определение 3. Пусть функция f(x) определена в окрестности точки х09 за исключением, быть может, самой точки х0; пусть также существуют оба односторонних предела lim f(x), х-+ *0 - О lim f(x), причем lim !(х)ф lim f(x). Тогда точка х0 назы- х-*хо + 0 х->хо-0 х-+хо+0 вается точкой разрыва первого рода функции f(x). Комментарий к определению 3. Точка *0 называется точкой разрыва функции / (х), если эта функция в данной точке не является непрерывной (определение точки разрыва, в котором не используются отрицания, приведено в § 2*.8, 2). Точка разрыва первого рода служит простейшей точкой разрыва: в ней функция не является непрерывной, так как отсутствует двусторонний предел, хотя оба односторонних предела существуют (но не совпадают). В более сложных случаях lim f(x) может не суще- ствовать, поскольку могут не существовать один или даже оба односторонних предела. Такой разрыв называют разрывом второго рода. Определение 4. Точка х0 разрыва функции/, не являющаяся точкой разрыва первого рода, называется тонкой разрыва второго рода. Примеры. lft Функция (х2 + 1 при х < О, 5 при х = 0, —х при л;>0 имеет в точке ^0 = 0 разрыв первого рода (рис. 42).
184 - • ^ ' Глава-II: Введение в математический анализ W 1k Рис. 42 i-f Рис. 43 2. Функция у=\х\/х определена для всех x£R, хФ0\ в точке л:0 = 0 она имеет разрыв первого рода. Левый предел lim# =—1; lim у = 1 (рис. 43). •-> о + о 1 ■0-0 правый предел 3. Функция у пределов (ни 1 (х-2)(х-3) односторонних, в точках х0 = 2 и х0 = 3 не имеет ни двусторонних), так как оо. Поэтому х0 = 2 и л:0 = 3—точки разрыва вто- }™о(х-2)(х-зу рого рода (рис. 44), 4. Для функции у = In |л:| в точке х = 0 имеем lim In | л: | = — со. х-*- 0 Следовательно, lim / (x) (а также односторонние пределы) не суще- ствует; х0 = 0 является точкой разрыва второго рода. 5. Не следует считать, что точки разрыва второго рода получаются только в случае, когда lim / (л:) = оо. Дело обстоит сложнее. X —>• Xq Так, функция y = sm(l/x) не определена при # = 0, не имеет односторонних пределов при х—*0—0, x—►о + О и не стремится к бесконечности при х—+0 (рис. 45). Значения функции y = sm(\/x) при х —у 0 «бесконечное число раз» повторяются в интервале от —1 до 1. Предел при х—>0 не существует, поскольку значения функции sin(l/#) не приближаются к какому-либо определенному числу, а «бесконечное число раз» повторяются в интервале от—1 до 1 при х—*0. Этот пример можно усложнить, не изменив характера Рис. 44 точки разрыва. Так, еели g(x) — № •i ! П
S2 8 Односторонние пределы. Односторонняя непрерывность. Точки разрыва 185 Рис. 45 непрерывная функция, определенная в окрестности точки дс = 0, и g(0)¥z0, то для функции y = g(x) sin (1/лг) точка х = 0 служит точкой разрыва второго рода. Поведение такой функции в окрестности точки х = 0 аналогично поведению функции у = sin (l/x) в окрестности этой же точки. Определение 5. Пусть функция y — f(x) определена в некоторой окрестности точки х0, за исключением, быть может, самой точки х0. Пусть также существуют и равны между собой левый и правый пределы: lim /(#)= lim f(x) и при этом либо функ- ция / не определена в точке х = х0У либо lim /(*)= Hm [(х)Ф х-+хо-0 х-+хо + 0 Ф[(х0). Тогда точка х0 называется точкой устранимого разрыва. Комментарий к определению 5. Определения 3 и 5 описывают точки разрыва. В том и другом случае существуют односторонние пределы: для точек разрыва первого рода односторонние пределы различны, а для точек устранимого разрыва односторонние пределы одинаковы. Иногда точки устранимого разрыва считают точками разрыва первого рода Г особый частный случай выполнения условия lim f(x) = lim / (х)~\. В таком случае условие lim !(х)Ф lim f(x) в определении 3 является лишним. К-^Л'о-0 Х-*-Хо + 0 Пример. Функция f(x)= «■ определена для всех #6R, хфЗ. В точке л:0 = 3 она имеет следующие левый и правый пределы: hm 5"= hm •->з-о х~~6 3 -О (* + 3) = 6, lim -*з+о !-9 *—3 lim (* + 3) = 6, -*з+о т. е. оба односторонних предела совпадают. Как отмечалось в комментарии к определению 1, в этом случае существует и двусторонний предел lim /(x) = 6. х-+3 (*) Однако точка х0 = 3 является точкой разрыва функции у = (д£—9)/(х—3), поскольку в случае непрерывности должно выпол-
186 Глава II. Введение в математический анализ няться равенство lim/(*) = /(3); (**) в данном же случае обозначение /(3) лишено смысла. Покажем, как можно добиться того, чтобы точка х0 = 3 стала точкой непрерывности. Рассмотрим функцию ]{х), заданную следующим условием: / х2 g if ч I г при хфо$ ( 6 при л; = 3. Значения функции f(x) совпадают со значениями функции / (х) — = (х2 — 9)/(х—3) всюду, кроме точки х = 3. В последней точке «старая» функция была не определена, а «новая» функция в точке х0 = 3 имеет значение, равное 6, в силу условия (###). Для функции f(x) справедливо равенство lim f (х) = / (3) = 6, означающее, что }(х) непрерывна в точке л:0 = 3, которая для данной функции f(x) служит точкой устранимого разрыва. Отметим, что главным обстоятельством, позволившим из разрывной функции f(x) получить непрерывную функцию f(x), является равенство односторонних пределов: lim f(x)= lim f(x). 3°. Упражнения Вычислите односторонние пределы: 1. lim tgx, lim tgx. 2. lim el/x, lim el/x. * -► л/2 - О # -> л/2 + О л: -> 0 + О * _> о - О Найдите точки разрыва следующих функций и определите, к какому роду они относятся: (*2_5* + 4)(*—2) _ У"72 е 1 3. у=у . ,—' / \ оч . 4. у— ; , 1че 5. t/ = cos —» * (х*—\)(х + 3) * х(х-\-\) у х § 2.9. Свойства функций, непрерывных на отрезке: ограниченность, существование наибольшего и наименьшего значений, существование промежуточных значений Непрерывные на отрезке функции обладают важными свойствами, которые сформулированы в следующих теоремах. Теорема 1. Если функция f(x) непрерывна в каждой точке (замкнутого) отрезка [а, Ь], то функция f(x) ограничена на этом отрезке. Доказательство приведено в § 2*.9, I. Комментарий к теореме 1. Напомним, что ограниченность функции на отрезке [а, Ь] означает существование числа М > О такого, что Л1>|/(л:)| для всех х£[а, Ь].
§2.9. Свойства функций, непрерывных на отрезке 187 Н Отметим, что ни одно из условий теоремы не является лишним. Если не учитывать условие непрерывности функции, то утверждение об ограниченности функции / (х) может оказаться неверным. Например, функция 1/х при 0 < л:^ 1, О при х = 0 определена на отрезке [0, 1], но не ограничена на нем (так как она разрывна в точке х = 0). Если же не учитывать того, что отрезок должен быть замкнутым, то утверждение об ограниченности функции также может оказаться неверным. Например, функция у=1/х на множестве ]0, 1] непрерывна, но не ограничена. Противоречия с утверждением теоремы здесь нет, поскольку рассматриваемая функция является непрерывной не на замкнутом отрезке, а на полуоткрытом интервале. Теорема 2. Пусть f (x)—непрерывная на замкнутом отрезке \ау Ь] функция. Тогда на этом отрезке найдутся точки х и х такие, что для всякого х £ [а, Ь] справедливы соотношения f (x)^f (x) ^.f(x). Доказательство приведено в § 2*.9, 2. Комментарий к теореме 2. Точки х и х, существование которых утверждает теорема, называются соответственно точками абсолютного минимума и абсолютного максимума функции (точками наименьшего и наибольшего значения функции). Отметим, что ни одно из условий теоремы не является лишним. Если f (х)—разрывная (т. е. не непрерывная) функция, то утверждение теоремы может оказаться неверным. Например, функция ... . _ „ при О^х <С 1, '-/w={ J при х=1 не имеет абсолютного максимума: эта функция не принимает значения, равного 1 ни при каком х£[0, 1], но на отрезке [0, 1] она принимает любое значение, меньшее 1. Если же функция / (х) непрерывна, но не на замкнутом отрезке, а на интервале ]а, Ь[ или полуоткрытом интервале ]а, &], то утверждение, что функция достигает своего наименьшего и наибольшего значений, также может оказаться неверным. Например, функция У = х на полуоткрытом интервале [0, 1[ непрерывна, но не принимает на нехМ наибольшего значения: функция принимает любое неотрицательное значение, меньшее 1, однако значение, равное 1, она не принимает. Теорема 3. Пусть функция y = f(x), непрерывная на (замкнутом) отрезке [а, &], принимает в точках х = а и х = Ь соответственно значения А и В (А Ф В). Тогда для любого числа С, заключен- ного между А и В, найдется такая точка х0, принадлежащая отрезку [а, 6], что f(x0) = C.
188 Глава П. Введение в математический анализ >] Доказательство приведено в § 2*.9, 3. Комментарий к теореме 3. Теорема устанавливает факт, который кажется очевидным с точки зрения здравого смысла, а именно: если значения функции непрерывно изменяются и если первоначально достигалось значение Л, а окончательно—значение В, то «по пути» должно получиться любое промежуточное (между А и В) значение. Однако дело обстоит не так просто, как кажется с первого взгляда. Имеется существенное различие между интуитивным «обиходным» понятием непрерывности и точным математическим термином «непрерывность», который связан с довольно сложными условиями, выраженными на языке е—б. В теореме используется строгое понятие непрерывной функции (определение 4 § 2.2), поэтому ее утверждения не являются самоочевидными фактами и требуют доказательства. Разумеется, условие непрерывности в теореме не является лишним. Если функция разрывна, то утверждение теоремы может оказаться неверным. Например, функция w , ,0 при 0<х<1/2, ' = /(*) = {" при 1/2<л:<1 определена на отрезке [0, 1], /(0) = 0, /(1)=1, однако значение 2/3 она на этом отрезке не принимает. i
Глава III ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ ФУНКЦИЙ ОДНОЙ ПЕРЕМЕННОЙ §3.1. Производная функции, ее геометрический и механический смысл. Производная суммы, произведения и частного (обзор теорем школьного курса) 1°. Определение производной. Определение L Пусть f (х)—функция, определенная в некоторой окрестности точки х0. Производной функции f (х) в точке х0 называется число, равное lim H*)-M*)t (1) X -> Х0 Х Х0 если этот предел существует, и обозначаемое /' (х0). Комментарии к определению 1. 1) Предел (1) может не существовать. Тогда говорят, что функция f (х) не имеет производной в точке х0. 2) Удобны и наглядны следующие обозначения: х—х0 = Ах (приращение х), f(x)—f(x0) = f(x0 + Ax) — f(x0) = Ay (приращение у). Используя эти обозначения, можно записать /'(*„)= Нт %. (2) Таким образом, производная функции f в точке х0—это предел отношения приращения функции (Ау) к приращению аргумента (Ах) при Аа:-^0. 3) Если предел (2) существует, то Ау —* 0 при Ал: —* 0. Это значит, что f (х) —/ (х0) —* 0 или f(x)—+f (д:0) при х —* х0. Следовательно, производная в точке существует только для функций, непрерывных в точке х0 (и то далеко не для всех; см. § 3*.1, I).
- 190 Глава III. Дифференциальное исчисление функций одной переменной 4) Равенству def v„ f(x)-fM f'(x0)= \im'wxZ'xyx°', (3) служащему определением Г (х0), эквивалентны следующие утверждения: f (x0)—f(x)Zfx(X°)==za(x> Ах^> r*e а(*> д*)~*0 при Дл:-*0; (4) Д;/ = /'(х0)Д* + о(Дх); (5) / (х) = / (х0) + Г (Хо) Ах + о (Ах). (6) Действительно, равенство (4) вытекает из (3), так как разность между функцией и ее пределом есть величина бесконечно малая (см. § 2.2, п. 5°). Соотношение (5) следует из (4): умножая обе части равенства (4) на х—х0, имеем /' W (x—x0) — (f (x)—f (х0)) = а (*, Ад:) (х—хд), или /(*)—/ (*о) = /' (*о) (х—х0) —а (х, Ах) (x—xQ)t (7) откуда Ay = f'(xQ)Ax + o(Ax). Здесь учтено, что — а(х, Ах)(х—х0) при а(х, Дх)--*0 является величиной более высокого порядка малости, чем х—х^^Ах: lim -«(*■ А*Н*-*о)д Иш (_а(х> Д*)) = 0, х-*х0 X Х0 х-*х0 так что —а(х, Ах) (х—х0) можно обозначить через о (Ах). Соотношение (6) следует из (7), если перенести /(л;0) из левой части равенства (7) в правую и заменить —а (х, Ах) (х—х0) на о (Ах). Определение 2. Пусть f (х)—функция, определенная на некотором открытом множестве йс R такая, что /' (х) существует в каждой точке x£Q. Функция /'(#), определенная в каждой точке х формулой /'(*)= lim f(X+Ax)-f(*)t (8) д*- Ах называется производной функцией от функции f(x). Комментарии к определению 2. 1) Зафиксировав x = xQ в формуле (8), получим производную функции f(x) в точке х0 (или, что то же, значение производной функции /' (х) от функции / (х) в точке *<,). Меняя фиксированное значение х0 в формуле (8), будем получать производные той же функции f(x) в различных точках х. Зависимость полученных производных в точках х от самих этих точек определяет функцию f (х). Это и. есть производная функция от f(x).
$3.1. Производная функции. Производные основных элементарных функций 191 Рис. 46 2) Предел (8) может не существовать вообще Hjp существовать при одних значениях х и не существовать при других значениях. В тех точках х, где предел (8) не существует, производная функция не определена. 2°. Геометрический и механический смысл производной. Понятие производной является одним из самых важных понятий математического анализа. Многие теоретические и прикладные вопросы, будучи непохожи друг на друга своей содержательной частью, сводятся к одной и той же математической задаче—к нахождению предела отношения приращения функции к приращению аргумента при условии, что последний стремится к нулю, т. е. к нахождению производной. Рассмотрим наиболее важные из таких задач—задачи о касательной к кривой и о скорости переменного движения. Задача о касательной к графику кривой {геометрический смысл производной). Рассмотрим график функции y = f(x), определенной в окрестности точки х0 (рис. 46). По определению /'(*о)= Hm f'{xl"frlXo). Числа /(*), f(xQ), х, х0, f(x)-f(x0) =, х-+х0 х — хо = Д# и х—х0 — Ах геометрически выражают соответственно длины следующих отрезков: CD, АВ, ОС, ОА, FD и АС (или BF). Тогда ( есть отношение катетов прямоугольного треугольника BDF, X — Xq т. е. тангенс угла <р = ^DBF. Если х-^х^, то точка D стремится к точке В по кривой, причем прямая BD стремится занять положение касательной к кривой в точке В. (Последнее утверждение не является фактом, требующим доказательства. Пока еще не введено определение касательной, и приведенные выше рассуждения служат лишь разумным с точки зрения здравого смысла обоснованием определения касательной: в дальнейшем будем называть касательной то положение прямой, к которому стремится секущая BD, когда точка*D стремится к В.) Далее, имеем /' (х0) = lim Х-+ Х0 f{x)-t(Xo) X Xq = Hm tg<P=tg<p0, B-*D где ф0—тангенс угла, который составляет касательная к кривой в точке В с положительным направлением оси Ох. Итак, геометрический смысл производной состоит в следующем:. производная функции в точке х0 равна тангенсу угла, образованного касательной к кривой y = f(x) в точке (х0; f(x0)) и положительным направлением оси Ох.
192 Глава III. Дифференциальное исчисление функций одной переменной , <** Задача о скорости переменного движения (механический смысл производной). Пусть материальная точка движется по прямой так,,что в каждый момент времени х она находится на расстоянии f (х) от некоторой выбранной в качестве начальной точки О. В этом случае функция f (х) называется законом два- эюения* Какова скорость этого движения? Определение скорости пока не введено, но можно предложить разумный подход к вычислению скорости. За малый промежуток времени от момента х до момента х + Ах материальная точка пройдет путь, равный /(дг + Дх)—f(x) (путь может быть и отрицательным). Средняя скорость такого движения равна f(X + Ax) — f(x) ,gv Ах * ^ ' Примем следующее допущение: средняя скорость за малый промежуток времени приближенно равна истинной скорости движения и чем меньше промежуток времени, тем ближе средняя скорость к истинной. Точнее, разумно определить истинную скорость движения как предел (9) при Ах—>0. Итак, механический смысл производной состоит в следующем: производная функции f (x) в точке х0 равна скорости движения, опре» деляемого законом движения f (х). 3°. Свойства производных. Следующие свойства производных легко вытекают из определений 1 и 2: 1°. Если производные функций f и g в точке х0 существуют, то существует и производная суммы f + g в этой точке, причем (/ + £)'(*„) = /'(*<>)+£'(*<,)' (Ю) (производная суммы равна сумме производных). 2°. Если производные функций f и g в точке х0 существуют, то существует и производная произведения fg в этой точке, причем №' (*о) = /' (*•) ё (Хо) + f Ы ё' fa). (11) 3°. Если производные функций f и g в точке х0 существуют и ё (*о) Ф 0, то существует и производная частного fig в этой точке, причем (f\ /~ \ - f (*о) 8 (*о) — / (*о) S' (*о) /io\ В частности, если g(x) = c, то №)'(х*) = (сГ)'(ь) = сГ(ь) (постоянный множитель можно вынести за знак производной). Доказательство справедливости свойств 1°—3° приведено в §3*.1,2.
§3.1. Производная функции. Производные основных элементарных функций 193" 4°. Примеры непосредственного нахождения производной I. Найти Производную функции у~х2- при х = х0. Решение. Имеем /(*<,) = 4, f (х0 + Ах) = (х0 + Ах)2, f(x0 + Ax) — — /WSE(Jfo + ^)a—х1- Составим выражение вида (8): = lim (2x0 + Ал:) = 2х0. Д*->0 Так как (x2)x=zXo~2x0 для каждого х0, то (х2)/ = 2л:. Значит, производной функцией от у = х2 является у = 2х. Можно показать (см. п. 2° § 3*.1), что (хпУ = пхп-К (13) Формула (13) справедлива не только для целых положительных я, но также и для отрицательных, дробных и, вообще говоря, любых вещественных п. В частности, используя формулу (13), имеем ([/■*)':= (jCl/2)' = 1*1/2-1 =1х-1 /2 2 2 2}/"* 2. Найти производную функции у — е*. Решение. Имеем /(х) = е*, /(.x; + AA:)=--e*+AA:, /(x + A*) — /(*) — = e*+A*—е*. Составим выражение вида (8): / (*)= hm г-—= hm е* - = lim ех -г- = е*. Д*->0 Л* Здесь бесконечно малая еАлг—1 заменена эквивалентной ей бесконечно малой Ал: в соответствии с теоремой 1 § 2.6 (доказательство этой эквивалентности приведено в § 2*.6, I). Итак, (е*)' = е*. 5°. Таблица производных основных элементарных функций. Производные основных элементарных функций сведены в таблицу, каждая формула которой основана на вычислении предела вида (8). Такие вычисления приведены в п. 2° § 3*.1. Производные, включенные в эту таблицу, называются табличными. 7 Ко 2636
194 . Глава III. Дифференциальное исчисление функций одной переменной Таблица 1 I II Па III Ша IV V VI VII VIII IX X XI XII у = х« У = а* У = е* у = \пх */ = sin# у = cos х y=tgx f/ = arcsinA? у — arccos x y = &rctgx e*_-e-* y = shx= —2— e-^ + e- y = chx— T9 y=zthx = 2 e* + e~ y' = ojc06"1, а б R у' = ах1пау a£R, a > 0, a =£ 1 / = e* a>0, a=^l v X y' = cosx yf — — sin д; у * у у' cos2 a: 1 i^t— /ь У - 1+*2 у' = ch x = e* + e~ У =shA: = —2— У 1 ch2*" (e* + e-*)3 Отметим важные частные случаи табличной формулы I, часто встречающиеся на практике: ^ ~27Т' (~) ~~"^* Методическое указание. Таблицу производных основных элементарных функций следует выучить наизусть. К экзамену нужно усвоить приемы вычисления производных от любой элементарной функции. Эти приемы основаны на правилах п. 3° и, кроме того, на правиле дифференцирования сложной функции, имеющем особое значение (см. п. 1° § 3.2). Последним шагом в каждом таком вычислении будет использование табличных формул. 6°. Примеры 1. Найти производную функции у = х*. Решение. Данная функция является частным случаем функции вида у — х* при а==3. По формуле I находим у' =*3х*-1 = 3х2.
$ 3.1. Производная функции. Производные основных элементарных функций 195 2. Найти производную функции # = тг—. / ]А2 Решение. Данная функция является частным случаем функции вида у = ха при а==—2/5. Используя формулу I, имеем y'^atf*-1, 2 -4-1 2 ~ 2 т. е. у=— -гх 5 = — Тх 5= гт=- 5 5 5 Ух* 3. Найти производную функции y = \og2x. Решение. Данная функция является частным случаем функции вида y = logax при а = 2. По формуле III получаем у' = — log2e. 4. Найти производную функции у = л:со$^. Решение. Данная функция имеет вид y=zf(x)g (х), где / (х) = х, g- (x) = cos х. Применяя правило дифференцирования произведения, находим у' = /' (л:) g(x) + f (х) g' (х) = х' cos х + х (cos х)' = cos я —х sin д; (использованы табличные формулы I и V). 5. Найти производную функции у= * . Решение. Данная функция имеет вид у = / (x)/g (x), где / (х) = е*, g (х) «= arctg л:. Применяя правило дифференцирования частного, получим г/ _ Г (*) g(*)-f (х) g' (х) __ (е*)' arctg х-е* (arctg д)' * ~~" g2 (*) arctg?* — е* arctg .у—е* . 2 arctg2 л; (использованы табличные формулы Па и IX). 6. Найти производную функции у = хех-\--.—. Решение. Согласно правилу дифференцирования суммы, имеем »,-(«,+^)'-«+(й)' Теперь используем правила дифференцирования произведения и частного: откуда у' = 1. е* + *е* -f cos#ln*—sin x • — х In2 л: (применены табличные формулы I, Па, IV, II 1а). _ тт „ « arcsin x arccos x 7. Найти производную функции у = arot x ,
198 Глава III. Дифференциальное исчисление функций одной переменной Решение. Согласно правилу дифференцирования дроби, получим , __ (arcsin *«arccos x)' arctg x—arcsin j^arecos x (arctg *)' ^ arctg^ x # Используя правило дифференцирования произведения и табличную формулу IX, находим , [(arcsin x)' arccos x-\-arcsin x (arccos х)'] arctg x у arcsin х arccos д> 1 1-j-x2 откуда arctg5? х ' 1 . 1 \ , arcsin л: arccos л: (> arccos х— arcsin x ,. ) arctg x - _ V\-x* V\-x*) l+*a J arctg2x (применены табличные формулы VII и VIII). Методические указания. 1) Приведенные примеры были решены на основании правил дифференцирования п. 3° и табличных формул. Заметим, что не всякую элементарную функцию можно продифференцировать таким образом. Рассмотрим, например, функцию у =:]/х2 + 1, которая не является ни суммой, ни произведением, ни частным более простых элементарных функций, и поэтому правила п. 3° к ней неприменимы. При этом у = Ух2- + 1 является сложной функцией: у = Уи,и = х2-\-\ и ее производную можно найти с помощью правила дифференцирования сложной функции (см. п. 1° § 3.2). Это правило в сочетании с правилами п. 3° и таблицей производных основных элементарных функций позволяет найти производную любой элементарной функции. 2) Хотя производная по определению есть некоторый предел, на практике вычисление производных не связано непосредственно с вычислением пределов, а сводится к использованию несложных правил дифференцирования и табличных формул. Отметим, что трудности, встречающиеся при вычислении пределов, преодолены при нахождении табличных производных, а также при доказательствах правил дифференцирования. 7°. Упражнения Исходя непосредственно из определения производной, найдите производные следующих функций: I. у = а*. 2. y = \ogax (a>0%a&\). 3. y = s\nx. 4. y = cosx. 5. # = tg#. Найдите производные следующих функций: 6. у= 5 - . 7. y=x2cosx. 8. у = х31пх. у х
§3.2. Производная сложной функции. Производная обратной функции 197 9. у = \п*х. Ю. у = *»(дй-1)«. И. ув^±^ + 2. 11 to arccos* 4. 12. */=-т-«—; «-"• 13. г/= . 14. # = * cos хе*. * sin2 x-\- cos2 л: ^ * * § 3.2. Производная сложной функции. Производная обратной функции. Производные обратных тригонометрических функций 1°. Производная сложной функции. Пусть заданы две функции y=zf(u)9 и = ф(л:), причем множество значений функции и — у(х) принадлежит области определения функции y = f(u). В этом случае определена функция */ = /(ф(#)), называемая композицией (суперпозицией) функций y — f(u) и и = ф(х), или сложной функцией. Примерами сложных функций являются: г/ = |/д;2+1 (здесь у = У~и, u==x2+l)\ y = sm3x (здесь у = sin и, и=*3х)\ у~\п(х +Ух2+ 1) (здесь у = \пи, u = x+Vx2+ l). Как было отмечено выше, всякую элементарную функцию можно получить из основных элементарных функций с помощью четырех арифметических действий, а также операции суперпозиции, т. е. образования сложной функции. Поэтому приобретает особую важность следующая теорема. Теорема 1 (правило дифференцирования сложной функции). Пусть y = f(u), u = y(x)—две функции и определена сложная функция у (х) = / (ф(*))- Если функция # = <р(х) дифференцируема в точке х = х0, а функция y = f(u) дифференцируема в точке и = ц)(х0), то сложная функция */ = /(ф(#)) дифференцируема в точке х0, причем #И*о) = /Пф(*о))фЛ*о)- (1) Комментарии к теореме 1. 1) В формуле (1) выражение Ух (хо) означает производную функции / (ф (х)) по переменной х в точке *0, т. е. у. {Хо) ^ Иш /(Ф(ДГ0 + Дд))-У(фЩ) . Ал:-* 0 выражение f'u(q>(x0))—производную 'функции f (и) по переменной и в точке ф(х0), т. е. Ди -+ 0 аи- « = ф(ЛГ0) выражение ц>'х(х0) — производную функции ф(лг) по переменной х в точке х0, т. е. ф;<*)-иш ^o+^ziM. Ах - 0 Д*
198 Глава III. Дифференциальное исчисление функций одной переменной 2) Основная идея доказательства теоремы состоит в следующем. Запишем выражение для у'х(х0) так: у'х(х0) = lim ^= lim(*!Lto\ (2) Здесь числитель и знаменатель выражения -р-, стоящего под знаком предела, умножены на Аи. Далее, имеем Ух(*о)— ^т т^= Ит \-г-'-г-)= Ит -—-• lira -г^ (3) V д*->оЛ* Ax^0\Au Ах J Ax^0Au Ax_^0 Ax w (использовано свойство предела произведения). Так как функция и = ф (х) дифференцируема, то Ах —> 0 фф Аи —* О, откуда ^ (л:) == Нт -г^- • lim -^ • (4) Наконец, по определению lim -ir- = f'u{u) при & = ф(л:0); lim -т^ = ди _* 0 &и Ах-+0 &Х = Ф^(х0), и из соотношения (4) вытекает равенство (1). При выводе формулы (4) мы предполагали, что Аи Ф О в некоторой окрестности точки х0. Иногда это предположение неверно, например, для функции u^x2sm(l/x) при х0 = 0. Поэтому приведенные рассуждения относятся лишь к частному случаю теоремы. Строгое доказательство этой теоремы приведено в § 3*.2, §. 3) Чаще всего теорему 1 применяют на практике в следующем виде. Пусть y«=f(u)—одна из основных элементарных функций, а и = у(х) — произвольная дифференцируемая функция. Формулу (1) можно переписать так: Ух(Хо) = Ги(и)и'. (5) В частности, для основных элементарных функций f(u) = un, f(u) — au, f (u) = \ogau, f(u) = sinu получаем (un)x = nun-^-u', (auyx = aa\na-uf, (loge u)'x = — loga e-u\ (sin u)'x = cos и-и'. (6) Теорема 1 в данном виде легко запоминается в связи со следующим обстоятельством. Для сравнения выпишем из табл. 1 формулы, соответствующие формулам (6): (хпУ == nxn~\ (ахУ = ах In д, (loga*)' = -logae, (sin*)'= cos*. (7) Если в формулах (7) заменить х на и и правых частях равенств (7) добавить множитель и\ то формулы (7) примут вид (6). Отметим, что указанное преобразование непосредственно вытекает из правила дифференцирования сложной функции.
§3-2. Производная сложной функции. Производная обратной- функции 199 Для удобства применения правила дифференцирования сложной функции строят таблицу производных (f(u))X9 где /—одна из основных элементарных функций. Таблица 2 I II На III Ша IV V VI VII VIII IX X XI XII у = ип У = а" у = е* у=\пи г/ = sin и у = cos и y=tgu y = arcs'mu y = avccosu y = axctgu y = shu y = chu y = thu y'x = au \na-u' y'x = e*-u' y'x = —\ogat'Ur l , JX и y'xz=cosu-u' y'x = — sin и-и' 1 Ух = —г--и Ух У. cos2 и 1 1 -и' Vl—u* 1 1-ьы2 ух = ch и • и' yx = shu-u' , 1__ , iJx— ch2w 'U Примеры. 1. Найти производную функции y = cos\nx. Решение. Данная функция является сложной функцией: у = cos и, где и = In х. Следовательно, Ух = — sin и • и' = — sin In x (In x)f = — sin In x • —. 2. Найти производную функции у=\^х2+1. Решение. Здесь y = Yuy и = х2-{-1. Поэтому и' __ (х2+\)' _ 2х х Ух ' 2 У и 2 Ух2+ 1 2 !/>+• 1 /л;2 + 1 ' 3. Найти производную функции z/ = arccos—. Решение. Здесь # = arccos«, u — l/x. Имеем V'-(i)'y" VHi) =ТШ\^)'
200 Глава III. Дифференциальное исчисление функций одной переменной Возможен такой случай, когда функция и, в свою очередь, является сложной. Тогда правило дифференцирования сложной функции применяется снова. 4. Найти производную функции х=1псозл;2. Решение. Здесь у=\пи, u = cosx2. Находим у' = — -и' = о (cos*2)'. JX и cos л:2.v ' Чтобы найти производную (cosл;2)', необходимо второй раз применить правило дифференцирования сложной функции. Имеем и = cos л:2, где a = cosi>, v — x2. Следовательно, и'х=з — sin v • v' да — sin x2 • (х2)' = — 2х sin х2. Окончательно получаем 2°. Производная обратной функции. Пусть заданы две функции y=zf(u), и = ц>(х) такие, что область определения функции / совпадает с множеством значений функции. <р, и равенство x = f((px)) справедливо при всех х из области определения функции ф. В этом случае функции / и ср называются взаимно обратными: функция <р — обратной к функции /, а функция / — обратной к функции ф (обозначения: / = ф~1, ф = /~1). Подробности, относящиеся к понятию обратной функции, см. § 3*.2, 2. Если функция ф (х) определена в некоторой окрестности точки хв и строго монотонна, то для нее существует обратная функция Теорема 2. Если функция у —у (х) непрерывна, строго монотонна в некоторой окрестности точки х0У дифференцируема в этой точке и у'х(х0)Ф=0, то и обратная функция л: = ф-1(у) дифференцируема в точке #0 = Ф (*о)> причем (Ф~1)ИУо) = 1/ф;(^о). (8) Доказательство теоремы приведено в § 3*.2, 3. Комментарий к теореме 2. Известно, что по отношению к функциям у = хп, у = а*, y = sinx, y = cosx, y=tgx (9) обратными являются соответственно функции x=Yy, x=\ogay, # = arcsin#, Ar = arccosy, x = arctgy. (10) С помощью равенств (10) переменная х явно выражается через переменную у, связанную с х равенствами (9). Теорема 2 позволяет вычислить производные функций (10) по известным производным функций (9).
S 3.3. Гиперболические функции. Производные гиперболических функций 201 Например, если y = q>(x)-=smx, то по формуле (8) получаем 1 > #0 (arcsiny);(y0)=(sin^(jC6)> или (arcsin^ (у0) = -^ Так как cosx0 = \/rl — sm2x0 = V^—yo> то (atcsmy)y(y0)= или (arcsin*); = . . V \—yl У 1-х2. В случае у = ф (х) = cos х9 у = ср (л:) = tg л; аналогично находим (arccosx ); = — ___, (arctg *); = у-^-у. Если # = ф (*) = #*, то по формуле (8) получим (1°ёаУ)у(Уо)== (аХу(Хоу ИЛИ (\0ga уУу(у0)=^±^. Так как ахо = у0, то (loget/)H</o) = ^r. или (1о§вх); = -^ = ^. Формулы для производных функций arccos*, arcsiriA:, arctg л:, log^x содержатся в табл. 1. Приведенные выше вычисления представляют собой выводы этих формул. 3°. Упражнения Найдите производные следующих функций: 1. y = sin3x. 2. у= =г. 3. y=Y~x\ntg £. у sin а: 2 ' 4. у = ех]пх 5. у=^хх. 6. # = (cosx)lnAr. 7. cos arctg 2х. Найдите производные функций, заданных неявно: 8. х* + у* = 1. 9. ,v2-f 2xy+y* = 0. 10. ln(* + */) = *2. § 3.3. Гиперболические функции, их свойства и графики. Производные гиперболических функций 1°. Гиперболические функции. Определение. Функция у = ~е называется гиперболическим синусом и обозначается y = shx. Функция у = —-^ называется гиперболическим косинусом и обозначается y = chx. Функция у= х~^_ _х называется гиперболическим тангенсом и обозначается y = thx. Свойства гиперболических синуса, косинуса и тангенса аналогичны свойствам (тригонометрических) синуса, косинуса и тангенса.
202 Глава III. Дифференциальное исчисление функций одной переменной Рис. 47 Рис. 48 Сравним, например, следующие соотношения: sin2х + cos2x = 1 и ch2*—sh2#=l; sin 2x = 2 sin x cos x и sh2A; = 2shA;chA:; tgx-- sin x ,« sh x и thjc = -r—. cos x ch л: О) (2) (3) Тождества (1) — (3), связывающие гиперболические функции, проверяются непосредственно. «Внутреннее родство» гиперболических и тригонометрических функций объясняется тем, что тригонометрические функции, подобно гиперболическим, выражаются через экспоненты по формулам Эйлера (см. § 5.3, п. 4°). Название «гиперболические» для функций y = shx, y = chx мотивируется следующим. Известно, что у = cost, y = sint—параметрические уравнения окружности х2 + у2=\ (тригонометрические функции у— cost, y = sint иногда называют круговыми косинусом и синусом). Уравнения # = ch t, y = sh t являются параметрическими уравнениями кривой х2—у2 = 1, представляющей собой равнобочную гиперболу. Графики функции y = chx, y = shx, y = thx изображены на рис. 47—49. Функции у = sh х, у = th x— нечетные; следовательно, справедливы тождества sh (— х) = — sh х, th (— х) = — th л: (х € R), и графики этих функций симметричны относительно начала координат. Функция y — chx—четная. Это значит, что ch(—x) = chx {x£ R), и график функции y = chx симметричен относительно оси Оу. График функции y — chx называют цепной линией. Тонкая нерастяжимая нить, закрепленная в двух точках и провисающая под действием силы тяжести, принимает форму кривой y = chx. 2°. Производные гиперболических Рис. 49 функций. Для нахождения произ-
§ 3.4. Дифференциал функции. Инвариантность формы дифференциала 203 водных гиперболических функций следует использовать правила дифференцирования и правило дифференцирования сложной функции. Найдем производную функции y = shx. Имеем s (sM' = (^^)'=i-(e*-e-*)' = = ^[(^У-(е-*)'] = y(e* + e-*) = ch*. (4) Аналогично получаем ^+^y==i.[(e^)' + (e-)'] = l(e*-e--) = sh^ (5) (ch*)' = (- л, у /shxV (sh^'ch*—(shx) (chx)' _^ * ' \ch#/ ch2# "^ ch л: ch #—sh * sh x 1 /C4 (6) ch2 x ch2 x (использованы формулы (sh#)' = ch#, (ch#)' = sh.x; и тождество ch2*—sh2*=l). Формулы (4) — (6) являются табличными. 3°. Упражнения Найдите производные следующих функций: 1. y=th2x. 2. # = ch34. 3. у = - * 2 у sh 2* ' 4. y = sh2x-{-ch2x. 5. y*=chxshx. § 3.4. Дифференцируемость функции. Дифференциал функции. Связь дифференциала с производной. Геометрический смысл дифференциала. Линеаризация функции. Дифференциал суммы, произведения и частного. Инвариантность формы дифференциала 1°. Дифференцируемость функции. Главная идея дифференциального исчисления—изучение функции f(x) путем сравнения значений функции в близких точках х и х + Ах, нахождения разности f(x + Ax) — — f(x) (приращения функции) и исследования этой разности с помощью разделения ее на две части—основной (главной) части и другой, малой по сравнению с главной частью. Часто приращение функции приданном х, т. е. Af=f(x+Ax)—/(#), можно представить в виде Д/ = Л Ад: + о (Ал:), где Л—число, не зависящее от Ал:, а о (Ал:)—функция, бесконечно малая более высокого порядка малости, чем Ад:. Как видно из этой формулы, если АфО, то выражение Л Ад: отличается от А/ на о (Ад:), т. е* на функцию, значения которой
204 Глава III. Дифференциальное исчисление функций одной переменной пренебрежимо малы по сравнению с А Ах (и с Л/) при малых Ах. Зависимость выражения А Ах и Ах очень проста—это прямая пропорциональность. Таким образом, если А/ представить в указанном виде, то за счет допустимо малого изменения А/ [на величину о (Ах)] можно сделать зависимость А/ от Ах очень простой. Определение 1. Функция у = /(х) называется дифференцируемой в точке л;0, если приращение функции А/ = / (xQ + Ах)—f(x0) в этой точке можно представить в виде А/ = ЛАл: + о(Ал:), (1) где А—некоторое число (не зависящее от Ах), а о (Ах)—функция, бесконечно малая более высокого порядка, чем Ал;. Определение 2. Пусть функция y = f(x) дифференцируема в точке х0. Тогда выражение А Ах в разложении (1) называется главной линейной частью приращения функции f в этой точке, или диффертциалом функции f в этой точке (обозначение: с1/=ЛДл; или dy = AAx). Комментарий к определению 2. Если функция / такова, что А/ можно представить в виде (1) в каждой точке х некоторого множества Q, то говорят, что функция дифференцируема в Q. В этом случае число А в разложении (1), естественно, изменяется с изменением х: Af=A(x)Ax + o(Ax). Главной линейной частью приращения А/ (или дифференциалом функции /) будем называть выражение А (х) Ах. Вместо термина «выражение» правильнее было бы использовать термин «функция» А (х) Ах от двух переменных: х и Ах\ относительно переменной Ах эта функция является прямой пропорциональностью. При введении понятия дифференциала функции возникают следующие вопросы: при каких условиях существует разложение (1)? если разложение (1) существует, то чему равен «коэффициент пропорциональности» А (х) в этом разложении? Оказывается, что: разложение (1) существует тогда и только тогда, когда существует производная функции f (х) в точке х\ коэффициент А (х) в разложении (1) равен /' (х). Доказательства сформулированных утверждений приведены в § 3*.4, I. На основании этих утверждений имеем d/= /'(*) A*; uy = f (х)Ах (2) (дифференциал функции равен производной, умноженной на приращение независимой переменной). Для функции у = х по формуле (2) получаем их = 1 • Ах,
§3.4. Дифференциал функции. Инвариантность формы дифференциала 205 так что dy = f'(x)dx (3) (дифференциал функции равен производной функции по независимой переменной, умноженной на дифференциал независимой переменной). Казалось бы, что выражение /' (х) (производная) и /' (х) dx (дифференциал), которые отличаются друг от друга только множителем, не могут сильно отличаться своими свойствами. Однако, как будет показано, дифференциал функции обладает свойством инвариантности, а производная не имеет аналогичного свойства. 2°. Инвариантность формы дифференциала. Пусть y — f(u),u = q>(x) и определена сложная функция */ = /(ф(*))- Если производные функций / и ф существуют, то дифференциал функции y=zf(q>(x)) в соответствии с формулой (3) равен производной функции /(Ф(л:)) по переменной х, умноженной на дифференциал независимой переменной х. Производную функции /(ф(л:)) можно найти по правилу дифференцирования сложной функции. Имеем йу-Ги(Ч(х))Чх(х)йх- (4) Докажем, что если и — ц(х)у то dy = f'u(u)du. (5) Действительно, подставим вместо и в /' (и) выражение <р (х) и раскроем du в соответствии с формулой (3): дифференциал du равен производной функции и по х, умноженной на дифференциал cU независимой переменной х: du = ф' (х) dx. В результате получаем f'(u)du = ru(<p(x))<f'(x)(lx. (6) Правые части формул (6) и (4) совпадают и, следовательно, dy = f (и) du, т. е. справедлива формула (5). Согласно этой формуле, дифференциал функции y = f(u) при и = у(х) равен производной функции / по переменной и, умноженной на дифференциал переменной и. Формула (5) справедлива Ъри любом выборе и = у(х) (хотя в формуле (3) предполагается независимость переменной х). Последнее утверждение называется инвариантностью формы дифференциала. Это значит, для любой функции w = q>(x) дифференциал равен производной по переменной и, умноженной на дифференциал dw. Итак, форма дифференциала не изменяема (инвариантна), какое бы u = q>(x) мы ни взяли. Утверждение об инвариантности формы дифференциала можно записать также в следующем виде. Пусть y = f(u) и dy — f'u (и) du. Если в правую часть последнего равенства подставить « = ф(х), то получим дифференциал функции y(f(x)): ty (Ф (*)) = Ги (Ф (*)) Ф' (*) dx.
Рис. 50 206 Глава 111. Дифференциальное исчисление функций одной переменной Возможность формальной подстановки любой функции (имеющей производную) в левую и правую части равенства dy = f'u(u)du является простым и легко запоминающимся правилом, которое отражает важное свойство дифференциала и часто используется на практике. 3°. Геометрический смысл дифференциала. На рис. 50 изображен график некоторой дифференцируемой функции / (х) в окрестности точки х0. Выражения Ах, / (х0), / (х0+Ах) и А/ = / (д:0+Дл:)— —/ (л:0) геометрически означают соответственно длины следующих отрезков: AC, АВ, DC и DF. Треугольник BEF ограничен горизонтальной линией BF, вертикальной линией EF и касательной к кривой BE. В силу геометрического смысла производной /' (х0) есть тангенс угла EBF, а /' (х0) Ax = d/ есть длина отрезка EF. Таким образом, с геометрической точки зрения дифференциал равен приращению ординаты касательной от тонки х0 до точки х0 + Ах. Заметим, что разделение приращения функции Af на две части: Д/ = /' (х0) Ах + о (Ах) соответствует разделению отрезка DF: DF = — FE + ED. Длина отрезка EF, как уже отмечалось, равна значению дифференциала, а длина отрезка ED—бесконечно малая более высокого порядка малости, чем Ах. Действительно, из рис. 50 видно, что доля ED в отрезке DF стремится к нулю при Ах—>-0. 4°. Линеаризация функций. В малой окрестности точки х0 график функции y = f(x) и касательная, проведенная к нему в точке х0, близки друг к другу (рис. 50). Из двух рассматриваемых линий касательная является более простой. Часто можно заменить исследуемую функцию f (х) близкой к ней функцией, графиком которой служит касательная к графику данной функции в точке х0. Тогда говорят о линеаризации функции f(x) в окрестности точки х0. Термин «линеаризация» мотивируется тем, что функция, графиком которой служит касательная, представляет собой линейную функцию от х, т. е. имеет вид у = ах + Ь. Уравнение касательной легко найти как уравнение прямой, проходящей через заданную точку (х0у f(x0)) в заданном направлении: как известно, тангенс угла наклона касательной равен /' (х0). Итак, У—/(*о) = /'(*в)(*—*«) — уравнение касательной, а y = f'(x0)(x—xQ)+f(x0) — функция, графиком которой является касательная. Из соображений наглядности вытекает, что J(x)*f(xJ + r(xJ(x-.xJ (7)
§3.4. Дифференциал функции. Инвариантность формы дифференциала 207 (знак « означает приближенное равенство в малой окрестности точки х0). Смысл равенства (7) состоит в эквивалентном этому равенству и уже известном соотношении f(x)—f (х0) = f (xQ) (x—x0) + о (Ах), или Af = f'(x0)Ax + o(Ax). Идея приближения исследуемой функции с помощью более простых функций будет развита в § 3.7 (формула Тейлора). Формулу (7) используют для приближенного вычисления значений дифференцируемой функции в окрестности точки х0. Примеры. 1. Вычислить £/1,06. Решение. Рассмотрим функцию y = f(x)=i//x. Имеем х0=1, Ах = 0,06; * = *0 + Д*=1,06, yTfi6 = f(x0 + bx) = f(x). По формуле (7) получаем f (*) « / (х0) + Г (х0) Ах, УТМ &У1 + Г (х0) Ах. Находим f'(x0) = {l/3)xo2/z, т.е. /'(jc0) = (1/3)-1-»/» = 1/3. Таким образом, ' ^1,06^1+(1/3).0,06= 1,02. 2. Вычислить \/~ё. Решение. Рассмотрим функцию y — f(x) — ex. Имеем х0 — 0, Ах =1/7, л: = д:0 + Дл:= 1/7, е1/7 =f{x0 + Ax) = f(x). По формуле (7) получаем / (х) « / (*«) + /' (х0) Аху е^ *; е° + /' (х0) Ах. Находим /'(x0) = e^, т. е. f'(x0) = e°= 1. Таким образом, \/е& & 1 + 1.(1/7)=1у«1,143. 3. Вычислить sin 31°. Решение. Рассмотрим функцию y = f(x) = sin х. Имеем х0 = я/6 (30° в градусной мере), Дл: = я/180 (1° в градусной мере), х = п/6+ + я/180 (31° в градусной мере), sm31° = f(x0 + Ax)—f(x). По формуле (7) получаем /(*)«/ (x0) + f [xQ) Ax, sin 31 °я* sin 30° + f (х0) (я/180). Здесь /'(a;0) = cosa:0, т. е. /'(a:0) = cos30o = K3/2. Таким образом, sin31°» ^+^-.^«0,6151. Точные значения ^/l,06, e1/7, sin31° с четырьмя знаками таковы: vT66= 1,0196, ^/7= 1,1530, sin 31°» 0,5150. 5°. Дифференциал суммы, произведения и частного. Для всякой пары дифференцируемых функций fug справедливы следующие
208 Глава III. Дифференциальное исчисление функций одной переменной формулы: d{f(x) + g(x)) = df(x) + dg(x); (8) d (/ (*) g (*)) = d/ (x) g (X) + f (X) dg (x); (9) ^fi-^'y^ ^w#°- (io) Доказательство справедливости этих формул непосредственно вытекает из соответствующих свойств производных. Покажем это, например, для формулы (9). Ее левая часть d(fg) на основании формулы (3) является произведением производной функции / (х) g (x) на дифференциал Ах: d(fg) = {fg)'<bc. Применяя к (fg)' правило дифференцирования произведения, получим d№ = №'te = V'g+fg')te=V'te)g+fte'dx)' Поскольку /' dx = df и g' dx = dg* (формула (3) применена к / и g), окончательно имеем d(fg)^gdf+fdg. Отметим важный частный случай формулы (9). Если g(x) = c — 5= const, то dg (x) = с' dx = 0 и d(fc) = cdf (постоянный множитель можно вынести за знак дифференциала). Немаловажным является то обстоятельство, что с помощью дифференциала функции можно ввести новое (и очень удобное) обозначение для производной функции у = /(*): Это обозначение согласуется с алгебраическим тождеством ' ^ ' dx dx Удобство этого обозначения можно оценить при рассмотрении формулы замены переменных в неопределенном интеграле и при интегрировании дифференциальных уравнений с разделяющимися переменными. 6е. Упражнения Вычислите приближенно значения следующих функций: 1. /(*)== j/l+л; при #==0,02. 2. /(*)=! — cos* при х=\°.
§ 3.5. Производные и дифференциалы высших порядков. Формула Лейбница 3. f(x)^=yR*—я? при * = 0,1#* 4. f(x) = tgx при х=\°. 5. /(*) = 1п(1+*) при * = 0,03. §3.5. Производные и дифференциалы высших порядков. Формула Лейбница. Неинвариантность формы дифференциала порядка выше первого 1°. Производные высших порядков. Пусть дана дифференцируемая функция y = f(x). Рассмотрим ее производную y' = f'(x). Если эта производная является дифференцируемой функцией, то рассмотрим ее производную (/'(*))'. Производную от производной функции / обозначают /"(*) и называют второй производной функции /(*). Производную от второй производной (Г(х)У (если она существует) обозначают /'" (л:) и называют третьей производной и т. д. По индукции производную от (п—1)-й производной (f{nmml)(x)Y (если она существует) обозначают f{n)(x) и называют п-й производной. Примеры. 1. f{x) = x\ /'(*) = 5*\ f"(x) = 20x*, /'"(я) = 60*?, /<4) (х) = 120*, /<5) (*) = 120, /<6) = /(7) =•...= /<"> = ... = 0. 2. / (х) = е"*, /' (х) = аеах, f" (х) = сс2еа*, ..., f{n) (х) = апеа<\ .... В частности, если /(*) = е*, то /<w)(*) = e*(n= 1, 2, ...)• 3. /(*) = sin*, /'(*) = cos*, Г Iх) — — sin*, /'"(*) =— cos*, /<4> (x) = sin *, /(*} (*) = cos *, /(e) (*) = — sin *, /(7) (*) = — cos * и т. д.; легко видеть, что fin+A)(x) = f{n)(x) (л=1,2, ...). Удобно рассматривать функцию /(*) как производную нулевого порядка от себя самой: /(*) = /(0)(*). Определение. Если функция / имеет непрерывную производную &-го порядка, то говорят, что /—гладкая функция класса С*. Комментарий к определению. Иногда употребляют термин «гладкая функция» без указания класса С*. Это делается в том случае, когда речь идет о функции достаточно высокого класса гладкости. Теорема (формула Лейбница). Если функции f(x) и g(x) имеют все производные до п-го порядка включительно, то (fg){n)(x)=2CkJM(x)g<»-»(x). (1) £=0 Доказательство приведено в § 3*.5, I. Комментарии к формуле Лейбница. 1) Через С% в формуле (1) обозначены коэффициенты бинома Ньютона или, что то же, количество сочетаний из п элементов по k: Ck __ n(n—\)(n — 2)...(n — k+\) /9. U"~ Ь2 ... k ' ^ где &=1, 2, ...,n; C£=l.
210 Глава IIL Дифференциальное исчисление функций одной переменной Формулу (2) можно записать в виде °* — kl(n—k)l' где и! (читается «эн факториал») означает произведение всех целых чисел от 1 до п включительно, т.е. п! = 1-2-3.. .п; по определению 0! = 1, С* = 0 при k>n, k<0. 2) Напомним формулу бинома Ньютона: п (а + Ь)»= 2 Cknakbn~k = bn + Clabn-* + C2na*bn-*+ ... +ап. (3) /г = 0 В частности, при л = 2 (a + b)2 = a2 + 2ab + b2; при п=3 (a + b)3 = a3 + 3a2b + 3ab2 + b*\ при п=4 (a + b)* = a* + 4a3b + 6a2b2 + 4ab3+b*. 3) Числа С\ обладают рядом замечательных свойств и часто встречаются во многих математических задачах. Отметим следующие важнейшие свойства этих чисел: Ckn = C«-k\ (4) С^ + СЬ = СЬп+1 (k = 0, 1, 2, ...,п-1). (5) 4) Числа С\ можно расположить в виде треугольника, составленного из целых чисел по простому правилу (он называется треугольником Паскаля): Это правило заключается в том, что по известной л-й строке чисел составляется следующая (л+1)-я строка, расположенная ниже я-й, причем &-й член (п+ 1)-й строки равен сумме (k—1)-го и £-го членов л-й строки. Удобно располагать k-й член (п+1)-й строки между (k—1)-м и k-м членами /г-й строки. Если в качестве нулевой взять строку .. .0, 0, 0, 1, 0, ... и считать, что единица в этой строке стоит на нулевом месте, то следующие несколько строк треугольника Паскаля примут такой вид: 1 "3 1 1 1 2 1 0-я строка 1-я строка 2-я строка 3-я строка 4-я строка 5-я строка ^ 6-я строка * 7-я строка * i Здесь выписаны только отличные от нуля числа. Каждое число в этом треугольнике задается номером строки (п) и номером члена в этой строке (&). Так, каждое из чисел 7-й строки: 1, 7, 21, 35, 35, 21, 7, 1 равно сумме двух чисел 6-й строки (которые распо- i 5 21 4 15 3 10 35 6 20 3 10 35 4 15 1 1 5 6 21 1 1 7 1
& 3.5. Производные и дифференциалы высших порядков. Формула Лейбница 211 ложены над ними): 1=0+1, 7=1+6, 21 = 6 + 15,35=15 + 20, 35 = 20+15, 21 = 15 + 6, 7 = 6+1, 1 = 1 + 0. При таком способе построения треугольника Паскаля оказывается, что число с номером k из п-й строки равно С*. Доказательство этого вытекает непосредственно из формулы (4). Если п фиксировано, то числа С\ (k = 0, 1, 2, ..., п) образуют п-ю строку треугольника Паскаля. Формула Лейбница содержит все числа вида С\ при фиксированном п и k = 0> 1, 2, ..., п. В частности, при/г = 1 (/£)' - bfe'+W'*; прия = 2(/£)" = l./^ + 2/y+l.fgr; при л=з (/£)'"= bfe''' + з/у+з/у+ ь/'''£; при п=4 (fer= b/«r(4> + 4/V8) + 6rer+4rV + i-/C4)e; при я= 5 (/g)(5) = l •/^)+5/V4)+10/Y"+10/',V+5/^V+l •№ Здесь коэффициенты в разложении (fg)in) по формуле Лейбница совпадают с числами n-й строки треугольника Паскаля. 2°. Дифференциалы высших порядков. Пусть y = f(x)—дифференцируемая функция. Как известно, дифференциал этой функции есть функция двух переменных (х и Дл:) вида d/ = /' (х) Дл: (относительно переменной Дл: дифференциал является однородным многочленом первой степени). В дальнейшем важную роль будут играть функции двух переменных (х и Ах) вида dnf = fM{x){Ax)\ (6) представляющие собой (при фиксированном л:) однородный многочлен по Дл: степени я. Функция вида (6) называется п-м дифференциалом функции f(x) (или дифференциалом п-то порядка); при л=1 функция (6) обращается, в df и называется первым дифференциалом. Понятие дифференциала я-го порядка встречается в задаче о приближении функции f(x) в окрестности точки х0 многочленами Л-й степени (см. формулу Тейлора). Так как dx = л:'Дл: = Д#, то в случае независимой перейенной х формула (6) примет вид dnf = fin)(x)(dx)n. (7) Формула (7) при п > 1 не обладает свойством инвариантности (в отличие от случая п=1). Покажем это на примере второго дифференциала d*/ = /"(*)(d*)2. (8) Свойство инвариантности некоторой формулы состоит в том, что, она остается в силе, если вместо независимой переменной х взять
212 Глава III. Дифференциальное исчисление функций одной переменной функцию х = ф(^). Вычислим левую и правую части равенства (8) при х —ср(/). Имеем d2/ (Ф it)) = (/ WW (dO2 = (/' (Ф (0) Ф' (*))' (dO2 = ,Qv = [Г (ф (0) ф'" (0 + /' (ф (0) ф" (0] (d/)2; l } г (ф (0) (ф' (о do2=г (ф (0) ф:2 <о (do2- (Ю) Левая и правая части равенства (8), вычисленные после подстановки в это равенство функции q(t) вместо ху отличаются на выражение /'(ф(0)ф" (0(d02> которое, вообще говоря, не равно нулю [ср. (9) и (10)]. Таким образом, второй дифференциал не обладает свойством инвариантности, и формула (7) задает я-й дифференциал только при условии, что х—независимая переменная. [Дифференциалы, порядок которых больше, чем 2, также не инвариантны относительно подстановки л; = ф(^).] Дифференциалы высших порядков обладают следующими свойствами: d*(/ + £) = d*/ + d"£; (11) d»(te) = 2cSd*/d»-*sr. (12) Формула (12), как и формула (1), называется формулой Лейбница (доказательство см. § 3*.5, I). Отметим, что правую часть формулы (12) можно истолковать как (df-\-dg)nf если придать этому выражению смысл в соответствии со следующими соглашениями: (dfl*=d*A (dg)k^d% d°/ = /, d»g = g. (13) Разумеется, формулы (13) означают не обыкновенное возведение d/ в k-ю степень, а некоторую особую операцию, переводящую d/ в dkf. При выполнении условий (13) k-я дифференциал произведения примет вид d*(fe) = (d/+d£)«. (14) Правую часть равенства (14) следует рассматривать как п-ю степень двух слагаемых, которая, согласно формуле (3) бинома Ньютона, равна сумме произведений степеней слагаемых (сумма степеней равна п), взятых с биномиальными коэффициентами. Рассмотрим формулу (14) при я = 3: d3 (fg) = (d/ + dgf = (d/ + dg) (d/.+ dg) (d/ + dg) = ■= (d/)3 (dgf + 3 (d/)2 (dgf + 3 (d/)1 (dg)> + (d/)° (dgf = = d3/# + 3d2/dg + 3d/d2£ + fd3£. (15) Правая часть формулы (15) совпадает с правой частью формулы Лейбница. Формулу (14) можно рассматривать как некоторое правило для
§ 3.6. Теоремы Ролля, Лагранжа, Коши. Правило Лопиталя 213 запоминания формулы Лейбница. Вместе с тем следует заметить, что условия (13) имеют глубокий содержательный, а не только формальный смысл. 3°. Упражнения Найдите производные л-го порядка от следующих функций: 1. я = 2; f(x) = sm*x. 2. л = 2;/(х)==уТ+х*. 3. f(x)=eax. 4. /(*) = sin2A\ 5. f(x) = \nx. 6. f(x)=^x*. С помощью формулы Лейбница найдите производные я-го порядка от следующих функций: 7. f(x)=xex. 8. f(x)=x2\nx. § 3.6. Теоремы Ролля, Лагранжа, Коши, их применения. Правило Лопиталя 1°. Теоремы Ролля, Лагранжа и Коши. Теорема 1 (теорема Ролля). Пусть функция f(x) определена и непрерывна на отрезке [а, 6], дифференцируема в интервале ]а, Ь[ и значения функции на концах отрезка равны, т. е. f(a) = /(6). Тогда существует точка с£]а, Ь[ такая, что /'(с) = 0. Доказательство приведено в § 3*.6, I. Комментарии к теореме Ролля. 1) Основная идея доказательства теоремы состоит в следующем. Функция у = /(х), будучи непрерывной на отрезке [а, Ь], достигает на нем своего минимума и максимума. Из условия f(a) = f(b) следует, что по крайней мере один из экстремумов (минимум или максимум) находится во внутренней точке отрезка [а, Ь], т. е. принадлежит интервалу ]а, Ь[. В этой точке производная (тангенс угла наклона касательной) равна нулю, поскольку касательная к графику кривой в точке экстремума горизонтальна (рис. 51). 2) В условиях теоремы предполагается непрерывность функции на отрезке [а, Ь] и диф>ференцируемость в интервале ]я, Ь[. Тем более утверждение теоремы будет иметь место, если функция f(x) дифференцируема всюду на отрезке [а, Ь]. Конечно, если известно, что функция f(x) дифференцируема на [а, Ь], то нет необходимости упоминать о непрерывности функции на этом отрезке: всякая дифференцируемая функция является непрерывной. Теорема 2 (теорема Лагранжа). Пусть функция f(x) определена и непрерывна на отрезке [а, Ь] и дифференцируема в интервале ]а, b[. Тогда существует точка с£]а, Ь[ такая, что у (r\-ft®-tit)
214 Глава III. Дифференциальное исчисление функций одной переменной J " JO i J а ^ Р \J^ у*№ /' у № На) ' 0 ~~^* I I г . Я £ t f-Hti 1 "л Рис. 51 Рис. 52 Доказательство приведено § 3*.6, 2. Комментарии к теореме Лагранжа. 1) Как видно из со f(b) — f(a) рис. 52, значение ь_а равно тангенсу угла наклона прямой (хорды), соединяющей точки графика (я, /(a)) и (6, /(b)). Теорема утверждает, что внутри отрезка [а, Ь] найдется такая точка с, в которой касательная параллельна хорде. Утверждение теоремы является наглядным и очевидным фактом. Тем не менее теорема требует доказательства хотя бы потому, что существуют различия между наглядным представлением о непрерывной кривой и графиком непрерывной функции, между наглядным представлением о касательной и точным математическим понятием касательной. 2) Основной идеей доказательства является преобразование функции f(x) к такой функции, которая удовлетворяет условиям тео- f(b)-f(a) Ь—а ремы Ролл я. К полученной функции ср (*) = /(*) — (х—а) (легко проверить, что ф(а) = ф(Ь) = 0) применяется теорема Ролля, из чего следует утверждение теоремы Лагранжа. Теорема 3 (теорема Кош и). Пусть: 1) функции fug непрерывны на отрезке [а, Ь] и дифференцируемы в интервале ]а, Ъ[\ 2) g' (х)фО в каждой точке х£]а, Ь[. Тогда существует тонка с£]а, Ь[ такая, что f(b)-f(a) _f'(c) m g(b)-g(a) g'(c)' V> Доказательство приведено в § 3*.6, 3. Комментарии к ^теореме Кош и. 1) Из условий теоремы следует, что знаменатель выражения (1) отличен от нуля, т. е. ёФ)—£ (я) =7^=0. В противном случае в интервале ]а, Ь[ в силу теоремы Ролля существовала бы точка с£]а, Ь[ такая, что g'(c) = 0, а это не имеет места. 2) Утверждению теоремы можно дать следующее механическое истолкование. Пусть функции f(x) и g(x) задают законы движения двух материальных точек. Это значит, что f(x) есть расстояние от начала отсчета первой материальной точки в момент времени х\
§3.6» Теоремы Ролля, Лагранжа, Коти, Правило Лопиталя 215 аналогичный смысл имеет функция g(x). С момента а до момента Ь первая точка прошла расстояние f{b)—f{a), а вторая— расстояние g(b)—g(a). Отношение расстояний, пройденных точками за f(b) — f(a) rr этот промежуток времени, равно ' ,ь[ ,1 • Теорема утверждает, что в некоторый момент движения отношение скоростей точек равно отношению пройденных расстояний. Если бы это было не так, то f(b) — f(a) Г (х) ^ . выражение ' '' — ,: ' ■ было бы отлично от нуля при всех #6]я, Ь[ и сохраняло бы постоянный знак. Пусть для определенности f(b)-f(a) . П± (0, g(b)-g(a) ^ g'(x)' W Последнее неравенство приводит к противоречию, поскольку отношение пройденных расстояний не может быть больше, чем отношение скоростей в каждый момент движения. Следует заметить, что в приведенном истолковании теоремы Коши было использовано несколько больше, чем дано в условиях теоремы. А именно, при выводе неравенства (2), по существу, была использована непрерывность функции /' (x)/g' (x), что не содержится в условиях теоремы. 3) Основная идея доказательства теоремы Коши состоит в построении функции F(x) = f(x)-f(a)-l^^(g(x)-g(a)), которая удовлетворяет условиям теоремы Ролля. К этой функции применяется теорема Ролля, из чего следует утверждение теоремы Коши. Следствием теоремы Коши является правило Лопиталя—теорема, позволяющая вычислять пределы, связанные с раскрытием неопределенностей вида 0/0 и оо/оо. При этом сложные по своей природе задачи вычисления пределов сводятся к сравнительно простым задачам вычисления производных. 2°. Раскрытие неопределенностей вида 0/0. Теорема4 (правило Лопиталя). Пусть: 1) функции f(x) и g(x) определены в окрестности точки х0, причем f(Xo) = g(xo) = 0\ 2) существуют производные /' (#0), g' (х0), причем g' (xQ) Ф 0. / (х) Тогда существует предел lim -^Ч и Шп Ж = 1Ы . , (3) Доказательство приведено в § 3*.6, А.
216 Глава III. Дифференциальное исчисление функций одной переменной f (х) Комментарии к теореме 4. 1) Предел lim-^рг- не мо- жет быть вычислен на основании известного свойства непрерывных функций (функции f(x) и g(x) непрерывны в точке х0, так как по условию эти функции дифференцируемы в этой точке). Действительно, формальная подстановка в выражение f(x)/g(x) числа х0 вместо х дает 0/0. В этом случае говорят, что предел lim / (x)/g (х) х-+х0 есть неопределенность вида 0/0, а вычисление предела—раскрытие неопределенности вида 0/0. 2) Теорема 4 исключает из рассмотрения случай f'(x0) = 0, g'(x0) = 0, который часто встречается в задачах. Справедливо усиление теоремы 4, позволяющее раскрывать неопределенности вида 0/0 при условии g'(x0) = 0. Теорема 5. Пусть: 1) функции f(x) и g(x) определены и дифференцируемы в некоторой окрестности точки х0, за исключением, быть может, самой точки х0\ 2) lim /(*)= lim g(*) = 0; X ~~^ Xq X •—► Xq 3) g' (х)Ф0 в окрестности точки х0, за исключением, быть может, самой точки х0\ 4) существует конечный или бесконечный (равный +оо или —оо) предел lim , у[. f (х) Тогда существует предел lim -~r-r и х-+х0 8\х) цш Щ = lim Щ. (4) Доказательство приведено в § 3*.6, 5. Комментарий к теореме 5. Иногда функции f'(x) и g'(х) обладают свойствами 1—4, перечисленными в условиях теоремы 5. Тогда, применяя эту теорему к функциям /' (л:) и g' (x), получим lim Aft = lim Щ-, (5) откуда, учитывая равенство (3), находим Mm ±W-= lim ilW = lim Ш (6) При соблюдении условий 1 — 4 для функций /", g"\ /'", g'"\ ...; fin~v, g<n~l\ цепочку равенств (6) можно продолжить: Иш Щ„ lim -D*L_ ига M... . - lim -^4- (7)
3.6. Теоремы Ролля, Лагранжа, Коши. Правило Лопиталя 217 Если в равенствах (7) п таково, что lim g{n) (х) Ф О, то последний х ->л:0 Из пределов (7) равен fin) (x0)/gn (xQ) при условии, что функции fin) (x) и gin)(x) непрерывны. В практическом отношении важен следующий частный случай теоремы 5. Следствие из теоремы 5. Пусть f(x), g(x)—функции, определенные вместе со своими производными /' (х), /"(*), /'"(*)>• • •» f{"l)(x)'9 g'(x), g"{x)> ♦.., g{n) (x) в некоторой окрестности тонки х09 причем fin)(x), g{n)(x) непрерывны в точке х0. Пусть также f(x0) = ifW-.-r'W^ и g{x0) = g'(x0)=...=g*-»(xQ) = 09 но f(n (x0)> §{n)(x0) не равны нулю одновременно. Тогда Отметим, что если f(n) (х0) Ф 0, а g<n)(x0) = 0, то Нт-^т4-=оо. Примеры. 1. Вычислить предел lim—й—7" "Г . Х-+1 Х *Х-\-1 Решение. Функции f(x) = xs—Зхъ + х+ 1 и g(*)=x14—2х + 1 определены вместе со всеми своими производнымив точке х=1. При этом /(1) = 0, йГ(1) = 0, но Г(1) = 8х7—15^+l|x=i=—6^=0 и g' (1) = 14л:13—21*=! = 12=^0. По формуле (8) при л=1 получаем 2. Вычислить предел lim ~~ 3—• л'-*0 х Решение. Функции f(x) = x— sin л: и ^(л:) = д:3 определены вместе со всеми своими производными в точке х = 0. При этом /(0)=0 /' (0) = 1 —cosлги=0=0, r(0)=sinx|^=0=0, Г"(0)=созх\х=о = 1ф0] g(0) = 0, g/(0) = 3xe|x=o = 0, «Г(0) = &с|ЖЯ5о = 0, g'"(0)=:6=^0. По формуле (8) при л = 3 находим ,. x-sinx _ f'"(0) 1 Зв Вычислить предел lim % ~~ -• л:->0 * Решение. Функции f(x) = ]/rl+x—1 —лг/2 и £(л;)=л:2 определены вместе со всеми своими производными в точке х = 0. При этом /(0) = 0, /'(0) = ^?4=Т-4 4—4-=°- /"(°)= 1 г . = — 4- ( здесь использовано правило дифференци- 4^(1+*)» |«0 4 V ( V VVV рования сложной функции: у=-^и~1/г> и=\+х, у'= — -jU-^2u'j ;
2IS Глава III- Дифференциальное исчисление функций одной переменной £(0) = 0, £'(0) = 2х|„0 = 0, ^ (0) = 2. По формуле (8) при я = 2 получаем lim V"T+Z-l-x/2 f"(0) _ -1/4 __ 1 х-+о х* g" (0) 2 -~ 8 ' 3°. Раскрытие неопределенностей вида оо/оо. Пределы lim -^~- в слу- чае, если lim f(x) = oo и lim g(x) = оо (неопределенность вида оо/оо) при выполнении некоторых дополнительных условий могут быть вычислены с помощью следующей теоремы, аналогичной теореме 5. Теорема 6 (правило Лопиталя). Пусть: 1) функции f (х) и g(x) определены и дифференцируемы в некоторой окрестности точки х0, за исключением, быть может, самой точки х0\ 2) lim / (х) = lim g(x) = оо; х-*-х0 х-+х0 3) gf (*)Ф0 в окрестности точки х0, за исключением, быть может, самой точки х0\ 4) существует конечный или бесконечный (равный +оо или —оо), предел lim ,,[ . t (х) Тогда существует предел lim -^jy и Доказательство приведено в § З.*6, 6. Комментарий к теореме 6. Пусть функции /' (х) и g'(х) удовлетворяют условиям 1—4 теоремы 6. Тогда, применяя эту теорему к функциям /' (л:) и g' (x), получим lim Щ. = lim IL^L = lim 4^-. (10) При соблюдении условий 1—4 для функций /", g"\ /'", g"\ ...; f{n~v> g{n~l) цепочку равенств (10) можно продолжить: ,-«.«(*) *+х.8'(*) x^x0§(x) x->x0S(n)(x) У > Если в равенствах (11) n таково, что lim f{n) (x) и \img{n)(x) X->Xq X-+Xq конечны и не равны нулю одновременно, то iira_q±=iim4^.
§3.6. Теоремы Ролля, Лагранжа, Коши. Правило Лопиталя 219 Примеры. 1. Найти предел Нтл:1пл;. Решение. Перепишем данный предел следующим образом! Нт х In х = lim -^. х->0 х-+0 *'х Имеем / (л:) = In x, g (х) = 1 /*; Нт / (х) = — оо, lim g(x) = оо. Исполь- зуя формулу (9), получим lim4^=limi^=lim-J^==lim-^ = 0. *->о 2(х) х->о S (х) х^о —1/** х-+о х 2. Найти предел lim -^- , а > 0. Решение. Имеем f(x) = lnxJ g(x)=xa, Hm/(jc) = Hm lnx= оо; lim g (л:) = lim xa = оо. Воспользуемся формулой (9): Нггг ^П^- = lim -^У^- = Нт —^^- = lim —1^- = 0, j^o, ха х-к» (ха) *_>«, ах*-1 *-*<» алга так как Итл;а=оо при любом а > 0. Полученный результат озна- чает, что функция у = 1пх растет медленнее, чем функция у = ха (а > 0) при х-+ оо. 3. Найти предел lim —. х-+со е Решение. Имеем f(x)=xn,g(x)=ex, lim f(x) = oo, Нт#(л:) = оо. Далее применяем формулу (9): хп ,. их"-1 Нт —=■= lim *- • Для функций /иг"-*1 (при п > 1) и е* снова получаем Нтш:и"1 = оо> Нт е* = оо. Функции / (х), /' (х), ..., /<»»d (#) таковы, что lim /ш (x) = = оо (£=1, 2, ..., п— 1), поскольку РЧ*)=я (л —1). ..(п—Л+1) *»-*, где п—k>0 при £= 1, 2, -.., п—1. Для функций g(x), g' (х), ..., g-^-i>(#) также имеем lim£ш (л:) = lim е* = оо* Однако функция /(п) (х) = п(п—1) (п— 2)... I постоянна и lim/U)(x) = n!. Применяя теперь формулу (11), получаем Hm^- = lim-^- = 0, '
220 Глава III. Дифференциальное исчисление функций одной переменной :§| поскольку п таково, что Нт/Ы(д;) и \\mg{n)(x) не равны нулю одновременно. Полученный результат означает, что функция хп растет медленнее, чем е* при х —*оо. Можно доказать, что для любого а > 0 и |3 > 0. Пусть а = 2, р = 1/100. Тогда ха и е$х при х= 100 равны соответственно 10000 и е = 2,71828, .... Тем не менее при больших х значение е*/10° много больше, чем л:2, как это следует из соотношения (12). 4°. Раскрытие неопределенностей вида оо — оо; Q.oo, 1°% 0°, оо°. Существуют несложные приемы, позволяющие сводить неопределенности вида оо — оо, О-оо, 1°°, 0°, оо° к неопределенностям вида 0/0 и оо/оо, которые, как было показано, можно раскрыть с помощью правила Лопиталя. Рассмотрим предел \imf (x)—g(x), где Нт/(л;) = +оо, \img(x) — Х-+Х0 X-+X0 Х-+Х0 = + оо (неопределенность вида оо — оо). Имеем Х- Так как /(*)~*oo, то 1//(аг) —^0. Если функция l—f(x)/g(x) не стремится к нулю при х-+х0, то предел lim f(x)— g(x) = = lim f(x)[l— g(x)/f(x)] не существует. Если же 1— g(x)/f(x) -*0 х-+х0 при х —► #0, то lim 1~fi^/((A:) представляет собой неопределенность вида 0/0. Рассмотрим теперь предел lim / (x) g (х), где lim / (л;) = 0, х-+х0 х-*х0 lim g (x) = оо. В этом случае lim / (x) g (x) = lim J.^h - Последний X-+X* Х-+Х0 Х-+Х0 1'ё\Х) предел представляет собой неопределенность вида 0/0. Рассмотрим еще предел lim[/(*)]*<*>, где /(*)—П, g(x)-+oo х->х0 при x-+Xq (неопределенность вида 1°°). Положим \\m[f(x)]*M = A. (13) х-+х0 Логарифмируя обе части равенства (13) и используя непрерывность логарифмической функции, получим In Л = In lim [^(x)]«w = limln[/(jc)]ew=* Х-+Хо Х-+Х0 = lim[\nf(x)]g(x) = \im-^-. (14)
* 5.6. Теоремы Ролля, Лагранжа, Коши. Правило Лопиталя * 221 В правой части формулы (14) имеем 1п/(л:) —*0 и l/g(x)-+0 при х—+х0 (неопределенность вида 0/0). Таким образом, вычисление натурального логарифма предела lim [/ (x)]&w сводится к раскрытию х-+х0 неопределенности вида 0/0. Аналогично (с помощью логарифмирования) неопределенности вида 0° и оо° могут быть сведены к неопределенностям вида 0/0 или оо/оо. Примеры. 1. Найти предел Итхх. Решение. Это неопределенность вида 0°. Полагая limxx = A, х-+0 имеем In A = lim х In x. Последний предел был вычислен с помощью х-+0 правила Лопиталя (см. пример 1 п. 3°). Следовательно, Л = е°=1. 2. Найти предел lim (ctgjc ). Решение. Это неопределенность вида оо — оо. Имеем lim (ctgjc- x-*Q \ ^-limctgxfl-i^Ulim^^^. x-*Q \ x I x-+Q x Так как xctg x— 1 —► 0 при x —> 0, то последний предел представляет собой неопределенность вида 0/0. Воспользуемся правилом Лопиталя: Г *ctg*~ 1 __ i: ctgx—jr/sin2* _ у sinxcosx—x *->0 x x-+0 l x->0 Sin X т. е. снова получили неопределенность вида 0/0. Применяя еще раз правило Лопиталя, находим ,. sinxcos*—х «. cos2* —sin2*—1 lim г-s = lim X^Q sin2 x x_^0 2 sin x cos x ,. —2 sin2 x ... sin* ~ s= lim -я—, = — lim = 0. X_+Q 2 sin x cos x x_+0 cos x 3. Найти предел Нт(1/л;)*2*. x-+0 Решение. Это неопределенность вида оо°. Полагая lim (1/я)1**=А, х->С получаем In А = lim tg л: In (1/*) = — lim tg x In x = — lim -J5£f т. е. неопределенность вида оо/оо. Воспользуемся правилом Лопиталя: _lim-feL = -Km //* =iimESi£ ^octg* ж^о -1/sin?* ""J * (получили неопределенность вида 0/0). Применяем правило Лопиталя повторно: Итак, 1пЛ = 0, откуда А = 1.
•if 222 Глава III. Дифференциальное исчисление функций одной переменной 'L 4. Найти предел lim (1EJL ] 1/х* II Решение. Это неопределенность вида 1°°. Полагая А =з || ,. /sin* у/*2 , ..... l « /sin* \ lim , имеем In A =lim -г- In , т. е. неопределен Х-+0 \ х J х-+0 Х \ X ) ность вида 0/0. Воспользуемся правилом Лопиталя: .sin* Л sin a: In In v * ,. I x J ,. (In sin*—In*)' hm —j5—= lim v 2, y = hm -* Y }- *->0 *' x-+Q Vх / x-+Q z* COS* 1 «. sin* * -. * cos*—sin* s= lim о = lim x-+o 2* ^0 2*2sin* (получили неопределенность вида 0/0). Применяем правило Лопиталя еще раз: ,. *cos*—sin* «. cos*—*sin*—cos* *. *sin* lim —я-*—- = lim —a—:—r-o-5 = — bm ■ x^0 2*2 sin x x->0 4* sin x +2*2 cos x x-+o 4* sin * + 2*2 cos * (снова получили неопределенность вида 0/0). Используем правило Лопиталя в третий раз: у *sin* ,. sin*-}- *cos* *->о 4*sin*-j-2*2 cos* ~~ x_+0 4 sinx + 4* cos * + 4* cos* — 2*2 sin* (опять получили неопределенность вида 0/0). Применяем правило Лопиталя в четвертый раз: 1. sin*+*cos* _^ х_+0 4 sin*-|-8*cos*—2*2sin* cos *+cos*—*sin* 2 1 = — lim x_^0 4cos* + 8cos*—8*sin*—4*sin*—2*2cos* 12 6* Итак, 1пЛ = —1/6, откуда А = е-1/6. 5. Найти предел lim — (ax—b*). х->0 х Решение. Это неопределенность вида оо-О. Имеем lim — (ах—ft*) = lim^—— х->0 х х-*0 х (получили неопределенность вида 0/0). Применяем правило Лопиталя: ,. а* — Ь* -. a* In а—Ъ* In а , л « « lim —-—= lim : = lna —ln&. x-+Q x x-+0 A 5°. Упражнения С помощью правила Лопиталя вычислите пределы: ч ,. *2-4* + 3 0 .. *3-4*2 + 5*-2
§8.7. Формула Тейлора. Применение дифференциала в приближен, вычислениях 223 3. lim —, #-►00 X 5. lim -. . #-►00 itl X X2 7. lim г— Я-»-оо X— 1 sin*(l 9 lim X-+0 X. cos x) - л;7 л:3 ' 2 + *5 8 -« 4. lim —r-4 *-oo Xb 6. lim -n—, дг-^оо In2 л: v^HFI-i- 8. lim 3— *-*o xl 10. lim*ln(1+*>. *-*0 I 1 » § 3.7. Формула Тейлора с остаточным членом в форме Лагранжа. Представление функций е*, cosjkt, sinx, 1п(1+лг), (1+*)** по формуле Тейлора. Понятие главной части функции. Приложения формулы Тейлора. Применение дифференциала в приближенных вычислениях 1°. Формула Тейлора. Главной формулой дифференциального исчисления является формула Тейлора. Эта формула позволяет значительно облегчить изучение поведения (гладкой) функции в окрестности данной точки. Формула Тейлора реализует математическую идею, заключающуюся в следующем: для данной (гладкой) функции f (х) в точке х0 подобрать такой многочлен Рп(&х)> где Ах = х—л:0, чтобы разность f (х)—Рп (Ах) была (при фиксированном х0) функцией от Ал: бесконечно малой более высокого порядка малости, чем (Ал:)". Таким образом, f(x) = Pn(bc) + o(bx)". (1) Частным случаем этой формулы при п—\ является формула !(х)-!(х0) = Г(х0)Ах + о(Ах), (2) рассмотренная в § 3.4, где с ее помощью было введено понятие дифференциала. Формула (2), переписанная в виде f(x) = f (х0) + /' (*о) (х—х0) + о (Ах), задает многочлен первой степени относительно Ал: = х—л:0, а именно^ /(*<>) + /' (#о) Ах у который отличается от исследуемой функции f(x) на величину о(Ал:) (эта формула справедлива для всякой функции /(л:), имеющей производную в точке х0). Решение задачи о нахождении многочлена Рп (Ах), удовлетворяющего условиям (1), дано в следующем утверждении. Теорема 1 (формула Тейлора с остаточным членом в форме Пеан о). Для всякой функции f(x), определенной в окрестности точки х0 и имеющей в этой точке производные /' (л:0),
224 Глава III. Дифференциальное исчисление функций одной переменной Г(Хо), •••, f(n) (Xo)> справедлива формула f W = /(*o) + 4r ^+J^(AxY+ ... +£^L> (Д*)* + о(Л*)", (3) которая называется формулой Тейлора. Доказательство приведено в § 3.*7, I. Комментарии к теореме 1. 1) Формула (3) определяет многочлен от переменной Ал;, а именно ^A*) = /(*o) + ^A*+^(^)2+...+^W, (4) удовлетворяющий условию (1). Многочлен Рп(Ах) называется п-ы многочленом Тейлора функции f(x) в точке х0. 2) Отметим, что самым важным утверждением теоремы является тот факт, что многочлен Рп (Ах) удовлетворяет условию (1). Иными словами, многочлен (4) с «высокой точностью» дает приближение исследуемой функции f(x) в окрестности точки х0. 3) Т1ри #o = 0 формула (3) принимает вид /(х) = /(0) + фх + ф^+...+^В + оМ (5) н называется формулой Маклорена. 4) Формула (3) справедлива и тогда, когда /' (л;0), /"(*0), ... • '-, /(/2) (х0)—односторонние производные. 5) Разность /(х)—Рп(Ах) называется я-м остаточным членом формулы Тейлора. Формула (3) утверждает, что f(x)—Рп (Ах) = ~о(Ах)п. Такой вид остаточного члена называется остаточным членом в форме Пеано. Следующая теорема уточняет теорему 1, при этом остаточный член о(Ах)п формулы (3) приобретает более конкретный вид. Теорема 2 (формула Тейлора с остаточным членом в форме Лагранжа). Для всякой функции f(x), определенной в некоторой окрестности точки х0 и имеющей в этой точке производные /' (х0), /" (#о), /'" (х0), ..., /(л) (*„)» а в некоторой окрестности этой точки (я + 1)-ю производную f{n+1)(x), справедлива формула где с—некоторая точка, принадлежащая интервалу ]х0, х[. Доказательство приведено в § 3.*7, 2. Комментарии к теореме 2. 1) Отметим, что условия теоремы 2 требуют существования п+1 производной, в то время как условия теоремы 1 требуют существования п производных.
S 3.7. Формула Тейлора. Применение дифференциала в приближен, вычислениях 225 2) При условиях теоремы 2 остаточный член f(x)—Рп(&х) оказывается не просто бесконечно малой более высокого порядка малости, чем (Ал:)", а бесконечно малой (п+1)-го порядка: (я 4-1)1 Ап + 1) (с) 3) Остаточный член f (х) — Рп (Дя) вида ' * ; (Ах)*** называется остаточным членом в форме Лагранжа. Пример. Представить функцию y = f(x)=x* в точке х0 = 1 в виде (3) и (6) при п = 3. Решение. Вычислим значения производных /' (1), /;'(1), /'"О)- Имеем /' (х) = 4х\ /" (х) = 12х2, /'" (*) = 24л:. Отсюда /' (1) = 4, /" (1) = = 12, ////(1) = 24. Подставляя эти значения в формулы (3) и (6), получим ^=1+^(^_1)+^(х_1)>+^(х_1)»+^(х_1)\ В последнем равенстве учтено, что /(4) (х) = 24, поэтому /(4>(с) = 24 при всех с. Если бы требовалось представить функцию y = f(x) = д;4 в виде (6) в точке х0=1 при п = 4, 5, 6, ..., то получили бы тождество *« = 14-4(*— i) + 6(x — l)2 + 4(x — l)3 + (x — I)4, поскольку все производные от я4, начиная с пятой, тождественно равны нулю. 2°. Представление функций е*, cos*, sin лг, 1п(1+лг), (1+*)а по формуле Тейлора. Все перечисленные функции бесконечно дифференцируемы при х9 = 0, так что условия теорем 1 и 2 выполнены. Конкретные формулы вида (3) и (6) для данных функций получаются в результате вычисления производных этих функций до п-го порядка включительно. 1. Пусть у = /(*) = е*, тогда /(*) = /' (x) = f"(x) = ... =/(и) (*) = = /<»+!> (х) = е*. Следовательно, / (0) = /' (0) = /" (0) = ... = /<"+1) (0)= = 1 и е-=1+^ + 4 + *|г+--*+^Г + 0(^ (7) у2 уЗ у/1 уИ + 1 рС 2. Пусть y — f(x) = cosx. Тогда /(a') = cosx, /'(х) = — sinx, /"(х) =— cosx, /'" (х) = sinx, /(4) (л:) = cos х, f{V(x) = — sinx, /(6) (х) = — cos л;, /(7) (х) = sin л:, /(4A)(x) = cosx, /(4А+1)(л:) = —sinA:,/U;f+?)(x)= —cosa:, /u*+^ (x)=sinx. (9) 8 № 2636
226 Глава HI. Дифференциальное исчисление функции одной переменной Производные функции /(at) = cosa: обладают следующим свойством: /<*+«> (*) = /<» (х), & = 0, 1, 2, Из формул (9) находим /(0) = 1, f (0) = 0, /"(0) = -1, /"'(0) = 0, Г(0) = 1, /(5>(0) = 0, /<°>(0) = -1, /<" (0) = 0, ..., /(4*> (0) = 1, /*«*+» (0) = 0, /(4*+?> (0) = —1, f<4*+3) (0)=0. Таким образом, COS*=l —^ + ^_...+(_l)*-gl + 0(^), (Ю) cos^i-^+^-.-.+HO^+Hi^^T^^Mii) 3. Пусть y = f (х) = sin x. Тогда / (х) = sin *, /' (дг) = cos x, /"(*) =— sin л:, f" (x) = — cosx, /(4,(*) = sin.*:, fW(x) = cosx, fi6)(x) = — sinx, /(" (x) = — cos x, /<«» (л;) = sinx, /<«*+» (a:) = cos ж, /<4ft+?> (x) = —sin л:, /<4*+?> (x) = —cos*. (12) Производные функции / (л:) = sin x обладают следующим свойством: /<*+*> (х) = /<*> (х). Из формул (12) получаем / (0) = 0, /' (0) = 1, \" (0) = = 0, /'" (0) = -1, /<4> (0) = 0, /<•> (0) = 1, /<•> (0) = 0, /<» (0) = -1, ... ..., /((Ш(0) = 0, /(4*+1>(0) = 1, /4**+!)(0) = 0, /<4*+з>(0) = — 1. Следовательно, v2* + l smx = x-jr + ±r-...+(-lf^-r^ + o(x^% (13) sin^x-^ + |--...+(-l)ft^ + (-l)^^%^-. (14) 4. Пусть у — f (x) — In (1 + х). Тогда /(*) = ln(l+*)f f'(x)=T^-x = (l+x)-\ Г(х) = (-1)(1+х)-*, Г (х) = (-2) (-1) (1 +*)-, /<" (х) = (-3) (-2) (-1) (1 +х)-*, ..., <15> /<»> (х) = (— l)»-i (п— 1)! (1 + *)-», /(п+1> (л:) = (—1)" п\ (l+x)-(n+1>. Отсюда /(0) = 0, f(0) = l, f(0) = -l, /'"«>) = 2!, /<4>(0) = -3!, ... ...,/(п,(0) = (—1)"-*(п—1)1 Следовательно, Ы(1+х) = х-^+^—^+... + (-1Г^^- + о(х"), (16) 1п{1+х)=х-^+^-^+... + {-1)^м-1)"Щ^^- (17) 5. Пусть y = f(x) — (l+ x)a, a £ R. Тогда /(x) = (l+x)a, /'(*) = «(!+*)"-1, ГМ=а(«-1)(1+^Г- Г'« = «(«-1)(а-2)(1+^а-3 ,m p>(x) = a(a—1)...(a—n + l)(l+*)«-", ( ' /<»+»> (*) = а(а—1).. .(а—п) (1 +ж)«-"-1.
§ 3.7. Формула Тейлора. Применение дифференциала в приближен, вычислениях 227 Отсюда / (0) == 1, Г (0) = а, /" (0) = а (а-1), /'" (0) = а (а-1) (а—2), ... ..., /<">(0) = а(а— 1)...(а—п + 1). Поэтому (1+^=1+^+^^^ + -..+а(а-1)-г;!(а--"+1)ж"+0(^),(19) (l+x)«=l+«x + ^^^+...+a(a-1)-nf-n+1)^ + + а(а~(п + \Т~П) ^ +c)e-"-1^+1. (20) Заметим, что если а—целое положительное число, то формула (20) (при a^Zri) превращается в известную формулу бинома Ньютона. Следует отметить частные случаи формул (19) и (20) при а = 1/2, ... +(1/2)(1/2~1)/;;'(1/2~rt+1)^+o(^), (2i) + (1/2)(1/2-^1);(1/2-п) (1+*)-'/»-» А (22) (1 + *)-* = 1 — х + х2—х3 + ... + {—\)пхп + о (хп), (23) (1 _!_*)-*:= 1_х + х2 — *3+... +(— 1)я*я + (— l)n+1(l+c)-n~2xn+1, . (24) (I +д:)-2= 1 —2x + 3x2—4xz+ ... +(—1)» (n+l)xn + o(xn), (25) (1 +ж)-?= 1—2x + 3jc2 — 4x»+... + (—1)" (n + 1) **+ + (—l)w+1(n + 2)(l+c)-"-3x"+1. (26) Формулы (23) и (24) связаны с суммированием членов геометрической прогрессии. Формулы (7), (10), (13), (16), (19) нужно знать наизусть. 3°. Вычисление пределов с помощью формулы Тейлора (метод вы- деления главной части). Пусть дан предел вида lim ^-~, . где х-*-х9 S\x) lim / (x) = 0, lim g (x) = 0, т. е. имеет место неопределенность х-+х0 х-+х0 вида 0/0. Допустим, что функции f (х) и g(x) таковы, что их можно разложить по формуле Тейлора в точке х0. Сделаем это, ограничившись в разложении лишь первым ненулевым членом: f(x) = a(x—x0)k + o(x—x0)k, афО, (27) g(x) = b (х—х0У + о {x—xQ)\ ЬфО. (28) Легко видеть, что /(*) _ yirn a(x—x0)k х-*-х0 8* lim 'у ' — lim l o; /29)
228 Глава III. Дифференциальное исчисление функций одной переменной Члены а(х—x0)k и Ь(х—х0)1 в формулах (27) и (28) называются главными частями функций f(x) и g(x) при х —>х0. Таким образом, предел отношения двух бесконечно малых функций равен пределу отношения их главных частей. Это правило можно успешно применять при вычислении пределов, если использовать известные разложения элементарных функций е*, cos*, sin л:, 1п(1+л:), (1+*)а и их простейших комбинаций. Примеры. 1. Найти предел lim *—smx л х-> о е ~~1—х—х >и Решение. Разложим функции х—sinx и е*—1—х—х2/2 в точке х = 0 ио формуле Маклорена при п = 3, используя соотношения (13) и (7). Имеем *_sin* = iJ- + o(*»)f е*— \-х-^ = ^ + о{х*). Далее, находим «. х— sin* ,. х3/3! « J™ e^-l-x-^/2=llrn^3!^L Заметим, что разложение функций х—sin* и е* — 1—х—х2/2 при п = 2 не приводит к цели, поскольку обе функции равны нулю с точностью до бесконечно малых более высокого порядка малости, чем х2. 2. Найти предел lim х-> О х cos*—sin* я sin* Решение. Учитывая, что cos л: =1—-^r-{-o(x2)f smx==x—~ + + o(x3)t имеем х cos x—sin x = х (1 — 4р J — (*—■Tjj-) + о (л:3), # sin л: = Их—-gj-J -f- о (л:2). Далее, находим ,. xcos*-sin*_ .. х-**/2-х+л*/3\__ у х* (-1/2+1/3!) _А 3. Найти предел lira (1^*} *~е. Решение. Пусть f(x) = (l + *)!/*- Тогда 1п/(х) = (1/л;) 1п(1 +х). Согласно формуле (16), получаем . 1п/(х)-1(х-4 + о(х2)) = 1—± + о(х), откуда f(x) = el-x/2+°w. Далее, имеем (1+х)х/х—е^е1-*/2*^*)—е = е(е-*/2+о<*>—1)=; = е(1— x/2 + o(x) — 1) = е(—*/2) + о(х).
§ 37. Формула Тейлора. Применение дифференциала в приближен, вычислениях 229 Таким образом, цт(1 + хГ'*-е_Гте{-х/2) _ _± х-+о х х-+о х 2' Неопределенности вида 0°, оо°, <х> — оо, 1°°, 0-оо известным способом (см. п. 4° § 3.6) можно свести к ^.неопределенности вида 0/0, после чего следует применить метод выделения главной части. 4. Найти предел lim(_J L\ x->0\^sin^ х2 / Решение. Это неопределенность вида оо — оо. Имеем 1 1 х— sin л: х sin х х2. a:2 sin x ' Используя разложение sin# = x—^ + о(л:3), получаем*—sinx = V'3 = ~ + о(л:3), x2s\nx = xz + o(x5). В результате находим хъ 1 1 \ УлгглХ— smx um 6 ' 1 lim(_! lWim*--sin* = linK *->oV*sin* x* J x-+o x2 sin x x-+Q хг-\-о (х3) 6' 5. Найти предел \im(e2x -\-x)1/x. х-+0 Решение. Это неопределенность вида I00. Пусть /(*) = *= (е2х + х)^х. Тогда In / (х) = -i In (е2ЛГ + х). Далее, In (е2* + х) = = In(1 +е2Х + х—1), и в силу формулы (16) имеем 1п(е2*+*) = = е2Х + х—1 +о(е2Х-\-х— 1), так как е2Х + х — 1—>0 при х—*0. Теперь, используя формулу (7), получаем In (е2* + х) = 1 +2х + х— 1 +о(х) = Зх + о (х), откуда limlin(e^+^)=lim-(3^ + o(x))=3. х—>0 X л->0 -^ Следовательно, \\т (е2х + х)1/х = ег. х-±0 4°. Применение формулы Тейлора в приближенных вычислениях. Формулу Тейлора можно использовать в приближенных вычислени- . ях, подобно тому как формулу /(*) = / (х0) + f (х0) (х—х0) + о (х--х0) применяют для приближенного вычисления значений функции f(x). Действительно, в соответствии с формулой Тейлора для х, близких к х0, справедливо приближенное равенство /(*)»/(*)47'(*)(*^^ (30)
230 Глава III. Дифференциальное исчисление функций одной переменной Примеры. 1. Вычислить приближенно значение функции у = = f(x)=V R2—л:2, используя формулу (30) при лг0 = 0, п = 2. Решение. Находим f(x) = VR2—x\ /(0) = Д; /'(*) = — У№-х* + х /'(0)=0; /"(*) = • ^R2~ х2 R2 — x2 Теперь по формуле (30) получаем (уц*—х*у УЯ2—х* ' ;Г(0) = —l/u. (*) D О 1QQ В частности, при *=jq имеем /(*) &R— 2оо = 20б#- Приближенному равенству (*) можно дать следующее геометрическое истолкование: две кривые—окружность у = \^R2—х2 и пара- X2 бола y = R—kr ПРИ малых х близки между собой (рис. 53). 2. Вычислить приближенно значение функции у = f (х) — In (1 + х), используя формулу (30) при х0 = 0, п = 3. Решение. По формуле (30) получаем In (1+*)«*—\ + \ (частный случай формулы (16) при п — 3). Например, при х = 0,1 имеем 0,01 , 0,001 In 1,1 «0,1 0,9953. Рис. 53 Уместно сравнить полученный результат с данными таблицы натуральных логарифмов: In 1,1 «0,9953 (здесь четыре знака после запятой верные). 3. Вычислить приближенно значение функции / (x) = arcsin# по формуле (30) при х0 = 0, п = 5. Решение. Находим /(x) = arcsin*, /(0) = 0; /'(*) = f (х) = -\ (1 -A-2)-*/* (-2х) = х(1 -х°-)-*''\ Г (0) = 0; /"' (х) = (1 —х2)-3/2 +х ( — 3/2) (—2*) (1 —л:2)-*/2 = = (1 —л;2)-'/2 + Зх2 (1 —х2)-5/2, /"' (0) = 1;
§3.7. Формула Тейлора. Применение дифференциала в приближен, вычислениях 231 /"> (к) = —(3/2) ( — 2х) (1 —х2)-*/* + 6х (1 —л:2)-5/2 + + Зх2 ( — 5/2) (—2*) (1 —x2)-v* = 9i(l — х2)-5</2 + + 15.v3(l—х-2)"7/2, /<4)(0> = 0; /<»> (x) = 9(1 —**)-*/* + 9л: (—5/2) ( — 2x) (1 — л:2)- */« + + A5x2 (1 — x2)"7/2 + 15jc3 (—7/2) ( — 2a:) (1 —л:2)"9/2 = = 9(1 — x2)-5/2 + 90x2 (1 —*a)- */» + 105a:4 (1 — x2)~9/2, /(5)(0) = 9. Теперь, используя формулу (30), получим . х* , Зх5 arcsin л: « л: + -g- + -ттг- В частности, при # = 0,5 имеем • л с лс . °>125 . 3-0,03125 acooit arcsin 0,5 « 0,5 + -1g-H ^— « 0,52317. Точное значение arcsin0,5 есть, как известно, л/6» 0,52359. 5°. Упражнения Найдите пределы: еа*_е&* Л ,. In (1 + 3*)—cos* 1. hm , 0—. 2. lim —*—' ; . *->0 tg2^ ^о в*—1 Л ,. 1-tg* „ ,. 4 $/\-х2-4ех* 3. lim 1— . 4. lim—-—г Х-+Л/4 cos 2л: x-»q arctg* —л; e ,. 2*—In (1 + 2*) й ,. sin*—*+*3/6—*5/120 5. lim 5 -• 6. lim ——r= *-*o ** *-*o (sin*)7 „ ,. sin2*-*2 0 t. ln2(l+*)-*2 7. lim ■;-'—-• 8. lim ~ 9. lim (1 + 1п(1+*))с'8*, 10. Mm(cosx)l/^X"~l~xK
Глава IV ИССЛЕДОВАНИЕ ФУНКЦИЙ С ПОМОЩЬЮ ПРОИЗВОДНЫХ § 4.1. Условия возрастания и убывания функций. Точки экстремума. Необходимое условие экстремума. Отыскание наибольшего и наименьшего значений непрерывной на отрезке функции 1°. Возрастание и убывание функций. Точки экстремума. Определение 1. Функция /(*), определенная на интервале ]а, Ь[, называется возрастающей (убывающей) в точке х0£]а, Ь[, если в некоторой г-окрестности этой точки выполняется неравенство f(x0 — К) < < / (*о) < / (*о + h) [соответственно f(x0—h)>f (х0) >f(x0 + h)] при любом h < е. Функция f (х) называется возрастающей (убывающей) на интервале ]а, Ь[, если для любых двух точек хи х2£]а, Ь[ при хг<х2 выполняется неравенство f(x1)<f(x2) [соответственно f(xt) > f(x2)]. Теорема 1 (достаточные условия возрастания и убывания функции в точке и в интервале). Если функция f (х) дифференцируема в точке х0 € ]а, Ь[ и /' (х0) >0 (/' (л:0) < 0), то функция f(x) возрастает (убывает) в точке х0. Если /' (х) > 0 (/' (л:) < 0) для всякого х£ ]а, Ь[, то функция f (x) возрастает (убывает) в интервале ]а, Ь[. Доказательство приведено в § 4М, I. Комментарий к теореме 1.. Следует иметь в виду, что условия теоремы 1 являются достаточными для возрастания (убывания) функции, но не необходимыми. Возможен такой случай, когда функция / (х) в точке х0 возрастает, а производная /' (#0) не является положительной. Такова, например, функция f(x)~xz в точке л;0 = 0. Действительно, в этой точке функция возрастает [большему значению х соответствует большее значение / (х)\ однако /'(*о)=Ф3)'*«о = 0.
§4.1. Условия возрастания и убывания функций. Точки экстремума 233 Определение 2. Точка х0 называется точкой локального экстремума функции f(x), если значение f(x0) является наибольшим (наименьшим) значением функции f(x) в некоторой е-окрестности точки х0. При этом само значение / (х0) называется локальным экстремумом функции f(x). Комментарии к опреде- р -. лению 2. 1) В случае, когда f(x0) > f(x) для всех х из 8-окрестности, говорят о точке локально- го максимума; если / (*0) < / (л:) для всех х из 8-окрестности, то х0 называют точкой локального минимума. Таким образом,локальный экстремум является общим названием для локального максимума и локального минимума. 2) Разумеется, в определении 2 предполагается, что функция f(x) определена в некоторой е-окрестности точки х0. Теорема 2 (необходимое условие экстремума). Если х0—точка экстремума функции, то либо /'(#0) = 0, либо производная функции f (х) не существует в этой точке. Доказательство приведено в § 4*.1, 2. Комментарии к теореме 2. 1) Точка х0, в которой функция f(x) определена и выполняется хотя бы одно из следующих условий: /'(д:0) = 0; f (х0) не существует при х = х0, называется критической. Теорема 2 утверждает, что в случае экстремума точка х0 обязательно является критической. 2) Условие /' (л;0) = 0 с геометрической точки зрения означает, что касательная к графику функции y = f(x) в точке (*0; f(x0)) горизонтальна. Условие несуществования производной f (х) в точке х0 с геометрической точки зрения означает, что касательная к графику функции y — f(x) в точке х0 является вертикальной (/' (л:0) = с») или вообще не существует (рис. 54). Последнее имеет место, например, если х0—угловая точка (в этом случае существуют левая и правая касательные, не совпадающие между собой, но нет общей касательной). 3) Теорема 2 имеет большое значение, поскольку устанавливает, что точки экстремума являются критическими. Это сразу сужает множество точек, среди которых могут находиться точки экстремума. В практических задачах множество критических точек состоит, как правило, всего из нескольких точек, к исследованию которых и сводится задача отыскания максимумов (минимумов). 2°. Правило отыскания наибольшего и наименьшего значений непрерывной на отрезке функции. Для отыскания наибольшего и наименьшего значений (абсолютного максимума и абсолютного ми-, нимума) непрерывной на отрезке [а, Ь] функции f(x) следует:
234 Глава IV. Исследование функций с помощью производных f!>0 f'<0 fr<o\fr>0 f'<o\Ff<o\ 'ff>o\f'>(7 Рис. 55 1. Найти критические точки функции f(x)t т. е. такие точки, в которых производная /' (х) равна нулю или не существует. 2. Для каждой критической точки х0 определить знак производной /' (л:) слева и справа от х0. Если /' (х) изменяет знак с — на + при переходе аргумента х через точку х0 слева направо, то х0 является точкой локального минимума. Если /' (х) изменяет знак с + на—, то х0 является точкой локального максимума. Если знак /' (х) слева и справа от точки xQ не изменяется, то хь не является ни точкой локального максимума, ни тачкой локального минимума. 3. Найти наибольшее из чисел /(a), f{x[)9 f(x'2), ..., f(x£), f(b) и наименьшее из чисел f(a), f(x{)f f(xl), ..., /(*J), /#), где x'l9 х2У... ..о, x'k—множество точек локальных максимумов, a xl, л£, ..., х\ — множество точек локальных минимумов. Первое из найденных чисел есть абсолютный максимум, а второе—абсолютный минимум функции f(x) на отрезке [а., Ь]. Обоснование этого правила приведено в § 4*.1, 3. Комментарии к правилу отыскания наибольшего и наименьшего значений функции. 1) Поведение функции f(x) в окрестности тючки xQ при различных комбинациях знаков /' (х) слева и справа от нее иллюстрирует рис. 55. 2) Приведенное правило применимо только доя тех функций, у которых .производная существует во всех точках отрезка [а, Ь], за исключением конечного -числа точек. Кроме того, предполагается, что 1Юличество решений уравнения /'(#) = О на i[jo, Щ конечно. Такие ограничения не являются слишком жесткими, поскольку в практических задачах эти условия выполняются. 3) Если знак производной при переходе слева направо через точку х0 меняется с + на —, то происходит смена возрастания функции [/' (х) > 0] <на убывание [/' (х) < 0] и в точке х0 имеет место максимум. Если же знак производной меняется с — на +, то убывание функции сменяется возрастанием и в точке х0 имеет место минимум. 4) Правило отыскания абсолютного экстремума основано на следующих рассуждениях. По определению точки локального экстремума являются внутренними точками отрезка [а, Ь]. Если точка абсолютного экстремума является внутренней для отрезка [а, Ь],
§4.1. Условия возрастания и убывания функций. Точки экстремума 235 то она является также и точкой локального экстремума. Поэтому точку абсолютного экстремума следует искать среди критических точек и граничных точек а и Ь. Примеры. 1. Найти наибольшее и наименьшее значения функции у = х2 — 4 на отрезке [ — 1,2]. Решение. Функция y = f(x) = x2—4 имеет производную при любом значении х: f'(x}=2x. Находим критическую точку: л:0 = 0. Производная /' (х) = 2х при переходе аргумента х через х0 = 0 слева направо изменяет знак с — на +. Таким образом, х0 — 0—точка минимума (локального). Локальных максимумов данная функция не имеет. Наибольшее из значений /(— 1)=—3 и /-(2) —0 есть 0. Поэтому наибольшее значение данной функции на отрезке [ — 1, 2J (абсолютный максимум) равно 0 и достигается при г=2. Наименьшее из значений /(— 1)=—3, /(0)=—4, /(2) = 0 есть — 4. Значит, наименьшее значение данной функции на отрезке [ — 1, 2J (абсолютный минимум), равно —4 и достигается при х = 0. 2. Найти наибольшее и наименьшее значения" функции у =* = sin 2л:—х на отрезке [—я/2, я/2]. Решение. Функция y = f(л:) = sin 2л*—х дифференцируема при всех значениях х : /' (я) =2 cos 2л;—1. Критическими точками являются значения ху которые удовлетворяют уравнению /'(л:) = 0, т. е. 2cos2л:—1=0, х£[—я/2, я/2]. Имеем cos2x=l/2, откуда х = = ± л/6 -f- я£, где k== 0, так как лг£ [ —я/2, я/2}. Значит, х± = —я/6,: л:2 = я/6. В точке хг——я/6 производная /'(х) = 2cos2л:—1 изменяет знак с — на + (2 cos 2л:—1<0 при х <—я/6 и х, близких к —я/6; 2 cos 2л:—1 >0 при х >—я/6 и х, близких к —я/6); в точке л:2 = я/6 производная изменяет знак с + на —. Следовательно, хг——я/6—точка локального- минимума, а л:2— я/6—точка локального максимума. Наибольшим из чисел /(—я/2) = я/2 = 1,5708", / (я/6) = V3/2 — — я/6 = 0,3424, Дя/2)= — я/2 =—1,5708 является я/2. Это наибольшее значение функции f(x) на отрезке [—я/2, я/2}; оно достигается при х=—я/2. Наименьшим из чисел / (—я/2) = я/2 = 1,5708, / (—я/6) =* = —1/*3/2 +я/6 = —0,3424, / (я/2) = —я/2 = — 1,5708 является — я/2. Это наименьшее значение функции f(x) на отрезке [—я/2, я/2], которое достигается при л: = я/2 (рис. 56). 3. Найти наибольшее и наименьшее значения функции y — f(x)=^ = 3х4—8л:3 + 6л:2 на отрезке [—2, 2J. Решение. Функция у = 3х*—8хъ + &х2 дифференцируема при всех значениях х : /'(л:}=12л:3— 24л;2 + 12л:; критическими точками являются значения ху удовлетворяющие уравнению 12л:3 — 24л:2- + + 12л: = 0. Решая это уравнение, получим *i = 0, r2 = ra=l. Производная f (x) обращается в нуль при л: = 0, л:=1 и в промежутках [—2, 0[, ]0, 1[, ]1, 2] имеет соответственно знаки —, +i +«
236 Глава IV. Исследование функций с помощью производных ;:| Рис. 56 Рис. 57 Таким образом, на отрезке [—2, 2] функция f(x) имеет только одну точку экстремума (точку минимума) х = 0. Сравнивая между собой значения /(—2)= 136, /(0) = 0, /(2) = 8, находим, что наибольшее и наименьшее значения функции f(x) на отрезке [ — 2, 2] соответственно равны /(— 2) = 136, /(0) = 0 (рис. 57). Методическое указание. При отыскании экстремумов функции y = f(x) на отрезке [а, Ь] удобно составить следующую таблицу: X а у' 1 У Xi х% ДСд ... Хп b Здесь Xi, x2, ..., хп—критические точки. Вторую [строку таблицы заполняют информацией о производной у'\ под х{ пишут либо О, если f'(Xi) = 0> либо «не существует», если f (xt) не существует. Между этими записями во второй строке помещают знак + или — в зависимости от того, какой знак имеет производная /' (х) в промежутке между xt и х{+1. В последней строке таблицы отмечают характер критических точек (max, min) и поведение функции f(x) в интервалах ]xiy xi+1[ (убывание или возрастание). Например, таблица X У1 У . а + возр. *1 0 max — убыв. *2 не сущ. min -г возр. b
§ 4.2. Исслед. функций на выпукл, и вогнут. Точки перегиба. Асимптоты 237 характеризует функцию, возрастающую от а до xlf убывающую от хг до х2 и возрастающую от х2 до Ь. 3°. Упражнения Найдите наибольшие и наименьшие значения следующих функций / (х) на заданных отрезках [а, 6]: 1. /(*) = *3 —27х, а = 0, 6=10. 2. /(*) = *3 — 27*, а = 0, 6=1. 3. )(х)=--хъ—27*, а= —1, 6 = 0. 4. /(*) = *3 —27*, а= —10, 6 = 0. 5. у^=соъ2хУ а = 0, 6 = л. 6. y = tgx, а = л/6, 6 = л/3. 7. у = х\пху а = 0, 6 = 3. 8. £/ = ln2*--21n*, а=1, 6 = 5. 9. # = 2*—!г, а=1, 6=10. 1,1 1 1 , 0 § 4.2. Исследование функций на экстремум с помощью производных высшего порядка. Исследование функций на выпуклость и вогнутость. Точки перегиба. Асимптоты кривых. Общая схема построения графиков функций 1°. Исследование функций на максимум и минимум с помощью производных высшего порядка. В § 4.1 был описан способ исследования функции на максимум и минимум в критической точке, основанный на изменении знака производной при переходе аргумента через эту точку. Этот способ имеет свои недостатки: часто вычисление значений производной /' (х) слева и справа от точки х0 бывает затруднительным; кроме того, иногда требуют уточнения понятия «слева от х0 и близко к лу>, «справа от х0 и близко к х0». Существует другой способ исследования функций на максимум и минимум в критической точке. Он пригоден только для такой критической точки х0, в которой /' (х0) = 0 и, кроме того, функция f(x) имеет в этой точке определенное количество высших производных. Точнее, справедлива следующая теорема. Теорема 1. Пусть функция f(x) определена в некоторой ъ-окрестности точки х0, причем f (х0) = 0, f"(xQ) = 0, ..., f&-1} (x9) = 0 и /(ft) (x0)^0. Тогда критическая точка х0 является точкой локального максимума, если k—четное и /ш (л:0) < 0, и точкой локального минимума, если k — четное и fik) (х0) > 0. Доказательство приведено в § 4*.2, I. Комментарии к теореме 1. 1) Число к в формулировке теоремы—это порядок первой отличной от нуля производной ,в точке хв.
Рис. 58 238 Глава IV. Исследование функций с помощью производных 2) Часто имеет место частный случай теоремы 1, когда /' (*<,-) = 0 и /" (х0) фО. При этом если /" (*0) > О, то х0 является точкой минимума, а если /" (х0) < 0—точкой максимума функции/(л:). Примеры. 1. Для функции у = — + -у + 2х + 5 критическими точками являются решения уравнения у' = х2 + Зх + 2 = 0, т. е. хг = — 1 и х2 = — 2. В точке дгх = — 1 имеем у" (— 1) = 2х + 31*= _ i = = 1 > 0; таким образом, согласно теореме 1, хг = — 1 есть точка минимума. В точке х2 =— 2 имеем г/" (— 2) = 2х + 31^= _2 = — 1 < 0, т. е. х2 =— 2 является точкой максимума. 2. Для функции у = х* + 2хь критическими точками являются решения уравнения у' = 4х3 + Юл:4 = 0, т. е. ^ = 0 и х2 =— 0,4. В точке хг = 0 имеем у" (0) = 12х2 + Ш*\х=0 = 0, у'"Щ = 24х + + 120л:2|^=о = 0; */(4) = 24 + 240х\х=0 = 24. Таким образом, в точке х± = 0 первая отличная от нуля производная имеет четный порядок (4) и положительна. Значит, х1 = 0—точка минимума функции. В точке х2 = — 0,4 имеем */"(— 0,4) = 12л:2 + 40л*|*=-0,4 = 1,92 — — 2,56 = — 0,64 < 0. Следовательно, в точке х2 = — 0,4 первая отличная от нуля производная имеет четный порядок (2) и отрицательна. Поэтому х2 — —0,4 есть точка максимума. 2°. Исследование функций на выпуклость и вогнутость. Определение 1. График функции y = f(x), определенной в некоторой е-окрестности точки х0 и дифференцируемой в точке х0, называется выпуклым вверх (вниз) в этой точке, если в некоторой е-окрестности точки х0 точки графика функции лежат ниже (выше) касательной к кривой в этой точке. График функции y = f(x), определенной, и дифференцируемой в интервале ]а, Ь[, называется выпуклым вверх (вниз) в этом интервале, если график функции является выпуклым вверх (вниз) в каждой точке х£]а, Ь[ (рис. 58). Комментарии к определению 1. 1) Более строгое и общее определение выпуклости графика функции y = f(x) вверх (вниз) приведено в § 4*.2, п. 2°. 2) Термин «вогнутость» употребляют как антоним термина «выпуклость». В последнее время термин «вогнутость» мало употребителен. Теорема 2 (достаточное условие выпуклости). Пусть функция y = f(x) определена и дважды дифференцируема в интервале ]а, Ъ[. Тогда если /"(*о)<0> т0 график функции в точке х0 является выпуклым вверх, а если /" (л:0) > 0—выпуклым вниз. При выполнении условий f" (л:0) < 0 (/" (л:0) > 0) для всех х0£]а, Ь[ график функции y = f(x) является выпуклым вверх (вниз) в интервале ]а, Ь[.
§ 4.2. Исслед. функций на выпукл, и вогнут: Точки перегиба. Асимптоты 239 Рис 59 Рис. 60 Доказательство приведено в § 4^.2, й. Коммента рш:ш к те о р е т е 2.~ Полезно знать следующее мнемоническое- правило: (так называемое «правило дождя»):, если в некотором интервале график функции является выпуклым вниз, то у" > 0; если график функции является выпуклым вверх, то у" < 0. Записав эти неравенства в виде у-\ у'\ отметим, что знаки неравенств соот- v л о о ветствуют направлениям выпуклости кривой (V—вниз, Л—вверх). Пример. График функции y = smx является выпуклым вверх для x£]2kn, (2& + 1)зт[, &£Z, и выпуклым вниз для x£](2k—1)я, 2&л[, k£Z (рис. 59). Определение 2, Пусть ft(x).—функция, определенная в некоторой е-окрестности точки х0 и дважды дифференцируемая в этой точке. Тогда если график функции / (х), слева от точки х0 является выпуклым вверх (вниз), а справа — выпуклым вниз (вверх), то х0 называется точкой перегиба. Комментарии к определению 2. 1) Более строгое определение-точки перегиба приведена, в. § 4*.2, 3. 2) Касательная, в точке перегиба обладает тем свойством, что разбивает кривую вблизи точки х0 на две части, лежащие по разные стороны от, касательной (рис. 60). Теорема 3 (необходимое усл.ави,е перегиба). Пусть f (x)—функция, определенная в некоторой г-окрестности точки х0 и дважды дифференцируемая в этой точке^ Тогда если х0 является точкой перегиба, то f (х0) = 0. Доказательство приведена в £ 4*.2, 4. Пример.. Для кривой у = х2—х* точка перегиба есть х =1/3. В самом деле, у" = 2—6х; у" (х) > 0 при х < 1/3 (график кривой является выпуклым вверх); у" (х) < G при х> t/З- (график кривой является выпуклым вниз). Теорема 4 (достаточноеусловие перегиба). Пусть f (x)—функция, определенная в некоторой окрестности точки х0 и дважды дифференцируемая: в этой окрестности; пусть, кроме того, \" (х0) = 0' и вторая производная f {x) изменяет знак при переходе через эту точку. Тогда х0 является точкой перегиба.
240 Глава IV. Исследование функций с помощью производных i N с \ ^к^ S* lim\MN\=Q У * Рис. 61 Рис. 62 Доказательство. Теорема 4 непосредственно вытекает из определения 2 и теоремы 2. Действительно, в силу условий теоремы 4 график кривой изменяет направление выпуклости при переходе через точку х0, а это и означает, что х0 является точкой перегиба. 3°. Асимптоты кривых. Определение 3. Прямая называется асимптотой кривой, если расстояние от переменной точки кривой до прямой стремится к нулю при удалении этой точки в бесконечность. -Комментарии к определению 3. 1) Об удалении точки в бесконечность говорят в том случае, когда расстояние от точки до начала координат (или какой-либо фиксированной точки) стремится к бесконечности. 2) Понятие асимптоты иллюстрирует рис. 61. 3) Зная асимптоты кривой, можно (приближенно, но с «хорошей точностью») вычислять координаты точек кривой, удаленных от начала координат. 4) Далеко не у каждой кривой имеется асимптота; в то же время кривая может иметь несколько асимптот (рис. 62). При нахождении асимптот различают вертикальные и наклонные асимптоты, т. е. прямые, параллельные оси Оу и не параллельные этой оси. Теорема 5. Пусть функция f(x) определена для всех достаточно больших х и существуют пределы lim Ш = А, Hm [f(x)—kx] = b. (1) лг-><* X х-^-сю Тогда прямая y = kx + b является наклонной асимптотой кривой y = f(x). Если же хотя бы один из пределов (1) не существует, то кривая y = f(x) не имеет наклонных асимптот. Пусть функция y = f(x) определена в некоторой г-окрестности точки х0 и lira /(лс) = оо. Тогда прямая х = х0 является вертикаль» х~+х0 ной асимптотой кривой y = f(x). Доказательство приведено в § 4*.2, 5. Комментарии к теореме 5. 1) Пределы (1) нужно рассматривать как при х—» + °°, так и при х—* — оо. Для каждого из этих
§ 4.2. Исслед. функций на выпукл, и вогнут. Точки перегиба. Асимптоты 241 случаев справедливо уточнение теоремы 5: если пределы (1) существуют при х —* + оо, то кривая y = f(x) имеет асимптоту y = kx + b\ если пределы (1) существуют при х—+• — оо, то кривая y~f(x) имеет асимптоту y = kx + b. При этом указанные асимптоты могут быть различными. Может быть и так, что одна из них существует, а другая—нет. 2) Дополнительную информацию о поведении кривой при х—+х0 можно получить, если установить, к чему стремится f (х) при x-+x(t: к -foo или к —оо. Полезно также различать случаи lim f (x) и x-+xQ - О lim f(x) (левый и правый пределы). Всего существуют четыре х-+хо+0 различных возможности: a) lim f (x) = — оо, lim /(х) = — оо; Х-+Х0 - О Х-+Х0 4- О б) lim /(*) = — оо, lim /(*) = +«>; в) lim f(x) = +oo, х-+Хо-0 х-+хо + 0 х-*хо~0 lim f(x) = — 00; г) lim / (х) = +оо, lim /(*) = +00 (рис. 63). 3) Вертикальные асимптоты x = xQ следует искать в точках разрыва второго рода функции или на границе области допустимых значений аргумента. х2 ! За: 4- 2 Примеры. 1. Найти асимптоты кривой j/= ^—3 * Решение. Имеем: *2 + 3*+2 !lm^-3R : = £ = ! (пределы при х—>- + оо и х—>- — оо совпадают); fx2+3x+2 lim (ig, lim *24-3* + 2 —*2 + 3* *—3
242 Глава IV. Исследование функций с помощью производных "t/Ao <? / lim — (снова оба предела при х—^ + °° и х—> — оо совпадают). Итак, прямая у = х-\-6 является наклонной асимптотой данной кривой. Вертикальная асимптота кривой имеет уравнение х = Зу поскольку функция y = f(x) = (х2 + 3х + 2)/(х—3) обращается в бесконечность в единственной точке х = 3. Легко видеть, что lim f{x) = *->3-0 ;=— оо, a lim /(#) = -f-oo (рис. 64). *-*3 + 0 2. Найти асимптоты кривой у = е~~*. Решение. Имеем: lim —= & = 0, не существует, lim (е~*—0-л:) = 0. Итак, прямая у = 0 Рис. 64 является асимптотой кривой у = е~х при х—^ + °°- Вертикальных асимптот данная кривая не имеет, поскольку функция определена для всех x£R. 4°. Общая схема исследования функций и построения их графиков. Главной задачей приложений дифференциального.исчисления является изучение свойств функций.. Поэтому построение графиков функции имеет большое значение. Для построения графика функции удобно использовать следующую схему: 1. Найти естественную область допустимых значений аргумента (область определения функции). 2. Найти точки разрыва и определить их характер. 3. Найти асимптоты графика функции. 4. Найти производную графика функции и с ее помощью определить интервалы возрастания к убывания функции. 5. Найти точки максимума и минимума, а также максимальные и минимальные значения функции.. 6. Найти вторую производную и с ее помощью определить интерн валы выпуклости и точки перегиба графика функции. 7. Используя все полученные результаты, построить график функции. Комментарии к общей схеме исследования функций. 1) Область определения функции следует искать, используя известные свойства элементарных функций, например такие, как: а) корень четной степени 2^/х (тг=1, 2, ...) определен только для неотрицательных значений х\ б) логарифм \щах определен только для положительных значений х и для оснований а > О, аф\\ в) функция у = / (x)lg (x) не определена для тех х, в которых g (х) = 0 обращается в нуль;
§ 4.2. Исслед. функций на выпукл, и вогнут. Точки перегиба. Асимптоты 243 г) функции arcs'mx и arccosx определены только для — 1^Сл:<Л и т. п. 2) При построении графика полезно использовать свойство четности и нечетности функции: если /(—х) = / (х) для всех х, то функция называется четной, а ее график симметричен относительно оси Оу\ если /(—r) = —f(x) для всех х, то функция называется нечетной, а ее гряфик симметричен относительно начала координат. Следует заметить, что в общем случае функция не обладает ни одним из упомянутых свойств. 3) Полезно отметить на чертеже некоторые точки графика функции, например пересечение графика с осями координат. 4) Целесообразно отмечать на чертеже элементы графика параллельно с исследованием. Бывает удобно сначала построить график «вчерне», а затем уточнить его и построить «набело». Примеры. 1. Используя методы дифференциального исчисления, исследовать функцию у = х3— 3# + 2 и построить ее график. Решение. 1. Область допустимых значений аргумента ]—оо, + °°[ (Функция определена при любых значениях л:). 2. Исследуемая функция непрерывна во всех точках числовой оси (поскольку у = х3—Зх + 2 есть сумма степенных функций). 3. График функции не имеет асимптот, так как пределы lim -^ и lim f (x) не существуют (они равны бесконечности). JK-*0O 4. Находим производную: у'—Зх2—3. Она обращается в нуль при x=ztl (Зх2— 3 = 0, х2=1, х=±1). Производная у' положительна для*£ ] — ею, —1 [ и ] 1, + оо{ и отрицательна для х£ ] — 1, 1[ (это вытекает из решения неравенства у'==3х2—3>0). Следовательно, функция х3—Зл:+ 2 возрастает в интервале ] — оо, —1[, убывает в интервале ] — 1, Г[ и снова возрастает в интервале ]1, оо[. 5. В точке х — — 1 функция имеет локальный максимум, в точке #=1—локальный минимум; соответствующие значения функции у(-1) = 4, у(1) = 0. 6. Находим вторую производную: у" = (3х2—3)'=€x; имеем у" > G при х > 0 и у" < 0 и при х < 0. Значит, график функции X У У' У" /с\ + — — 1 max 4 0 — \Г* — — 0 2 — 0 \w — + 1 min 0 0 + /\J + +
244 Глава IV. Исследование функций с помощью производных у при х > О является выпуклым вниз, а при х < О—выпуклым вверх; х = 0—точка перегиба. 7. Объединим все полученные результаты в таблицу- График функции изображен на рис. 65. 2. Исследовать функцию у = х\пх и построить ее график. Решение. 1. Областью допустимых значений аргумента является множество ]0, оо[ (\пх определен только для х > 0). 2. Во всех точках, где функция определена, она является непрерывной (согласно теореме 1 § 2.3). 3. График функции не имеет наклонных асимптот, так как не существует предел lim L^-= lim ^-^ = lim lnx= + oo. Y Y x-+<x> лг-х» л;-»-сю Будем искать вертикальные асимптоты. Для этого необходимо найти такие точки х0, что Нтд:1пл;= оо. Легко установить, что таких точек не существует. Действительно, при х0 > 0 функция у = х\пх непрерывна и предел Нтл:1пл: имеет конечное значение. При л:0 = 0 предел функции также является конечным: lim л:1пх = ,. \п х ■■ urn -ту- = lim \/х + 0 1<л- х->+<х> (здесь применимо правило Лопиталя). Итак, вертикальных асимптот график функции не имеет. 4. Производная функции y — xlnx имеет вид у' = Inх + х/х = = In л: + 1; она обращается в нуль при х=\/е (если у' = In x +1=0, то х=1/е). Если х£]0, 1/е[, то у' < 0; если *£]1/е, +оо[, то у' > 0. Следовательно, функция у = л: In л: убывает в интервале ]0, 1/е[ и возрастает в интервале ]1/е, +оо[. 5. В точке #=1/е имеет место локальный минимум. Значение функции у = х\пх в точке х=1/е равно —1/е. 6. Вторая производная имеет виду"=1/л;. При всех х>0 имеем у" > 0 и график функции является выпуклым вниз для всех х > 0. 7. Объединим полученные результаты в следующую таблицу: X У У' У 0 0 — 00 + 00 \w — + 1/е min -1/е 0 + /KJ + + ' '
§ 4.2. Исслед. функций на выпукл, и вогнут. Точки перегиба. Асимптоты 245 y*xr'3x*Z f ~" Це lie / 277 /у-хШ *^ , Рис. 65 Рис. 66 График функции изображен на рис. 66. 3. Исследовать функцию y = f (х) = x2 л. 2*4-3 и П0СТР0ИТЬ ее график. Решение. 1. Область определения функции — интервал] — оо, + оо[, так как числитель и знаменатель дроби определены при всех x£R, а знаменатель ке обращается в нуль (корнями знаменателя служат комплексные числа). 2. Точек разрыва функция не имеет, поскольку числитель и знаменатель правой части непрерывны и знаменатель не обращается в нуль. 3. Найдем асимптоты графика функции. Имеем т k= lim lim b= lim [/(*)— x]= lim (*2-|-2л: + 3)л: 1, ;^v*2+2*+3 5= lim x^_xs__2x2 — 3x "*? + 2x + 3 = lim -2л:2 — 3* л;2 + 2л: + 3 X =* - — 2 (пределы при х—* + °° и при л:—*— оо совпадают). Это значит, что прямая у = х—2 является асимптотой графика, причем неограниченное сближение графика с асимптотой имеет место как при д:~-^ + 00, так и при х—►—оо. Отметим, что график функции пересекается со своей асимптотой в точке х — — 6. 4. Найдем производную , _ За:2 (л:2 ±2х + 3) — *3 (2л:+ 2) _ х* + 4х* + 9х* (х* + 2х + 3)Ч "(*? + 2* + 3)? Определим интервалы возрастания и убывания функции. Решим неравенство д* + 4л:3 + 9л:2 (л:2 + 2л- + 3)2 > 0, т. е. *2(л:2 + 4л: + 9) (х2 + 2л:4-3)2 >о.
246 Глава IV. Исследование функций с помощью- производных Квадратные трехчлены л:2-|-4л; + 9 и л:2 + 2л: + 3 имеют отрицательные дискриминанты и при любом значении х положительны. Сокращая последнее неравенство на эти множители, получаем х2 > 0. Следовательно, у' (х) > 0 для всех *, кроме х = 0, где у'(0) = 0. Данная функция возрастает в каждой точке х% за исключением, быть может, точки x — 6f которая является единственной критической точкой функции. с г> о Л , х* + 4х* + 9х2 5. В критической точке х = 0 производная у = . ' 2х ' 3)2 не изменяет знак при переходе через х = 0 слева направо (у* > 0 всюду, кроме л: = 0). Таким образом, данная функция не имеет экстремумов. 6. Найдем вторую производную _(х2(х2 + 4х + 9)\' _ ' У "V (*2 + 2лг + 3)2 J __ [2х (х2 + 4х + 9)+ х2 (2*+ 4)] (х2 + 2х+3)2—х2 (x2+4*+9) 2 (*2+2лг+3) (2*+2) ~~ (*2 + 2* + 3)4 _2х[(х2 + 4х+9+х* + 2х)(х2 + 2х + 3)—х(х2+4х+9) (2^+2)]^ — (*2 + 2* + 3)3 2х [(2*2 + 6* + 9) {х2 + 2х + 3) — (х2 + 4х+9)(2х2 + 2хЦ (*2 + 2л: + 3)3 Раскрывая скобки и приводя подобные члены в числителе дроби, получим 2х(х*+18х+27} 2х(х—а)(х—$) (х* + 2х + Щ* "" (*2+2*+3)3 > где а и Р—корни квадратного трехчлена х2-\- 18л:+ 27, т. е. а =* = _9—3/"б, р = — 9 + ЗК"б. Определим теперь интервалы выпуклости вверх и вниз графика. Так как 2/(л;2 + 2л:4-3)3 > О при всех значениях х, то неравенство ' ,_ 2х(х—а)(*— р) 0 * (*2 + 2* + 3)3 ^ равносильно неравенству л:(*—а) (л:—0) > 0. Последнее неравенство легко решить методом интервалов. Его решением является множество ]а, P[U]0, + сю [. Решением же неравенства у"<0 является множество ]—со, a[(J]P, 0[. Таким образом, в интервалах ]—оо, а[ и ]р, Of график функции—выпуклый вверх, а в интервалах ]а, Р[ и JO, + oof ^выпуклый вниз. Точки х = а, х — ^ и х = 0 являются точками перегиба графика. 7. Объединим полученные результаты в следующую таблицу: у" X У у' У" /Г\ + — a + 0 /yj + . + Р + 0 /г\ + !_._ 0 0 + 0 /KJ + +
§ 4.2. Исслед. функций на выпукл, и вогнут. Точка перегиба. Асимптоты 247 График функции изображен на рис. 67. 4. Исследовать -функцию у = х2е~хи построить ее график. Реш-ение. 1. Область определе- ния функции—вся числовая прямая. 2. Функция у=х2е~х непрерывна при всех значениях х. 3. Найдем асимптоты графика функции y — f(x).. Вертикальных асимптот нет, поскольку функция определена при всех*€Я (и, следовательно, не обращается в оо). Для отыскания наклонных асимптот находим Urn ^=iim-^l=lim _*. = й> Прих-^+°° этот предел существует. Его можно вычислить по правилу Лопиталя: lim £= lim -L = 0 (при х —* —оо предел не существует). Далее, имеем lim [/ (х)—kx] = Х-+ СО = lim f(x) = 0. Итак, прямая # = 0 является асимптотой графика х -> оо' функции. 4. Находим производную у' = /' (х) = (х2е~хУ = 2хе~х—хЧ}~х = (2x—xz) е-*. Определим теперь интервалы возрастания и убывания функции. Так как е~х > 0 для всех значений х, то неравенство у' = (2х—х2) е~*>0 равносильно неравенству 2х—х2 > 0, а неравенство #'<0—неравенству 2х—х2 < 0. Решением неравенства 2х—х2 > 0 является интервал ]0, 2[ (здесь функция возрастает), а решением неравенства 2х—х2< < 0—множество ]—оо, 0[U]2, +oo[ (здесь функция убывает). 5. В точке хг = 0 функция имеет минимум, а в точке х2 = 2 — максимум. Соответствующие значения функции равны yt = 0 и У2 = 4е-2. 6. Найдем вторую производную у" = [{2х—х2) е-*]' = (2—2х) е~х—(2х—х2) е-х = (х2—4х + 2) е~х. Для нахождения интервалов выпуклости вниз и вверх графика функции нужно решить соответственно неравенства у" > 0 и у" < 0.
248 Глава IV. Исследавание функций с помощью производных вверх 7. Первое из них, равносильное неравенству х2 — 4л: + 2 > 0, имеет. решение ]—оо, а[и]Р, +оо[, где а и (3 — корни квадратного трехчлена х2—4х+2, тче. а=2—К2"« 0,5858, Р = 2 + 21/"2^ 3,4142. На этом множестве график функции является выпуклым вниз. Решение неравенства у" <0—интервал ]а, |3[, в котором график является выпуклым Точки а и Р служат точками перегиба. Объединим полученные результаты в следующую таблицу: Z'tt Z Рис. 68 X У У' \Г \V — + 0 min 0 0 + /\J + + 2 — Y2 + 0 /r\ + — 2 max 4/e2 0 — \n — — 2+/T — 0 \y\ — + График функции изображен на рис. 68. 5°. Упражнения Исследуйте следующие функции и постройте их графики: 1. */= 3*2 — 7х— 16 X2 — X—6 3. у=\п(\+х% 4х 2. у= x*-S 5. у= 7. у= 9. у= 4+jc2 # 1 х2 + 2х ' 4л? + 5 2х2 ' 4. у = х—\п(х2 — 4). 6. y^ln-iL-. * jc— 1 8. у=хе**-г. 10. */=(*+4) е2*.
Глава V ВЕКТОРНЫЕ И КОМПЛЕКСНЫЕ ФУНКЦИИ ДЕЙСТВИТЕЛЬНОЙ ПЕРЕМЕННОЙ § 5.1. Векторная функция скалярного аргумента. Производная, ее механический смысл 1°. Векторная функция скалярного аргумента. Определение 1. Функция, область определения которой является подмножеством в R, а множество значений—подмножеством в пространстве R3, называется векторной функцией скалярного аргумента. Комментарии к определению 1. 1) Иногда понятие векторной функции скалярного аргумента рассматривают в более общем виде, предполагая, что множество значений является подмножеством в R* (см. § 5М, I). 2) Значения векторной функции / скалярного аргумента ty соответствующие значениям аргумента t = а1У t = a2, ..., t = ani ... -> ->• (u/€R; i = l, 2, ..., n ...), обозначаются через f(ai),f(a2), ..., •••> /(Ял)> ••• -Пусть (el9 e2, e3)—базис в Rz и 7Ю=хУ)-7г + уМ^ + гМ-е9 (1) — разложение вектора f(t) по этому базису. Коэффициенты х (/), y(t), z(t) разложения (1) при каждом фиксированном t являются вещественными числами, изменяющимися при изменении аргумента t, т. е. скалярными функциями скалярного аргумента /. Таким образом, векторная функция порождает три скалярных функции (при выборе базиса в R3). Обратно, правая часть формулы (1) определяет векторную функцию скалярного аргумента при любых трех скалярных функциях *(9. у(0. *(0-
:)Г 250 Глава V. Векторные и комплексные функции действительной переменной \\1 Рассмотрим операции над векторными функциями скалярного * аргумента. Любую векторную функцию можно умножить на вещественное число, любые две векторные функции с общей областью определения можно сложить, перемножить скалярно или векторно. Все указанные операции определяются для каждого конкретного значения аргумента как соответствующие операции над векторами —- значениями функций (подробнее см. § 5*1, 2). Можно рассматривать предел векторной функции f(t) при / —*/0 -> (возможен случай ^0 = ±оо), обозначаемый lim f(t). По определе- нию, lim /(/)= lim x(t)-e1 + lim y(t)-e2+ lim z(t) e3 (2) ' t -*• tQ t -> t0 t -> t0 t -* tQ при условии, что пределы функций lim x(t), lim y (t), lim z(t) t -> t0 t -> tQ t -> t0 существуют. Если же хотя бы один из перечисленных пределов не -> существует, то выражение lim f(t) лишено смысла. t->t9 Понятие предела не зависит от выбора базиса пространства R3 (см. § 5М, 3). Отмеченное выше позволяет сформулировать следующее определение. ->• I Определение 2. Производной векторной функции /называется ' * -» векторная функция /'(О» определяемая для каждого значения t формулой ?(0вКш2^ф.. (3) tx-*t 1±~г Комментарии к определению 2. 1) Формула (3) аналогична формуле, с помощью которой вводится определение производной скалярной функции. 2) Если векторная функция f(t) задана в виде (1), т. е. -> -> ->• -> -»-»■-» f{t)^x(t)^e1-\-y(t)*e2'\-z(t)^eZy где {е19 е2У е3)—некоторый базис в R3, то Г (П = х'(t).X + y' (t) .^+z' (t).73. (4) Здесь х\ у\ z'—производные скалярных функций ху у, z по переменной t. Формула (4) является простым следствием определенных выше операций над векторами, которые справедливы лри любом выборе базиса в R3 (см. § 5*1, 4). 3) Если функции ху у, z в равенстве (1) непрерывны, то вектор- ~+ ная функция / называется непрерывной', если х, у, z дифференци-
в 5.1» Векторная функция скалярного аргумента. Производная 251 Рис. 69 Рис. 70 руемы, то / называется дифференцируемой] вообще, если х, у, z£ Сг, -> то векторная функция / называется принадлежащей классу СГ (г = = 0, 1, ..., п, ...; г = оо). 2°. Механический смысл векторной функции скалярного аргумента и ее производных. Пусть точка Р движется в трехмерном пространстве R3 (точнее говоря, в точечном координатном пространстве R3). Направленный отрезок ОР (где О—точка (0, 0, 0)€R3) определяет вектор, изменяющийся при изменении t, т. е. задает некоторую вектор-функцию скалярного аргумента t. -> Обратно, если дана вектор-функция / скалярного аргумента t, то при каждом значении t определены вектор / (t) и точка Р в R3, а именно та, для которой OP = f(t) (рис. 69). Механический смысл векторной функции состоит в следующем: каждому движению точки в R3 соответствует векторная функция и, обратно, каждой векторной функции соответствует двиэюение точки в пространстве R3. Механический смысл производной векторной функции состоит в следующем: если f{t)—радиус-вектор движущейся в пространстве точки Р, a t—время, то f (t) означает скорость движения точки Р в момент времени t. Комментарий к механическому истолкованию производной векторной функции. Определение скорости движения в точки в R3 основано на следующих рассуждениях* Пусть в близкие моменты времени t и ^ {^ > /) движущаяся точка занимает соответственно положения Р и Рх, За малое время tx — Сдвижение (с достаточной степенью точности) можно считать прямолинейным; приближенная скорость движения равна «пройденному пути» (т. е. вектору РРг), деленному на время tx—t: PPt = OP.-OP = fW-fjt) t\—t *i—/ t\—t (5)
252 Глава V. Векторные и комплексные функции действительной переменной^ При ti—+t приближенная скорость будет стремиться к истинной (рис. 70). Поэтому выражение Игл tx-»t f(ti)-fV) (6) Рис. 71 называется скоростью движения, описываемого векторной функцией f(t)f в момент /. Заметим, что выражение (6) совпадает (в силу определения 2) с производной векторной функции. -> Производная от производной /' (t) векторной функции f(t) называется второй производной от -» -> f(t) и обозначается через /" (t). Механический смысл второй производной состоит в следующем: если векторная функция f(t) задает движение точки в пространстве R3, то вторая произ- водная /"(/) при любом значении / равна вектору ускорения этого движения в момент времени t. 3°. Примеры 1. Следующие формулы определяют векторные функции скалярного аргумента: а) f(t) = tet + (t2 + 2t) 72 +t43\ -* ->• -v -> б) / (f) = cos («>/•£! +sinю/-еа+ 0-e3\ - в) f(t) — cos(dt-e1 + sin(dt-e2 + hte3\ r) f(t) = tei + 2ie2 + Vl — 5t273. Векторная функция а) обладает тем свойством, что /*(/) — е= 2е2 + 2е3 = const. На основании второго закона Ньютона можно считать, что движение, соответствующее этой функции, является движением материальной точки под действием постоянной силы. Пусть (eif е2У е3)—ортонормированный базис. Тогда векторная функция б) описывает движение по окружности с угловой скоро- стью о, поскольку координаты вектора f(t), таковы, что сумма их квадратов равна единице; векторная функция в) задает движение по винтовой линии (рис. 71); векторная функция г) определяет движение по сфере радиуса 1, так как t2 + \t2+l—5/2 = 1. 2. Найдем производные от векторных функций а) — г) из примера 1: а) ?(()=1-ъ + ф + 2)?ш+2£; б) /'(0 = —<*> sin Ы-ег + со cos <dt-e2 + 0 ez\
§5.1- Векторная функция скалярного аргумента. Производная 253 в) f (t) = —со sin ddt • ег + со cos со^«е2 + he3\ г) П0 = ^1 + 2^ + у=|=?8. Согласно механическому смыслу производной векторной функции, векторные функции а) — г) данного примера при каждом значении * задают вектор, равный скорости движения, определяемого векторными функциями а) — г) примера 1. 3. Приведем примеры выполнения операций над векторными функциями: а) умножение числа X на / = х (t) ег + у (t) е2 + z (t) е3: Я(xit^ + y (t)72 + z(t)73) ^XxW^+kyW^ + Xzit)^: б) скалярное произведение двух векторных функций (векторы ег, е2, е3 образуют ортонормированный базис) / (t) ==cosco^-e1 + . -\-sin<dt-e2 + hte3i g(t) = f'(t); -* ->• (/ (0» S (0) = —<° cos ®tsm ®t + <° sin <*>'cos ®' + h2t = h2t; -> в) векторное произведение двух векторных функций / (t) = -/^ + ^ + 0^3, i(0 = 0.^+12-^3: = —1% + t2e2 + te3. e\ e2 e3 fxg=\t t2 0 10 1 — t2 | 4. Дифференцирование векторных функций, т. е. вычисление производных от векторных функций, обладает рядом свойств, например: -» -> -> -> ->• -» (/+£)' = /'+/; (*/)' = */'; (t g)' = Cr, Ъ+fi ?); (/x^r=rxi+7x? (доказательства справедливости этих свойств приведены в § 5М, 5). Последние два свойства аналогичны правилу дифференцирования произведения скалярных функций. Пусть векторная функция /(/) такова, что (/(/), f(t)) — const. Покажем, что tf'(0. /('))== 0. Имеем: (7, ?)' = (const)', (/', /) + + (/, ?) = 0, 2(/,Л = 0и (/, П = 0. 4°. Упражнения -» -> _». _> 1. Докажите, что векторная функция / (/) = (/2 — 1) е± + 2fe2 + (/2 + 1) е3 описывает движение по кривой, лежащей на конусе x2~{-y2 — z2. -►-»-»■ -> 2. Докажите, что векторная функция f(t) = 3t2ei — 2te2-{-(4t—3t2)e3 описывает движение по плоской кривой.
254 Глава V. Векторные и комплексные функции действительной переменной. 3. Найдите производные от следующих векторных функций: Г(0 = е*71 + 1пЛ^ + Уг^; f(t) = V\+t271 — cos3t-T2. 4. Найдите производные от произведений (/, g) и (/Xg), если f(t)— \ t ех-\- § 5.2. Параметрические уравнения кривой на плоскости и в пространстве. Функции, заданные параметрически, их дифференцирование 1°. Параметрические уравнения кривой. Геометрический смысл производной векторной функции. Пусть заданы три функции вещественной переменной /: x(t), y(t) и z(t). При каждом конкретном значении t три числа x(t), y(t) и z(t) задают в R3 точку P(x(t), y(t), z(t)). Точка Р меняется при изменении / и описывает кривую в пространстве R3. Обратно, всякую кривую в R3 можно считать траекторией некоторого движения точки. Всякое такое движение, как показано в § 5.1, задается тремя функциями x(t)9 y(t) и z(t). Итак, тройка функций определяет кривую, а кривой соответствует (неоднозначно) тройка функций. Неоднозначность в указанном выше соответствии объясняется следующим обстоятельством. Тройка функций x(t), у (t) и z(t) однозначно определяет траекторию движения точки, однако существуют различные движения по одной и той же траектории. -> Определение 1. Пусть /(/) — векторная функция скалярного аргумента, определяющая движение точки в пространстве R3. Траекторией движения (или годографом векторной функции) называется кривая в R3, состоящая из тех и только тех точек Р, для которых вектор ОР равен /(/) при некотором значении t. Комментарий к определению 1. Траектория движения (годограф векторной функции) состоит из точек пространства, через которые движущаяся точка проходит во время движения. Определение 2. Пусть у—кривая в R3, a x(t)9 y(t) и z(t)— непрерывные функции вещественной переменной t. Пусть также выполнено следующее условие: точка Р (х; у\ z) £ R3 принадлежит кривой у тогда и только тогда, когда при некотором t ** = *('). У = У(0. z = z(t). (1) В этом случае уравнения (1) называются параметрическими уравнениями кривой у. Комментарии к определению 2. 1) Если зависимость координат движущейся в пространстве точки Р (х\ у\ z) от времени t выражается уравнениями x — x(f), y = y(t), z = z(t), то они являются, очевидно, параметрическими уравнениями кривой. Обратно,
§ 5.2. Параметр, ур-я кривой. Дифференцир. функций, задан, параметрически 255 Рис. 72 если заданы параметрические уравнения кривой, то их можно истолковать как описание закона движения точки в пространстве R3. 2) Частным случаем определения 2 является определение параметрических уравнений кривой в R2, которые имеют вид * = *(/), y = y(t). Геометрический смысл производной векторной функции состоит в следую- -»■ щем: производная /' (t) векторной фун- -> кции f(t) в каждой точке t представляет собой вектор, касатель- -» ный к кривой, задаваемой векторной функцией /(/}. Комментарий к геометрическому истолкованию производной векторной функции. Определение касательного вектора к кривой основано на следующих рассуждениях. Пусть дака кривая, определяемая векторной функцией /(/). Рассмотрим две точки Р и Pi этой кривой, соответствующие значениям t и tt (рис. 72), т. е. f(t) = OP,f(t1) = OP1. Вектор РР± представляет собой направленный отрезок, соединяющий две близкие точки кривой. РР При этом вектор * коллинеарен (имеет то же направление) вектору PPf. Естественно считать, что направление вектора PPi U—t (или, что то же, РРг) стремится к направлению касательного вектора при tx —+■ t. Отсюда можно сделать следующий вывод: вектор h—t +-*t *i~~f tt-+t (2) является касательным к кривой, определяемой векторной функцией /(/). Заметим, что вектор (2) совпадает с f (t). 2°. Дифференцирование функций, заданных параметрически. Две функции x(t) и у (t) вещественной переменной t задают плоскую кривую на плоскости,, а именно, множество точек (хг у) £ R2 таких, что при некотором t выполняются соотношения x = x(t), y = y(t), (3) которые являются параметрическими уравнениями кривой. При выполнении условий (3) одна из переменных (например, у) становится функцией (возможно, неоднозначной) другой переменной в следующем смысле. Значению х соответствует (быть может, не единственное) значение t такое, что x = x{t)> а значению t—значе-
256 Глава V. Векторные и комплексные функции действительной переменной ние у, равное y(t). Таким образом, значению х соответствует значение у, что определяет функцию y = f(x). Говорят, что равенства (3) задают параметрические уравнения функции y = f(x). Уточнение этого понятия, связанное с неоднозначностью функции f(x), см. в § 5*.2, I. Можно поставить вопрос о производной функции f(x). Ответ на него содержится в следующем утверждении. Лемма. Производная у' — /' (х) функции y = f(x)y заданной параметрическими уравнениями x = x(t), y = y(t), имеет следующие параметрические уравнения: yx = ify x = x(f). (4) Доказательство приведено в § 5*.2, 2. 3°. Примеры -» -> -» -» 1. Дана векторная функция f (t) cos at-e^ shoot-e2+hte3. Найти уравнение касательной к траектории движения, задаваемого этой векторной функцией, в точке t = t0. ~> Решение. Как известно, вектор /' (/0) является касательным к траектории движения в точке t=t0. Имеем -*• -> -* -» /' (/0) = — со sin со/0 • ег + со cos со/0 • е2 -\~ he3. Искомые уравнения касательной получим как уравнения прямой, проходящей через точку (cosco/0, sinco/0, ht0) в направлении вектора ?('•): х—cos (x)t0 у—sinco/0 z—ht0 — со sin со t0 со cos.co/0 h 2. Найти первую и вторую производные функции у = у (х), заданной параметрически: A: = sin^, у = cost. Решение. Используя формулу (4), находим параметрические уравнения производной ух данной функции: — sin t . , / ч Ух = Т у * = SHI t. (*) *х COS t v ' Сноза применяя формулу (4) к функции у'х, заданной параметрическими уравнениями (*), находим вторую производную ух: ух= „ \ $ x = smt, т. е. ух = ^ , x~smt. и COS t i jx CQS3 ^ > 4°. Упражнения 1. Покажите, что годографы векторных функций f (t) и f (и (t)) совпадают при любом выборе скалярной функции и (t), взаимно однозначно отображающей область определения функции f (t) на себя.
§5.3. Алгебрсшч., триеонометрич. и показат. формы комплексного числа 257 2. Найдите уравнения касательной к графику векторной функции /(/) = = (l/0^i + ^2 + *n t*ez в точке t—l. 3. Найдите первую и вторую производные ух, Ух функции у=у(х)> заданной параметрически: x = t2, y = lnt. § 5.3. Комплексные числа, их изображение на плоскости. Модуль и аргумент комплексного числа. Алгебраическая, тригонометрическая и показательная формы комплексного числа. Операции над комплексными числами. Формула Муавра 1°. Определение комплексных чисел. Многие математические задачи связаны с рассмотрением выражений вида а + Ы, где а иЬ—произвольные вещественные числа, а символ i («мнимая единица») удовлетворяет соотношению i.t^P^—l. (1) Естественным образом определяются операции сложения и умножения выражений вида а + Ы. При этом выражение а + Ы включает в качестве частного случая вещественные числа (при Ь = 0). В некоторых случаях использование обобщения вещественных чисел — выражений вида а + Ы— упрощает решение той или иной задачи, даже тогда, когда ее условие не содержит «мнимых единиц». Рассмотрим множество С всех выражений вида а + Ы, где а, &£ R, i—абстрактный символ. Определим на множестве С операцию сложения элементов: (а + Ы) + (c + di) = (а + с) + (b+d) i (2) («покоординатное сложение»). Определим на множестве С также операцию умножения элементов: (а + Ы) (c + di) = ac + bci + adi + bdi-i = (ac—bd) + (bc + ad) i. (3) Элементы умножаются по правилу умножения многочлена на многочлен, причем учитывается дополнительное условие (1): j2 =—1. Таким образом, условие (1), которому удовлетворяет символ /, является аксиомой, позволяющей определить умножение (3). Иначе говоря, если принять условие (1), то с его помощью можно ввести умножение (3), которое вместе со сложением (2) определяют важное математическое понятие. Определение. Комплексными числами называются выражения вида а + Ы, где a, b£R, i — абстрактный символ, для которых операции сложения и умножения определены соответственно формулами (2) и (3). Комментарии к определению. 1) Определение в строгом смысле нуждается в уточнении (см. § 5*.3, I). 2) Два выражения а + Ы и c + di равны тогда и только тогда, когда а = с, b — d. 9 № 2636
258 Глава V. Векторные и комплексные функции действительной переменной \У 3) Вещественные числа 0 и 1 могут быть ' ^толкованы как комплексные числа 0 + (Ы | „ер ^ 1 + 0-/ соответственно. Умножение комплексных чисел обладает следующим свойством. Лемма 1. Для любого комплексного числа а = а + ЫфОсуществует такое комплексное число Р, что оф = 1. Доказательство. Назовем комплексное число а—Ы сопряженным комплексному числу а + Ы. Очевидно, что (а + Ы)(а—bi) = a2 + b2 + 04 = a2 + b2. (4) Для любого комплексного числа а = а + Ы (а=£0) рассмотрим число а—Ы а Ь Рис. 73 Р = a2+b2 а? + № a*.+b* Проверим, что ар = 1. Имеем ^ = аЩтЛ^ + Ы){а—W)=2£±g = l. Комментарий к лемме 1. Из леммы следует, что комплексные числа можно делить друг на друга (за единственным исключением случая деления на нуль). Действительно, а/р = а(1/Р). Здесь через 1/р обозначено комплексное число у такое, что Ру=1. Для деления комплексных чисел удобно применять способ, использованный при доказательстве леммы. Он состоит в том, что делимое и делитель умножают на комплексное число, сопряженное знаменателю. При этом знаменатель становится вещественным положительным числом, что позволяет осуществить почленное деление. Например, 2+3/ (2 + 3Q(4 + 3Q _ 8+12/ + 6/ —9 —1 + 18/ 1 .18. 25 25 25 ' 25' 4—3/ (4—30(4 + 3/) Сложение и умножение комплексных чисел обладают рядом «естественных» свойств: коммутативностью и ассоциативностью сложения и умножения, дистрибутивностью умножения по отношению к сложению и др. (см. § 5*.3, 2). 2°. Алгебраическая и тригонометрическая формы комплексного числа. Комплексные числа принято изображать точками на плоскости, в которой введена декартова система координат. Именно, комплексное число z = a + bi обозначается точкой Р с координатами (а, Ь) (рис. 73). Число а называется вещественной частью комплексного числа а-\-Ы и обозначается # = Rez = Re(a+W), число b—мнимой частью комплексного числа а + Ы и обозначается b =? Im z = im (a+bi).
§5,3. Алгебрам., тригонометрии, и показат. формы комплексного^ числа 259 Комплексное число нуль изображается началом координат—точкой О. Запись числа z в виде а-\-Ы называется алгебраической формой комплексного числа. Длина отрезка ОР называется модулем комплексного числа; очевидно, что \ОР\ = Vra2 + b2. Модуль комплексного числа z обозначается через |г|или г. Таким образом, \z\ = VaF+&, r==Va*+F> (5) Угол ф между положительным направлением вещественной оси и направленным отрезком ОР называется аргументом комплексного числа. Аргумент определен для всех комплексных чисел, за исключением нуля. Так как величина угла определена не однозначно, а с точностью до 360° или 2пп (n£Z), то следует различать записи Ф = arg г, 0 < ф < 2я и Arg2= argz + 2nn (n£Z). (6) Очевидно, что если z = a + bi, то r = |z|, а = гсоэф, Ь = гзи1ф. При этом z = а + Ы = г (cos ф + i sin ф). (7) Представление числа z в виде (7) называется тригонометрической формой комплексного числа. Лемма 2. Пусть z1 = ai + b1i и z2~a2-\-b2i—два комплексных числа, г± и г2—их модули, а у± и ф2—аргументы. Тогда модуль комплексного числа zxz2 равен ггг2, а аргумент комплексного числа z±z2 равен Ф1 + Ф2. Доказательство. Из условий леммы и формулы (7) имеем гг = п (cos ф^ + * sin Фх), z2 = r2 (cos ф2 + i sin ф2). Далее, используя формулу (3), получим *А = ггг2 (cos Ф1 + i sin ф^Ксоб ф2 +1 sin ф2) =* s= rtr2 [(cos фх cos ф2—sin ф! sin ф2) + * (sin Ф1 cos ф2 + cos <pt sin ф2)] =* = rxr% [cos (ф* + ф2) + i sin (Ф1 + ф2)]. * (8) Формула (8) задает комплексное число zxz2 в тригонометрической форме; следовательно, модуль z1z2 равен гхг2, а аргумент Фх + Ф2. Следствие (формула Муавра). Справедливо соотношение \ (cos ф +1 sin ф)" = cos п ф + I sin n ф. (9) Доказательство. Левая часть формулы (9) представляет собой произведение п одинаковых множителей с модулем, равным единице, и аргументом, равным ф. В силу леммы 2, модуль произведения равен единице, а аргумент произведения равен сумме п слагаемых, каждое из которых равно ф, т. е. дф. Следовательно, 9*
260 Глава V. Векторные и комплексные функции действительной переменной тригонометрическая форма комплексного числа (cos ф + i sin ф)" имеет вид cos wp + i sin щ. Примеры. 1. Представить комплексное число 2 = 5 + 12* в тригонометрической форме. Решение. Имеем г = |г| = К52 + 122 = К25+144= 13. Вынесем множитель 13 за скобки из выражения 5+ 12г, тогда z= 13 (то+уз ь) • При этом в скобках получается комплексное число, модуль которого равен единице [(5/13)2 + (12/13)2= 1], т. е. число вида созф + /sin<p, ~ cos ф = 5/13, sin ф= 12/13. Итак, г = 5 + 12г = 13 (cos Ф + / sin ф), где Ф « 1,176 (радиан). 2. Вычислить (1+О^- Решение. Запишем комплексное число 1 -ft в тригонометрической форме: - l+t = K2^ + ^f) = l/2(cos45° + isin45°). Далее, используя формулу Муавра, находим [l/2(cos45° + tsin450)]24 = (K2)24[cos(45°.24)+isin(450.24)]== = 212 [cos (3 • 360°) + i sin (3.360°)] = 212 (1 + i • 0) = 4096. 3°. Корень я-й степени из комплексного числа. Пусть z = a + bi. Найдем все комплексные числа u = x + yi такие, что un = z. При этом удобно воспользоваться формулой Муавра. Запишем г и и в тригонометрической форме: z=r (cos ф+/ sin ф), и = Гг (cos (pt+i sin фх) (г, ф известны, a rl9 q>i неизвестны). В силу условия un — z и леммы 2 имеем г? = г, пф! = ф. (10) ri=fT . (И) и <Pi = £ + -^ (* = 0, 1, 2,..., п-1). (12) Равенство (12) требует пояснений. Второе из равенств (10) выполняется с точностью до 2nk (k£Z). При этом числа —и — -f -2L задают совпадающие значения аргумента ф1 комплексного числа и = {/г. Таким образом, в формуле (12) целое число k должно принимать все значения от 0 до п — 1. Равенства (11) и (12) позволяют решить поставленную задачу. Оказывается, что она имеет ровно п различных решений: y,-^[cos(i+^)+*sin(i + M)] (fe-o, 1.2.....H-1). (13) Отсюда
§5.3. Алгебраич., тригонометрич, и показат. формы комплексного числа 261 Рассмотрим частный случай—вычисление корня n-й степени из комплексного числа 1. В этом случае r=l, q> = 0 и по формуле (13) находим -/I^cosM + .-sinM {k = 0y 1, 2, ..., п-\). (14) Например, при я = 3 имеем з /т 2я& . . . 2nk ,i л 1 г»\ / 1 =cos~«- + i sin—g- (& = 0, 1, 2). Полагая & = 0, 1,2, получим соответственно значения 1, —у+ -^г"*\ 1 VJL 2 2 Отметим одно замечательное свойство множества решений (14). Если обозначить e = cos \-i sin— (&= 1), то все решения из множества (14) имеют вид е, е2, е3, ..., е/2 = 1 (на рис. 74 изображено множество значений f/l при п = б). 4°. Показательная форма комплексного числа. Как известно, показательная функция у = ех, определенная для вещественного аргумента, обладает следующим свойством: е*.е* = е*+6 Уя, b£R, (15) В теории функций комплексного переменного показательная функция е* определена для любого комплексного значения аргумента, причем свойство (15) Сохраняется (подробнее см. § 5*.3, 3). При таком определении выполняется соотношение Уф = cos ф + i sin ф (Ф€^| (16) которое называется формулой Эйлера, Учитывая эту формулу, равенство (9) можно записать в виде I/ (е'ф)»^*1*. (17) Для произвольного комплексного числа / \ x + yi имеем / \ t*+yi ^ е* (е^) = е* (cos у + i sin у). (18) f£,9_f \ f-"-+->i Пусть z = a + bi — произвольное от- \ / личное от нуля комплексное число и \ / z = г (cos ф + i sin ф)—его тригонометри- х\ / ческая форма. Очевидно, что в силу г**"4^*. равенства (18) получаем """" _-* z = r (cos ф + i sin ф) = eln r ё"9 = eIn r+% рис. 74 x j
262 Глаза V* Векторные и комплексные функции действительной переменной ИЛИ 2 = eln|z|-H argz# пд\ Равенство (19) задает показательную форму комплексного числа. 5°. Упражнения Вычислите: 1. (1+/):(1 —2t). 2. (3 + 2t):(3—2/). Представьте в тригонометрической форме следующие комплексные числа: 3. 2=l+i. 4. 2 = 24+Юг. 5. z=V"3+/. Вычислите: 6. (2 +/)7. 7. (3 —4/)5. 8. *97. В поле комплексных чисел решите уравнения: 9. 26=1. 10. 28 =—16. 11. z5=l+i. § 5.4. Комплекснозначные функции действительной переменной, их дифференцирование. Многочлены в комплексной области.; Теорема Безу. Условие тождественности двух многочленов. Корни многочлена. Основная теорема алгебры. Разложение многочлена с действительными коэффициентами на линейные и квадратичные множители 1°. Комплекснозначные функции действительной переменной. On ре- деление 1. Комплекснознанной функцией действительной переменной называется функция, область определения которой принадлежит множеству R действительных чисел, а множество значений—множеству С комплексных чисел. Пусть /—комплекснозначная функция действительного аргумента t. Значение функции /, соответствующее значению t аргумента, обозначается через f(t). Запишем комплексное число f(t) в виде f(t) = x(t)+y(t)i, (1) где х (t) = Re / (t)9 у (t) = Im / (/)—функции действительного аргумента t, принимающие действительные значения. Комплекснозначные функции действительной переменной можно складывать, умножать, делить на ненулевые числа. Эти операции сводятся к выполнению соответствующих операций над комплексными числами, являющимися значениями функций при каждом фиксированном значении аргумента. Можно рассматривать предел комплекснозначной функции действительной переменной при t —► t0 (возможен случай tQ = ± со), обозначаемый lim f(t). По определению, lim / (/) = lim x (t) + i lim у (t), (2)
§5.4. Комплекснозн. функции действ, трем. Осн. теоремаг алгебры ' 263 где x(t)y y(t) определены равенством (1). В равенстве (2) предполагается, что оба предела lim x(t) и lim у (t) существуют, в противном t-+t0 t-+t0 случае выражение lim f(t) лишено смысла. t-*-t о Определение 2. Производной комплекснозначной функции f действительного аргумента t в точке t = t0 называется комплексное число /'(/)e lim fW-fM. (3) Комментарии к определению 2. 1) Функция /', определенная при каждом значении аргумента t0 равенством (3), называется производной функцией. 2) Формула (3) аналогична формуле, с помощью которой вводится определение производной функции с действительными значениями. 3) Производная комплекснозначной функции действительной переменной вычисляется по формуле f'(t) = x'(t) + y'(t)l% (4) где х' (/), у' (/) — производные функций x(t), y(t), принимающих действительные значения (доказательство приведено в § 5*.4, I). 4) Производная от производной данной функции. /(/), т. е. (/' (t))\ называется второй производной от f (t) и обозначается f"(t). Аналогично, производная от (п—1)-й производной f{n"1]{t), т. е. ^(л-1) (t))',- называется п-й производной от / (t) и обозначается f(n) (t). 2°. Теорема Безу. Основная теорема алгебры. Рассмотрим комплексно- значные функции комплексной переменной г, имеющие вид Р(г) = а9г» + а1г»-1+...+ап_1г + ап, (5) где а0, а19 ..., ап—заданные комплексные числа (а^ФО). Такие функции называются многочленами n-й степени. Комплексное число г0 называется корнем (или нулем) многочлена Р, если P(z0) = 0. Справедливо следующее утверждение. Теорема 1 (теорема Безу). Комплексное число z0 является корнем многочлена Р (z) тогда и только тогда, когда существует такой многочлен Q(z), что P{z)^=Q{z){z-z,). (6) Доказательство. Из школьного курса алгебры известно, что всякий многочлен Р (z) можно разделить на любой заданный многочлен Q(z) с остатком. Это значит, что для любых многочленов P(z) и Q(z) существуют такие многочлены S(z) и R(z), что P(z) = Q(z)S(z) + R(z), (7) причем степень многочлена R(z) меньше степени многочлена Q(z) (представление Р (г) в виде (7) получается при делении Р (z) на Q(z)
264 Глава V. Векторные и комплексные функции действительной переменной «углом»). В школьном курсе рассматриваются многочлены с действительными коэффициентами, однако аналогичное утверждение справедливо и для многочленов с комплексными коэффициентами (см. §5*.4,2). Для случая Q(z) = z—z0 формула (7) примет вид P(z) = S(z)(z-z0) + b; (8) здесь Ъ—многочлен, степень которого меньше единицы (степени z—z0), т. е. постоянное число. Полагая в равенстве (8) z = z^ получим Р{г*) = Ь. (9) Итак, если г0—корень Р (г), т. е. Р(г0) = 0, то Ь = 0 и формула (8) совпадает с (6). Обратно, если Р (z) делится без остатка на г—г0, то b в формуле (8) равно нулю и в силу равенства (9) имеем Р(г0) = 0. Лемма (условие тождественности двух многочленов). Две функции p1(z) = aQz» + a1z»-1+... + ая, P2(z) = b0zm + b1zm~1 + .. .+ЬМ (10) совпадают \тогда и только тогда, когда т — п и a0 = bQy at =? *=Ь19 ..., an = bn. Доказательство приведено в § 5*.4, 3. Комментарий к лемме. Две функции совпадают тогда и только тогда, когда при любом значении аргумента они принимают равные значения. Лемма утверждает, что при выполнении этого условия многочлены (10) имеют одинаковые степени и равные коэффициенты. Теорема 2 (основная теорема алгебры). Всякое уравнение вида a0zn + a1zn-1+...+an^=0J где /t^l, а а0ф0, au а2, ..., ап—комплексные числа, имеет решение в поле С комплексных чисел. 3°. Разложение многочлена с действительными коэффициентами на линейные и квадратичные множители. Теорема 3 (о разложении многочлена на линейные множители в поле комплексных чисел). Всякий многочлен Pn(z) = a0zn + a1zn-1+...+an (я0=^0, аи а2, ..., an£Q) может быть представлен в виде Pn(z) = aQ(z-z1)^(Z-z2)K ... (г-гм)"*\ (И) где zly z2, ..., zm—некоторые комплексные числа [корни многочлена Pn(z)]j a klf k2f ..., km—целые положительные числа, причем
§ 5.4. Комплекснозн. функции действ, перем. Осн. теорема алгебры 265 ki + k2+ ... +km = n. Разложение (11) единственно с точностью до порядка множителей. Следствие. Всякий многочлен Р (г) = a0zn + ахгп ~х + ... +ап с вещественными коэффициентами а0ФО, аи а2У ..., ап может быть представлен в виде Р (z) = a0(z-z1)^(z-z2)^.. .{z-zr)krX X (г* + Plz + <7i)<> (*a + р2г + qj*>... (z2 + psz + qs)\ (12) где 2lf z2, ..., zr— вещественные корни многочлена Р (г); числа Pi, <7i> P2» <7г» •••» P*> Qs—вещественные; каждый из квадратных трехчленов z2 + pmz4-qm Н=1, 2,_..., s) имеет два комплексно со- пряженных корня zm = xm + ymi и zm = xm—уmi, являющихся корнями многочлена Р (г)\ klf &2, ..., kr\ ll9 /2, ..., ls—целые положительные числа, причем k± + k2 + • • • + &г + 2(/! + /2 + ... +ls) = n. Разложение (12) единственно с точностью до порядка множителей. Доказательство приведено в § 5*.4, 4. Доказательства теорем 2 и 3 приведены в курсах высшей алгебры.
Глава VI ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ § 6.1. Функции нескольких переменных. Область определения. Предел функции. Непрерывность 1°. Функции нескольких переменных. Пусть /—функция такая, что ее область определения D принадлежит пространству R", а область значений является подмножеством во множестве вещественных чисел R (иногда вместо R рассматривают множество комплексных чисел С). Так как точка Р в R"—это упорядоченный набор чисел (хи x2J ..., хп), то рассматриваемая функция / принимает определенное значение при любом выборе точки (xlf х2, ..., xn)£D. Это значение обозначается через f(xu х2, ..., хп) или f(P). Определенная таким образом функция / называется функцией п переменных Для функций нескольких переменных рассматривают понятие предела функции в точке. Определение 1. Говорят, что число А является пределом функции f(P) в точке Р = Р0% если при Р -+Р0 f(P) стремится к Л, т. е. f(P)-+A. Комментарий к определению 1. Определение требует уточнения понятий Р —> Р0 и / (Р) —* А. Назовем расстоянием между точками Р (хи х2, ..., хп) и Р0 (*}, х°2, ..., х°п) число p{P1P0) = V(xl-J®* + (xt-j®*+ ... +{xn-xl)\ (1) Будем говорить, что Р —* Р0, если р (РгР0) —* 0. Аналогично, будем говорить, что f(P)—+A, если \f(P) — Л|—>0. Определение предела функции на достаточно строгом уровне приведено в § 6*.1, I. Определение 2. Функция / нескольких переменных называется непрерывной в точке Р, если lim f(P) = f(P0). Функция / назы- Р-+Ро вается непрерывной на множестве Z), если она непрерывна в каждой точке этого множества.
§ 6.1. Функции неск. переменных. Обл. определения. Предел. Непрерывность 267 Определение 3. Множество точек Р таких, что расстояние р(Р, Р0) между Р и Р0 меньше е (e£R, е > 0), называется г-ок- рестностью точки Р0. Комментарий к определению 3. При п = 2 е-окрестность точки Р0 есть внутренность круга с центром Р0 и радиусом, равным е. При /г = 3 е-окрестность точки Р0 является внутренностью шара с центром в точке Я0 и радиусом е. Определение 4. Пусть D—подмножество в R". Точка P0£Rn называется предельной для множества D, если в любой е-окрестности точки Р0 содержатся точки области D. Определение 5. Множество D в R" называется замкнутым, если оно содержит все свои предельные точки. Определение 6. Множество D в R" называется открытым, если вместе с каждой точкой PQ£D оно содержит и некоторую е-окрестность точки Р0. Определение 7. Множество D называется связным, если любые две его точки можно соединить непрерывной кривой, целиком принадлежащей этому множеству. Определение 8. Множество D£ R" называется ограниченным, если оно принадлежит некоторой е-окрестности точки (0, 0, ... 0). Определение 9. Открытое связное множество в R* называется областью. 2°. Свойства непрерывных функций. Непрерывные функции обладают рядом важных свойств, некоторые из них приведены ниже (доказательства см. § 6.*1, 2). 1°. Сумма и произведение непрерывных функций являются непрерывными функциями. Частное от деления двух непрерывных функций есть непрерывная функция во всех точках, где делитель не обращается в нуль. 2°. Пусть функция f(Xi, x2, ..., хп) непрерывна в области D и xi = xi(u1,u2,...,um),x2 = x2(ui,u2,...,um), -..,хя = хп(ии и2, ... ..., ит) непрерывны в области D\ Тогда функция f (xt (ии и2, ..., ит), х2 (Mjl, и2, ..., ит), ..., хп (ии и2, ..., ит)) непрерывна в U, как функция от переменных иг, и2, ..., ит, если точки хг (иг, и2, .. .,'ит), x2(uif и2У ..., ит), ..., xn(Ui, u2, ..., ит) принадлежат области D. 3°. Функция f, непрерывная на замкнутом и ограниченном множестве D, достигает в D своих наибольшего и наименьшего значений. Это означает, что в D существуют такие точки Рг и Р2, что f(Pi)>f{P)>f(P,)VP£D. 4°. Пусть множество D, в котором определена функция /, связно; пусть также a^f(Px), b = f(P2), a<b, Pu P2£D. Тогда функция f принимает в D любое значение в промежутке от а до Ь. Примеры. I. Каждая точка 8-окрестности точки Р0 (е—любое положительное число) является предельной для этого множества. Кроме того-, к числу предельных точек е-окрестности принадлежат точки Р, удовлетворяющие условию р(Р1Р0)^&.
Глава VI. Функции нескольких переменных Рис. 75 Рис. 76 2. Множество точек Р, удовлетворяющих условию р(Р, Р0)^е> где Р0—фиксированная точка, является замкнутым (см. пример 1). 3. Покажем, что е-окрестность точки Р0 является открытым множеством. Действительно, пусть Р—точка из е-окрестности точки Р0. Тогда расстояние р(Р, Р0) < 8. Поэтому е-окрестность точки Р целиком принадлежит е-окрестности точки Р0 при ех < е—р(Р, Р0), поскольку если Рг такова, что р(Р, Р1)<е1 = е—р(Р, Р0), имеем р(Ри Po)<P(Pi, P) + P(P, Р0)<в-р(Р, Р0) + Р(Л Р0)<в. При исследовании поведения функции нескольких переменных полезно следующее понятие. О преде ление 10. Множество точек Р из области определения D функции f от п переменных (хи х2, ..., хп), удовлетворяющих услевию /(Р) = С, называется поверхностью уровня С. Комментарии к определению 10. 1) Число С в определении 10 произвольно. Поверхность уровня Си очевидно, не пересекается с поверхностью уровня С2 при СхфС.г, и всякая точка Р € D принадлежит некоторой поверхности уровня, поэтому вся область определения D разбивается на непересекающиеся поверхности, каждая из которых соответствует некоторому значению С. Значение функции / в точках поверхности уровня С постоянно и равно С. 2) /Термин «поверхность уровня» является условным, более точным был бы термин «множество уровня». Действительно, для функций двух переменных поверхность уровня представляет собой, как правило, кривую в D€R2« Для функций от п переменных поверхность уровня представляет собой гиперповерхность, т. е. поверхность размерности п—1. Иногда поверхность уровня представляет собой множество точек, не похожее на поверхность в общепринятом смысле. 3) К поверхностям уровня часто прибегают для наглядного описания модели поведения некоторых функций. Например, если функция /(л:, у) определяет температуру в точке с координатами (ху у), то поверхность уровня, т. е. множество точек (х, у) таких, что f(x, t/) = C, является некоторой кривой на плоскости, называе-
§€.2. Частные производные: Дифференциал 269 мой изотермой. Аналогичный смысл имеют кривые, называемые изобарой, изохорой, изоклиной и т. д. Примеры. 1. Для функции / = xf+ *! + *! поверхность уровня при С > 0 является сферой с центром в начале координат и радиусом VC (рис. 75). Уравнение поверхности уровня имеет вид xl + xi + xl = C. При С<0 поверхность уровня является пустым множеством; при С = 0 она состоит из единственной точки (0; 0; 0). 2. Поверхности уровня функции /(#, у) = х-\-у представляют собой семейство параллельных прямых, перпендикулярных биссектрисе I и III координатных углов (рис. 76). Уравнение поверхности уровня имеет вид х-\-у = С. § 6.2. Частные производные. Дифференциал, его связь с частными производными. Инвариантность формы дифференциала. Геометрический смысл дифференциала 1°. Частные производные. Определение 1. Пусть /(xiyх2У ...,хп)— функция п переменных, определенная в точке Р0 (х°19 х\, ..., xQn) и в некоторой е-окрестности этой точки. Частной производной функции / по переменной х( (i = l, 2, ..., п) в точке Р0 называется предел £/00 0 0 0\ * / 0 0 0 0\ lim / \*1> *2» • ■ • > Xj-l> Xj, Xj+1> • • • » Хп)—/ \Xi, Хч, . . . , Xj, . . ., Хп) , *. если он существует. Комментарий к определению 1. 1) Отметим, что в числителе (1) стоит разность между значениями функции / в точках Р и Р0, причем координаты (х[, х\, ..., х°^и хь х%+19 ..., хп) точки Р совпадают с координатами (х°и х°2> ..., x°h ..., х°п) точки Р0, за исключением одной координаты с номером i (номер той переменной, по которой берется частная производная), t-я координата точки Р равна хь а t-я координата точки Р0 равна х?. 2) Частная производная функции / по переменной х( в точке Р0 обозначается так: -д£:(Л>), /*ДЛ>)- 3) Согласно определению 1, частная производная функции / по переменной х( в точке Р0 является числом. При изменении точки Р0 изменяется и предел (1). Таким образом, частную производную от функции / можно рассматривать как функцию от п переменных (Xi, X2i • • •,. Хп). 2°. Дифференциал функции. Важной частью исследования функций является локальное исследование, под которым понимается сравнение значения функции в данной точке со значениями функции в точках, близких к данной. Все дальнейшее изложение будет проведено на примере функции двух переменных, что позволит сделать обсуждение геометрически наглядным. Следует заметить, что каждое
270 Глава VI. Функции нескольких переменных утверждение о функции двух переменных, которое будет приведено, без труда обобщается на случай функции п переменных. Итак, сравним значения функции / двух переменных х, у в заданной точке Р (х, у) и в близкой точке Рг(хи уг). Рассмотрим разность Af = /(*. Vi)-fix* У)- (2) Полагая xt = x + Ax, уг = у + Ауу запишем выражение (2) в виде Af = f(x + Ax, y + Ay)-f(x, у). (3) Величины Ах, Ау называют частными приращениями переменных х и у, а А/—приращением функции f. Изучение разностей (2) и (3) основано на весьма глубокой математической идее, которая заключается в следующем. Приращение А/, как видно из (3), зависит от х, у, Ах, Ау. Особенно важен характер зависимости А/ от Ах, Ау. «Самой простой» функцией от Ал:, Ау является линейная функция вида ААх + ВАу, (4) где А, В—постоянные. Подберем функцию вида (4) (т. е. иначе говоря, коэффициенты А, В) так, чтобы эта функция «наилучшим» образом приближала бы исследуемое выражение А/. Пусть Af = AAx + BAy + s(x, у, Ах, Ау), (5) где е — разность между А/ и ААх + В Ау. При соблюдении некоторых условий оказывается, что, выбрав особым образом А и В, можно добиться того, чтобы 8 была бесконечно малой функцией высшего порядка по сравнению с \^Ах?-\-Ау2—расстоянием между точками Р и Pi, т. е. lim r 8 =0. (6) Дк-*о Допустим, что А/ представимо в виде (5), где t удовлетворяет условию (6). Тогда А = -^(х,у), В = %(х,у). (7) Действительно, полагая в равенстве (5) Ду = 0, получим Af = f(x + Ax, y)—f(x, у) = ААх + г{х, у, Ах). (8) Разделив равенство (8) на Ах и перейдя к пределу при Ах—>0, в силу определения 1 получим -~- = Л. Аналогично доказывается и второе из равенств (7). Определение 2. Пусть f(x, у)—функция двух переменных, для которой в точке (л:, у) существуют частные производные
§ 6.2. Частные прбизводные. Дифференциал ' 271 -J-(x, у)> —- (л:, у). Тогда если функция 8, определяемая равенством &f = &&*+%&y + e, (9) является бесконечно малой более высокого порядка малости, чем УАх2 + Ау2у то функция f(x, у) называется дифференцируемой в точке (х; у). Функция /(л:, у), дифференцируемая в каждой точке множества D, называется дифференцируемой на множестве D. Комментарий к определению 2. Отметим, что в определении требуется выполнение свойства (9), а не только существование частных производных (существование частных производных необходимо, но не достаточно для дифференцируемости; см. достаточное условие дифференцируемости. Определение 3. Для функции 4(ху у), дифференцируемой в каждой точке области D, выражение V=wAx+i$Ay (10) называется дифференциалом. Комментарии к определению 3. 1) Функции f(x,y) = x и g(x> У) = У являются, очевидно, дифференцируемыми. Для этих функций согласно формуле (10) имеем dx = Ax, dy = Ay. (11) Таким образом, равенство (10) можно записать в виде Af=*Ldx + 2Ldy. (12) Отметим, что формула (12) получена в предположении, что xf у—независимые аргументы [т. е. справедливы равенства (11)]. 2) Для случая функции п переменных получается формула, аналогичная формуле (12): 3) Равенство (9), приводящее к понятию дифференциала, позволяет говорить о дифференциале как о главной линейной части приращения А/ функции /. Действительно, -^Ах+-^-Ау — часть приращения А/, линейно зависящая от Ах, Ау. Эту часть называют главной потому, что ее доля в А/ стремится к единице при У"Ах2 + Ау2 -* 0. Теорема (достаточное условие дифференцируемости). Если частные производные -^ и -—• функции f(x, у) сущест-
272 Глава VI. Функции нескольких переменных вуют и непрерывны в точке (#, у), то функция f(x, у) является дифференцируемой в этой точке. Доказательство приведено в § 6*.2, I. 3°. Правило дифференцирования сложной функции. Так как частная производная от функции f(xy у) совпадает с обычной производной от функции, полученной из / фиксированием значений остальных переменных, то известные свойства обычных производных выполняются и для частных производных: d(f + g) dl>dg.d(kf)_,df дх '"дх^дх1 дх ~А~дх~> Л^К' d(fg) = df дх дх «+/& £(£)-№«-£)*.■ (13) df де если -^, g| существуют. Особого внимания заслуживает правило дифференцирования сложной функции. Пусть z = f(x, у), х = х(и, v), y = y(ut v). Найдем частную производную функции z(x(u, v), y(uy v)) no переменной и, предполагая, что /(#, у), x(u,v),y(u, v)—дифференцируемые функции своих аргументов. В силу дифференцируемости f(x, у) [см. равенство (9)] имеем дх ^ ду и^ \TAx* + Atf v ' Аналогично, дифференцируемость функций х(и, v), у (и, v) означает, что Дд;=~ Аи + -^ Av + sif • r 8l — —»0, ди dv ' 19 ^Au^+Av2 ' by = $LAu + 2jLto + ev r f2 -+0, * ди ' dv 2 \^Аи2+Аи2 Подставляя Ад:, Ау из (15) в правую часть (14), получим (15) дх V ди • df , df 83 Л 3 п дх г ] ду 2 Y^Aut+Av* Из равенства (16) следует, что Mf-l+f-^Mtf+i*)4"^- <17> Полагая Ди = 0, разделим обе части равенства (17) на Аи и перейдем к пределу при Аи —> 0. Тогда получим
§ 6.2. Частные производные. Дифференциал 273 Аналогично находим dv дх dv * ду dv ' ^ ' Формулы (18) и (19) задают правило дифференцирования сложной функции. Доказательство правила дифференцирования сложной функции п переменных приведено в § 6*.2, 2. 4°. Инвариантность формы дифференциала. Пусть z = f(x, у), х-х(и, v), y = y(u, v). По определению, имеем Рассмотрим функцию z(x(u, и), у (и, v)) переменных и, v. Найдем дифференциал этой функции, считая и, v независимыми переменными. Согласно определению, dc _ df (х (и. р). У ("» а)) дц | ff (* (ц> р). У (ц> р)) ^ /2о) ^ df(x(u, v), у (и, v)) df(x(u,v)yy(u,v)) Для отыскания частных производных д, v , <4 воспользуемся формулами (18) и (19). Имеем Перегруппировав слагаемые в равенстве (21), получим Для функций х(и, v)y у (и, v) независимых переменных и, v дифференциалы можно найти по формуле (12), поэтому dx = d£du + ^dv, dy=d£du + ^dv. (22) Теперь из соотношений (21) и (22) получаем dz=4d* + |rdy- (23) В сопоставлении формул (23) и (20) и заключается свойство, называемое инвариантностью формы дифференциала. Остановимся на этом вопросе подробнее. Если z = f(x, у), а х, у — независимые переменные, то согласно формуле (12) dz = -—• dx + ^- dy. Если же х, у — переменные, зависящие от других (независимых) переменных иу и, то дифференциал dz сложной функции z(x(ut v)y у (и, v)) равен правой части формулы (20). В силу доказанного выше, правые части формул (20) и (23) совпадают. Поэтому равенство dz = -^-dx-\- J- dy справедливо
274 Глава VI. Функции нескольких переменных не только для независимых переменных л;, у, но также и для тех, которые являются функциями от других переменных (в рассматриваемом случае—от переменных и, v). Свойство инвариантности формы дифференциала функции п переменных рассмотрено в п. 3° § 6*.2. 5°. Геометрический смысл дифференциала. Пусть 2 = /(л:, у) — функция двух переменных, рассматриваемая в малой окрестности D точки (xQj y0). В трехмерном пространстве переменных отметим точки (х, у, z) такие, что (х, у)€Д a z = f(x, у). Множество таких точек задает поверхность (график функции z = /(#,#); рис. 77). Уравнение касательной плоскости к этой поверхности в точке (х0, у0, f(x0, y0)) имеет вид J 7 [г 1 Q /** -* """ *— ~" *" -*\ У Рис. 77 ' Z° дх (Х- -*•>+■£ (у-у0). (24) г/0 = Ду, то на основании (см. п. 4° § 6*.2). Так как х—x0 = Axt у равенства (10) имеем z—z0 = d/|0, (25) где знак |0 показывает, что рассматриваются значения функций при Х — Х0у у = Уо» Формула (25) устанавливает геометрический смысл дифференциала: при х = х0, у = у0 и произвольных Ал:, Аг/ значение дифференциала равно z—z0, т. е. приращению апликаты точки касательной плоскости к графику функции z = f(x, у). 6°. Примеры 1. Найти частные производные функции r = V~x2 + y2. Решение. Имеем дг 1 дх -2х- ду 2yrxT+^ Vx^+y*. r ' 2. Найти дифференциал функции z = arctg — . Решение. Сначала находим частные производные данной функции дг_ дх дг if£V'\ х* J *2 + У2-' ду it (JLV х Теперь, используя формулу (10), получим Л дг Л . дг Л —у Ах , х* + у* xl^-tfl xdy x2 + yV
§ 6,3. Яастн. производные и дифференц. высших порядков. Формула Тейлора 275 7°. Упражнения Найдите частные производные сложных функций: 1. w=u2 + uv+v2, и = (х+у)2 v=(x—y)2. 2. ш = гсоэф, r=Vx2 + y2, (p = arctg(y/x). Найдите дифференциалы функций: Вычислите приближенно значение функции f (х, у) в точке х = х0, у = у0: 5. /(*, У) = У^Т?> *о = 3,002, (/о = 4,003. 6. f(x, y) = arcXg(y/x), x0= 1,002, у0 = 1,001. § 6.3. Частные производные и дифференциалы высших порядков. Формула Тейлора 1°. Частные производные высших порядков. Пусть задана функция f(xy у) и ее частные производные -J-, -J-. Будем называть частные производные -J-, J- частными производными функции / пер- вого порядка, а частные производные по х и у от частных производных -j-, -j-—частными производными второго порядка (по отношению к функции /, или просто частными производными функции / второго порядка). Будем использовать следующие обозначения: ±{JL\=,£L JL( МЛ =*-*!- ±(<L\^J1L ±(MA=ML <и дх\дх ) дх2 > дх\ду ) дхду ' ду \ дх J дудх' ду\ду ) ду2 ' к > а также обозначения дЧ _f d2f f d2f , d2f f m dx2 lxx> дхду ,ХУУ дудх 'Ух' ду2 '№ у ' Аналогично частные производные от частных производных второго порядка будем называть частными производными третьего порядка и использовать следующие обозначения: L(ML\—ML д ( д2/ \= &f д ( d2f \ ^ д* дх\дх2 )~~ дх* ' дх\дхду) дх2ду > дх\дудх) дхдудх* д (d2f\ d*f д > d2f \ &f . д ( d2f \__ d*f nv дх [ду2 ) ~ дхду2 ' дх \ ду2 ) дхду2 ' ду \ дх2 ) ~~ ду дх2 ' ^ ' д f d2f \ d*f д / d2f \ а3/ д ( d2f \ __ &f ду\дхду) дудхду9 ду\дудх) ду2дх ' ду\ду2)~~ду* ' Подобным же образом можно определить частные производные четвертого, пятого и т. д. порядков. О пределение 1. Частная производная по любой из независимых переменных от частной производной (т—-1)-го порядка функции f(xu х2У ..., хп) (т = 2, 3, ...) называется частной производной т-го порядка.
27& Глаза VI. Функции нескольких переменных Количество частных производных от функции f при увеличении т растет. Однако при некоторых, часто выполняющихся условиях, многие из частных производных совпадают, а именно, оказывается, что m-я частная производная не зависит от того, в каком порядке проведено дифференцирование, а зависит от того, по каким переменным и сколько раз была взята производная. Точная формулировка этого утверждения приводится в следующей теореме 1 и комментарии к ней. Теорема 1. Пусть функция f(x, у) определена вместе со своими частными производными fx> fyy fxyy fyx в некоторой г-окрестности точки (х0> уQ)y причем fxy и fyx непрерывны в этой точке. Тогда fxy(xo> Уо) = !ух(хо,Уо)' (4) Доказательство приведено в § 6*.3, I. Комментарий к теореме 1. Из доказанной теоремы вытекает, что /?г-я частная производная не зависит от порядка дифференцирования. В частности, при условии существования и непрерывности частных производных, записанных ниже, справедливы следующие равенства: / ху == / ух> Ixyx^lyxx Iхху I хуху >ххуу> d2f _ d2f d*f __ a3/ __ d*f d*f ___ d*f dx ду ~~ дудх1 дх ду дх ~~ ду дх2 дх2 ду ' дхдудх ду дх2 ду2 и т. д. (подробнее см. § 6*.3, 2). 2°. Дифференциалы высших порядков. Используя понятие частных производных m-го порядка, можно определить дифференциал т-го порядка функции /. С помощью дифференциалов 1, 2, ..., т-го порядков записывается важнейшая формула дифференциального исчисления функций нескольких переменных—формула Тейлора, служащая обобщением формулы Тейлора для функций одной переменной. В дифференциальном исчислении функции нескольких переменных большое место занимает изучение зависимости приращения Д/ = /(х + Ах, у + by)-f(x, у) (5) от х, у и в особенности, от. Длг, Д#. При этом важное значение имеет понятие дифференциала высшего порядка. Определение 2. Выражение называется дифференциалом т-го порядка функции /. Комментарии к определению 2. 1) Предполагается, что функция / в равенстве (6) имеет непрерывные частные производные до m-го порядка включительно.
§ 6.3. Части, производные и дифференц. высших порядков. Формула Тейлора 277 2) Выражение (6) задает функцию от переменных х, у, Ах, Ау. При фиксированных х, у эта функция является однородной функцией степени т переменных Ах, Ау. 3) Числа Ckm в равенстве (6) означают коэффициенты бинома Ньютона (или количество сочетаний из т элементов по К), т. е. rk — ml __m(m— l)...(m—k + \) ^"i — k\(m—k)\-~ 1-2...6 " V) 4) Особое значение для приложений имеет дифференциал второго порядка W = ^^ + 2^yAxAy + ^Aif (8) (здесь т = 2 и С°=1, С\ = 2, С22=1). 5) Если х, у — независимые переменные, то с!л: = Дл:, йу = Ау, поэтому формулу (6) можно записать в виде dm/=Ec«^4^dxftdr~ft- (9) Однако в отличие от дифференциала первого порядка d/ = -~-cU + + y-ck/ ни один из дифференциалов Amf (тф1) не обладает свойством инвариантности. 6) Правую часть формулы (6) позволяет легко запомнить следующее правило. Рассмотрим множество всех многочленов от двух переменных р, q, в котором введена естественная операция умножения многочленов. Для каждого такого многочлена можно на- д д ~ писать символическое выражение, заменив р на -т- и q на ^-. Если после подстановки использовать символические равенства / д \Ь ( д \m-k дт /»v-*= (!) (£) -s4r=». <10> то любой многочлен от р, q преобразуется в линейную комбинацию выражений вида (10). Условимся считать, что «произведение» выражения д кд т_к на функцию / равно соответствующей частной производной: дт с dmf дхкдут~* ' ^дх* дут-* * *") При этом соглашении d-/ = (рАх + qAyy / = (! Л* +1А у)" /. (12) Рассмотрим простейшие частные случаи формулы (12): Vf^df-pAx + qAy^J^Ax + ^Ay; (13) d2/ = (рАх + qAyf f = (/Мх? + 2pqAxAy + q*Ay*) /.=
278 Глава VI. Функции нескольких переменных -{&Ax2+2&y^Ay+wAy2)f- ,ш ^^Lax2 + 2^LAxAu + ^Lau2 дх2 аХ ^Z дхду ахаУ-Г ду2 *У' [формула (13) совпадает с формулой (10) § 6.2, а формула (14)—с формулой (8)]; iff = (РД* + ЧА9Г = (£г Ах- + 3-gfa.Ах'Ау + 3 -J^.ДдД,,.+ +£^)'4^+st&^+»teStw+-#-v. 3°. Формула Тейлара. Теорема 2. Пусть f(x, у)—функция, определенная в некоторой е-окрестности точки (х, у) и имеющая непрерывные частные производные до т-го порядка включительно. Тогда справедливо равенство f(x + Ax, y + Ay)-f(x, у)=У£^ + гм(х, у, Ах, Ау), (15), где rm(x, yf Ax, Ay)—бесконечно малая более высокого порядка малости, чем (УАх2 + Ау2)т при Ах, Ау—*0. Доказательство приведено в п. 3° § 6*.3. Комментарии к теореме 2. 1) С помощью формулы (15) исследуется поведение разности Af = f(x + Ax, у-\-Ау)—f(x, у) (основного объекта изучения локального поведения функции) в следующем смысле. Разность Д/ разбивается на два слагаемых т dkf V -£р и гт(х, у, Ах, Ау). Зависимость первого из них от Ах и Ay довольно простая; она описывается многочленом n-й степени от переменных Ах я Ау с коэффициентами, зависящими от х, у (при фиксированных х, у—с постоянными коэффициентами). Именно зависимость Д/ от Дл; и Ау особенна важна при локальном изучении функции. Второе из слагаемых гт представляет собой величину бесконечно малую более высокого порядка малости, чем (]/гАх2+Ау2)т, т. е. чем т-я степень расстояния между точками (х, у) и (х + Ах, у + Ау), вследствие чего этим слагаемым во многих задачах можно пренебречь. 2) При некоторых дополнительных условиях выражение гт(х, у, Ах, Ау) (его называют т-м остаточным членом формулы Тейлора) можно представить в виде, удобным для дальнейшего изучения (см. § 6*.3, 3). 3) Иногда гт(х, у, Ах, Ау)-+0 для всех (х, у), (х + Ах, у + Ау) из некоторой области D. Тогда говорят о сходящемся ряде Тейлора (этот вопрос подробно рассматривают при изучении степенных рядов). 4) Рассмотрим простейшие частные случаи формулы Тейлора (15) при /га=1, 2, 3. Имеем:
§6:3. Части, производные и дифференц. высших порядков. Формула Тейлора 279 Д/ = /(х + Дх, y + Ay)-f(x, у) = ^Ах + ^Ау + Г1; Af = f(x + Ax, y + Ay)-f(x, У) = -|-^+-|-Аг/ + Af = f(x + Ax, y + Ay)-f{x, у)=У-Ах + -^Ау + +^[ж^+2шГуАхАУ+§-АУг]+ (16) Здесь все частные производные рассматриваются в точке (х, у). Следует заметить, что каждая последующая формула в равенствах (16) является уточнением предыдущей: правые части этих формул отличаются лишь дополнительным слагаемыми -т^- (k = 2, 3, ...), не считая остаточного члена rk. Действительно, формулы (16) можно кратко записать так: A/^dV + rx, A/ = d1/ + 4r+^ А/ = ^/ + -^ + -^+г3. 5) Формула Тейлора при х = 0, у = 0 называется формулой Мак- лорена: т f(Ax, Ay)-f(0, 0) = SC*,^| Ax*Ay»-* + rm. (17) :1 Эту формулу часто записывают в следующем виде: Пх,У) = ПО,0)+Щ0х + *\оу + ^Щох* + 2^-у /) + ... ••• + ^2-i С^дх^-^ду^\оХт кУк+г*»> О8) обозначая через х и у соответственно приращения Ах и Ду в равенстве (17); все частные производные в равенстве (18) рассматриваются в точке (0, 0). Примеры. 1. Представить функцию /(#, у) = ех+? в виде (15) при т = 3. Решение. Имеем А! = ^хАх + ^&У = ех+УАх + ех+УАу = &+У(Ах + Ау); d^ = S А*2 +2^ Д*Л#+ |^V=e*+Mx2+2e*^ Ах Ду+е*+Му2=; = &+у (Ах2 + 2Дх Ay + Ay2) = е*+^ (Ajc + Ay)*; йз/^А.з + з^А^А. + З^АхД^ + ^Д^з^ = e* +у (Ах3 + ЗДл;2 Ay + ЗА* Ay* + Ay3) = e*+^ (Ад: -f Ay)3.
280 Глава VI. Функции нескольких переменных Используя полученные результаты, по формуле Тейлора находим А/ = е*+А*+^+А^—е*+у = е*+У (Ах + Ау) + ех+У^х+^2 + или е*^(еА^-1) = е*^ [(Ах+ A^ + ^+^' + ^i^'l +r*' 2. Представить функцию /(*, у) = \п(\ +3х + 2у) в виде (18) при /71 = 2. Решение. Имеем Ло = 0, Й/ = П^А, + ТТ^АУ, Ufb-Ш+Щ, (12/==~(1 + Зл; + 2г/)2Ал;2 — (1 + Зх+2у)*АхАу (1 + Зх + 2у)* Л#^ d2/10 = — 9Ах2 — 12Дх Ау—Щ\ Отсюда, заменяя Ал; на х и Ау на уу по формуле (18) получаем \п(1+3х + 2у) = 0 + 3х + 2у—~(9х2 + 12ху + 4у2) + г2. 4°. Упражнения 1. Првверьте, что функции f1(x1 t) = u(x—at) и /2 (*, t) = u(x+at) удовлет- воряют уравнению -^=а2 ^~. 2. Проверьте, что функция / (*, у, г) = удовлетворяет уравнению V *2 + У2+г* дхьЛду^дг*'" ' 3. Найдите d/i, d2/, d3/, если [ = хеУ+уех. 4. Представьте функцию / (лг, у) по формуле Маклорена при п = 2, если: a) f(*> #)=1 + л;+у; б) f(x, y) = cos(x—y2). § 6.4. Неявные функции. Теорема существования. Дифференцирование неявных функций Пусть дана функция F(x9 у) двух переменных. Рассмотрим уравнение F(x,y) = 0. (1) Для каждого фиксированного х уравнение (1) относительно пере- ( менной у имеет некоторое множество решений. Обозначим это множество через Ах (оно может быть и пустым, т. е. не содержать ни одного элемента). Будем рассматривать только такие значения xt
§ 6.4. Неявные функции. Дифференцирование неявных функций 281 для которых Ах hq пусто. Тогда соответствие /: х-+ Ах определяет (многозначную) функцию переменной х. Такая функция называется неявной. Название «неявная функция» отражает способ задания этой функции: для каждого х значения неявной функции f (х) по определению являются решениями уравнения (1) при заданном х. Эти решения не всегда можно записать в виде явной формулы y = f(x), где f(x)—элементарная функция. Примеры. 1. Уравнение х2 + у2=1 определяет неявно функцию y=±V\—x2 (двузначную при | х \ Ф 1 и однозначную при л;=±1). Действительно, x2 + (±V\—х2)2=1. 2. Для уравнения у& + у—# = 0 невозможно записать решение в виде # = /(*), где /(л:)—элементарная функция, хотя сама зависимость y = f(x) определена правилом х-+ Ax = f (х) (напомним, что f(x) может быть многозначной функцией). Если в каждом множестве Ах выбрать по одному элементу, то получим (однозначную) функцию у = / (х), также называемую неявной. Теорема (о неявной функции). Пусть функция F(x,y) двух переменных определена в некоторой г-окрестности точки (д;0, у0) и F (х0, у0) = 0\ пусть также частные производные Fx(x9y), F'y (*. У) существуют и непрерывны в этой г-окрестности и F'y (*0, у0) =й=0. Тогда в достаточно малой окрестности точки х0 существует одна и только одна однозначная непрерывная функция y = f(x), удовлетворяющая соотношениям Уо = /(*о), F(xtf(x)) = 0, (2) причем y'(x) = — Fx(x9y)/Fy(x9y). (3) Доказательство приведено в § 6*.4, |. В § 6*.4 сформулировано обобщение теоремы о неявной функции— теорема о существовании отображения, заданного (неявно) системой уравнений, и следствие о существовании обратного отображения. Примеры. 1. Рассмотрим уравнение х2-\-у2—1=0. Как уже отмечалось, это уравнение определяет неявную функцию у = ±j/"l -^-.х2. Пусть (*0; у0) удовлетворяет данному уравнению и (х2 + у2 —1)^|0 = = 2у0 Ф 0. Тогда на основании теоремы существует (в некоторой окрестности точки х0) единственная функция y = f(x)j удовлетворяющая условиям (2), а именно, y = (sgny0)Vl—x2, где ( 1 при у0 > 0, Производная этой функций рис. 78
282 Глава VI. Функции нескольких переменных #; = sgny0 (j/i_*3);=^g|>. (**) Найдем теперь производную по формуле (3): = — (2х)/(2у) = -х/у, (***) что согласуется с (**); действительно, из соотношения (*) имеем XX X У sgnyvVl-x* V\-& Sgnr/o так как l/sgny0 = sgn*/0. Отметим, что точки (—1, 0) и (1, 0) не удовлетворяют условиям теоремы, поскольку dF/dy |0 = 2у |(_1§ 0) = 2у |(ь 0) = 0. Из рис. 78 видно, что невозможно однозначно определить функцию y = f(x) в окрестности указанных точек. 2. Найти производную неявной функции у = /(*), заданной уравнением х2 + Аху + 2у2 — 3х + 2у = 0. Решение. Согласно формуле (3), имеем Р F_x__ 2х+4у—3 '*"" Fy~~~4x + 4y+2 ' § 6.5. Экстремумы функций нескольких переменных.: Необходимое условие. Достаточные условия 1°. Экстремумы функций нескольких переменных. Определение. Точка Р0 (л:0; у0) называется точкой локального максимума функции f(x,y), если существует такая е-окрестность Q точки Р0, что /(Р0)>/(Р), VP0, PgG, Pe#P. (1) Точка Р0(х0\у0) называется точкой локального минимума функции / (х> У)у если существует такая е-окрестность точки Q, что / (Р.) < / (Р), VP0, P 6 О, Р0 Ф Р. (2) Точка Р0 называется точкой локального экстремума, если она является либо точкой локального максимума, либо точкой локального минимума. Само значение f(P0) называется локальным экстремумом (локальным максимумом или локальным минимумом). Понятие локального экстремума иллюстрируют рис. 79 и 80. Комментарий к определению. Задача о нахождении точек локальных экстремумов играет важную роль при вычислении точек абсолютных экстремумов, т. е. точек, в которых функция принимает свои максимальное и минимальное значения. Если точка абсолютного экстремума является внутренней точкой области определения функции, то она должна, очевидно, совпадать с одной из
§6.5. Экстремумы функций нескольких переменных 283 Г_|ЛУ=/СМ 2-'fr,y/ Рис. 79 Рис. 80 точек локальных экстремумов. Таким образом, задача о вычислении абсолютного экстремума сильно упрощается, поскольку дальнейшему исследованию подлежит лишь множество локальных экстремумов, как правило, конечное. 2°. Теоремы об экстремумах. Теорема 1 (необходимое условие локального экстремума). Если (д:0, у0)—точка локального экстремума функции /(#,#), имеющей непрерывные частные производные -J-, j- в этой точке, то |(*о,#о) = 0, |(*о,</о) = 0. (3) Доказательство. Используя формулу (9) в § 6.2, имеем Д/ = /(*0 + Л*, Уо+А^)-/(^о,Уо)=||0А^+||0^ + е. (4) Ду не есть тождественный df нуль, Л+1 т. е. хотя бы одно из чисел ^Ч Допустим, что функция ^ д1 ду отлично от нуля. Будем рассматривать А/ в столь малой 8-окрестности точки (д:0; у0), чтобы знак А/ совпадал со знаком ~ Д# + ~ Ду (этого можно добиться всегда, так как 8—бесконечно малая более высокого порядка малости, чем ]/~&х2 + &у2. Если (х0\ у0) является точкой экстремума, то А/ сохраняет знак в малой окрестности этой точки на основании формул (1) и (2). Однако выражение — Дя + ^ч Ду (его знак совпадает со знаком А/) изменяет знак при замене Ах на — Ад; и Ду на —Ду. Таким образом, в точке экстремума выражение ~ Длг + ^Ч Ду тождественен -" Х ° У ° но равно нулю, т. е. ~ = о дД = ' ду\о :0. Теорема 2(достаточное условие экстремума). Пусть fix>y)—функция, определенная в некоторой г-окрестности точки (л:0, у0) и имеющая в этой точке непрерывные частные производные второго порядка ^ а2/ | d2f о* дхду\о' ду2 Пусть, кроме moeof в точке (х0,
284 Глава VI. Функции нескольких переменных = °.||о = °- <5> у0) выполняются необходимые условия экстремума: д1 дх Если при этом (дичаю©и<«■ , i6> то (х0, у0) является точкой локального экстремума: при j-2 L>0 — d2f локального минимума, при j\ <0—локального максимума. Доказательство. По формуле (15) § 6.3 при т = 2 получаем + 0|оЛ/) + г,(*.У. А*, Ду). (7) Отсюда, используя условия (5), имеем А/-т[2|.А*'+2з1ЯоА*^+5М+^ <8> Выражение в квадратных скобках в равенстве (8), т. е. второй дифференциал функции f(x, у) в точке (x0; у0), является квадратичной формой от Ах, Ду. Если выполнено условие (6) (дискриминант квадратичной формы отрицателен), то квадратичная форма сохраняет постоянный знак. Этот знак совпадает со знаком А/ в некоторой 8-окрестности точки (л:0; у0), поскольку гп — величина бесконечно малая более высокого порядка малости, чем \гАх2-\-Ау2. Если же знак А/ постоянен в некоторой е-окрестности точки (х0; у0), то справедливо одно из неравенств (1) или (2) и (х0\ у0) является точкой экстремума. d2f I Если ^Н > 0, то второй дифференциал d2/—положительно определенная функция от Ад:, Ау. Тогда Af >0 и / (х0 + Ах, у0 + &y)>f(xQ, у0)г т. е. справедливо неравенство (1) и (х0, у0) является точкой локального минимума. Аналогично, если ^2 < 0, то (х0, у0)—точка локального максимума. Теоремы, обобщающие теоремы 1 и 2 на случай п переменных, сформулированы и доказаны в § 6*.5. Пример. Найти локальные экстремумы функции f(x,y)^=3xy — — (х3 +у*) в области Z> = {(х, у)\х>0, у > 0}. Решение. Имеем 4- = Зу—Зл:2, ^- = 3л:—Зу2. Решив систему уравнений получим л:=1, у=1. В этой точке выполнены необходимые условия экстремума. i Найдем второй дифференциал функции / в точке (1, 1):
§6.6. Ь7слоен, экстремум. Метод множителей Лагранжа. Абсолют, экстремумы 285 ^-Щм+2Ша^у+Шау2- -= — 6х|0Дл:2 + 2.3 'дхду\о У ' ch/2|o 0 Дл: Ау—бу |0 Ау2 = —6Ах2 + бД* Ау—6Ду2. Дискриминант этой квадратичной формы отрицателен: З2 — — (—6) (—6) < 0. Следовательно, достаточное условие существования локального экстремума выполнено и точ-ка (1, 1) является точкой локального экстремума, а именно—локального максимума, так как ё = -6<0- 3°. Упражнения Найдите экстремумы функций: 1. f(Xy у) = х2-4ху + 9у2. 2. /(а-, у) = 10ху—9*2—у*. 3- /(*• у)-т+х^Т72' 4'/(А'' у)=х2+у2—6х- 5- /(*» у)=Уг(1+*)2+у2- § 6.6. Условный экстремум. Метод множителей Лагранжа. Абсолютные экстремумы 1°. Условный экстремум. Рассмотрим функцию z = f(xi9x2y ...,xn) п переменных на множестве Л, состоящем из точек, координаты которых хи х29 ..., хп удовлетворяют уравнениям <Pi (xl9 x2J • • •, хп) = 0, ф2 (х19 х29 ..., хп)=0, ..., Фл (х19 *2» • • •. хп)=0 О) (уравнения связи); предполагается, что функции <pm (t = 1, 2, ..., /п) имеют непрерывные частные производные. При исследовании некоторых прикладных и теоретических вопросов возникает следующая задача: найти наибольшее и наименьшее значения функции z = f(xlfx29 --,хп) при условии, что переменные х19 х29 ..., хп удовлетворяют уравнениям (1) (задача об условном экстремуме). Как уже отмечалось, нахождение наибольшего и наименьшего значений функции / в области DczRn связано с вычислением локальных экстремумов и отысканием точек, в которых выполняются необходимые условия локального экстремума. Задача об условном экстремуме сложнее задачи об экстремуме функций* в области DczRn. Однако и здесь можно указать необходимые условия искомого экстремума. Эти условия сформулированы в следующем утверждении. Теорема. Пусть L(xl9 х2, ..., хп9 у19 у2У ..., ут)—функция от т + п переменных х19 х29 ..., хп% у19 у2, ..., ут, заданная формулой L (Xl9 Х2, . . . , Хп9 Уху У 2, •••» Ут) = Г\Х1> Х2, •••, Хп) —У1Ф1 (*i> х2У ..., х„)—у2ц>2 (х19 х29 ..., хп)— ... — — Ут<Рт(Хи Х2У ...., Хп). (2) Тогда если (xl, х%9 ..., х°п)—точка локального экстремума функции f(Xi, х2У ..., хп) при условиях (1), то система уравнений
286 Глава VI. Функции нескольких переменных ^ g = 0 (i = lf 2, .... л), ^ = 0 (/ = 1, 2, ...,т) • (3) имеет решение вида (*}, 4, ..., 4, У?, #8, • •., Ю. где 0i. У** • •* */^—некоторый набор значений переменных уи у2У ..., ут. Доказательство приведено в § 6*.6, I. Комментарии к теореме. 1) Локальный экстремум функции f(xiy x2J ..., хп) при условиях (1) представляет собой значение в такой точке Р0(х1; х\\ ...; х%), что для всех точек Р9 принадлежащих некоторой 8-окрестности этой точки и удовлетворяющих условиям (1), выполняется одно из двух неравенств /(Р)</(Р0), f(P)>f(P0) (РФР0). 2) Функция L называется функцией Лагранжа, а переменные Уи #2» • • •» Ут—множителями Лагранжа. 3) Теорема утверждает, что локальный экстремум функции f(xi9 х2> • • •» хп) ПРИ условиях (1) может достигаться только в тех точках Л>М> *2i •••» *°)> координаты которых вместе с некоторым набором чисел у\у у\, ..., у°т удовлетворяют системе уравнений (3). Пример. Найти экстремумы функции f (xu x2) = Xi+x2 при условии, что х19 х2 связаны соотношением ^? + ^| —1=0. Решение. Составим функцию Лагранжа L = Xi-\-x2—у(х* + -\-х\—1). Запишем систему уравнений (3): ^==1-2^ = 0; -^ = 1-2^ = 0; Щ = х\ + х\-\=0. (*) Выражая х± и х2 через у из первого и второго уравнения системы (*) и подставляя эти выражения в третье уравнение, получаем откуда «/=±1/^2. Решение системы (*) имеет вид (1/1^2, 1/J/2, 1/]/"2) и (—1/1/2, —1/1/2, — 1/К2). Согласно теореме, локальные экстремумы могут достигаться только в точках (1/К2, 1/1^2) и (-1/К2, -1/К2). Более подробное исследование показывает, что в точке (1/1/2, 1/1/2) имеет место локальный условный максимум, а в точке (—1/|/*2, —1/К2)—локальный условный минимум. Более того, (l/j/"2, 1/K2)—точка абсолютного условного максимума, а (—\\V% —1/|/*2)—точка абсолютного условного минимума. 2°. Упражнения 1. Найдите экстремумы функции Xs при условии х2-\-бху-\-у2. = 1. 2. Найдите экстремумы функции х# при условии 2# + 3*/=l. 3. Найдите экстремумы функции х2-\-у2-\-гЪ при условии х-\-у-\-г=1.
Глава /* ЛИНЕЙНАЯ АЛГЕБРА С ЭЛЕМЕНТАМИ АНАЛИТИЧЕСКОЙ ГЕОМЕТРИИ § 1*.1. Трехмерное пространство. Линейные операции над векторами. Линейные пространства. Линейно независимые системы векторов. Базис линейного пространства 1°. Декартова система координат на плоскости и в трехмерном пространстве. Пусть на плоскости L заданы две перпендикулярные прямые хну, пересекающиеся в точке О. Каждую из этих прямых будем называть осью координат. Точка О разбивает каждую из осей координат на две полупрямые. Условимся одну из них называть положительной полупрямой, а другую—отрицательной. При соблюдении этих условий говорят, что задана декартова система координату причем каждой точке А плоскости соответствуют два действительных числа—декартовы координаты точки А, определяемые следующим образом. Проведем из точки А две прямые, параллельные осям координат Ох и Оу, до пересечения этих прямых соответственно с осями координат Оу и Ох в точках Ах и Ау. Координатой х точки А будем называть число, равное но абсолютной величине длине отрезка ОАх и взятое со знаком плюс, если точка Ах лежит на положительной полуоси Ох, и со знаком минус, если она лежит на отрицательной полуоси Ох. Аналогично определяется координата у точки А. (Длины отрезков определены заданной единицей масштаба.) Координаты точки принято записывать в скобках рядом с буквенным обозначением точки: А (х, у). Аналогично определяется декартова система координат в трехмерном пространстве. Отметим, что имеет место взаимно однозначное соответствие между точками плоскости и упорядоченными парами вещественных чисел — декартовых координат. Каждой точке соответствует пара чисел, разным точкам — разные пары чисел, каждой паре чисел—точка. 2°. Векторы и линейные операции над ними. Упорядоченная пара точек А я В в пространстве определяет направленный отрезок: первая точка пары называется- началом направленного отрезка, вторая—концом. С помощью направленных отрезков удобно изображать некоторые физические величины, например силу, скорость, ускорение. Так, если.на материальную точку М действует сила, то для описания этого явления удобно рассмотреть направленный отрезок, имеющий начало в точке
288 Глава /*. Линейная илгебра с элементами ^аналитической геометрии, М, направление, совпадающее с направлением силы, и длину, численно равную величине силы (измеренной в каких-либо физических единицах). Аналогично при движении материальной точки М в пространстве скорость движения удобно изобразить направленным отрезком, имеющим начало в точке М, направление, совпадающее с направлением скорости, и длину, численно равную величине скорости (измеренной в каких-либо физических единицах). I в некоторых физических задачах величины, изображаемые направленными отрезками, лежащими на параллельных прямых и имеющими одинаковую длину и одинаковое направление, равны между собой (т. е. неразличимы с физической точки зрения). Например, при поступательном движении твердого тела скорость каждой точки тела изображается направленным отрезком, причем все такие направленные отрезки параллельны, одинаково направлены и имеют одинаковые длины. Естественно считать, что множество всех таких направленных отрезков задает физическую величину, называемую скоростью тела. Разумеется, далеко не всегда два параллельных, одинаково направленных и имеющих одинаковую длину направленных отрезка неразличимы в условиях рассматриваемой задачи. Так, сила F, действующая на абсолютно твердое тело, оказывает на него некоторое воздействие, которое не меняется, если точку приложения силы перемещать вдоль прямой /, проходящей через данную точку параллельно направленному отрезку, характеризующему эту силу. Если же точку приложения силы F взять вне прямой /, то воздействие силы на тело изменится. Направленные отрезки, описывающие физические явления в случае, когда сила действует на абсолютно твердое тело, и в аналогичных случаях приводят к понятию скользящего вектора. Мы будем рассматривать только направленные отрезки, описывающие явления, аналогичные поступательному движению твердого тела. Таким образом мы приход дим к понятию свободного вектора, или просто вектора^ \ Для строгого определения вектора (свободного вектора) как некоторого множества направленных отрезков используем общее математическое понятие разбиения множества на классы эквивалентности. Определение U Прямым произведением множеств А и В называется множество всех пар х, у таких, что х£А, у£В. Прямое произведение множеств А и В обозначают так: АхВ. Употребляется также запись АхВ = {(х, у)\х£А, у£В). С помощью такой записи обычно задают изучаемое множество. Фигурные скобки означают, что рассматриваемому множеству принадлежат все элементы, обозначен? ные символами в левой части выражения в фигурных скобках (до вертикальной черты), а в правой части записаны условия, характеризующие элементы описываемого множества. Определение 2. Пусть А — некоторое множество и UdAXА. Будем и ' говорить, что #, у£А находятся в отношении U, если (х, y)£U, и писать х~у. Отношение U называется отношением эквивалентности, если выполнены следующие условия:
§ l*.l. Трехмерное пространство, Линейные пространства. Базис 289 и 1) х~х для всякого х£А (рефлексивность); и 2) если х~у, то у~х (симметричность); и и и 3) если х~у, y~zt то x~z (транзитивность). Если х, у находятся в отношении эквивалентности, то говорят, что х эквивалентен у. При описании понятия отношения можно не использовать явно понятие прямого произведения множеств: на множестве А задано отношение U, если указаны все (упорядоченные) пары элементов х, у£А, о которых будем говорить, что они находятся в отношении U. В любом случае при задании отношения U должно быть указано правило, позволяющее решать вопрос о том, находятся ли два произвольных элемента в отношении U или нет. Лемма 1 (о разбиении множества на классы эквивалентности). Пусть А — множество, U—отношение эквивалентности; пусть Ах—множество всех у£А, эквивалентных элементу х. Тогда: 1) для любых двух yi, у%^,Ах и имеет место у±~у2; 2) если у\^АХУ у2(£Ах, то уг и у2 не эквивалентны. и и Доказательство. Пусть yi£Ax, у2£Ах. Это значит, что yt~x, у2~х* и Вследствие свойств симметричности и транзитивности у\~у2. Если yi£Ax, а у2фЛх, т0 У± не эквивалентен у2> поскольку в противном случае из у±~ху у2~у± в силу свойств транзитивности и симметричности следовало бы, что у2~х, т. е. у2£Ах, что противоречит предположению. Смысл леммы состоит в том, что множество А распадается на сумму (непересекающихся) подмножеств Ах, каждое из которых обладает следующими свойствами: любые два элемента подмножества Ах эквивалентны; всякая пара эквивалентных элементов принадлежит одному из Ах. Множество Ах называется классом эквивалентности. В множестве всех направленных отрезков введем отношение 1/, определяемое следующим образом: два направленных отрезка находятся в отношении V тогда и только тогда, когда второй из них параллелен первому и имеет ту же длину и то же направление, что и первый. Такое отношение является эквивалентностью (доказательство очевидно). Определение 3. Вектором называется класс эквивалентности V на множестве всех направленных отрезков. Как следует из доказательства леммы 1, всякий класс эквивалентности имеет вид Ах, т. е. состоит из всех элементов, эквивалентных данному. Поэтому определение 3 равносильно определению 1 § 1.1. Определение 4. Пусть а — вектор, т. е. класс эквивалентности V в множестве направленных отрезков, и ОС — единственный из направленных отрезков ->• класса а, начало которого совпадает с началом координат О. Координатами век- -> тора а называется упорядоченная тройка чисел #, у, г —координат точки С. -» -» Вектор а с координатами х, у, z будем обозначать так: а = (х, у, г). Общеупотребительно (хотя и не вполне строго) обозначение вектора а в виде А В, Ю № 2536
290 Глава I*. Линейная алгебра с элементами аналитической геометрии 4 , . 'Ц tz / / /* W J /у / J /Я сгЧ 1 / V/7 ъ *s ** ^л Рис. 81 ^ J, CD, ..., где Л£, CD, ...—направленные отрезки из класса эквивалентности а. При таком соглашении говорят о равных направленных отрезках,имея в виду эквивалентные направленные отрезки. Тогда обозначение вектора с координатами х, у, г примет вид АВ = (х, у, z). 2 Каждому направленному отрезку АВ со- ответствует вектор а—тот класс эквивалентности, которому принадлежит направленный отрезок АВ. При этом эквивалентным («равным») направленным отрезкам АВ и CD соответствует один и тот же вектор, Координаты-вектора однозначно установлены определением 4. Таким образом, эквивалентные («равные») направленные отрезки определяют векторы с одинаковыми координатами. Координаты вектора А В могут быть выражены через координаты точек А и В. Лемма 2. Если х0, у0, zQ и х±, уг, z±—соответственно координаты точек А и В, то AB = (xi—x0, yt~y0, Zi~z0). 3 Доказательство. Покажем сначала, что для всякого направленного отрезка CD, эквивалентного заданному направленному отрезку АВ, где A (х±, Уи *i), В(х2, у2, г2), С(х3, Уз, г3), D (х*> У*> г*)> числа *a—*i» Уг—Уъ Ч~Ч равны соответственно числам #4—x3l t/4—*з, Н—*з« Действительно, как видно из рис. 81, числа х2—х±, у2—У1> z2—*i равны соответственно d cos a, dcosP, dcosy, где d—длина отрезка АВ, а а, Р, у — углк между направленным отрезком АВ и лучами, проведенными через точку А параллельно осям координат так, что направление каждого луча совпадает с положительным направлением соответствующей координатной оси. Из того же рисунка получаем равенства *4 —x3 = d cos ai, #4—#3 = dcosPf, z4 —z3 = 4cos Yf. Здесь d—длина направленного отрезка CD (по условию она равна длине d направленного отрезка АВ); oti, Pi, 71~УГЛЫ» образованные направленным отрезком CD и лучами, проведенными через точку С параллельно осям координат так, что направление луча совпадает с положительным направлением соответствующей координатной оси. Очевидно, что a — ai, p —Pi, V —Yi» откуда следует х2 —*i = =»*4~Х3, У2 — У1 = У4 — УЗ, Z2 — Z1 = Zi — Z3. Таким образом, разности соответствующих координат конечной и начальной точки направленного отрезка не зависят от того, какой из эквивалентных направленных отрезков использован для вычислений. Если, в частности, выбрать тот единственный направленный отрезок данного класса эквивалентности, начало ко-
§>l*.l. Трехмерное пространство. Линейные пространства. Базис 291 торого совпадает с началом координат, т. е. отрезок ОС, где О(0, 0, 0), С (х, у, г), то для него эти разности х—0, у—О, г—0 совпадают с.координатами х, у, г точки С, т. е. по определению 4 являются координатами вектора. ->■ -» Определение 5. Суммой двух векторов а и Ь называется вектор, обо- -> -» значаемый а-\-Ь и получаемый по следующему правилу. -»• -> В классах эквивалентности а и Ь выберем (произвольно) по одному направленному отрезку А В, CD. Построим направленные отрезки ЕР и PF так, чтобы АВ и CD были эквивалентны отрезкам ЕР и PF (начало PF совпадает с концом ЕР). Рассмотрим направленный отрезок EF и соответствующий ему класс -» -> эквивалентности—вектор с. Этот вектор и будем называть суммой векторов а -> ->->->■ и Ьу т. е. с — а-\-Ь. 4 Проверка корректности определения 5. Докажем независимость суммы векторов а-\-Ь от случайного выбора направленных отрезков АВ и CD из классов эквивалентностей а и Ь. Пусть вместо направленных отрезков АВ и CD из классов а и Ъ выбраны отрезки АгВг и CiD^ Далее, пусть направленные отрезки £iPi и PiFf эквивалентны соответственно A±Bt и CxDj;. , Рассмотрим четырехугольники ЕРРгЕг и PFFxPx. Они являются параллелограммами, поскольку направленные отрезки ЕР и ЕгРъ а также PF и PiFtf эквивалентны по условию. Отсюда следует, что направленные отрезки РР± и EEi, а также РРг и FFx равны, параллельны и одинаково направлены; следовательно, направленные отрезки EEi и FFi эквивалентны, четырехугольник EFFiE±—параллелограмм, и направленные отрезки EF и EFx также эквивалентны, что и требовалось доказать. Определение 6. Пусть а—вектор и X—вещественное число; Проивееде- нием вектора а на число X называется вектор, обозначаемый Ха и получаемый по следующему правилу. В классе эквивалентности а выберем произвольный направленный отрезок АВ, построим новый направленный отрезок ХАВ, параллельный отрезку АВ и имеющий длину |А||Л£|, где | АВ | — длина АВ. Направление отрезка ХАВ выберем так, чтобы при X > 0 оно совпадало с направлением АВ, а при X < О —> -»■ было противоположно направлению АВ. Вектором Ха называется класс эквива* лентности направленного отрезка ХАВ. 5 Проверка корректности определения 6. Пусть вместо направленного отрезка АВ для вычисления Ха выбран другой направленный, отрезок A\Bi, принадлежащий классу эквивалентности (вектору) а. Тогда направленный 10*
292 Глава* /*. Линейная алгебра с элементами аналитической геометрии отрезок L4i#i, очевидно, эквивалентен направленному отрезку %АВ, поэтому вектор Ка определен однозначно вне зависимости от случайно выбранного направленного отрезка АВ из класса эквивалентности а. Множество всех векторов трехмерного пространства обозначим через L3. 6 Действия над векторами (сложение векторов, умножение векторов на числе) обладают следующими естественными свойствами. 1°. Для любых двух векторов a, b из L3 справедливо равенство a-\-b = b-\-a (коммутативность сложения векторов). -»-»■-> -»■-»■ 2°. Для любых трех векторов а, Ь, с из Lz справедливо равенство (я+6) + -> -+ -> -> + с = а + (Ь + с) (ассоци ати вность сложения векторов). 3°. В L3 существует такой вектор О (называемый нуль-вектором), что для любого вектора а из L3 справедливо равенство 0-{-а —а (существование нулевого вектора). -» -*■ 4°. Для любого вектора а из L3 существует такой вектор а! из [L3, что -►->-»■ а-\-а = 0 (существов ание противоположного вектора). -»■ -► 5°. Для любого вещественного числа К и всяких векторов a, b из L3 справед- -> -> -* -> ляво равенство X(a+b) = Xa-\-'kb. -»■ 6°. Для л/обой /ш/?б/ вещественных чисел ?ii, Я,2 и любого вектора а из L3 cnpa- -> ->• ведливо равенство (ЯДг) а = А,х (X2 а). 7°. Для.любой пары вещественных чисел Klt А2 и любого вектора а из L3 cnpa- ведливо равенство (к± + А,2) а = A,ia + ^2а- 8°. Для любого вектора а из L3 справедливо равенство \*а = а. Эти свойства могут быть записаны кратко с помощью условных обозначений V и 3- Первое из них читается «для всякого» (или «для всяких»), второе—«существует», причем после символа з пишут обозначение того элемента, существование которого утверждается, затем ставят вертикальную черту, а за вертикальной чертой записывают свойства, которым удовлетворяет этот элемент. Запись за чертой читается так: «такой, что выполняются указываемые свойства». Сформулируем перечисленные выше свойства действий над векторами с помощью обозначений V, 3: 1°. Va, b£L3 Z+'b—T+a. 2°. V?, ?, ~с£Ц (а + Ц + с*=а + ф + ф. 3°. 3^€L3|VagL3 0 + а = а. 4°. wa'\a + a'= & 5° vXgR, Va, ?€й Ма+"?) = Ло + А?. 6°. vAi, ^2gR, VaigjLs (ЯД2)а = МА,2а).
§ 1*.L Трехмерное , пространство. Линейные пространства. Базис 293 8°- Va£L3 Ьа = д. Доказательства этих свойств вытекают непосредственно из определений 5 и 6, поэтому ограничимся лишь некоторыми комментариями. 1) Если в некотором множестве G для любых двух элементов а> Ь определен элемент я+ 6, удовлетворяющий свойствам 1°—4°, то говорят, что задана абелева группа. Таким образом, множество L3 векторов трехмерного пространства является абелевой группой. 2) Вектор а', о котором идет речь в свойстве 4°, равен —Ьа. Для крат- кости записи его чаще обозначают —а. Действительно, вектор —Ьа определен и в сумме с вектором а дает aV(~--l)a=:l.aV(-- 1)<Г=(1 + (— 1))а = Са! Покажем, что 6 + 0«а = 6, для любого Ь: очевидно, что b~^a'-\-a = b в силу свойств 4°, 2°, 3°; поэтому 6 + 0-a ="£+fl'+e + 0-"а=Л+"а'+ 1 -"a+0."a = «=He4(l+0)fl = Hfl,+ ba=He,+ e = ^ Таким образом, 0*а—нуль-вектор, о котором говорится в свойстве 3°. В множестве L3 имеется только один нуль-вектор. Действительно, если предположить противное, т. е. существование двух неравных между собой нуль-век- -> -> ->->•-»•-»-» торов О* и 02, то на основании свойств 1° и 3° получим 0i + 02 = 0i\ 02-j-01 = -> -> -» = 02, т. е. 0х = 02, что противоречит предположению. ->•->• -> -> Значит, —0-а = 0 для любого вектора а, и вектор —а противоположен вектору а\ае — —а). 3) Для любого вектора а противоположный вектор а , существование которого утверждает свойство 4°, определен4 однозначно. Предполагая противное, т. е. существование двух различных противоположных векторов alt a2 к вектору а> получим, с одной стороны, а~\-ах -fa2 = а2, а с другой стороны, a+#2+01 = = ai и так как «i + ai + a2 =ь а± + a2 +ai в силу свойств 1° и 2°, те а2 ■= «i, т. е. имеет место противоречие с предположением. Отсюда следует, что единст- -*/ "* "* венным противоположным вектором а к вектору а является вектор —а. Из этих рассуждений вытекает, что если классу эквивалентности (вектору) -> —> -> а принадлежит направленный отрезок А В, то противоположному вектору —а принадлежит направленный отрезок ВА (и все ему эквивалентные). 4) Нуль-вектор, о котором идет речь в свойстве 3°, есть класс эквивалентности направленных отрезков вида АА> т. е. таких, для которых начало отрезка совпадает с концом.
294 Глаза I*. Линейная алгебра с элементами аналитической геометрии Лемма 3. Если векторы а и b имеют соответственно координаты (я*, у и z{) и (х2, у2, г2),товек- тор а -\-Ь — имеет координаты (xi+x2, Уг + Уъ* 2! + г2)» а вектор Ха—координаты (kxi, Хх2, Алс3). 7 Доказательство. В классе эквивалентности а выберем направленный отрезок О А, начало которого совпадает с началом координат, а в классе экви- валентности Ъ выберем направленный отрезок АВ. В силу определения координат вектора, точка А имеет координаты (xi, у±, гг). Если координаты точки В обозна- —> чить через (х3, у3, г3), то координаты вектора АВ таковы: (х3—х±, Уъ — Уъ г3—Zi). Согласно определению 5, направленный отрезок АВ принадлежит классу эквивалентности (вектору) а-\-Ь. Координатами вектора а-\-Ь по определению 4 являются (х3, |/з, z3); в т0 же вРемя *3 = *i + (*3—*i)> Уз = У1 + (Уз—Ух), *з = -> ^^^-(гз —Zi). Так как координаты (х3 —*i, y3—y±> г3—гг) вектора Ь равны по условию (*2, у2* z2), то x3 = xt+x2, Уз = У1+У2> z3=Zi-\-z2. Докажем теперь второе утверждение леммы. Из класса эквивалентности (вектора) а выберем тот направленный отрезок ОС, начало которого совпадает -*■ с началом координат. Согласно определению 6, вектору Ха принадлежит отрезок >' ->> OD, начало которого совпадает с началом координат, длина равна |Х,||а|, где |а|^ДЛина вектора а, а направление совпадает с ОС, если Х^О, и противоположно ОС, если X < 0. При X > 0 утверждение леммы вытекает из известных свойств подобных треугольников (рис. 82), а случай Х<0 сводится к случаю X > 0 симметрией относительно начала координат. Требуемое утверждение дока- зано, поскольку определение 6 корректно и для построения Ха достаточно использовать любой из направленных отрезков данного класса эквивалентности, 3*. Линейные пространства. Из изложенн ого выше вытекают следующие выводы* Каждому вектору а из множества L3 векторов трехмерного пространства соответ-. ствует упорядоченный набор из трех вещественных чисел (х, у, z) — координат вектбра а;~ обратно, каждой упорядоченной тройке вещественных чисел (х, у, z) соответствует вектор, заданный направленным отрезком ОС, где О—начало координат, а точка С имеет координаты (х, у, z). Легко убедиться в том, что такое соответствие взаимно однозначно. Более того, как во множестве L3 векторов, так и во множестве R3 всех упорядоченных троек вещественных чисел [определены операции сложения элементе» к умножения элемента на вещественное число. Во множестве Ls указанные операции заданы определениями 5 и 6, а во множестве Rz они определены
J 7* .7. Трехмерное пространство. Линейные пространства. Базис 295 следующими формулами: (*!> У1, *i) + (*2, У2> *2) = (*i+*2, */l+#2, 2i+Z2), M^U/i^i) = Ф*ь Ь:2, Я*3). (1) Отмеченное соответствие L3—► R3 сохраняет эти операции, т. е. если векто- рам a, 6£L3 соответствуют упорядоченные тройки чисел (xi> yi, *i), (#2, у2, z2) (координаты векторов), то вектору а + 6 [соответствует упорядоченная тройка -» '■, - (*i+*2» У\Л-Уъ 21 + г2), а вектору Яа—упорядоченная тройка (Я**, Я#1, Ягх) (на основании леммы 3). Поэтому при изучении свойств векторов из, множества L3 достаточно рассмотреть множество R3 с операциями (1). По аналогии с множествами L3 и R3, связанными с трехмерным пространством, можно рассмотреть множества L2 и R2, связанные с плоскостью! Имеет место взаимно однозначное соответствие между векторами на плоскости, в которой введена система координат, и упорядоченными парами вещественных чисел. Евклидово пространство четырех и более измерений не существует как физическая реальность, однако для многих целей удобно рассматривать координатное л-мерное пространство, элементами которого являются всевозможные упорядоченные наборы из п вещественных чисел (см. определение 5 § 1.1). В таком прост* ранстве определены операции сложения векторов и умножения вектора на число» удовлетворяющие свойствам 1°—8°. Обобщением понятия координатного «-мерного пространства служит линейное (векторное) пространство — одно из самых важных математических понятий. 8 On ре деление 7. Пусть L — множество произвольной природы, и R—поле вещественных чисел, Далее, пусть: 1) в L определен закон, сопоставляющий двум произвольным элементам a, b£L третий элемент, обозначаемый а-\-Ь и называв- мый суммой элементов а и Ь\ 2) для всякого элемента a£L и всякого Я £ R опре- ->• делен элемент, обозначаемый Ка и называемый произведением числа Хна элемент -» - а; 3) операции сложения элементов и умножения элементов на число удовлетворяют свойствам 1° — 8°. Тогда множество L называют линейным пространством над полем R, а элементы этого пространства—векторами. Линейное пространство также называют векторным пространством и линеалом. Если в множестве L определены операции сложения элементов и умножения элемента из L на числа из некоторого поля К (например, на комплексные числа), то говорят о линейном пространстве над К. Примеры. 1. Множество всех многочленов от т переменных с вещественными коэффициентами, в котором определены обычные операции сложения многочленов и умножения многочлена на число, является линейным пространством. 2. Множество решений однородного дифференциального уравнения У" + Р(х)у'+1(х)У = 0 (2) является линейным пространством относительно обычных операций сложения функций и умножения функции на число. Это легко проверить, доказав, что если функции у± (х), у2 (л:) —решения уравнения (2), то их сумма уг (х)-£у2 (*)," а так-
296 Глава /*. Линейная алгебра с элементами аналитической геометрии же функция %yi (х) являются решениями уравнения (2). Действительно, (tJi + У 2)" + Р (х) {у[ + уд + у± + У2 = (y"i + РУ1 + уд + (yl + ру'ч + У г) = 0; (W + P (ЬугУ + (Цг) = Я (yi + pyi + qyj = 0. Аналогично можно установить, что множество решений системы однородных линейных дифференциальных уравнений (обыкновенных или в частных производных) является линейным пространством относительно обычных операций сложения функций и умножения функции на число. 3. Как утверждается в теореме 1 § 1.1, множество решений однородной системы линейных алгебраических уравнений является линейным пространством (подпространством соответствующего «-мерного координатного пространства). 4. Множество всех матриц размера тХп с элементами из произвольного поля К является линейным пространством относительно операций поэлементного сложения матриц и поэлементного умножения матрицы на число из поля /С. Это— линейное пространство над полем /С (см. определения 6 и 7 § 1.4). 5. Множество L всех линейных преобразований данного линейного пространства L (над полем К) является линейным пространством (над полем К) относительно операций сложения линейных преобразований и умножения линейного преобразования на число, определенных следующим образом: (fi+/i)?=/iW + fiW vW2€l. v*€Lf (Kfjx = bf(x) VXgtf, V/g£, Vx£L. 6. Отметим, что л-мерное координатное пространство R" является линейным пространством над R. Рассматривают также л-мерное координатное пространство над произвольным полем К—множество всех упорядоченных наборов из «элементов поля К, в котором операции сложения векторов и умножения вектора на число вводятся аналогично правилам определения 5 § 1.1. 7. Множество, состоящее из одного элемента 0, в котором определены опера- ции 04-0 — 0, А,0 = 0, является линейным пространством. в Onределение 8. Пусть L — линейное пространство над полем К и М — под- -> -» -> -> множество в L, удовлетворяющее следующим свойствам: 1) х-\-у£М Чх,у£М; ~> -» 2) hx^M yx£M, vA,£/(. Тогда М называется линейным подпространством линейного пространства L. Примеры. 1. Множество всех многочленов степени, не превосходящей п, является линейным подпространством в линейном пространстве всех многочленов. 2. Линейное пространство L является линейным подпространством в самом себе; подмножество в линейном пространстве L, состоящее из одного нулевого вектора, также есть линейное подпространство в L. Эти линейные подпространства имеются в каждом линейном пространстве. ю Термин ^несобственное линейное пространство» линейного пространства L означает одно из двух упомянутых выше линейных подпространств. Если в линейном пространстве L справедливо равенство -*•-»•-»• -> Ь = Кгах -f- А2«2 + • • • + knan
\ § 1*.L Трехмерное пространство. Линейные пространства. Базис 297 для некоторых векторов а*, я2, ..., а„, 6£L и некоторых чиселЯ1Д2, ...ДЛ€^» -> ->-»•-»• то говорят, что вектор Ь линейно выражается через векторыalt а2, ...уап. -* -» Выражение Y^Pi^-Я2я2 +... +Кпап называется линейной комбинацией векторов Определение 9. Система векторов af, a2, ...,«« называется линейно зависимой, если среди этих векторов найдется по крайней мере один, который линейно выражается через остальные. ~ -+ -* "* Система векторов a*, а2» •••» ап линейного пространства называется линейно независимой, если ни один из ее векторов не может быть линейно выражен через остальные. Нетрудно привести пример линейно зависимой системы векторов. Возьмем -»■-»■ -► любое множество а*, а2, ..., ап векторов из L, любое множество из п действи- -► -> -> тельных чисел A-f, Я2, ...,Я,„ и построим вектор Я^х-j-Я2«2 + • • • +^„а„, кото- -> рый обозначим через Ь\ тогда ->■->-> -* 6=A^i + Я2й2 + .о. -{-hnan* (3) т. е. по определению система векторов а±, а2, ..., ап> Ь линейно зависима. II Приведем примеры линейно независимых систем векторов. Рассмотрим в четырехмерном координатном пространстве L4 систему векторов а* = (1, 0, 0, 0), ?2 = (0, 1, 0, 0), я3 = (0, 0, 1, 0), а4=(0, 0, 0, 1). (4) -> Предположим, что система (4) линейно зависима. Тогда некоторый вектор а^ можно ->• линейно выразить через остальные векторы. Однако вектор а^ есть упорядоченная четверка чисел, в которой на k-u месте стоит единица, а все остальные векторы системы (4) представляют собой упорядоченные четверки чисел, у которых на k-u месте стоят нули. Любая линейная комбинация этих векторов представляет собой упорядоченную четверку чисел, у которой на k-u месте стоит нуль. -»■ • Поэтому вектор а^ не может быть линейно выражен через остальные векторы и, значит, данная система линейно независима. Рассмотрим теперь в координатном пространстве L4 следующую систему векторов: oi = (5, 2, 3, 1), а2 = (0, 4, 7, —2), а3 = (0, 0, 3, — 1), ~а4 = (0, 0, 0, 8). (5) Докажем, что она линейно независима. Допустим противное. Тогда по крайней -> i мере один из векторов (например, а0 системы линейно выражается чере/з остальные: fl* = Xifli + ... +A,4fl£ (6)
298 Глава /*. Линейная алгебра с элементами аналитической геометрии (в правой части равенства нет слагаемого, содержащего вектор а$). Перенесем -> вектор аь из левой части равенства в правую (со знаком минус), т. е. прибавим -> к левой и правой частям равенства вектор—aft. В результате получим -> -> ->->-» Mi + Мг + Ms + Кч = 0, (7) где А,£ = —1. Коэффициент Xf в равенстве (7) равен нулю, в противном случае линейная комбинация (7) представляет собой упорядоченную четверку чисел, первое из которых отлично от нуля. Из того, что Ях = 0, и равенства (7) вытекает, что Я2 = 0, иначе линейная комбинация Я2а2 + Яз#з + ^4 есть упорядоченная четверка чисел, второе из которых отлично от нуля. Далее, из того, что ?ti = 0, Я2 = 0, и равенства (7) аналогично вытекает,"что Я3 = 0. Наконец, из того, что A,i = 0, Я2 = 0, л3 = 0, и равенства (7) получаем Я4а4 = 0 и Я4 = 0. Таким образом, все коэффициенты Х±, Я2, Я3, Я4 в равенстве (7) равны нулю, что противоречит условию К^ =—1. Из полученного противоречия следует, что система векторов (5) линейно независима. 4°. Базис линейного пространства. Для всякого линейного пространства L справедливо одно из двух предположений: или в пространстве L существует линейно независимая система векторов, содержащая сколь угодно большое число векторов, или любая система, в которой число векторов больше, чем заданное число N, линейно зависима. В первом случае говорят о бесконечномерном пространстве, во втором — о конечномерном. Определение 10, Пусть в конечномерном линейном пространстве L сущест- -» ->• -> вует линейно независимая система из п векторов (alt a2) ..., ап), а всякая совокупность из я+1 векторов является линейно зависимой. Тогда (упорядоченная) система векторов (а*, а2, ..., ап) называется базисом линейного пространства L. Очевидно, что в конечномерном линейном пространстве существует хотя бы один базис (в случае линейного пространства, состоящего из одного нуль-вектора, базис состоит из «нуля» векторов). Справедливо следующее утверждение. Теорема 1. Если (%, а2, ..., ап) и (£i, b2i ..., bm) — два базиса в линей" ном пространстве L, то т = п. Иными словами, количество векторов в базисе ли* нейного пространства не зависит от выбора базиса, V3L Доказательство. Пусть даны два базиса линейного пространства L: (а, а2, о.., ап)(А), (blt b2 bm) (В). -> -> ->■ -* -> -> Будем называть две системы векторов (с1у с2, ..., с^) и (db d2, ..., dt) эквива- -> лентными, если каждый вектор с/(*=1, 2, ,.., k) линейно выражается через н- -*■ векторы dj(j = \y 2, ...,/) и, наоборот, каждый вектор dj линейно выражается ~» через векторы с/.
§ 1*.L Трехмерное пространство. Линейные пространства. Базис 29§ В этом смысле два исходных базиса (А) и (В) эквивалентны. При доказа- тельстве мы заменим некоторые из векторов bt, b2i ..., Ьт некоторыми из век- -► -► -»■ торов а±, а2, ..., ап так, чтобы полученная система была эквивалентна исход- -* '-+ -* ной системе Ь±> Ьъ ..., Ьт. В результате система (В) перейдет в систему, содержащую все векторы системы (Л), откуда вытекает, что п<т. Если же этот процесс осуществить в другом направлении, т. е. некоторые векторы базиса (А) заменить некоторыми векторами базиса (В), то получим систему из п векторов, содержащую все векторы базиса (В), откуда следует, что п^т. Из неравенств т^п и п^т получим т — п. Опишем теперь процесс замещения. На первом шаге заменим один из векто- ров системы (В) вектором at так, чтобы новая система была эквивалентна старой. -> -»■->-» Вектор at по условию линейно выражается через векторы blt b2l ..., Ьт. Воз- можно, что а± линейно выражается через некоторую часть системы векторов (В). Очевидно, что существует такое подмножество (С) векторов множества (В), что: 1) вектор at линейно выражается через векторы множества (С); 2) если из множества (С) исключить хотя бы один вектор, то никакая линейная комбинация -> -> оставшихся векторов не равна вектору at (т. е. аг не выражается линейно через оставшиеся векторы). Покажем, что если в системе векторов (С), обладающей указанными свойст- -> вами, заменить какой-нибудь вектор вектором аь то получится система, эквива- -> лентная системе (С) (и содержащая вектор ах). Пусть (С)—совокупность векторов Ъ, c2i ..., ck. (8) ->-*-»- -» По условию tfi = Ai^i + ^2 + •.. +A,£Cfc, причем X/ Ф О (*=1, 2, ..., к), иначе -*■ вектор at линейно выражался бы через часть векторов системы (С). Тогда любая система (С) ci, с2, ..., с/_1, alt Ci+t, ..., cki (9) полученная из (С) заменой вектора с,- вектором ах, эквивалентна исходной системе (С). Действительно, имеют место следующие формулы: -*■ -> cj = cj (/==1, 2, ..., f—1, i+l, ..., я), [так выражаются векторы системы (С) через векторы системы (С)]; 2у = су (/=!, 2, ..., * — 1, f+1, ..., л), fl='A.icr+Va+...+XnC« [так выражаются векторы системы (С) через векторы системы (С)]. Пусть на k-м шаге процесса в результате замены векторов системы {В) век- торами ai, a2, ..., a# мы получили систему векторов ->• -> ->-»■-> -»■ я*, а2, .♦., a*, ^i, x*v.-.,,- *,»-*, (10)
300 Глава /*. Линейная алгебра с элементами аналитической геометрии где а1у а2, ..., я* — первые k векторов и системы (Л), xi, х2> •••> xm-k—некоторое подмножество векторов системы (В). Система (10) эквивалентна системе (В). Сделаем (&-|-1)-й шаг, т. е. заменим в системе (10) один из векторов -> -> х±, х2> ..., xm~k на a^+j. По условию a^+t линейно выражается через векторы -> (10). Возможно, что я#+1 линейно выражается через часть системы (10). Во всяком случае найдется такое подмножество (С) множества (10), которое обладает ->■ следующими свойствами: 1) a^+i линейно выражается через векторы множества (С); 2) если из множества (С) иключить хотя бы один вектор, то никакая линей- ная комбинация оставшихся векторов не равна вектору а^+р Если в системе (С) заменить какой-нибудь вектор вектором я#+1, то получится система (С), эквивалентная системе (С). Доказательство этого совершенно аналогично доказательству эквивалентности систем (8) и (9). Очевидно, что система (С), обладающая отмеченными свойствами, не может -*■->-»■ -»■ быть подмножеством множества а±, а2, *.., а^: в этом случае вектор a^+f должен -»■ -> -> линейно выражаться через векторы а±, a2i *.., а& что невозможно вследствие линейной независимости системы векторов (А). Итак, в множество (С), обладаю- -»■ -► щее указанными свойствами, входит по крайней мере один из векторов х±, x2l *** -> -» -> > • •» xm-k системы (10), т. е. по крайней мере один вектор из множества bf, Ь2, ■. -.» -..., Ьт. Заменим этот вектор вектором a^+f. По доказанному ранее новая система векторов эквивалентна системе (10), а следовательно, и исходной системе (В) и содержит £+1 векторов'яь а2, ..., я*+£. Таким образом, в силу принципа математической индукции доказано, что т^п, и существует система векторов -> -* -»•-»-> ~» Я£, я2, ..., ап, уъ */2, ..., *//»-/*> где i/i, 1/2» •••> i//»-« — векторы из множества Ьъ, Ь2, ..., &„, эквивалентная системе векторов (В). Меняя местами системы векторов (А) и (£), аналогично получаем п^т, еткуда следует, что т=--п. Если в линейном пространстве L задан базис (/ь /2, ..., /„), то каждому вектору g соответствует упорядоченный набор из п чисел — коэффициентов разло- жения вектора g по базису (fx, /2, • •> /«)• ?= <?i/i + c2f2 + ... +cjw. (11) Существование такого разложения вытекает из определения базиса. Докажем единственность разложения (11). Пусть g = cJi + cJ*+ - • .+cnfn* g = d1fi + d2f2 + ... + dnfn (12)
§ l*.l: Трехмерное пространство. Линейные пространства. Базис $01 — разложения вектора g по базису (fa, f2, • • • > /«)• Вычитая из первого равенства второе, получим 0 = ^-^) ff + (c2-c/2)f2+ ... +(cn-dn)Jn. (13) Равенство (13) означает, что линейная комбинация линейно независимых векторов равна нулевому вектору. Согласно определению линейной независимости, отсюда следует, что все коэффициенты в правой части равенства (13) равны нулю, т. е. C{ = di (i=\, 2, ..., п) и разложения (12) совпадают. Определение 11. Пусть в конечномерном линейном пространстве L задан ->-»-*•-»• -» -»• вектор g и базис (flt f2, ..., fn)- Координатами вектора g в базисе (fi, /2, ..4 ->• ..., /„) называется (однозначно определенная) упорядоченная совокупность чисел ->■->-► -»■ Съ с2» • • •» Сп — коэффициентов разложения g = cji + c2f 2 + ♦ • • + ^л • Определение 12. Пусть L —конечномерное линейное пространство и (/i» /2» .-., /г)—базис в L. Число г, равное количеству векторов в базисе (безразлично, в каком именно), называется размерностью конечномерного линейного пространства L. 13 Используя понятия базиса конечномерного линейного пространства, координат вектора в базисе, размерности конечномерного линейного пространства, докажем второе утверждение теоремы 1 § 1.1. Всякое линейное подпространство n-мерного координатного пространства Ln есть множество наборов (xlt х2, ..., хп), удовлетворяющих некоторой системе линейных однородных уравнений. Прежде всего докажем, что всякую линейно независимую систему векторов /ь /г> • ••♦ fu B конечномерном линейном пространстве L можно дополнить до базиса пространства L. В самом деле, если данная линейно независимая система векторов не является базисом, то в I найдется вектор fk+i* не равный никакой линейной комбинации -> -> -» векторов базиса. Добавим его к системе /lt f2, •••> fk и покажем, что полученная -» -> -> -» система векторов fi, /2, ..., fk, fk+t линейно независима. Если бы эта система была линейно зависима, то при некоторых с*, с2, ..., с^ С/^+ъ одновременно не равных нулю, было бы справедливо равенство Clfl + C2f2+ • • • +Ckfk + Ck + lfk + l = °- В случае Сц+± Ф 0 вектор f^+1 линейно выражается через остальные векторы, что в действительности не имеет места. Таким образом, c&+i = 0, откуда *lfl+*2/2+.--+*ftf* = 0. Последнее равенство для линейно независимых векторов /,, f2l ..., fu может иметь место только при сг = с2== ... =c/j = 0. Итак, система /ь /2, - • •> /fc» /^ч-х линейно независима. Добавим теперь к системе £+1 линейно независимых векторов f±t f2, ..., fk+i вектор ^+2, не являющийся линейной комбинацией векторов fi, f2, ..., ffe» />+i
302 Глава I*. Линейная алгебра с элементами аналитической геометрии (если такой найдется), и т. д. Окончательно получим такую линейно независимую систему векторов 7* 7а. ....?г. (И) всякий вектор которой в линейном конечномерном пространстве L линейно выражается через векторы (14). Система (14), очевидно, представляет собой базис в L. Покажем теперь, что размерность линейного подпространства не превосходит размерности включающего его конечномерного пространства. - Пусть М — линейное подпространство в конечномерном линейном пространстве L. Если L и М совпадают, то, очевидно, совпадают и их размерности. -»■ Если же в L существует вектор /i, не принадлежащий подпространству М, то для размерностей L и М (соответственно dimL, dim M) справедливо неравенство dim L > dim M. (15) Выберем в М базис (/i, f2, --»> fr) Ш является конечномерным, поскольку конечномерно L). Как было показано выше, линейно независимую систему /i, /2, . * * ..., fr можно дополнить до базиса в L, при этом на первом шаге можно к век* торам /i, /2» ••♦> fr присоединить вектор / (он существует в силу условия MczLf М Ф L), так что число векторов в базисе линейного пространства L будет строго больше, чем в базисе пространства М, т. е. выполняется неравенство (15). Перейдем теперь к непосредственному доказательству сформулированного утверждения теоремы 1 § 1.1. В линейном подпространстве М выберем базис из векторов /i, /2, ..., f% и дополним это множество векторами fk+i, fk+2» •••» fn ДО базиса всего л-мерного координатного пространства Ln: (/1, /2, .-•, /а» /Wi> /ft+2» •••>/«)• (16) Для всякой системы векторов gi, g2, t.., gk обозначим через ((gi, g2> ...» gk)) и назовем линейной оболочкой множества векторов gi, g2t ..., gk линейное пространство, элементами которого являются всевозможные линейные комбинации век- торов gi, g2, •*'* gk (нетрудно показать, что множество линейных комбинаций является линейным пространством относительно обычных операций сложения и умножения на число). Обозначим теперь через Ms (s = ^+l, k + 2, .*., п) линейное пространство -> -> -» -» -> -» -> ((/i* /2, ••"*» fk>fk+i> ••., /s-i» /5+1» •'•» fn))* (Щ Очевидно, что размерность каждого из линейных подпространств Ms равна п—lg т. е. на единицу меньше размерности координатного пространства Ln. Докажем, что каждое из Ms можно описать с помощью некоторого линейного однородного уравнения, связывающего переменные Xi, х2, *..9 хп. При этом под. пространство М является пересечением линейных подпространств Ms и может быть описано системой линейных однородных уравнений, составленной из всех
§ 1*ЛЧ Трехмерное пространство. Линейные пространства. Базис 383 линейных уравнений, которые соответствуют каждому из Ms. Остается показать, что всякое Ms (s = £+l, fc+2, ..,, п) можно описать одним линейным однородным уравнением. Очевидно, что к линейному пространству относятся все те и только те векторы координатного пространства Lnt s-я координата которых равна нулю в базисе (16). Другими словами, 'g£Ms&~g = c1fi + c2f2+.i.+cnfn и ^ = 0. (18) Для любого вектора * = (*i, хъ . ■.., хп), x£Ln числа *ь х2, ..., хп являются координатами вектора х в базисе 7i = (lt 0, ..., 0), "?2 = (0, 1, .,., 0), Si., ^ = (0, 0, ,.., 1). (19) Один и тот же вектор в разных базисах имеет различные координаты. Координаты вектора в различных базисах связаны следующими формулами: сг = ацс[+Я21С2 + • • • + атс'п* с2 = а12с[ + а22с2 + .. • + ап 2сП9 сп = ainc'1+a2nC2+ .. • +аппс'п. Действительна, пусть (git g2t *..,gn) и (h^ h2l ...t hn)— два базиса, а (cf, cZf *.., cn) и (c'u c2t ,.., ^ — координаты вектора / в этих базисах. Имеем j = Cigi+c2g2+...+cngnt (21) / = Ci/ii+c2/i2+«^+^rt. (22) Векторы /ii, h2f *»., hnt как и все векторы линейного пространства Lt линейно выражаются через векторы базиса gi, g2> • ••> gn- ->-+-* -»■ ^i = angi + а12#2 + • • • + ai^g** -►-»■-* ~> ^2 = ^lgl + 022^2 + * • • + a2ngm • « « (23) К = anlgi + an2g2 + ... + anngn. -+-*-* -*» -> Подставляя выражения (23) векторов hi, Л2, ..., Л„ через векторы базиса #ь g2> . • ♦ ->■ • ••>£/» в равенство (22), имеем ?= Й (anJi + a12g2 + ... + au'gn) + >{ •+ -+ ->\ (24) + ^2 V^lgl + «22^2 + • • • + ^2ngn) + • • • ».. + cn \anlgi+art2g2 + • • • + anngn) = ~ Wi^i+021^2 + • •. + anlcn) gx + + \а±^1-{-а22с2 +... 4-«/i2qD #2+ • • • • • • + \аьА + ^2п^+ •'-• • +«»»<Wgf««
304 Глаза I*. Линейная алгебра с элементами аналитической геометрии Соотношения (21) и (24) представляют собой два разложения вектора / по базису (ёъ ёъ • • •» en)- Как было показано выше, коэффициенты разложения вектора по базису определены однозначно; поэтому справедливы равенства (20). -> Вернемся теперь к рассмотрению координат произвольного вектора g из линей- -» ->> -» -> -»• -> ного подпространства Ms в базисах (/ь /2, *»., fn) и (еь £2, •••> £«)• В первом из них координаты clf с*» • ••> ^-ъ £$+i> •••» си произвольны, ас5 = 0. В силу равенств (20) координатами xlt x2f .. ,9 хп вектора g подпространства Ms в базисе -» -> -» (elt е2, ..., еп) являются те и только те числа, которые удовлетворяют уравнению д15*1 + ^2SX2 + . . . -j" йп8Хп = 0. (25) Так как линейное подпространство М является пересечением линейных подпространств Ms (s = fc+l, k-j-2, ..., я), то координаты (*ь х2, ..., #«) вектора этого пространства в базисе (elt e2, ..., г„) должны удовлетворять всем уравнениям (25) при s = k-\-lt &+2, ..., /г, т. е. системе уравнений [ «1, £ + 1*1+02, fc + l*2 + • • • +ЯЛ, * + 1*Л = 0> I ^ ft + 2^i + «2, £+2*2 + ••• + ^72, *+ 2*/* = 0» (26) I am*i+ «2^2+...+ a«n^ii = 0f- что и доказывает требуемое утверждение. 5°. Изоморфизм линейных пространств. О п ре делен ие 13. Пусть L± и L2—два линейных пространства над полем /С. Говорят, что эти пространства изоморфны, если существует взаимно однозначное отображение ф: Ьг—*L2 такое, что Vxfy£Lf, Х£/С выполняются равенства ф(* + #) = ф(*) + ф(#)> ф(Лл) = Лф(х). Само отображение ф называется изоморфизмом. Если два линейных пространства Lx и L2 изоморфны, то с точки зрения линейных операций сложения векторов и умножения вектора на число Lx и L2 тождественны. Всякому векторному равенству в одном пространстве соответствует равенство в другом пространстве, построенное с помощью отображения ф (или обратного отображения ф"1, которое так же, как и ф, является изоморфизмом). Поэтому представляет интерес задача изучения линейных пространств «с точностью до изоморфизма». Ответ на вопрос о том, какие конечномерные линейные пространства изоморфны между собой, дает следующая теорема. Теорема 2. Два конечномерных линейных пространства L± и L2 над полем К изоморфны тогда и только тогда, когда размерность Ьг равна размерности L2. Доказательство. Пусть размерности пространств L± и L2 совпадают (например, равны /г), a (flt f2> •.., fn) и (gi, ^Гг» •••» £«) — базисы соответственно в Li и L2. Определим отображение ф: Li—>L2 следующим правилом: пусть х£Ц
§1***2. Скалярное произведение векторов в Rz и его свойства » ♦ 305 разлагается по базису (flt /2, ...» fn)* т. е. * = ci/i +... +cnfn; тогда ф(*) = = c1gi+c2g2+ ... +cngn. Отображение ф определено и притом однозначно, так как любой вектор разлагается и притом единственным образом по базису. При этом ф отображает L± на все L2, поскольку для любого вектора у(£Ь2 найдется такой вектор x£Lly что q>(x)=y: если y = 2jcigi> т0 x — 2jcifh Наконец, ф — i t линейное отображение. Итак, линейные пространства одинаковой размерности изоморфны. Поскольку п-мерное координатное пространство Rn имеет размерность п, всякое я-мерное линейное пространство изоморфно Rn. Обратно, пусть пространства L± и L2 изоморфны. Покажем, что их размер- -*■->-* -> ности совпадают. Пусть (/ь f2f ..., fn)—базис в Llt Система векторов ф(/х), -> -» ф(/г)> • ••> ф (fn) является базисом в L2, поскольку она линейно независима ->-->■-» -> (иначе была бы линейно зависима система /ь /2, ..., fn) и любой вектор у раз- ->->-> -> лагается по ф(/1), Ф(/2), ..., Ф (/«). Действительно, пусть x£L—такой вектор, что ф (#) = #, x~2jcifi> т°гда согласно определению изоморфизма ф имеем #=» = 2 с*ф (//)• Таким образом, количество векторов в базисах изоморфных линейных пространств Li и L2 одинаково, т. е. размерности этих пространств равны. § 1*.2. Скалярное произведение векторов в R3 и его свойства, Аксиоматическое определение скалярного произведения в линейном пространстве. Длина вектора. Расстояние. Неравенство Коши — Буняковского. Угол между векторами. Пространство R". Ортогональный базис. Разложение вектора по базису 1°. Скалярное произведение векторов в R" и его свойства. Трехмерное пространство R3, в котором введена декартова прямоугольная система координат, порождает векторное координатное пространство L3 и скалярное произведение векторов, определенное формулой (2) § 1.2. Аналогично, пространство R", в котором введена декартова прямоугольная система координат, порождает векторное координатное пространство Ln и скалярное произведение векторов, определенное формулой (4) § 1.2. -> -> -* -» Определение 1. Скалярным произведением (а, Ь) двух векторов a, b£Ln, -» -► а—(а1у а2, ,.., ап) и b = (bly Ь2, ..., Ьп) называется число (a, ~b) =a1b1 + a2b2+ ... +апЬп. (1) С помощью скалярного произведения можно выразить длину вектора, расстояние между двумя точками и угол между векторами. -* -» Длина \а\ вектора а — (аи а2, ..., ап) вычисляется по формуле ■ |а| = У (а, а). (2)
306 Глава /*. Линейная алгебра с элементами аналитической геометрии Расстояние р(Л, В) между точками А (а±, а2, ..., ап) и В (р±9 bZt ♦ .., 6Л) равно длине вектора АВ, т. е. р(Л, В) = У(аВ, ^) = ]/"2 (*/-«/)*. (3) Косинус угла ф между векторами а=((ц, аг а„) и b = (pi, b^ 6„) вычисляется по формуле г.оЯф= & *) =— aA+flifti+...+аА . (4) У (а, а) (б, 1) КахЧа!+...+4 K&I + &I+...+бД Скалярное произведение обладает следующими свойствами: 10. (а, *) = (&, а) у?, ?€*■*• 3°. %{а, с) = (Ал, с) уЯ ?€ ^лД € R. 4°. (ai a)^0 v^€ *-• 5о. (а, а) = 0 <Фа = (Г Введем скалярное произведение в абстрактном линейном пространстве над полем действительных чисел как некоторый аналог скалярного произведения (1). I Определение 2. Пусть L — конечномерное линейное пространство. Ска* лярным произведением называется всякая функция f (х, у), определенная в пространстве LxL и принимающая значения из R такая, что: 1°. /&») = ЛйГ* *) V*, у€*- 2°. / (*+^ ?= / (Z *)+/ (£ г~) vxt у, ?£ L. 30. f(Ut 0 = У(*, У) V^jTcL, bgR. 40. /(£ i)^0. 5°. f(£ *) = 0 **?=(?. -»■ -> Часто вместо /(#, г/), как и в случае координатного пространства Lni пишут ->■ ->• (л:, */). В дальнейшем будет использоваться именно эта запись. Задать' конкретное скалярное произведение можно следующим образом. Зы« берем в конечномерном линейном пространстве базис (flt f2t ..., fn) и положим (Ti,7j) = aij (*./=!, 2, ..л), (5) где aij—произвольные вещественные числа, удовлетворяющие условию ay^a-ft» Ддя любых двух векторов х == xji+xJz+ -• • • + *л/л и у = #i/i+y2h + . *.
§'1*.2. Скалярное произведение векторов в ф и его свойства &07 • «•+#я/л ПОЛОЖИМ (х> #)=2a'V*/*/? (6) тогда получим функцию двух переменных х, у, удовлетворяющую свойствам -> -»• 1°—3°. Обратно, всякая функция двух переменных х, у имеет вид (6), где -> -> #// = (//> //)• Можно выбрать числа а/у таким образом, чтобы функция (6) удовлетворяла бы условию 4°. С помощью определения 2 можно ввести понятия длины вектора и угла между векторами: длина \а\ вектора а находится по фор- муле |а|=р (а, а), а косинус угла между векторами а, Ъ £ L — по формуле (а, ?) ' cos ер = v 7 , У(а,а)&Ь) Очевидно, что скалярное произведение (1) в пространстве Ln является частным случаем скалярного произведения, введенного с помощью определения 2. Заметим, что формулой (1) не исчерпываются все скалярные произведения в координатном линейном пространстве Ln. Можно легко построить скалярные произведения, отличные от (1). Например, выбрав в Ln некоторый базис (h> /а» **•> /«)> можно взять в качестве ау=ф, fj) числа . __ ( 1 при * = /, аЧ~~~\ 0 при 1ф\. Тогда функция (6) будет обладать всеми свойствами 1°—5° и, вообще говоря, не будет совпадать с (1). . Для скалярного произведения векторов га и Ь в абстрактном линейном пространстве справедливо неравенство Коши—Буняковского: (а, 6)2<(а, а)(Ь, Ъ). (7) Доказательство. Рассмотрим функцию / (t) = (а-\~Ы^ а+6/) вещественного переменного t. Имеем /(0 = (J,a)+2(a,&)^(M")ft Так как f(t)^0 в силу свойства 4°, то, используя известное свойство квадрат- ного трехчлена, получим (а, Ь)?'<:(а, а) (Ь, 6). . , « . -» -»• Определение 3. Пусть L — линейное пространство над полем R, (#, у) — -> -» -► -> -+■ скалярное произведение векторов х, у из L и (/ь /2> *••* /«)—базис в L. Этот базис называется ортонормированным, если при i Ф и при *?£/♦
Зб8 Глава /*. Линейная алгебра с элементами аналитической геометрии -»• ->-►-* Задача разложения вектора g по ортонормированному базису (/*, /2, •-•*fn) была рассмотрена в п. 5° § 1.2. 2 2°. Вычисление проекции вектора на подпространство. Пусть в линейном конечномерном пространстве L заданы скалярное произведение, линейное подпро- -> ->->-»-»■ странство М и вектор g. Требуется представить вектор g в виде g = giJrg2> гДе -*•-*-*■ ->• -> £г£М, (£ь х) = 0 для любого #£М. Вектор g2 называется ортогональной проек- -> цией вектора g на подпростра ictbo M относительно заданного скалярного произведения. Выберем в М ортонормированный базис (/ь f2, ..., fr). Рассмотрим вектор -* JL -* -* -► ->• ->-► #2= ^ (g> //)//• Легко видеть, что g2£Af и вектор g—g2 ортогонален любому i= 1 вектору #£М. Действительно, если х£М, то *« 2j */// и i= 1 fo g—g2) = S */ (//» #)—2 */ fe. К*) = 0. Таким образом, построенный вектор g2 является проекцией вектора g на подпространство М. 3 3°. Ортогонализация базиса. Существует алгоритм (т. е. система правил), используя который произвольный базис линейного конечномерного пространства можно преобразовать в ортонормированный базис. Такое преобразование называется ортогонализацией базиса. При описании процесса ортогонализации будем использовать решение задачи -> о вычислении проекции вектора g на подпространство М, в котором задан ортонормированный базис. Пусть (hi, h2, ..., hn) — произвольный базис в пространстве L. В качестве первого вектора будущего ортонормированного базиса возьмем /1 = /i1/|/i11. Оче- -»■ -» видно, что длина вектора /х равна 1. Далее, построим вектор /2 такой, что пара -* -*- векторов /i, f2 удовлетворяет следующим условиям: (fi.7i)=l. ?i,fi) = 0, (/i,« = I. (8) В качестве /2 выберем вектор ^_ t2-(ft2, fpfi Г2—— =;—_► _> * lyj |Л> —(Л«, /i)/il "►-*-*-»> -т> Вектор h2 — (h2l fi) fx ортогонален вектору f±: $2-$2, ЪТъ 7i) = (h2i h)-(h2i fi)(Ti, W = 0.
§1*.2. Скалярное произведение векторов в В? и егр свойства 3(# В силу этого вектор h2 — (h2, fi) /i, деленный на свою длину, т. е. вектор /2, удовлетворяет условиям (8). В формуле (9) предполагается, что длина вектора h2 — (h2, /i)/i не равна нулю. Это действительно имеет место, поскольку если бы \h2 — (h2, h)fi\ = 0, то h2 = -~jjz'l} i и система векторов h2t hi оказалась бы /й, К ) линейно зависимой, что противоречит предположению о том, что (/if, Л2, •••»ЛЛ)— базис в L. Третий вектор /3 построим следующим образом. Рассмотрим вектор ->■ -»->-> -»■->-»■ Лз—(из» /i)/i —(&з> /2) /2- Как и выше, можно показать, что этот вектор ортого- -► -» нален векторам /х и /2, а его длина не равна нулю. Положим т»_^ /г3—(**з, fi)h — (h9t /2)/2 i£3-(4 ШхЧ^зЛ^ы' Очевидно, что ° ПРИ !*?' (U-1.8.4 при * = / (Й, 4 ад)=«ГьТ2,?з)). Для завершения процесса ортогонализации применим метод математической индукции. Пусть построены векторы /lf /2, ...,/& такие, что О при * 5?= /, -* -> го <&.//> = { ! при г = / и линейные оболочки систем векторов hlt h2, *.., hk и /ь /2, ..., /^ совпадают: ((Ai» &2> ...» hk)) = ((flt /2, ..., /^)). Построим вектор /ft+i по формуле /Wi=-j £—— — I /= I Легко проверить, что система векторов /i, f2i ..., /#+1 удовлетворяет условиям (10) if ?\=i ° при ^^ Vl'"' \ 1 при * = / (/, /=1, 2, ..., k+l) -►-►-> -> -> -> и при этом ((M2-..u*+i)) = ((/i. /2, •••» /ft+i))- Тем самым заканчивается про- -* -> -> цесс построения ортонормированного базиса (/i, /2 fn) такого, что ({hi, h2, .... /ГА)) = ((7ь Г2. .... W) Д^ *=1. 2, ..., n. Примеры. 1. Используя описанный алгоритм, провести ортогонализацию базиса а!=(1. 1# —1, —1), /k = (3, —1, —1, —1), й3 = (2, —1, 1, —2) подпро-
310 Глава /*. Линейная алгебра с элементами аналитической геометрии странства М координатного пространства Ln> заданного уравнением лг*+#2 + + #з+*4==0* Скалярное произведение векторов #=(*i, x2f x3f х£ и у = = (Уъ У2> Уз, Уд определено формулой (дг, y)=xlyi+x2tj2 + x3y3 + x^. Решение. В качестве вектора /х возьмем hi/\hi[; так как \hi\ = 2t то -+ 1 -*■ /1==;--(1, 1, —1, —1). Вектор /2 находим по.формуле (10) при k=l: «?. Р2 _ ^2 —fe> /l)/i IPil 1^2 —fe fl)/ll Так как (£2, fi) = 2, то p2 = (3, —1, —1, —1)—2 • -1- (1, 1, -1, —1) = = (2, —2, 0, 0), |^2| = 2}/"2 . Следовательно, T^O/T^S) (1, —1, 0, 0). Вектор /3 находим по формуле (10) при &=2: -* -*-*-*■-*■-*-*■-* г"__ Рз _ /»з—№з. fi)fi—(hs, h)h \рг\ |А«-(Аз, h)1i-(h3,\)\\ ' Так как (As< Ti)=l, &, Й) = 3/УТ, то р3 = (2, -1,1, _2)-Ь(1/2) (1, 1, -1, -l)-(3/Vr2)(l//2)(l, -1, 0, 0)=(0, 0,3/2, -3/2), | ^ | = 3 ]/"2/2. Значит, ^=(1//2)(0, 0, 1, -1). Итак, получаем ортонормированный базис в подпространстве М: f± = = (1/2, 1/2, -1/2, -1/2), f2=(l/K2\ -1/^2, 0, 0), £=(0,0, 1/^2-,-1/>^2). При этом (&)) = (£)), (Й, Л2)) = ((/ь К)),т,К Аз» = - «&, £. Те». 2. В условиях примера 1 найти проекцию вектора £ = (4? 3, 2, 1) на подпространство М. Решение. Имеем g = gi+g2, (*) ?«=<£ h)Ti+(g, 72)T2+(?, ft/* (**j где (/i, /2» 7s) —ортонормированный базис в М. Этот базис был найден при решении примера 1. Используя формулу (**), находим 8> = ^i+y=n+Y=% = (U 1. -1, -1)+ +(т- -I- °«°)+0 °> т'-4)-(т-Т' -*• -т)"
§ i*.3. Уравнения гиперплоскости и прямой в Rn ••• . £ц Здесь учтено, что (g, /i) = 2, (g, f2)=l/V"2 , (g, 7з) = 1/1^2 . Вектору является -> ортогональной проекцией вектора g на подпространство М. Это означает, что -»■-»-*■ £2£М и вектор fg—g2 = gi = (5/2, 5/2, 5/2, 5/2) ортогонален любому вектору из М, поскольку (gb /i) = (gi, /2) = (gi, /з) = 0. § 1*.3. Уравнение плоскости в R3 (векторная и координатная формы). Уравнение гиперплоскости в R" (векторная и координатная формы). Прямая в R* (векторная и координатная формы). Линейные многообразия размерности ft в R" 1°. Уравнения гиперплоскости и прямой в R". Множество] точек (#, у, z) £ R3, удовлетворяющих уравнению Ax+By + Cz+D = 09 (1) где не все числа Л, Б и С равны нулю, образует плоскость. Обратно, всякую плоскость в R3 можно задать уравнением вида (1). Уравнение плоскости, проходящей через точку (x0i yQ, zQ) перпендикулярно вектору с координатами Л, В и С, таково: А (Х-Хо) + В (y-yQ) + C (z-z0) = 0. (2) Обратно, по уравнению (1) можно определить вектор, ортогональный плоскости (вектор с координатами Л, В, С или с координатами, пропорциональными Л, В, С, т. е. ЯЛ, ЯВ, ЯС), а также некоторую точку (*<>, у6, z0), через которую эта плоскость проходит [пригодно любое решение уравнения (1)]. Отметим, что левая часть уравнения (2) есть скалярное произведение вектора (Л, В, С) и вектора (х—х0, у—уо, z—z0). Последний вектор может быть изображен направленным отрезком с началом в точке (х0, у0, г0) и концом в текущей точке (х, у, г) плоскости. Уравнение (2) можно записать в виде (e,W) = 0, (3) где а = (А, В, С), Р0 (x0i у0, z0), P (*, у, z). По аналогии с пространством Rz в пространстве R" рассматривают уравнения a1xi + a2x2 + ... + anxn + b = 0 (4) при условии, что не все числа а±, a2l ..., ап равны нулю. Множество всех точек (*!, х2, ..., хп) пространства R7*, которые удовлетворяют уравнению (4), называется гиперплоскостью (линейным многообразием размерности п—1). Гиперплоскость можно описать с помощью скалярного произведения. Пусть Р0 (*?, *2, ям Xn)£Rn. Рассмотрим все точки Р (**, x2, i8., xn)(£Rn такие, что вектор, определяемый направленным отрезком Р0Р> ортогонален заданному вектору a=(ai, а2, .*., ап). Очевидно, координаты точки Р удовлетворяют условию (а,Р^>) = 0, (5)
312 Глава /*. Линейная алгебра с элементами- аналитической геометрии или в развернутом виде а± (*i— х\) + а2 (х2 — х°2)+ ... + ап (хп— 4) = 0. Уравнение гиперплоскости можно записать и в другой форме. Множество векторов Р0Р, удовлетворяющих уравнению (5), является линейным простран- ством —подпространством в Ln. Пусть (bl9 b2, ..., &n-i)—базис этого пространства (очевидно, что размерность пространства равна п—1). Далее, пусть р0 и р — векторы, определяемые соответственно направленными отрезками ОР0 и ОР, где О—начало координат в R". Тогда уравнение (5) эквивалентно уравнению P = Mi + M2+ ... +*и-1*,|-1 + А». (6) где h, t2i *.., /w_£ — произвольные вещественные числа. Очевидно, что при изменении h, t2, ..., tfw-i независимо друг от друга от — оо до -foo точка Р (конец направленного отрезка ОР) опишет гиперплоскость (5). Уравнение (1) плоскости в R3 называется координатным, а уравнение (3) — векторным. Аналогично, уравнение (4) гиперплоскости называется координатным, а уравнение (5)—векторным. Пусть в Rw дана точка Р0 (х%, *?, ..., х%) и вектор а=(а±, а2> ..., йп). Эти исходные данные определяют прямую в R", т. е. множество точек Р (xl9 —> х%, ..., хп) таких, что направленный отрезок Р0Р принадлежит вектору, кол- ->■ линеарному а. —». Пусть Р (хь х2, ..., хп) — текущая точка прямой. Координаты вектора Р0Р имеют вид (*f — x\t х2—х\, ..., хп — х°п). По условию векторы PQP и а колли- неарны. Это значит, что числа хг—*?, x2 — xl, ..., хп—х£ и a*, a2i ..., a„ пропорциональны: (*i — *!)/ai = (*а — *°)/a2 = ... = (*„ — 4)/fl« • (7) Обозначив общее значение дробей (7) через t, запишем уравнения (7) в виде xx — ait + xi, x2 = a2t-\-xl, ..., xn = ant + x°n. (8) Это — уравнения прямой в R": им удовлетворяют точки прямой, проходящей -> через точку Р0 в направлении вектора а, и только они. Уравнения (8) называются уравнениями прямой в параметрической форме: для любого —оо < t < оо они определяют п чисел — координат текущей точки' прямой. -*■ -*■ Пусть х и х0 — векторы, определяемые соответственно направленными отрезками ОР и 0PQ (О—начало координат в R72). Тогда равенство (8) можно записать в виде -> -> -»• x = at+x0 (9) {векторная форма уравнения прямой).
§ 1*.3. Уравнения гиперплбскости и прямой в Rn 313 I 2°. Линейные многообразия размерности k в R*. Уравнения прямой {9) и плоскости (6) можно обобщить, рассматривая в Rn множества точек, удовлетворяющих уравнению p = a1ti + a2t2+... + aktk-\-p0l (10) где P(xt, x2i 48i, xn), P0(xl, х%, ..., хп) — точки из R72; векторы р и р0 определяются направленными отрезками ОР и ОР0; векторы а*, а2, ..., я& линейно независимы; переменные tt, t2, ..., tk независимо друг от друга принимают все вещественные значения от —оо до + оо. Такое множество точек в R* будем называть k-мерным линейным многообразием в Rn. С этой точки зрения прямая является одномерным линейным многообразием, а гиперплоскость —(л—1)-мерным линейным многообразием. Отметим, что множество векторов вида ai/i + a2^2 + •• -+яЛ является линейным пространством—подпространством линейного пространства Ln. Как известно (см. теорему 1 § 1.1), всякое линейное подпространство в Ln описывается системой линейных однородных уравнений. Это значит, что числа х1—х\, x2 — — *2> *.., хп — Хп удовлетворяют некоторой системе уравнений вида ( aa(Xi—x\) + а12(х2-х°2) +...+«i«(^ — x°n)=0, I a2i(xi—xi) +a22(x2—xt) + .. .+а2п (хп— л£)=0, ( a»-ft, i (xt—.xb+an-k, 2 (х2—х°2)+ ... + aw_*, „ (^—^=0. (11) Следовательно, числа #i, х2> ..., хп удовлетворяют некоторой системе линейных (неоднородных) уравнений aii*i+ (ц2х2+...+ а1пхп= Ъ±, a2LXi-j- 022*2+••• + агпХп~ b2t (12) где an-kt i*i + 0/i-*, 2*2+• •• + <*«-*, пхп= &«-*> bi = «11*1+ «12^2+...+ CLinXn, b2 = a2i*i + ^22*2 + ... + a2nXn, bn-k = an-k, Л + Я72-*, 2*2+ . ..+fl/i-*f nXn- Отметим, что не всякая система уравнений вида (12) определяет ^-мерное линейное многообразие. В § 1*.9 будет показано, что система линейных неоднородных уравнений определяет ^-мерное линейное многообразие тогда и только тогда, когда ранг матрицы системы равен п—k. 2 3°. Расстояние от точки до гиперплоскости в R". Пусть в R" задана точка Р0 (#ь х2> ..., хп) и гиперплоскость Mt определяемая уравнением a1Xi-\-a2x2+ ,,.+апхп—Ь = 0. (13>
314 Глава /*. Линейная алгебра с элементами аналитической геометрии Рассмотрим вопрос о вычислении расстояния от точки до гиперплоскости (13). Расстоянием между точкой и гиперплоскостью будем называть min[P0P|, где Р£М, т. е. минимальную из длин векторов, определяемых направленными отрезками Р0Р, где Р0 — заданная точка, а Р—произвольная точка гиперплоскости М. Спроектируем вектор Р0Р на одномерное линейное подпространство {(а±, а2, «•. *.., an))t состоящее из всех векторов, координаты которых пропорциональны числам at, a2i .*., ап. Имеем ?o?=ft+ft. (14) где вектор щ принадлежит подпространству (fa, а2, .,,, ап))9 а вектор g2 ортогонален gt (см. п. 2° § 1*.2). При этом -* _ (Р"0Р, а)а . £i — цг-ц. 9 (15) (а, а) или, в более подробной записи, gi = №i fa—xl) + a2 (x2 — х\) + .. 4 + а„ (*„—4)] ■ (а, а) (Щ ,i 0 0 (К Я :(&—«Л—а2*2— »•« —Я/Л) -> -> • (а, а) Здесь использовано равенство (13), справедливое для любой точки (х±, х2§ ••• *.., х„)£М. Итак, -*■ -*■ —>- -*• Векторы gi и gi=P0P—gi ортогональны: (<Г, а) £ Г)? Квадрат длины вектора Р0Р равен сумме квадратов длин векторов gi и P0P—git так как (Р0Р, P0P)*=(gi+gb fifi+fif2) = tei. ft) + fe«. £2). Как видно из равенства (16), вектор gi (и квадрат его длины) не зависит от точки Р, поэтому минимум квадрата длины вектора Р$Р достигается цри g2 = 0,
§ 1*.3. Уравнения гиперплоскости н: прямой в Rn 315 Тогда P(>P = gi и расстояние d от точки Р0 до гиперплоскости М равно fei» £i)= /-^-^ • У (а, а\ Окончательно получим d = 1 aixl + a2X2+ .;. +апХп—Ь\ (17) Множитель 1/К fli + a|+*..+«п называется нормирующим множителем уравнения (13) гиперплоскости. Числитель в правой части формулы (17) есть абсолютная величина результата подстановки координат точки Р0 (#?, xl,...9 *л) в левую часть уравнения (13). Частным случаем формулы (17) являются формулы, выражающие расстояния от точки до плоскости в R? и от точки 'до прямой в R2. 3 4°. Расстояние между двумя скрещивающимися прямыми в R3. Пусть в R3 заданы две прямые 1± и /2, определяемые соответственно уравнениями xi = ait + + *i1), x2 = a2t+x21\ х^^а^ + хз* и *i = W + *i2\ x2=:b2t+x22\ x3=a3t+x32)* Требуется найти длину общего перпендикуляра к этим прямым. Прямая 1± проходит через точку (^i1}, х2г), #31}) в направлении вектора а = = (ai, a2t a3)t а прямая /2 — через точку (#i2\ х22\ х(32)) в направлении вектора b=(bi, b2i b3). Составим уравнение плоскости, проходящей через точку (х^\ x(z1}* #2 ) параллельно векторам а и Ь: 1 v v(1> ai 1 Н х2—х2 а2 h Y V(1> I Хз—х3 «3 h \ =0. (18) Длина общего перпендикуляра равна расстоянию от точки (xi2*, х^, xffi до raioci кости (18). Используя формулу (17), имеем 1 <*=T v(2) v(l) Хх —Xi Qi h л 2 —X2 a2 *2 42)-41> a3 h где l/N—нормирующие множитель, равный 1 1 N i/|«i a2 ; У \b± b2 2+\c*i «з|2 + «2 «3 b2 b3 \bi b3\ Примеры. К Найти расстояние от точки (1,, 1, 1, 1) до гиперплоскости Xi+2x2+3x3 + 4x*~ 2=Q. W
Глава I*. Линейная алгебра е элементами аналитической геометрии Решение. Нормирующий множитель уравнения (*) есть 1^1 + 4 + 9+ 16' = "^30. Искомое расстояние вычисляем по формуле (17): i=r-|bl+2.1 + 3.1 + 4.1 —2| = -JL.. ^"30 ' ^ }^30 2. Найти расстояние между прямыми *i = * + 2, x2 = 2t — 3, *3 = — / + 4 (1г) и л:, = — ^ + 1, *2 = 2/ + 3, x3 = t — 2 (/2). Решение. Составим уравнение плоскости, проходящей через точку (2, —3, 4) параллельно векторам (1, 2, —1) и (—1, 2, 1): Xi — 2 #2 + 3 #з—4 1 2 —1 —1 2 1 =е, или (#£~2)(2 + 2) + (#2+3)(1~1) + (#з-4)(2+2) = 0# или Х£+*8 —6 = 0. (*) Расстояние от точки (1, 3, —2) до плоскости (*) (равное расстоянию между скрещивающимися прямыми'/х и /2) находим по формуле (17): d^-^zA 1—2 —6| =* __ 7 "71' § 1*.4. Линейные операторы и матрицы. Линейный оператор и матрица оператора в заданном базисе пространства R". Сложение операторов, умножение операторов на число, произведение операторов и соответствующих матриц 1°. Линейные операторы. Матрицы линейных операторов I Определение 1. Линейным оператором А из линейного пространства L в линейное пространство М называется отображение A: L -± М, удовлетворяющее -»-»• -> -» -> ->-»-»• следующим условиям: А(х+у) = Ал:+Ay; A(kx) = kAx v*, y£L, уЯ^/( (/(означает поле, над которым заданы линейные пространства L и М). Если линейные пространства L и М совпадают, то говорят, что линейный оператор А действует в пространстве L. -*■ -> -> -► Определение 2. Пусть А —линейный оператор, (Д, f2, •••» /п) и (gi# ->• -> ^2t •••» ёт) — базисы в пространствах L и М соответственно. Разложим векторы
§ 1*Л; Линейные операторы и ~ матрицы 317 A/i, А/2| ..., Afn^M по базису (gi, g2l 4.., gm): A/i = augi + a21g2+ ... +amigmf A/2 = «12^1+ «22^2 + • *. +am2gm> Nn = CLlngi + <*2ng2 + • • * +Я/Ял£/Я- Матрицей линейного оператора А, соответствующей базисам (fi, f2l iiif fn) и -*■ -> ->. feb g"2. ..-> gm) линейных пространств L и M, называется прямоугольная (размера пхт) таблица чисел f ад «12... ои' a2t a22 ... а2п <ami am2" *атп * Если линейные пространства L и М совпадают, то базисы (fi, f2, .*** fn) -> -> -> и fei» fife» •••» gm) обычно выбирают совпадающими. В этом случае говорят о квадратной матрице линейного оператора А в линейном пространстве L, соответствующей базису (fi, f2, ..., fn) (см. определение 2 § 1.4). Определение 3. Суммой линейных операторов A: L^M и В: L-+M называется линейный оператор, обозначаемый А+В и определяемый формулой (А + В) х=Ах+Вх vx£L. О преде лен ие 4. Произведением линейного оператора A: L -+■ М на число X называется линейный оператор, обозначаемый ЛА и определяемый формулой -*• -> -> (ЬА)х = к(Ах) \fx£L. Опреде ленив 5. Пусть L, М и Л/"—линейные пространства и A: L -> М, В: М-+N—линейные операторы из L в М и из Л1 в iV соответственно. Произ* ведением линейных операторов А и В из L в iV называется линейный оператор, обозначаемый ВА и определяемый формулой (ВА)* = В(А*) yx£L. В частном случае, когда пространства L, М и N совпадают, каждый из линейных операторов А, В и ВА действует в пространстве L. Определение 6. Суммой матриц А — (a(j) и В — (Ьц) размера пXт называется матрица С = (с,«у) размера пхт, определяемая формулами су = ау+ + bu (i'=l, 2, .... /г; /=1, 2, ..., т). Определение 7. Произведением матрицы А = (а/у) размера пХтначисло Я^/С называется матрица C = (C{j) размера пхт, определяемая формулами с/у = а=Ял/у (i = l, 2, ..., л; /==1, 2, ..., т). Определение 8. Произведением матрицы А — (aij) размера nxk на мат* рицу B — ipij) размера kxm называется матрица C—(Cij) размера nxmt опреде- к ляемая формулами с/у= 2 ais^sj (' —U 2, ..., п; /=1, 2, *.., т). s= 1
318 Глава I*. Линейная алгебра с элементами аналитической геометрий 2 Как вытекает из определений, множество Mat (я, К) всех квадратных матриц порядка я над полем К обладает следующими свойствами: 1°. уЛ, В gMat (я, К) A + B£Mat(n, К). 2°. А + (В + С) = (А + В) + С уЛ, В, CgMatfa, К). 3°. 3o€Mat(n, /Q|v^€Mat(/i, К) 0 + Л = Л. 4°. уЛ^МаЦя, К)ъА'\А-\-А' = 0. 5°. А + В = В + А у/А, B£Mai(n, К). 6°. уЛ^Ма^я, К), v>vg/( ЯЛ £ Mat (я, К). 7°. Х(А+В)=ХА + ЬВ уЛ, SgMat(/i, К), уЯ^/С. 8°. (Я+^i) Л = ЯЛ+ ^Л уЛ^МаЦя, Я), уЯ, ц^Я. 9°. Я (\iA) = (Я^) Л у Л gMat (я, /С). 10°. VЛ,БgMat (/г, К) AB^Mat (я, /С). 11°. Л (Б + С) = Л5 + ЛС, (В + С)Л = ВЛ + СЛ уЛ,ВгС^Ма! (п, К). 12°. Л(ЯБ)==ХЛВ, (ЯЛ)£ = Я(ЛЯ) УЛ,В£МаЦя, /С), УЯ^К. Свойства 1°—9° означают, что Mat (я, /С)—линейное пространство над полем /Г. Свойства 10°—12° означают, что в Mat (я, К) определено умножение элементов, дистрибутивное по отношению к сложению (свойство 11°). Если в некотором линейном пространстве L определено умножение элементов, обладающее свойствами 10°—1.2°, то говорят, что задана алгебра L над полем /С. Таким образом, линейное пространство Mat (я, К) является алгеброй над К относительно операций сложения и умножения матриц (роль 0 в свойстве 3° играет нулевая матрица, т. е. матрица, все элементы которой равны нулю). *' ' Алгебра Mat (я, К) обладает кроме перечисленных общих свойств, присущих каждой алгебре, следующими важными свойствами: 13°. А(ВС) = (АВ)С уЛ, В, CgMat (я, К) (свойство ассоциативно сти умножения). 14 . д£| уЛ ЕА — АЕ = А (существование единицы). Действительно, в качестве Е в свойстве 14° можнр взять матрицу, Алгебра Mat (я, К), обладающая свойствами 13° и 14°, называется ассоциативной и униталъной (т. е. алгеброй с единицей). Умножение матриц в Mat (я, К) не обладает свойством коммутативности. Иными словами, АВ и В А, вообще говоря, различны. Определение 9.-Матрицей, обратной квадратной матрице Л, называется матрица, обозначаемая Л~* такая, что А~гА=Е% где Е = I С) I (единичная матрица}. \ 'J
§1*А Линейные операторы и матрицы 319 2°. Некоторые соотношения алгебры матриц 1. Пусть матрица S имеет вид и все 7„j, %2t Sis, Я„ различны. Установим, какие матрицы перестановочны с «S, т. е. каковы матрицы Т9 удовлетворяющие условию ST = TS. Пусть T={tij)y тогда (sf)ij = Xitij, (ts)ij = tijXj (i=l, 2, iie, л; /=1, 2, ..., л). (2) Для того чтобы выполнялось равенство ST — TS, т. е. (st)i/=(ts)ip необходимо и достаточно, чтобы М/у = ^7^у Если i Ф j, то //у=0. Таким образом, матрица Г—диагональная, т. е. имеет вид 7= Для всякой матрицы Т, отличной от (3), ST ф TS* 2. Рассмотрим умножение произвольной матрицы fait ai2 «* * а±п Д __ [ a2i a22 * * * Я2л (3) Л»1 ат2 •«• ая слева и справа на матрицу (4) где число \ находится на, пересечении i-й, строки и /-го столбца ЦФ!)> а все остальные недиагональные элементы равны нулю. Умножив матрицу А размера mXft на матрицу S размера mXm слева, имеем fa±i i.. #12 «*. #i« 5Л=( ац+Xaji ..> аь + Ка/2 ... ain + %ajn ]. (5) ^wl • • • Я/Л2 * • • amn Таким образом,- матрицу SA можно получить из A q помощью следующего преобразования: к i-й строке матрицы А прибавляется /-я строка, умноженная на X, а остальные строки матриц SA и А совпадают.
320 Глава /*. Линейная алгебра, с 9ммттами,дшицщической.геометриц Аналогично, умножив матрицу А размера тХп на матрицу «S размера пХп справа, имеем /ад ».. aiib + a±j Si. afn\ AS=\ ^21 '" а^~^аУ ••• a2n \ щ \ami ... amiX + am/ ... amn/ Значит, матрицу AS можно получить из матрицы А следующим образом: к /-му столбцу матрицы А прибавляется i-й столбец, умноженный на X, а остальные столбцы матриц AS и А совпадают. 3. Преобразование матрицы Л, состоящее в перестановке строк или столбцов, можно произвести с помощью умножения матрицы А слева или справа на матрицу S, определяемую, следующим образом. Пусть (/ь /2, •••> /^ — перестановка из т символов 1, 2, ..., т. Положим (1 при /=/*, 5*'-\0 при 1фгн (/, Л=1, 2, ..., т). *\ Элементы s^j определяют матрицу S. При этом матрица SA (размера тХп) получается из матрицы А (размера тхп) перестановкой строк (ix, i2t ..., im), т. е. k-я строка матрицы А есть /^-я строка матрицы SA. Пусть (/ь /а» •••» /^ — перестановка из л символов 1, 2, ..., п. Положим /1 при £=/„ да ^-\0при^/г. . (8) Элементы s^t определяют матрицу S. При этом матрица AS (размера тХп) получается из матрицы А (размера тХп) перестановкой столбцов (/ь /2, ..., jn)t т. е. &-й столбец матрицы А есть /#-й столбец матрицы 5Л. Итак, мы рассмотрели умножение произвольной матрицы А слева и справа на матрицы вида (1), (4), (7), (8). Преобразования матрицы Л, полученные в результате такого умножения, называются элементарными. При этом нетрудно проверить, что матрицы, обратные матрицам вида (1), (4), (7), (8), имеют тот же вид. 4°. Теоремы о матрицах линейных операторов. Теорема 1. Пусть: А, В — два линейных оператора в линейном пространстве L\ X—произвольное число; (/i, /2,.*« «*•» /«) — базис в L; A = (aly)1 B = (b(j)t /, /=1, 2, ..., п—матрицы линейных операторов А, В в заданном базисе. Тогда в этом базисе: 1) матрица линейного оператора А + В есть А-\-В\ 2) матрица линейного оператора КА есть ХА% 3) матрица линейного оператора А В есть АВ. 3 Доказательство. 1) Имеем (А + В)К- = АК-+В?^2^-+2^в =2 (*//+*//)?/. /==1>2— п- w Здесь использованы определения суммы линейных операторов и матрицы линейного оператора. Равенство (9) означает, что на пересечении *'-й строки и /-го столбца матрицы линейного оператора А + В в базисе (/ь /2, ..., /«) находится число 0// + £/у» т. е. эта матрица имеет вид А + В.
-fl*А. Линейные операторы и матрицы ^ 321 2) Находим (ЯД)?/ = Я (kU) = % 2 ajtf/ = 2 (Ялу/) /у. (Ю) Здесь использованы определения произведения оператора на число и матрицы линейного оператора. Равенство (10) означает, что на пересечении i-й строки -»■-»• -> /-го столбца матрицы линейного оператора АА в базисе (/i, /2, ...»/«) находится число Ял/у, т. е. эта матрица имеет вид ЯЛ. 3) Находим ABfi = А 2 *//?/ =22&//я*/* = 2 (%акуьЛ%. / /* * \ / У (И) Здесь использованы определения произведения линейных операторов и матрицы линейного оператора. Равенство (11) означает, что на пересечении, k-ft строки и 1-го столбца матрицы линейного оператора АВ в базисе (fi,J2> ••♦> fn) находится число Z^abfojii т. е., согласно определению произведения матриц, искомая матрица имеет вид АВ. Теорема 2. Пусть: А—линейный оператор в линейном пространстве L; (fi, /2» • ••> fm) —базис в L\ А — (а/у)— матрица линейного оператора А в базисе Vi. /2»».«» //я); g—вектор из L; g = clfl-\-c2f<i +.. .+cmfm — разложение этого вектора по базису (/ь /а» • ••> //»)• Гогда если разложение вектора Ag no базису (fi» /2, **** /я») шю*т вид то коэффициенты этого разложения выражаются через с±, с2, «,** ст и (aij) еле* т дующим образом: hi= 2 <*//?/ (/=1, 2, ..., т). 4 Доказатель ство, Находим Ag=A {c1f1 +с/2+ .,« +сХ) =*• =<* 2 a*if* +<?2 2 я*/* + • • • +ст 2 Д*/я7* = = 2 (cikiCi+ЧчРг +... + ашст) Tk (12) (здесь использовано определение матрицы линейного оператора). Равенство (12) означает, что коэффициент-при fk в разложении Ag по 7ь 7г> • •.» 7т равен 2a^kjcj> что и требовалось доказать. % 11 № 2636
322 Глава /*. Линейная алгебра с элементами аналитической геометрии* § 1*.5. Сопряженный оператор. Сопряженная матрица. Самосопряженные операторы и симметрические матрицы. Ортогональные матрицы 1°. Сопряженные операторы. Рассмотрим конечномерное линейное пространство L и множество L* линейных функций, определенных в L и принимающих числовые значения, т. е. функций а(х), удовлетворяющих следующим условиям: <х(х+У)=а(х) + <х>(у) V?, ~У$Ц :' а (Хх) = Яа (*) vx£L, у%£К. Как отмечалось ранее, множество L* является линейным пространством (над тем же полем /С, что и L) относительно операций сложения линейных функций и умножения линейных функций на число из поля К: (а + Р)* = а* + Р* уа, P£L*, ^L; (ka)1c = X(ax) yag^*, V«*€L» ¥*•€#• Пусть в пространстве L задан линейный оператор А. Этот оператор порождает линейный оператор А*, действующий в L* по следующему закону: (А*а)*=а(А*) agL*, ~x*£L. (3) On ределение 1. Пусть L — линейное пространство над полем К и L* — сопряженное к L линейное пространство. Пусть, далее, А — линейный оператор в L. Линейный оператор А*, действующий в L* по закону (А*а)* = а(Ак), (4) называется линейным оператором, сопряженным к Л. Лемма 1. Если линейное пространство L* сопряжено линейному прострет» ству L, то линейное пространство L изоморфно линейному пространству\ сопря* женному к L*, т. е. L изоморфно (L*)*. -»■-»• -*■ Доказательство. Пусть (/ь f2, ..., fn) —базис в L. Рассмотрим мно* жество линейных на L функций о&ь «2> • ••> ал> определяемых формулами ^)-{oSKW;U-i.a.....«. (5> Это система линейных функций (элементов пространства L*) линейно независима. Действительно, пусть Ciai+c2a2+ ...+^a« = 0. (6) Вычислим значение левой части равенства (6) при x — fi (*=1, 2, . iS, л). В силу формул (5) получим с/ = 0 (*= 1, 2, .. ., л). Таким образом, единственная линейная комбинация векторов аь а2, • • •> ал££*, равная нулю, является тривиальной. Это и означает, что система ab a2, ...,ая линейно независима. Покажем, что всякая линейная функция у, определенная на L, является линейной комбинацией функций aXt a2, ..., <хп. Рассмотрим значения функции у
§ 1*;5. Сопряженный оператор. Сопряженная матрица 323 на векторах базиса (fb f2, • ••> fn) линейного пространства L. Пусть y(h) = ai, 7(?2) = я2, ..., 7(7„) = ая. (7) Тогда значения линейной функции агаг + а2а2 + ... + «паЛ (8) на векторах базиса совпадают со значениями функции у на этих же векторах. Так как у и функция (8) являются линейными, то их значения совпадают на каждом векторе из L, т. е. эти функции совпадают: у = агаг + ааа2 + ... + апап. (9) Итак, система а*, а2, ..., ссп является базисом в L*. Базис (otf, otg, 5ii, а„), удовлетворяющий условиям (5), называется двойственным сопряженным {дуальным) к базису (/х, /2, ..., /„). В частности, линейное пространство L*линейных функций, определенных на n-мерном линейном пространстве L, является п-мерным линейным пространством. Линейное пространство (L*)*, сопряженное к n-мерному пространству L*, в силу отмеченного выше, также является п-мерным. Определим отображение <p:L—► (/,*)• (10) следующим образом. Каждому x£L поставим в соответствие линейную функцию на пространстве L*. Для этого каждой линейной функции a£Z/*, определенной на L, сопоставим число а—>а(х). (11) Формула (11) задает элемент из (L*)», соответствующий x£L, т. е. <р(х). Определенное с помощью формулы (11) отображение (10) является линейным. При этом <р(*) = 0 только при #=0: если х Ф 0, то можно найти такую линейную функцию а на L, что a (x) в правой части отображения (11) не равно нулю. Рассмотрим систему п векторов <p(/i), <p(f2), ..., Ф (fn) B пространстве (L*)*. Эта система является линейно независимой. Действительно, пусть ПФ <М + ЗД (Т2) + . • • +СпЧ> (fn) = 0. (12) -» -» -» -> -> -> Тогда из равенства (12) имеем ф (c1fi + c2f2+ ... + ^J п) = 0. Так как ф(*)=0 только при х = 0, то ^jc/// = 0. В силу линейной независимости системы векто- ров /lf /г, ..., fn это возможно лишь при сх = с2= .. .=с„ = 0. Итак, система /г векторов ф(/1), Ф^2)> ...» ф (fn) B n-мерном линейном пространстве линейно независима, поэтому она является базисом в \L*)*, а отображение ф — изоморфизмом линейных пространств L и (L*)*. Таким образом, доказано, что линейное пространство, сопряженное.к L*, изоморфно линейному пространству L и, кроме того, явно определен этот дзо* 11*
324 / Глава /*. Линейная алгебра с элементами аналитической геометрии морфизм. Следовательно, при отождествлении <p:L—► (L*)* можно считать, что линейные пространства L и L* взаимно двойственны. Линейное пространство L** называют вторым сопряженным пространству L$ а изоморфизм (10) — естественным изоморфизмом пространства L на второе со* пряженное пространство. Докажем теперь следующее утверждение. Лемма 2. Пусть линейный оператор А действует в линейном пространстве L; оператор А*г сопряженный к А, действует в сопряженном пространстве L*, оператор А**, сопряженный к А*, действует в пространстве L**, сопряженном к L*; Ф — естественный изоморфизм (10) линейных пространств L и L**. Тогда для любого x£L имеет место формула А**ф(*) = фА(х). (13) Доказательство. Согласно определению изоморфизма ф, ф(х) является элементом пространства L**, т. е. линейной функцией, сопоставляющей каж- -* -> -* дой линейной функции а от x£L число &(х)\ поэтому фА (*) — линейная функ- -» -* ция, сопоставляющая каждой линейной функции а от x£L число а (Ах), т. е. а—► а (А#). В этом состоит смысл правой части равенства (13). Рассмотрим теперь левую часть равенства (13). По определению, ф (#)— элемент пространствах**, т. е. линейная функция, сопоставляющая каждой ли- -»• ->• -> нейной функций а от x£L число а(х): а—>а(х). Действие сопряженного оператора на линейных функциях описывается формулой (4). Поэтому (А*)* ф (х) есть линейная функция ф(#), вычисленная от аргумента А*а. Эта последняя функция (определенная на L*) в силу формулы (4) равна а (Ах) на каждом векторе x£L. -»• -> - ' Итак, А**ф (х) — а (А*) и справедливость формулы (13) доказана. Если отождествить элементы пространств L и L**, соответствующие друг другу в силу естественного изоморфизма ф, то формулу (13) можно истолковать как утверждение о том, что оператор (А*)*, сопряженный А*, совпадает с А и линейные операторы А и А* взаимно двойственны. Лемма 3. Пусть линейные операторы А и В действуют в линейном пространстве L, а А* и В*—операторы, сопряженные соответственно А и В. Тогда (АВ)* = В*А*. . (14) Доказательство. Рассмотрим левую часть равенства (14). Пусть x£Lf &£L*. Используя формулу (4), имеем • , [(АВ)*а]Й = а(АВ^. (15) Далее, раскрывая правую часть равенства (14), получим (А#а)* = а(А*), [В*( А*а)]*=(А*а) (В"*) = а (Ав£). (16) Таким образом, справедливость формулы (14) доказана. -
£ /*.Д. Сопряженный оператор. Сопряженная матрица 325 2°. Сопряженные линейные евклидовы пространства, и сопряженные операторы, действующие в евклидовых пространствах. Пусть линейное конечномерное пространство L над полем вещественных чисел R является евклидовым. Это озна- чает, что в L задана билинейная функция (я, у), называемая скалярным произведением и обладающая следующими свойствами: 1°. (*,*) = &. *). 2°. ((* + У), *) = (*, ?) + &?). 3°. (Я*, */) = Ч*> «/). 4°. (*, х)^0. 5°. (*, лО = ОФФ* = 0. Для любого евклидова пространства L существует естественный изоморфизм ф: L—> L* между L и L* (сопряженным к L). А именно, справедлива следующая теорема. Теорема 1. Для евклидова пространства L отображение ф: L —* L*, опре* деляемое формулой Ф (*)#=(*, 7). *. #€L> ф (*)€*<*» (17) г& (#, у) —скалярное произведение в L, является изоморфизмом между L и L*. Доказательство. Отображение (17)—линейное. Действительно, ; Ф((*1+*2)#)=(*1+*2, у)==(хъ y)+(xi,y)=q>(xi)у+ч(х2)у% ф (be, у) = (A,*, #) = А,(*, #) = Я,ф(*)*Л Линейная функция ф (л:) на линейном пространстве L, определяемая формулой -► -»■ -► (17), равна нулю только тогда, когда х = 0. В самом деле, если (х, у) = 0 при -»• -> -■»■->■ любому и фиксированном х> то, в частности, (я, л;) = 0 и вследствие свойства 5°, *-> -> -+-+-* -*■ -> Докажем, что если (/ь f2, ..., f„)— базис в L, то система ф (fi), ф (/2), *** -> -»■->->-> Ь ., Ф (/„) линейно независима в L*. Пусть схф (/х) + с2Ц> (А2) + • • • +спЦ> (fn) = 0. -> -»■ -» -»■ -»-» -> ^* Тогда ф(с^1 + с2/:2+,-• •+^«/:п) = 0 и так как из ф(*) = 0 следует, что * = 0, то ,->->•->•>, -*> ^1/1 + ^2/2+ • • • +сл/л = 0- Отсюда в силу линейной независимости векторов /ь -> -> /2» • ••»/«£ £ получим гх—с2 = •.. =с„ = 0. Следовательно, система векторов ф (/i)> Ф (/2)» •••» ф (fn) линейно независима в L*. Как известно, размерности пространств L и L* одинаковы, поэтому система -» -» -> из л линейно независимых векторов ф (fx), ф (f2), ...» ф (fn) B ^* является базисом. Итак, образ отображения ф совпадает со всем пространством L* и ф* —изоморфизм линейных пространств. Теорема 1 устанавливает естественный мзоморфизм L и L* как линейных пространств. Однако можно говорить и об изоморфизме L и L*. как евклидовых,
326 Глава I*. Линейная алгебра с элементами аналитической геометрии пространств. Для этого введем в L* скалярное произведение, определяемое формулой (а, Р) = (ср->а, ср-ЧЗ) Va, pgL*. (IS) Очевидно, что скалярные произведения соответствующих пар элементов из L и L* одинаковы, что и означает изоморфизм L и L* как евклидовых пространств. Отождествляя элементы из L и L*, соответствующие друг другу при естественном изоморфизме ф, можно дать другое определение сопряженного оператора. Определение 2. Пусть L — евклидово пространство и А—линейный оператор в L. Линейный оператор А*, удовлетворяющий условию (АЧ^ = £,А^) (19) для любых х9 y£L, называется линейным оператором, сопряженным исходному линейному оператору А относительно скалярного произведения (18), заданного в евклидовом пространстве. I Докажем существование и единственность оператора А*, удовлетворяющего свойству (19) о -*• -* -*• -*» Выражение (#, Ау) при фиксированном х и переменном у является линей- ной функцией от у, принимающей вещественные значения. Как следует из теоремы 1, любая такая функция может быть единственным образом записана в виде ->->-* ~> -* (z, у), где г — некоторый вектор из L (зависящий от х). Покажем, что z зависит от х линейно, т. е. что z (хг-\-х2) = z (хг) + z (х2) и z (Хх) = Xz (x) для любых хи *г» *€^> Я£Я. Имеем И5.У)=£АЙ. (20) Если * = *i + *2. то „у у nAi -л, V му .у у ..„jy ...у „, у ^ у - у | у (2(*! + л:2), у) = (Х!+х2,Ау)у т. е. (г(*! + д:2), I/) = (лг^ Ay) + (xt Ay). Согласно определению z(#), находим (xi, Ay) = (г й), #); (х2, А*/) =Т* (*2), "у). Таким образом, z (x\ + x2,1) =7* (*i> +^ Й), У) (21) -*->-►-*-►-*'-*' -> и z(xi-\-x2) = z(xi) + z(x2)t поскольку равенство (21) справедливо при любом у. Аналогично, если x = Xxi, то из соотношения (20) получаем £(Й, #) = (**, Ау) = Я&, Ау) = Х(г£}9 у) = (& (*), j/)t -» -*• ->• -► откуда г (Яд;) = Яг (л:). Итак, мы показали, что z (х) — вектор, линейно зависящий от х, т. е. z—линейный оператор в L, однозначно определенный условием (19). Введем обозначе- вне А*=ги назовем А* линейным оператором, сопряженным линейному опера*:
§ 1*.6. Определители п-го порядка и их свойства 327 тору А относительно скалярного произведения, заданного в евклидовом пространстве L. Определение 3, Пусть L—евклидово пространство и (х, у) — скалярное произведение векторов х, у в L. Линейный оператор А в L называется самссо- пряженным, если для любых х, y£L справедливо равенство (А?, у) = (Х Ау). (22) Теорема 2. Пусть А и А* — сопряженные друг другу линейные операторы в п-мерном координатном евклидовом пространстве Еп\ (fi, /2> •••» /«)—ортонор» мированный базис в Еп, А = (а(у) и А* = (ац)—матрицы, соответствующие one» риторам к и А* в этом базисе. Тогда я// = <й (*» /=1. 2> **•» *)• (23) Обратно, две матрицы А и А*, удовлетворяющие условию (23), задают во всяком ортонормированном базисе линейные операторы А и А*, такие, что А* сопряжен к А. Доказательство прямого утверждения теоремы было приведено в § 1.5. dL Докажем обратное утверждение, В базисе (fb /2, ...,/и) матрица А однозначно определяет линейный оператор А; для любого линейного оператора в евклидовом пространстве однозначно определен сопряженный оператор А*. Матрица -> -» -»■ А* линейного оператора А* в базисе (f%, f2,..., fn) B СИЛУ прямого утверждения теоремы является транспонированной по отношению к Л. Рассмотрим линейный оператор, соответствующей матрице, транспонированной по отношению к А. Поскольку такой оператор определен однозначно, он совпадает с линейным оператором А*, сопряженным к А. § 1*.6. Определители if-го порядка и их свойства 1°. Подстановки и их свойства. Строгое изложение теории определителей я-го порядка требует введения некоторых вспомогательных понятий, имеющих и самостоятельное значение в различных алгебраических вопросах. Определение L Подстановкой из п символов 1, 2, ..*, п называется взаимно однозначное отображение / множества Т = {\, 2, ..., п} на себя. Подстановку обозначают так: ( . . "'. ], где *i = / (1), i2=f (2), ..., in=f(n), Vi h •• -W или (*i, /2, ..., in). Определение 2. Произведением подстановок а и Р из п символов называется подстановка у, отображающая множество Г = {1,2, ,..,я} на себя по правилу у (/) = « (Р(/)). гДе /= 1, 2, ..., п. .. Определени.е 3. Транспозицией называется такая подстановка у из п символов, которая отображает каждый из символов 1, 2, *.., п в себя, за.исключег нием двух символов i и / (i Ф /), для которых y{i) — \, y(j) = i. Транспозицию обозначают так: (i,/).
328 Глава /*. Линейная алгебра с элементами аналитической геометрии Докажем, что любую подстановку можно разложить в произведение транспозиций. Для этого сначала покажем, что любую подстановку можно разложить в произведение некоторых «простых» подстановок, называемых циклами, а затем убедимся в том, что каждый цикл является произведением транспозиций. Определение 4, Пусть 5 = {/х, 1Ъ ...,im) при ik^h Фф1, k, /=1# 2, ..., т) — подмножество множества Т = {1, 2, ..-.,«}. Отображение у, определяемое формулами У (*i) = <2, V (У = *з, • • •, Y (im-i) = *т> У (*т) = k, У(р)*=Р при р ф S, (1) называется циклом длины т. Очевидно, что каждый цикл определяется подмножеством 5 а Т и (произвольной) нумерацией элементов этого подмножества. Тождественная подстановка у (р) — р,р £ Т есть цикл нулевой длины (тривиальный цикл). Простейшим нетривиальным циклом является транспозиция—цикл, длина которого равна 2. Лемма 1. Всякая подстановка разлагается в произведение циклов. Доказательство. Для каждого /£ Г = {1, 2, ..., п) рассмотрим последовательность элементов 01 = /\ <*2 = Y(/)> «3 = Y2(/) = Y(Y(/)) ап = Уп(!), .... (2) где у—заданная подстановка. Так как Т = {1, 2, ...,«} содержит конечное число элементов, то для некоторых натуральных ky I (k > /) выполняется равенство У*Ф = У*ф. (3) Применяя m = fc—/ раз к обеим частям равенства (3) отображение у1, обратное к у, получим Г (/) = /. (4) m , Пусть ту—наименьшее натуральное число, удовлетворяющее условию у J (/) = /. Покажем, что имеет место равенство у 1 (х) — х для любого л:, принадлежащего последовательности (2). Действительно, согласно определению, x=ys(j) при некотором целом неотрицательном s. Отсюда Таким образом* последовательность (2) л является периодической с - (наименьшим) периодом ту. ■ - Рассмотрим множество Sj элементов {/. уф. y2(/) ymr\i)Y .... Ф Как было отмечено выше, множество (5) (вместе с нумерацией, которая приписывает элементу yk (/) номер k) определяет цикл Оу. Очевидно, что (J S/ = 7\ Кроме того, множества S/ и 5» при / ^ / либо не пересекаются, либо совпадают. Действительно, если SyflS/^ф, то последовательность Ьг = /, Ь2 = уф, &з — Y2 (0 = Y (Y (0)» •• • •» Y" (0 • • • связана с последовательностью (2) соотношением bs = as+p, где ^—неотрицательное целое-число .гакве,
§ I*Л.^Определители п-го порядка и их свойства 329 что уР (/) = /. Тогда my = mi и' множества Sj и St совпадают как отрезки периодической последовательности (2), имеющие ту же длину ту = /гсь что и период последовательности. Пусть 5,-t, S/a, ..., S/ —множества вида (5), попарно различные и неперет секающиеся. Каждое из этих множеств (вместе с нумерацией) определяет цикл длины т/Л, т. е. преобразование a/ft множества 7, = {1, 2, ..., п} в себя по закону т. -1 '* ~* Y 0ft). Y ('*) —► V2 ('*)> • •.. Y '* (h) —+ —► Y '* (*ft) = «ft. /—►/ ПРИ /£5/> 'ft8*1» 2 r- (6) Произведение 07,(7/,... a/ в силу (6) совпадает с исходной подстановкой -у При этом, поскольку подмножества S/t, 5/2, ..., 5/г попарно не пересекаются, произведение 7=07,07,. • .07 не зависит от порядка сомножителей. Лемма 2. Всякая подстановка разлагается в произведение транспозиций. Доказательство. Сначала покажем, что каждый цикл разлагается в произведение транспозиций. Пусть цикл а задан нумерованным подмножеством S = {('i, (2, ..., /л}, ik Ф Н при & Ф /, /г, /=1,2, ..., т. По определению of(/i) = /2, a(/2) = /3 aftn-i)^*. сг(/т) = /ь су(/)=/ при /£5. (7) Рассмотрим произведение транспозиций ft»» */»-l)ft», ««-2)...(*«, W. (8) В результате подстановки (8) имеем: ^ —► /2. 'г —► *з, • • • > *т-1 —► */«» Г*л* —► *ь /s-т-^/ при /£S. Действительно, /* (£=1, 2, ..., /та — 1) отображается в себя всеми транспозициями (/л, /*-i), ft», /*-2)> ..., («Л1 /i), /* переходит в |л при транспозиции (im$ /*); далее, /л переходит в /ft+i при транспозиции (im> /*+i); остальные транспозиции произведения (8) оставляют /#+1без изменения, т. е./*—► —►**+! при k=£ т. Если &=т,то im переходит в /х при действии транспозиции ('я*. *i); Далее, все транспозиции в произведении (8) оставляют ix на месте, следовательно, im—*h- Все /£S переходит в себя при подстановке (8), поскольку каждый сомножитель в (8) переводит / в /\ Таким образом, всякая подстановка согласно лемме 1 разлагается в произведение циклов: у = 07,073.. .(7/г, а каждый цикл разлагается в произведение транспозиций. Имеем т=Ж- • •*&,_!) (*!*!•• 4,,-х)- • •№*• • -*«.,_»). (9) Здесь через я{я|.. .я^ _х обозначено разложение 07, в произведение транспозиций. В правой части равенства (9) скобки можно расставлять произвольно (нельзя только изменять порядок сомножителей) на основании следующего свойства умножения подстановок: (aP)Y = «(Pv), (Ю) справедливого для любых трех подстановок из п символов. Это свойство называется ассоциативностью умножения подстановок и вытекает из определения 2. Доказательство леммы закончено.
330 Глава /*. Линейная алгебра с элементами аналитической геометрии Лемма 3. Пусть подстановка у разложена в произведение транспозиций двумя способами: y=n1nt...itk, Y = pip2...p/. (H) Тогда число l—k является четным. I Доказательство. Пусть 8—тождественная подстановка, т. е. отображение /—►/ для всякого i£T = {\, 2, ..., л}; у"1 — подстановка, обратная к у, т. е. преобразование множества Г, обратное к у. Легко проверить, что Y-^p^pjiV-'Pr1- (12) Действительно, ГГ1==(Р1Р2- - -Pi) (P^PF-i- * -РГ1)*55 = pip2.. .pj-iep^.. .pj^pA. • .p/-iP7ix. • .pfx= ... =8. Здесь использовано свойство ассоциативности умножения подстановок и тот факт, что еа = а, ае = о* для любой подстановки а; последнее равенство легко проверить, исходя из определения умножения подстановок. Отметим, что р""1 = р для любой транспозиции р (это очевидно из определения). Из разложений (11) имеем 8 = уу-1==я1я2.. .Jtfcp-ip/^.. .p-i = ttiJt2.. .я*р/_*.. .pf. Таким образом, тождественная подстановка 8 разложена в произведении k+l транспозиций. Если будет доказано, что в любом разложении тождественной подстановки содержится четное число транспозиций, то любые два разложения (11) подстановки у должны удовлетворять условию «&+/ — четное», или, что то же, «&—/ — четное» Покажем, что любое разложение тождественной подстановки в произведение транспозиций содержит четное число сомножителей. Доказательство проведем по индукции. Пусть e=aicr2...aj (13) и aj — (kjjj)y kj^lj, /=1, 2, ..., s. Обозначим через т число различных элементов среди &ь k2, ..., kSy /ь /2, ..., ls. Если т = 2, то все множители в правой части произведения (13) имеют вид а/ = (Л, /), т. е. Oi = a2=...=o> Для всякой транспозиции а имеем о2 = 8, поэтому выражение (13) равно 8 при s четном и ai Ф 8 при s нечетном. Значит, утверждение верно при т = 2. Допустим, что утверждение верно при т = £; докажем его справедливость при m = k+l. Пусть в равенстве (13) m = fc+l и/—одно из чисел kit k2, ...,*„ /ъ k> •••> h* Воспользуемся следующими легко проверяемыми формулами: (<7, г) (р, г) = (/?, q) (q, г) при р ф q, p ф г, q ф Г\ (14) (Р> Я) (р9 г) = (р, г) (q, г) при q ф р, р ф г, q ф г% а также очевидными соотношениями (Р> Я) '(r9 s) = (r, s) (p, q) при рфг, рф s, q ф г, дЩ'з. (15)
1 - §1*.6. Определители п-го порядка и их свойства 331 Применяя несколько раз формулы (14) и (15), можно преобразовать выражение (13) к виду е= (/, к) (/, /2). • •(/, 1Р) {kp+i, lp+i) (kp+2, lp+2).. .(ks, ts), (16) где все kp+f, kp+2> •••» &S» lp+i> lp+2> • ••» h отличны от /. При этом число s множителей в разложении (16) равно числу множителей в исходном разложении (13). С помощью формул (14) можно упростить произведение (/, /i) (/, h)-- (/> lp-i) (/» lp>- B самом деле' (/» 1р-д #'• tp^U* 1Р> (^-ь У» если /^ ^ 1р-ъ и (/, lp~i)(j, /») = 8, если lp_i = lp. В каждом из этих случаев получаем менее двух подстановок, содержащих /. Произведение (/, /х) (/, /г)... (У, tp~.i) (]\ 1р) после преобразования будет состоять из меньшего числа транспозиций, содержащих /. Используя указанный прием многократно, можно преобразовать произведение (16) к виду >«(/. 'i')(/-.<o-"(/. <»(*;«. w (*;+.. ';+.)■■•(*;■ а от> где ?<2, среди чисел k'q+v k'q+v >.., k'r, lq+r lq+2 /; нет / и г от- личается от s в разложении (16) на четное число. Действительно, с помощью рассмотренного приема можно заменить две транспозиции, содержащие /, на меньшее число транспозиций, содержащих /. Поэтому в окончательном выражении число транспозиций с участием / равно единице или нулю. Общее число транспозиций г в. формуле (17) отличается от s в выражении (16) ва четное число, поскольку при использовании формул (14) число транспозиций сохраняется, а при использовании формулы (/, k) (/, k) — е оно уменьшается на 2. В окончательной формуле (17) число q (количество транспозиций, содержащих /) на самом деле равно нулю, а не единице. В противном случае подстановка (17) имела бы вид е=(/, /^) (££, 1'2) (k'v /p.. ,(k'r, Гг) и переводила бы символ / в l'v т. е. не являлась бы тождественной. Итак, в=(*£. ЦК Q — K Ю> (18) где все числа k'v k^, **., k'r, l'v /^, ..., l'r отличны от /. В силу индуктивного предположения разложение (18) состоит из четного числа г транспозиций. Следовательно, и число s в разложении (16) — четное. Определение 5. Подстановка у называется четной, если в разложении Y = n!^2. ..Jt£ в произведение транспозиций число &-транспозиций является четным, и нечетной, если это число является нечетным. В первом случае используют запись sgn у = 1, во втором —запись sgny =—1. Отметим, что в лемме 3 доказана корректность определения 5, т. е. независимость понятия четности подстановки от конкретного разложения у в произведение транспозиций. 2°. Определители я-го порядка и их свойства. Определение 6. Определителям (детерминантом) квадратной матрицы
,332 Глава I*. Линейная алгебра, с элементами аналитической геометрии /«и ^12 -. а1п А -_ [ а21 #22 . . • «2л ^#«1 #«2 • • • апп называется число det А = 2 (sgn Y) flii,вз/, • •.в„/я. О9) где Y=0i» ^2» ...» *'и) — подстановка из п символов 1, 2, . it, n и суммирование ведется по всем подстановкам из п символов; sgnY=l> если у—четная подстановка, и $gny = —1, если у—нечетная подстановка. Вычисление определителей по формуле (19) довольно сложно, поскольку сумма (19) содержит п\ слагаемых и количество слагаемых быстро увеличивается с ростом я. Вычисление и изучение определителей основывается на свойствах, сформулированных и доказанных ниже. 1°. Определитель матрицы А равен определителю транспонированной матрицы А': det A = det A\ (20) Доказательство. Используя определение транспонированной матрицы, имеем det А' = 2 (sgn у) ahlai22 *.. ain^ (21) где у— подстановка (/*, *2, ..., in), которая в силу леммы 2 является произведением некоторого числа s транспозиций. Переставим множители в правой части равенства (21) так, чтобы первые индексы этих множителей образовали последовательность 1, 2, ..., п. После указанной перестановки вторые индексы множителей в правой части равенства (21) составят подстановку p = (/i, /2, ...t /«), полученную из тождественной подстановки (1/2, ...,л) в результате s транспозиций. Тогда det А' = 2 (sgn Р) aiJxa2h e.. anjnt (22) где подстановка р имеет ту же четность, что и у, поскольку обе они разлагаются в произведение s транспозиций: sgn у — sgn р. Итак,, det А' = det A. 2°. Пусть матрицы Л = (а,у), £ = (&,-Д С=(с/у) отличаются друг от друга только k-й строкой, причем k-я строка матрицы А равна сумме k-x строк мат* риц В и С, т. е, aij = bij=Cij (i Ф k), akj = bkj+ckj; i, /, £=1, 2,.. .,n. Тогда det A = det В + det C,
$1*.6. Определители п-го порядка и их свойства 333 или fan а12 ... а±п det( bkl + ckt bk2+ck2 .;. bkn+ckn }— \a>ni аП2 ••• ann {ац a12 ... ain \ /an a12 ... a±n = det bki bk2 ... bkn + det cki ck2 ... ckn . (23) \ял! an2 ... ал^/ \ал1 ая2 ... annt Доказательство. Имеем /ац ai2 ... «!>, det [ «*i flfti -.. в*я 1 = 2 (s2n 7) ei/i * * • **/* ««/«■ >««! #Я2 • • • «Л72' = 2 ^SgnV) fll/i • • • (bkik+ckik) • • • <W„ = = 2(sgnV)fli/, ••• %* ••• anin + ^(sgny)aut ... ^/ft ..* ая/я=« fali a12 ••• а1я \ /aU a12 ... «1/z = det bki bk2 ... ^„ +^t cui ck2 ... с*я ^«1 Я/*2 • • • fl««/ ™ni <*n2 ••• «, 3°. Общий множитель всех элементов одной строки матрицы можно вынести за знак определителя: (flu Ate ... «i«\ /«if Д*2 ... Я£л \ Xakl Uk2... Ла*я J=Xdet( aki ak2 ... akn J. (24) Доказательство. Имеем aii a12 ... ai« \ det( %akt Uki ... Яа*я \=^(4ni)a^h...a2i% tii (Xaft/ft) 444ал,я=« a«i an2 ... ann/ /«if «12 ... &in = Я. 2(sgfl V) «i/A/» * * * amn = Я det J a^i aft2 ... a*n \#wf Л/12 • • » впп
334 Глава /*. Линейная алгебра с элементами аналитический геометрии 4°. При перестановке любых двух строк определитель изменяет знак, т..е. для любых р, q справедливо равенство (aXi a12 ... а±п \ det a pi ар2 ... арп I aqi aq2 • • • aqn \ani аы ••• ann) Доказательство. Имеем faii «12 ... ain \ = — det (aVi ai2 , aqi aq2 • api ap2 \anl «л 2 *in \ at qn a pn ann)> (25) det *pl up2 ao2 ... a pn aqi aq2 »• • aqn • 2 (s%n Y) Oii&u •«• anin = ani Q>m • • • ann ) 2(—sgny)alixa2U ... ^p'bip.1agtgap+itl-p + i ...aq-biq-.%X («H «la ... aln \ «—det aq± aq2 ... aqn a pi &p% ... apn Kani an2 • •• O'nn) Здесь v= fa, ?* «. *,?«); v= (k> t%, ..., V-i, <>, ^+i, ..., /,_!, *V> ^+j, , s., /„). Очевидно, что y=(ip, iQ)y\ разложение у в произведение транспозиций содержит на одну транспозицию больше, чем разложение у; отсюда sgny= — sgny и справедливость формулы (25) установлена. Утверждения 2°—4°, как и всякое свойство определителя, остаются справедливыми, если в них заменить слово «строка» словом «столбец», что непосредст* венно вытекает из свойства 1°. 5°. Определитель единичной матрицы равен 1, т. е. '1 1 . о О ' л det E= det 1. Доказательство. Согласно определению (19), получим detE=ana22 ... апп, где ац=1 (/==1, 2, ..., л).
§1*.6. Определители п-го порядка и их свойства 335 Остальные слагаемые в правой части формулы (19) равны нулю, поскольку они содержат по крайней мере один элемент матрицы £, не принадлежащий главной диагонали, т. е. множеству {аи> а2» апп\. Всякий элемент матрицы Е вне главной диагонали равен нулю. 6°. Если матрица А содержит две одинаковые строки (одинаковых столбца), то det А = 0. Доказательство. Пусть Л —матрица, полученная из А в результате перестановки двух одинаковых строк (столбцов). Согласно свойству 4°, det A = = — det Л; так как А = А, то det A = det Л, откуда det^ = 0. 7°. Пусть матрицы А и А отличаются только k-й строкой, причем k-я строка матрицы А равна k-й строке матрицы А, к которой прибавлена 1-я строка матрицы А, умноженная на (произвольное) число X. Тогда или det --det det A = det Л, (ац tfi2 .*. аи } Ufci + ^п ak2+Xai2 ... akn + hn t tfn at2 ... ain \ani an2 *.. ann ) = det fan a12 ... aln ' aki ak2 ... аьп ац ап ... aln {аы an2 ... annj tbo. Имеем (axt ац ... аи у \аы-\-%ац ak2 + Xai2 ... akn + Xaln ati ai2 ... ain \ani an2 ... ann > fan ai2 .... aln ан ak2 ... akn ац at2 ... агп \ani аП2 ... ann, . =det + *• fan aia ... aln ) au a^ ... ain ац al% ... atn [ani апг ... алп) faii ate ... ain " aki ak2 ... akn ац an • • • atn \flni a„2 . . ann) * (26)
336 ., Глава I*. Линейная алгебра, с элементами аналитической геометрии 8°. Если множество векторов-строк (векторов-столбцов) квадратной матрицы А, линейно зависимо, то det А — О. -» Доказательство. Пусть k-я строка а^ матрицы А линейно выражается -►->■->-»■ -»■ через остальные стройи alt а2 ... я*-ь a^+1-, ..., ап: -►->->. -* ' -»■ -> Тогда, умножая 1, 2, ..., &—1, £+1, ..., п-ю строки соответственно на числа —с1у —с2у ..., — c^-i, —с*+ъ . ••» — ^ и прибавляя их к &-й строке, получим матрицу, у которой k-я строка состоит только из нулей и, следовательно, ее определитель равен нулю. Согласно свойству 7°, определитель исходной матрицы А также равен нулю. Определение 7. Пусть А = (а/у) — квадратная матрица. Выделим в множестве Т = {1, 2, ..., п) два подмножества из т элементов: Si = {*'i, /2, ..., im), ik <it при k < /, k, I = 1, 2, ..., m; S2 = {/lf /2, ..., jm], jk < jt при k< /, &, /=1, 2, ..., m. Рассмотрим квадратную матрицу B = (bki) порядка m, определенную равенствами Ь^ — а/. у ; &, /=1, 2, ..., m. Определитель det5 матрицы В называется минором т-го порядка матрицы А. Если 5х = {1, 2, ..., *—1, i + l, .... л}и52 = {1,2, ..., /— I, /+ 1, ..., я}, то соответствующий минор (п—1)-го порядка называется минором элемента а/у и обозначается М/у. Число Aij, связанное с 7W/y формулой Л/у = (—\)*+JMij, называется алгебраическим дополнением элемента a{j. 9°. Разложение определителя по строке (столбцу). Для всякой квадратной матрицы и произвольного целого k такого, что. \<:k^n, справедливо равенство det A = aklAkl+ak2Ak2 + ... +afcnAkn, (27) где Afti, Л#2, ..., Akn —алгебраические дополнения элементов а^, а^, .<., а^п k-й строки матрицы А. 2 Доказательство. В правой части формулы det Л=2 (Чп У) %/Afa- —&ni объединим члены, содержащие ащ, ak2y ..., а^п\ тогда получим det А = 2 (sgn У) (аи\ • • • «*-i, /Л-!«А + i, ih + г • • ^Шп) akl + + 2^П V) («111 • • • A*-l, /jfe-i?* + l, /* + l ••««/„) ^2 + Здесь множитель 2 (sgn V) (%м ••• «ft-i, i^^k+i. ik+i ••• <*nin) при а*, связан с подстановкой P, = (*i, *2> •••» *A-i> *£+!> •••» *«) из /г —1 символов 1, 2, ... • .., s— 1, s+1, ..., и такой, что (*ъ *2,..".., *ft-i> s> '*+i> ..., **) = Y-
§ {?<6: ^Определители п-го порядка и их свойства 337 Покажем, что sgti7 = (— l)A~,ysgn Р,. Действительно, пусть произведение из г транспозиций переводит подстановку (if, i2, ..., /*_ь *fc+i> ..., /«) в (1,2, ... ..., s— 1, s + 1; iiif n). При этом перестановка (ilt i2, ..., ikmml, s, ik+i, ..., in) перейдет в (1, 2, ..., k— 1, s, £, ..., s— 1, s+1, .... л). Потребуется еще &—s транспозиций чтобы перевести (1, 2, ..., k — 1, s, k, ...,s—1, s + 1, ...л) в (1, 2 л), а именно, (s, k)y (s, & + 1) ... (s, s—1). Таким образом, число транспозиций в подстановках, переводящих (ilf i2, ..., «£_ь **+i> • ••» *л) в (1, 2, ..., s—1, s+1, ..., n) и («ь <2, ..., **_!, s, /Л+1, ..., in) в (1, 2, ... ... л), отличается на &—s. Обратные подстановки, т. е. подстановки fis и 7, обладают тем же свойством, поскольку если р~1 = я1я2 ... яг и у~1== Jt^2... ...ягяг+1 ... яг+£_5, то в силу известной формулы (оф)~1 = р-1а"'1 имеем: Р5 = ягяг_! ... ях; Y==Jt/-+fe-.y:rrr+*-<?-i ••• я1« Согласно определению 6, минор М^ можно записать в виде Следовательно, Убедимся в справедливости формулы (27), для чего вычислим ^aksAks. S Имеем 2 (sgn7)aiM--aft-i/fe-ia^^+i /ik+1...ae/„=s v=(tV2 **-r s' 'fc+i' '») = 2 (sSn Y) «i/A/, •. • ««/„ = <*et Л. 10°. Сумма произведений элементов k-й строки (столбца) матрицы Л = (а,*у) яа алгебраические дополнения соответствующих элементов 1-й строки (столбца) равна нулю (k Ф /). Доказательство. Рассмотрим матрицу А, полученную из матрицы А заменой 1-й строки на k-ю строку: (а1Х а12 ... аХп \ А = aki ctk2 ... а^п aki ak2 ... akn Kani a>n% • • • ann) Очевидно, что det А — О. С другой стороны, разлагая определитель матрицы А по /-й строке, получим 0=det Л = аыАц+а&Ап+ .*. +акпА1п<
-338 Глава I*. Линейная алгебрами элементами аналитической геометрии Здесь использован тот факт, что алгебраические дополнения соответствующих элементов 1-й строки матриц Л и Л совпадают. 11°. Определитель произведения матриц равен произведению определителей матриц, т. е. если С = АВ, то det С — det Л • det В. Доказательство. Отметим сначала частные случаи свойства 11°. '1 1 1) А = \ О " |, B = (b(j)y где число % в матрице Л находится на 1/ пересечении /-й строки и /-го столбца (i Ф /), а все остальные недиагональные элементы равны нулю. Согласно определению произведения матриц, имеем АВ = (Ьц Ь12 ... Ъи Ьц + Щ-г bi2 + Xbj2 ... bin + lbjn >Ji b 72 •-- ьпп ) J, где число % в матрице В находится на Согласно свойству 7°, det (АВ) = det В и так как det Л = 1, то det ^Z?)=det Л» det В. 2) А = (аи), В = \ " Х о'. пересечении i-й строки и /-го столбца (*#/), а все остальные недиагональные элементы равны нулю. Как и в предыдущем случае, получаем, что det (ЛВ) = = det Л-det Л. 3) Л = ( * ~ ), B = (bjj). Находим о (Xi^if Я1&12. . A*A«\ Х2^21 W>22 • •• ^2^21 J . knbni knbn2. • .knbnn/ Вынося %i, %2t ..., kn за знак определителя, получим det (ЛВ) = А1Х2.<. .. ,Хп det В — det Л • det В, поскольку det Л = А,^.. .Хп. /\ \ 4) Л = (а/у), 5 — 1 ". ГАналогично предыдущему получаем det (АВ) =* \ \У = det Л-det 3.
§ 1*.7. Ранг матрицы. Теорема о базисном миноре 339 Теперь отметим {это будет доказано в § 1*.7), что всякую квадратную мат* рицу можно представить в виде произведения матриц вида f \ \ ( 1 О '. )' 1 0Л К' \ 1> Пусть A = AiA2A3...Aft, где А*, A2t A3t ..., Л#—матрицы указанного вида. Тогда det (АВ) = det [(AtA2Az. ..Ak) В] = det Л*, det (A2A3... AkB) = = det i4i- det A2- det (A3...AkB) — ... = det Af det A2.det A3...det (Л^В) = = det (ЛхА2). det A3.. .det Ла-det B = = det(^1^2i43)...det/l^.detB=...=det(^1^2^3...^).detB = deti4.detB. § 1*.7. Ранг матрицы. Теорема о базисном миноре Определение. Пусть Л^0—матрица размера тХп, и ft, q2, ..., ?,» — векторы- строки этой матрицы. Максимальное число векторов-строк в линейно независимом подмножестве множества {ft, q2t ..., gm} называется рангом матрицы А (рангом системы векторов). Ранг нулевой матрицы равен нулю. Теорема 1. Определитель квадратной матрицы А равен нулю тогда и только тогда, когда множество векторов-строк этой матрицы является линейно зависимым. Доказательство. Прямое утверждение теоремы (если множество векторов-строк линейно зависимо, то определитель равен нулю) является содержанием свойства 8° и доказано выше (см. с. 336). I Докажем обратное утверждение: если определитель матрицы равен нулю, то множество векторов-строк линейно зависимо. Как известно, всякую матрицу с помощью элементарных преобразований можно привести к ступенчатому виду. В результате этих преобразований абсолютная величина определителя не изменяется. Если определитель исходной матрицы А равен нулю, то матрица В, к которой А может быть приведена с помощью элементарных преобразований, имеет по крайней мере одну (нижнюю) нулевую строку. Обратно, матрицу А можно получить из матрицы В (с нижней нулевой строкой) в результате элементарных преобразований (преобразование, обратное элементарному, является элементарным). Речь идет о следующих элементарных преобразованиях: 1) прибавление к одной строке (i-й) матрицы А другой строки (/-й), умноженной на число Я; 2) перемена местами двух строк; 3) перемена местами двух столбцов. Действие элементарного преобразования 1 состоит в умножении матрицы А слева на матрицу (1)
340 Глава /*. Линейная алгебра с элементами аналитической геометрии где X занимает место с номером «/, а все остальные недиагональные элементы равны нулю. Действие элементарного преобразования 2 состоит в умножении матрицы А слева на матрицу (\ Р = О 1 1 1 0 (2) I) где все диагональные элементы равны единице, за исключением Ьц = Ьу; = 0, а все недиагональные элементы равны нулю, за исключением 6/у = 6у/=1. Действие элементарного преобразования 3 состоит в умножении матрицы А справа на матрицу (2). Итак, B = SATt (3) где S—произведение матриц вида (1) и (2), а Г—произведение матриц вида (2) и в матрице В последняя строка состоит из нулей. Обозначим AT— А; тогда B — SA и по-прежнему последняя строка матрицы В состоит из нулей. Пусть Si s2 ... sa — последняя строка матрицы 5, alf а2, ..., яи^ векторы-строки матрицы А. Тогда последняя строка матрицы В есть Sia1 + s2a2+... +s„a„ = 0. (4) При этом не все числа sb s2, .... sn равны нулю, в противном случае матрица была бы вырожденной (т. е. det«S = 0), что невозможно, поскольку «S—произведение матриц вида (1) и (2) с определителями, отличными от нуля, а определитель матрицы 5 равен произведению определителей этих матриц. Матрицы Ли А отличаются только нумерацией столбцов. Поэтому если 01» Яг» •••» ап — векторы-строки матрицы Л, то из равенства (4) следует CiOi + Ctat+*.>+chaa = 09 что и доказывает линейную зависимость векторов-строк матрицы Л (при единственном предположении det Л = 0). Лемма 1. Пусть А — матрица размера тхп(т<п). Если множество ее векторов-строк линейно зависимо, то любой минор т-го порядка матрицы А равен нулю.
§lf.7i Ранг матрицы. .Теорема о базисном миноре 341 Доказательство непосредственно вытекает из прямого утверждения теоремы 1. Лемма 2. Если множество векторов-строк матрицы А размера тХп, где т<я, линейно независимо, то существует такой минор т-го порядка этой матрицы, который не равен нулю. 2 Доказательство. Воспользуемся тем, что любую матрицу с помощью элементарных преобразований можно привести к ступенчатому виду (см. ниже § 1*.9, п. 1°). Пусть В—матрица ступенчатого вида, к которой с помощью элементарных преобразований приведена матрица Л. Тогда B = SATt B = SA, A = AT, где «S—произведение матриц вида а = (а^), P = (Pto)> y=(Y*j): 1 Ъ ( и fli 7 = О' О а Т—произведение матриц вида р = (|5^). Покажем, что последняя строка матрицы В содержит по крайней мере один ненулевой элемент. Предположим противное, т. е. допустим, что последняя строка матрицы В состоит только из нулей. Пусть sx s2 ... s'n — последняя строка ~£ "2 ~2 ~ ~2 "■*■ матрицы S и alt a2t ..., o>m — векторы-строки матрицы А. Тогда s^i+«2^2 +••• ...Ц^&пап — 0, причем не все числа -Sf, s2, s3, ..., sn равны нулю (иначе матрица S была бы вырождена, что невозможно, поскольку S—произведение невырожденных матриц вида а, Р, у). Следовательно, векторы-строки матрицы А линейно зависимы, а значит, линейно зависимы строки матрицы Л, которая получается из А перестановкой столбцов. Однако это противоречит, условию линейной независимости системы векторов-строк матрицы Л, и ступенчатая матрица В не может иметь в последней строке только нули. Поэтому ступенчатая матрица В имеет вид Ь22 • •-Ь2п B = l 0 ] ); Ьц9 b22, «••, bmm^0.
342 Глава /*. Линейная алгебра с элементами аналитической геометрии Обозначим fb-ц ..А,» ^22' ••^2/Л mm * Пусть Н означает матрицу размера тх(п—т), составленную из т—п послед* них столбцов матрицы В. Таким образом, первые т столбцов матрицы В составляют матрицу G, а последние п — т столбцов—матрицу Я. Поскольку A = S~1B, первые т столбцов матрицы А образуют матрицу S~1G, а последние п—т столбцов —матрицу 5_1Я. Очевидно, что det (S-1G) ф 0, так как detS^O, det G ф 0. Итак, в матрице А имеется минор т-го порядка, не равный нулю. Матрица А также содержит минор т-го порядка, не равный нулю, так как она получается из А перестановкой столбцов. Теорема 2 (о базисном миноре). Если ранг матрицы А равен г, то среди миноров г-го порядка этой матрицы найдется минор, не равный нулю, а все миноры, порядок которых больше, нем г, равны нулю. Обратно, если существует минор r-го порядка матрицы А, не равный нулю, а все миноры, порядок которых больше, чем г, равны нулю, то ранг матрицы А равен г. Доказательство было приведено в § 1.7. Следствием теоремы является тот факт, что ранги матрицы А и транспонированной по отношению к ней матрицы А' совпадают. Если в определении ранга матрицы слово «строка» заменить словом «столбец», то получим определение, эквивалентное исходному. § 1*.8. Векторное произведение. Основные свойства» Смешанное произведение и его свойства Пусть (fi, f2, ..., fn) и (gi> g2> •••> £*)—Два базиса в линейном пространстве L над R,_h А—линейный оператор, переводящий // в щ (/=1, 2, ..., п). Будем говорить, что эти базисы ориентированы одинакова, если det А > 0, и ориентированы противоположно, если det A < 0. I Покажем, что отношение одинаковой ориентации на множестве базисов* в Ln над R является эквивалентностью. -» -*■ -► 1. Рефлексивность. Базис (/ь /2, ..., fn) ориентирован одинаково -> ->• сам с собой, поскольку оператор А: //—►// (*=1, 2, ..., п) является тождественным, его матрица Е в любом базисе является единичной и det£ = l > 0. —> —> -> —> 2. ^Симметричность. Линейные операторы А://—*gf и A_1:g/—►// (£=1, 2, i8., n) являются взаимно обратными: det Л = 1/det А"1, так что при —► -* —> det Л > 0 выполняется неравенство det Л"** > 0 и базис (glt g2> ..., g„) ориен-
§ 1* Л Векторе - произведение. Смешанное произведение 343 —у —г ~-г —г —■*■ —г тирован одинаково с базисом (fa, /2, *;., /„), если базис (fa, /2, ..., /„) ориен- ->• -> -> тирован одинаково с базисом (gly g2l .«., gn)> -»■-*• -► 3. Транзитивность. Пусть базис (fa, fa, *••» /л) ориентирован одина- -*■->*■» -»-»■-»• -► ково с базисом (gi, g2, • ••> £л)> а базис fei» #2» ...» £«)—с базисом (Л^ -> . -» -> -* •-»• Л2, ..., Л/г). Покажем, что базис (fa, fa, •••» In) ориентирован одинаково с ба- зисом (/ii, /i2, ..., hn). В самом деле, при сделанных предположениях detA > О, det£>0, где А и В—линейные операторы, определенные соответственно фор- мулами kfi—gi, Bgi=hi, i=l, 2, i4., л. Линейный оператор, переводящий fa в hi (t=l, 2, *..,/*) равен, очевидно, ВА. Так как det BA = dzt B-det А >0, -> -> -> -* -» -► то базисы (fa, fa, ..., fa) и (h^ h2i *.., &„) ориентированы одинаковы. -* *_» Определение. Векторным произведением двух векторов a, b£Ez в евкли- -*■-*• **► довом пространстве Е3 с ортонормированным базисом {е±, е2у е3) называется третий вектор c — axb, удовлетворяющий следующим условиям: 1) длина вектора с равна площади параллелограмма, построенного на направленных отрезках APt AQ, которые принадлежат соответственно векторам а -*■ и Ь, т. е. \с\*=\а\\Ъ\*\ащ% (1) где ]а|, |&|—длины векторов а, &, а ф—угол между ними; -> -* -*► 2) вектор с перпендикулярен векторам а и Ь: -> -»> -> 3) из двух возможных направлений вектора c—axb, удовлетворяющих усло- ->-»■-> вию 2, выбирается то, при котором упорядоченные тройки (elt e2l е3) и (a, bt с) ориентированы одинаково. _ -> -> Отметим, что условие 3 относится только к случаю, когда векторы а и b ли- ->• -►-*■-> нейно независимы. Тогда | с | ?£ О и тройка (а, 6, с) является базисом. Если же векторы а и 6 линейно зависимы, то |с| = 0, и нет необходимости выбирать*для вектора c=axb какое-либо направление. Справедливо следующее утверждение. Пусть (е±, е2, е3)■— ортонормйрованный базис в Е3; a = a1ei-\-a2e2-{-azez\ Ь = Ьхе±-\-Ь2е2-\-Ьъег. Тогда axb=(a2b3—azb2)ei + (abbi—atb3)e2 + (a1b2^а2Ьг)е3. (2) Формулу (2) легко запомнить, если записать ее в виде axb = е± е2 е3 #f flg CL3 £f ^2 ^з
344 Глава /*. Линейная алгебра с ■ элементами аналитической геометрии *. 2 Действительно, найдем квадрат длины вектора в правой части равенства (2): (а2Ь3—аф2)2 + (Цфх—аФг)2 + (яА—аМ2 = = аг&з ~Ь аз^2 — 2а2Лз^2^з + аФг + а1^з— — 2агафф3 + ли + a\b\ — 2а1а2Ь162 = = (a? + a| + «•) W + Ь\+bl) - (aA + афг + a3b3f = = |a|2|jT|2 — (a, 6)2 = |a|2|?|2(l—cos29). (3) -»•-»■-*•-► Здесь использовано равенство (a, 6) = | a \ \ b | cos ф. Из соотношения (3) следует, что длина вектора в правой части равенства (2) -* -► равна |a||6||sin(p|f т. е. площади параллелограмма, построенного на направ- —*■ -* -> -> ленных отрезках АР, AQ, принадлежащих векторам a, b. Значит, условие I определения для вектора (2) выполнено. Вектор (2) перпендикулярен векторам а и Ь. Чтобы убедиться в этом, вы- -*-►-►-» -> -»■ числим скалярные произведения (с, а) и (с, Ь). Так как с=(а2&3—Я3&2) ^i + -> -*->->■ -> -»■->-»->--»• + (Я3&1—а1^з) ^2 + (яА—^bi) e3l а = агег + а2е2 + а&3. Ь = Ьгег + Ь2е2 + Ьзе3, то -> -» (с, а) = (а2&3—М2) «i + («3^i—Я1&3) «2 + («i^2—^i) «3 = 0, (с, 6) = (а2&з—аф2)Ьх + (аф1 — аф3) b2 + (a1b2—a2b1)b3 = 0. Поэтому условие 2 определения для вектора (2) также выполнено. Пусть А—линейный оператор, переводящий ег в а, е2 в b, e в с. Его доат* рица в базисе (еь еа» е3) имеет вид ,аг bi a2b3— Я3&2 Л = ( a2 b2 афх — аф3 ^а3 Ь3 аф2—афх' Далее, находим det А — аф2 (аф2—афг) + офг (аф± —: аф3) + 02&з (Яг^з —г аз^г) — —fli&3 (azb\ — афз)—афг (аф2 — афг) — аф2 (аф3—аф2) = = (аф3—аф*)2 + {афг - <*Фз)2+(аф2 — афг)2. > 0. (4) Так как det Л > 0, то базисы {еъ е2, е3) и (а, 6, axb) ориентированы одина- ->> -»• ково (в предположении, что векторы а и b линейно независимы). Итак, условие 3 определения для вектора (2) также выполнено. 3 Свойства векторного произведения 1°. «Х?= — 1>Ха \fat t^E*. -+• -*■ Доказательство. Пусть векторы а и b линейно независимы.Длинывек- -*->-►-»■ .->_*. торов axb и £>Ха равны, оба вектора перпендикулярны плоскости векторов а, 6. ->•-»->-►—»->•-»->► Тройки лекторов (а, 6, axb) и (6, а, &Хя) ориентированы одинаково с базисом
§ 1*.8. Векторное произведение. Смешанное произведение 345 (*1* е2, е3), а следовательно, и друг с другом. Матрица линейного оператора А, переводящего а в b, b в a, axb в Ьха, в базисе (а, Ь, ах?) имеет вид ,0 1 0 Л = (1 0 0]. (5) Ч) 0 ±1' Из предыдущего ясно, что axb равно либо Ьха, либо —бХа, поэтому в матрице (5) элемент в правом нижнем углу равен ±1. Так как тройки векторов (а, 6, ах&) и (6, а, &Ха) должны быть ориентированы одинаково, то det A > 0 и, следовательно, этот элемент равен —1. Поэтому axb= — Ьха. Случай, когда ->■-* -»■-»■-►->-*•-> в иб линейно зависимы, очевиден: axb = 0 и &ха = 0. -*-+•-*- -> -> 2°. :flx^ = 0^a и 6 линейно зависимы. Доказательство. Имеем |ах^| = |а| |^| sinф = 0. Так как длина век- -> -*> -> -> тора а х^ равна нулю, то либо |а| = 0, либо |6| —0, либо 81пф = 0« Во всех трех -> -»■ случаях векторы а и Ъ линейно зависимы. -* -> Обратно, если векторы а и Ъ линейно зависимы, то один из них (напри- -» -> -»■ мер, а) линейно выражается через другой: а — ХЬ. Тогда по формуле (2) полу- ->-*•-► чим axb = 0. 3°. {caxb) = c{aX?) Va, ~b g £3, c^R, Доказательство непосредственно вытекает из определения. 4°. (а+Ъ)Х^=(аХ~с) + (Ь*Х~с) Va, b, с£ £3. Доказательство непосредственно вытекает из формулы (2). 5°. (ах*, axb) + $, ?)2 = M2W2 va, ?€ £3. Доказательство. Имеем (ах£, ах?) = I а*|2 | ?2 i sin2 ф, (а, б)2 = | а |2 | ?|2 cos2 ф, (ах?, ах6) + (а[ б)2 = | а"|21 ?|2 (cos2 ф + sin2 ф) = | а\2 \ t\*. 6^ ах(?Х^)+^Х(аХ?)+6х£ха)==0 Va, £ с^^3- Доказательство. Пусть а = агег~{-а2е2 + аз^з> ^ — ^х+^г+^з» £ = — Ci^i'H-V*+ £«*•• Учитывая свойства 3°, 4°, 1°, достаточно рассмотреть только случаи, когда векторы а, 6, с совпадают с базисными векторами ех> е2, £з« Если все три вектора a, b и с совпадают с каким-то вектором из fa, e2t e9)7 то доказываемая формула очевидна в силу свойства 1°. рслц же среди векторов a, b и с два вектора равны между собой и отличны от третьего, то, полагая для определенности а — Ь==е\, с = е2, имеем
346 Глава /*. Линейная алгебра с элементами аналитической геометрии Если, наконец, векторы а, Ъ и с попарно различны (пусть для определенно* сти a = elt b=e2, c=e3), то e1X{e2Xez)+e3X(e1Xe2)+e2X{e3Xe1)= ±7xXe*i ±~ezX?z ± е^Х^=0. § 1*.9. Системы линейных уравнений. Метод Гаусса* Теорема Кронекера — Капелли 1°. Метод Гаусса. В теории систем линейных уравнений важное место занимает метод Гаусса, который позволяет целенаправленно преобразовать систему уравнений, не изменяя при этом множества ее решений, и привести ее к так называемому ступенчатому виду. После приведения системы к такому виду легко найти множество ее решений. Метод Гаусса лежит также в основе доказательства многих утверждений линейной алгебры, в частности, теоремы Кронекера — Капелли. Рассмотрим подробно этот метод. Пусть дана система линейных (неоднородных) уравнений аХ1хг + а12х2 +...+ainxn = ЬХ, <*21*1 +«22*2 +...+«2 amiXi + am2X2+...+ Матрицу «21*1 +«22*2 +«»'+л2и*л =^2э /|\ (2) ^ami атг • • • атп' составленную из коэффициентов при неизвестных, будем называть матрицей си* стемЫу а матрицу /ац аХ2 ... а±п Ьх\ А = [ U2i U22 '" а%п ^2 I (3) — расширенной матрицей системы. При использовании метода Гаусса каждый шаг состоит в преобразовании расширенной матрицы А (а вместе с ней и матрицы А). Иначе говоря, на каждом шаге исследуемая система уравнений заменяется эквивалентной системой уравнений, а вместе с системой уравнений последовательно, шаг за шагом, изменяются и матрицы Л, Л. На каждом шаге над матрицей (или системой) производится одно из следующих элементарных преобразований: 1) умножение одной из строк на произвольное число с последующим прибавлением результата к другой строке; 2) перестановка двух строк матрицы; 3) перестановка двух столбцов матрицы (без участия последнего столбца). Укажем, какие элементарные преобразования следует производить на каждом шаге применения метода Гаусса.
§ /*.Р. Системы лин. уравнений. Метод Гаусса. Теорема Кронекера — Капелли 347 Результаты преобразования матрицы А на k-ы шаге (&=0, 1, 2, ...) является матрица Л<Л) следующего вида: Л<*> = ыГ Ak) «22 • • 0 * « Ak) 0 рш Q(A) pik) 0<Л> (4) Здесь в левом верхнем углу находится матрица размера kxk, у которой на главной диагонали расположены ненулевые элементы a[i , а^ >•••> <*kk П°Д диагональю— нули и над диагональю—произвольные элементы. Левый нижний угол занимает нулевая матрица размера (т—k)xk. На пересечении 1, 2, ..., k-й строк и £+1, £ + 2, .,., я-го столбцов находится матрица Р(Л) размера kx(n— k). На пересечении &+1,& + 2, ..., m-й строк и £+1, £ + 2, ..., л-го столбцов находится матрица Qik). Наконец, последний (п + 1)-й столбец образуют две одностолбцовые матрицы /?<Л)(1, 2, ..., k-я строки) и qW (£+1, £ + 2, ..., m-я строки). Если Q(A> — нулевая матрица или если fc = min(m, n), то процесс преобразований методом Гаусса считают законченным, а матрицу (4) называют ступенчатой. Переходим к описанию (&+1)-го шага метода Гаусса. Если Q(/f) Ф О, то, выбрав некоторый ненулевой элемент этой матрицы (пусть в матрице ASk) его номер |/, k<i^m, k<j*^n), переставим местами (£ + 1)"ю и /-ю строки матрицы Л(А), а также (&+1)-й и /-й столбцы. Преобразованная матрица также имеет вид (4) и на пересечении (&+1)-й строки и (&-|-1)-го столбца содержит ненулевой элемент, который обозначим а(£+ик+ь Умножая теперь (&-|-1)-ю строку на подходящие числа и прибавляя результат умножения к £ + 2, & + 3, ..., m-й строкам, добьемся того, чтобы на пересечении (&+1)-го столбца с & + 2, & + 3, ..., /п-й строкой стояли нули. Для этого достаточно умножить 6 +1-ю строку матрицы А на —aj%b+i/ak+i4k+i и прибавить полученный результат к /-й строке (j — k-\-2, £ + 3, ..., т). На этом заканчивается (&-|-1)-й шаг, после которого получаем матрицу вида Л<я + /> = * 0 ' * Л "/г+1, k+i 0 pvt+iy QU + 1) p<*-i> <^Л + 1) (5)
348 Глава /*. Линейная алгебра с элементами аналитической геометрии, Здесь левый верхний угол занимает матрица размера (&+1)Х(& + 1), у которой на главной диагонали расположены ненулевые элементы а(ц+1), «22+1), Jk+i) «*+i, fc+i, под диагональю—нули и над диагональю—произвольные элементы. В левом нижнем углу находится нулевая матрица размера (т—k—1)Х(&+1). На пересечении 1, 2 (& + 1)-й строк и &+1, £ + 2, ..., я-го столбцов находится матрица P<*+x> размера (k+\)X(n — k—l). На пересечении & + 2, £ + 3, . ..,т-й строк и £ + 2, £ + 3, ..., /г-го столбцов находится матрица Q<*+1). Наконец, последний столбец образуют две одностолбцовые матрицы р<Л.+1)(1, 2, ..., k-я строки) и ф*+1) (k-\-2, £ + 3, ..., я-я строки). Полученная в результате &-го шага матрица (5) имеет вид (4), где k заменено на k-\-\. К матрице (5) следует применить очередной шаг метода Гаусса и т. д. Процесс вычислений заканчивается, когда после r-го шага матрица Q^+1> является нулевой или r = min(m, л). В результате получаем матрицу вида A^i к? <4? е 0 * 1 4? 0 ркп 0 р(г) Я{п г<т<п (6) или Л<'>= «11 «22 о ' • ««« 0 р(Г) ! ФП n<Lmm (7) Преобразования матриц методом Гаусса соответствуют преобразованиям систем линейных уравнений, причем множество решений системы не изменяется. Таким образом, система уравнений, соответствующая матрицам (6) и (7), эквивалентна исходной системе уравнений (1). При этом систему уравнений с матрицами (6) и (7) можно легко решить и исследовать (см. п. 2° § 1.9). 2°. Теорема Кронекера—Капелли I л емма. В результате элементарных преобразований ранги матриц А и А не изменяются. Доказательство. Отметим сначала, что ранг матрицы равен размерно- сти линейной оболочки, построенной на векторах-строках матрицы аь а2, •••> «яг Действительно, по определению линейная оболочка ((а1} а2,. ..., ат)) есть множен
§ /*.9. Системы лин. уравнений. Метод Гаусса. Теорема Кронекера — Капелли 349 ство векторов вида^ах + с2а2-|-. •• +стат> гДе Съ Ъ* . ••» ^ — произвольные числа из поля /С, над которым рассматриваются матрицы Л и Л. Пусть векторы -+ -> -► я/t» a«V •••» а/'й составляют максимальную линейно независимую подсистему в мно- -►-»■-» -*■->•-». жестве векторов-строк (а*, a2, ..., ал). Система векторов (ait, а/а, ...,а;А состав- -►-»•-» ляет базис в ((ai, a2, •••» «/»))» поскольку эта система линейно независима и вся- -*»->■ -> кая линейная комбинация C\at -|- с2а2+ • • • ~i~cmam может быть выражена только через -►->-* -»-»-> векторы a/j, a/t, ..., a^ (каждый из векторов ai, a2, •••» ат линейно выражается через a/t, а/а, ..., а/- в силу максимальности этой системы). Итак, ранг системы —»--*■-► -►->•-»>. (ai, a2, •••» ат) равен fc и размерность линейной оболочки ((аь а2, ..., a^)) (равная числу векторов в базисе) также равна k. Если элементарная операция, произведенная над матрицей Л (или Л) состоит в прибавлении к s-й вектор-строке i'-й вектор-строки, умноженной на число X £ /С, то получим систему векторов аъ a2, ..., ау.г, aj-\-%ai, aj+it ..., affi. Линейная оболочка этой системы совпадает с линейной оболочкой системы векторов-строк ->-»■-► Яъ «2» • ••» я*»» поскольку каждый из векторов последней системы линейно выра- жается через векторы ах, а2, ..., aj^i, aj-\-Ka;, aj+t, ..., а„: -►-*->•->■ -*> ->-►-*-*-*> а±=*ах, a2 = a2, ...» u/-i = #/-i> лу = (л/ + Яд/)—Ха/, 0/+i = a/+i» •••> ат~ат* -► -* -*■.-»■-»•-*• -* и, наоборот, каждый из векторов ai, a2, ..., ay_i, ay + ^a/» a/+i» *♦., ял линейно -» -* -* выражается через векторы аъ а2, ..., ат\ «1 = ^1» «2 = «2» ...» ау-1 = Яу.£, (ау + Яд/) = ау + Ха/, ay+1 = a/+j, ..., ат = ат. Так как линейные оболочки совпадают, то совпадают и их размерности, т. е. ранги систем векторов ах, а2, .. .* #/» и ai, а2, ..., Я/-1» a/+i ± ta*/, fl/+i» ...» ат а, значит, и ранги матриц А (или Л) до и после преобразования. Если произведенная над матрицей А (или А) элементарная операция состоит в перестановке строк, то очевидно, что линейная оболочка векторов-строк до и после преобразования не изменится, т. е. не изменится и ранг матрицы. Если элементарная операция, произведенная над матрицей Л (или Л) состоит в перестановке столбцов, то множество всех миноров матрицы Л (или Л) взаимно однозначно отображается на множество всех миноров преобразованной матрицы Л или Л). Действительно, если в матрице Л (Л) минор был образован строками **£» Н* ...» *fc -и столбцами /i, /8j ..., /ft, то этому минору поставим в соответст-
350 Глава /*. Линейная алгебра с элементами аналитической геометрии вие минор преобразованной матрицы со строками i±t i2, ...» 1ц и столбцами ч/ь /г» *.» Jk> где h («=1» 2, *.., &)—столбец, в который переходит столбец js матрицы А (А) в результате рассматриваемого элементарного преобразования. Указанное соответствие является, очевидно, взаимно однозначным. Соответствующие друг другу миноры отличаются только нумерацией столбцов, поэтому они одновременно либо равны нулю, либо отличны от нуля. В матрице А (А) существует не равный нулю базисный минор, порядок которого равен рангу матрицы А (А), а все миноры, порядок которых больше, чем ранг, равны нулю. Таким образом, минор преобразованной матрицы А (А), соответствующий базисному минору, не равен нулю, а все миноры большего порядка равны нулю, поскольку они соответствуют равным нулю минорам матрицы А (А). Следовательно, ранги матриц А (А) до и после рассматриваемого элементарного преобразования совпадают. Теорема (теорема Кронекера—Капелл и). Система линейных уравнений (1) совместна тогда и только тогда, когда ранг матрицы системы равен рангу расширенной матрицы этой системы. 2 Доказательство. Как было отмечено при описании метода Гаусса, всякую систему линейных уравнений с помощью элементарных преобразований можно привести к системе уравнений, имеющей матрицу ступенчатого вида: г п—г 1 г т—г eg <£ • 0 * * 0 Р(П 0 р{п Qin г <т9 г <п (8) или #11 rtin «22 s 0 ' * в агг 0 Рт\ фп\ п—г 1 г = п<т г=*т<А. (9)
§ 1*.9. Системы лан. уравнений. Метод Гаусса. Теорема Кронекера — Капелли 351 - Матрицы (9) представляют собой крайние случаи матрицы (8) при m = r и п = п Система линейных уравнений, соответствующая матрице (8), имеет вид ( ацу1+а12у2+ ... +Я1г#2 + яь r+tfr+i+ • • • + сЦпУп = Рь | «22^2+ • • • +Я2/-#2 + Я2, Г + 1УГ + 1+ • • • + ^2пУп = Р2у I ••**# • \ аГгУг + агч г+1Уг11+ • • • +аГпуп = Рп (10) I * • • • Здесь буквами де, #2, •••» У« обозначены старые неизвестные #ь х2, «*в, #Л, пе- реставленные определенным образом (эта перестановка определяется перестановками столбцов, которые были произведены в ходе преобразований методом Гаусса). Полученная система (10) эквивалентна исходной системе (1). Покажем, что система (10) разрешима тогда и только тогда, когда qr+i** = <7r + 2= ...=?m = 0. Если хотя бы одно из чисел qr + i, qr + 2, ..., qm отлично от нуля, то очевидно, что система (10) не имеет решений. Еслиже^г+1=^г + 2=.., ••• =^т = 0, то рассмотрим систему уравнений, состоящую из г первых уравнений (10) (последние m — г уравнений не будем принимать во внимание, поскольку они имеют вид 0 = 0). Запишем систему, составленную из указанных г уравнений, в виде Г ацУ1 + Я12У2+ . •. +airyr = Pi — Oit г+хУг+i— - -. — ЧпУп* I 022^2+ • • • +а2гУг = Р2 — <*2, Г + 1Уг + 1'—" • • • —<*>2пУгп /(|. V аггуг = рг~аГу r + 1yr + i— .. .—агуп. Придавая неизвестным yr+i, Уг+ъ> •••» Уп произвольные значения из поля К, можно однозначно- определить неизвестные у±, у2, ...., уг из уравнений-{И). Действительно, из последнего уравнения (И) (агг Ф 0) найдем уг. Подставив найденное значение уг в предпоследнее уравнение системы (11), определим уг^%; далее, подставив найденные значения yr nyr~i в (г—2)-е уравнение системы (II), определим ^г.2 и т. д, Таким образом, при выполнении условий qr + i = gr + 2 = ... =^ = 0 система (10) разрешима. Более того, множество ее решений зависит от п — г произвольных постоянных (значений переменных yrj-i, yr+2> •••» Уп)- Покажем, наконец, что снетема уравнений (10) разрешима тогда и толька тогда, когда ранг матрицы этой системы равен рангу ее расширенной матрицы. Действительно, ранг матрицы Л<г) равен г, так как матрица Л(г> содержит минор порядка г, не равный нулю (этот минор составлен из первых г строк и г столбцов матрицы Л(г>. и равен апа22 ... агг Ф 0, поскольку аг1 Ф 0, а22 Ф 0, ... ..., аггф0), а все миноры, порядок которых больше, чем г, содержат нулевую строку и поэтому равны нулю. Если <7r +1 = <7г + 2 = • • • =<7/» = 0, то в силу сказанного выше ранг расширенной матрицы Л{г> равен г, как и ранг матрицы А^. Итак, если qr + i = qr+2=z... =qm = 0r то система (10) разрешима и ранги матриц ЛИ и Л<г> одинаковы.
352 Глава /*. Линейная алгебра с элементами аналитической геометрии Если же какое-то из чисел gr+t, qr + 2> •••> Йп* например qj, не равно нулю, то система уравнений (10) несовместна и ранги матриц А{г) и Air) различны, поскольку матрица Air> содержит минор (г+1)-го порядка, не равный нулю. Этот минор составлен из 1, 2, ..., г, /-й строк и из 1, 2, ..., г, (я + 1)-го столбцов и равен ап а22 ... arr qj. Согласно лемме, ранг матрицы Л(г> (й(г)) системы (10) совпадает с рангом матрицы А (А), поскольку матрица Л(г> (Л<г>) получена из А (А) в результате элементарных преобразований. Следовательно, система (10) совместна тогда и только тогда, когда ранг матрицы А этой системы равен рангу ее расширенной матрицы Л. Теорема Кронекера—Капелли доказана. § 1*. 10. Формулы Крамера. Обратная матрица Рассмотрим систему п линейных уравнений с п неизвестными яц*1 + ^12*2 + . *. + аихп = h, 021*1 + #22*2 ~Ь • • • +#2Я*Я =^2> . . . * Яя1*1 + Я«2*2+ • • • +ЯппХп =*Ьп. 0) Теорема 1. Если A = det>4 Ф 0, то система (1) имеет единственное ре* шение xr= Ai/A, х2 = Д2/А, ...,*„ = Д„/А., (2) где A=det Л —определитель матрицы А системы (1), а Д/(/=1, 2, *.., л) — определитель матрицы, полученной из матрицы А заменой i-го столбца на столбец свободных членов. Формулы (2) называются формулами Крамера. Доказательство и комментарий были приведены в § 1.10. Отметим, что доказательство является простым следствием свойств 9° и 10° определителей. Систему линейных уравнений можно записать в матричной форме. Пусть *2 Л = (а/у)—матрица размера тХп; х = \ь2 — матрицы-столбцы; xff \xnJ \bmJ #2, *i»t xn — неизвестные; Ъ±, b2l . *.» bm~-заданные числа. Матрицы-столбцы Ах и Ь равны тогда и только тогда, когда числа *i, x2, ..., хп удовлетворяют ->• . '• системе уравнений (1). Поэтому задача нахождения неизвестного вектора х из уравнения
§ 1*. 10. Формулы Крамера. Обратная матрица 353 эквивалентна решению системы уравнений (1). Уравнение (3) называется матричной формой записи системы линейных уравнений. Для квадратной матрицы А при условии det А Ф О решение уравнения (2) можно записать с помощью обратной матрицы. Теорема 2. Справедливы следующие утверждения: 1) матрица Л-1, обратная матрице А, существует тогда и только тогда, когда det А Ф 0. 2) А и А'1 —взаимно обратные матрицы, т. е. А-гА = АА~1 = Е; 3) если для данной матрицы А существует обратная матрица А*1, то она является единственной. I Доказательство. 1) Пусть А = (а/у)—данная матрица, причем dtt А Ф 0. Рассмотрим матрицу det Л! 'An A*i Л12 Л22 А\п AZn (4) где А /у— алгебраическое дополнение элемента а/у в матрице А. Покажем, что произведение матрицы (4) на матрицу А равно единичной матрице: ) = Е. (5) А%п Апп/ \ani апг Действительно, элемент с номером ц в произведении (5) равен dcO (Л ^V + А*аУ + • • • + AnianJ)t (6) т. е. на основании известных свойств определителя он равен единице при i*=j и нулю при i Ф /. Таким образом, матрица (5) —единичная. Мы показали, что для всякой невырожденной матрицы А (т. е. такой, что det Л Ф 0) существует по крайней мере одна обратная, определяемая формулой (4). Если det Л = О, то для матрицы Л не существует обратной. Действительно, если бы существовала обратная матрица Л-1, то Л"1Л=£и согласно свойству определителей (det Л-1)'0= 1, что невозможно. Утверждение 1 теоремы доказано. 2) Пусть Л-1 —матрица, обратная к Л, и (Л~1)_х —матрица, обратная к Л"1. Тогда Л-М=£, (А-1)-1А~1 = Е. (!) 12 № 2636
354 % Г лава I*. Линейная алгебра с элементами .аналитической геометрит Умножая . второе из^ равенств^) на А справа, имеем - (Л-1)-М-М = Л, (ф так как ЕА = А. Умножение матриц обладает свойством ассоциативности;-в част-* ности, это значит, что ((Л-1)-1Л-1)Л = Л, (Л-1)-1(Л-М) = Л. (9) Учитывая равенства (7), получаем (А"1)-1 Е = А и, следовательно, АА~1 = Е. 3) Предположим, что Л"1 и Л Г1—-матрицы, обратные данной матрице Л. Покажем, что они совпадают. Действительно, Ai1A=E; умножая это равенстве справа на Л"*1, получим Ai1AA"x~A"mlt т. е. АГ1 = А~1. § 1*.П. Ядро и область значений линейного оператора Альтернативы Фредгольма для линейного оператора 1°. Ядро и область значений линейного оператора I On ре деле н ие /. Пусть А — линейный оператор, отображающий линейное пространство L± в линейное пространство L2 (возможен случай Li = L2). Ядром -*■ ->• -> линейного оператора А называется множество векторов x£Li таких, что Алг = 0, -> где 0—нулевой вектор из L2. Определение 2. Пусть А—линейный оператор, отображающий линейное пространство- Li в линейное пространство L2. Областью значений линейного one- ратора А называется множество векторов y£L2 таких, что существует x£Li, -►.-►. удовлетворяющий условию у — кх. Теорема 1. Ядро линейного оператора A: Lf-+L2 является линейным подпространством в L^ -> -> -*-*-».-* Доказательство. Если х±, х2 таковы, что Ах± = О, Ах2 = 0, то ->->■->-►->•->->■ -> -» -*■ A(*i + #2) = A*i-f Ал:2==0+0 = 0; для любого Я, имеем А (Ххг) == АА (jcJ = 0. Теорема 2. Область значений линейного оператора A: L* ->• L2 является линейным подпространством в L2. Доказательство. Если у±, у2£L2 таковы, что A*i = yi, А#2 = */2 при -►-*■ ->-»->-> ->_> некоторых д?1, x2£L, то A (^i + ^2)=i/i+y2; для любого % имеем A(bri) = A#b -►-»■-► и векторы уг-\-у2, kyt принадлежат множеству значений линейного оператора А; Определение 3. Линейный оператор A: L± —► L2 называется обратимым, если он задает взаимно однозначное отображение линейных пространств Li и L2. Т е о р е м а 3. Справедливы следующие утверждения: 1) ядрф обратимого, линейного оператора A: Lr —* L2, где линейные прост- ранства Li и L2 конечномерны, состоит из одного нулевого вектора 0£Lir областью значений обратимого линейного оператора A: Lx-+ L2 является все линейное пространство L%\ размерности Li и L2 совпадают-, -> -*> -►-»■-► -> 2) rtf/стб (/i, /2, ••>» /л) и (gi» £2» «««I gn) —базисы в линейных простран*
§f*111. Ядро и область значений лин. оператора. Альтернативы Фредгольма 35# ствах L% и L2. Тогда определитель матрицы линейного оператора А, соответствующей этим базисам, не равен нулю; 3) обратно, если определитель матрицы линейного преобразования A: Lf —► L2, соответствующей базисам (/i, /2, »**»/«) и (gi> £2» »«*> &л)> не.равен нулюу то такой линейный оператор является обратимым. Доказательство. 1) Сформулированное утверждение легко доказывается от противного. Действительно, если ядро линейного оператора А состояло бы ->• более чем из одного элемента 0 или область значений линейного оператора А не совпадала бы со всем пространством L2, то отображение А: Ь± -> L2 не являлось бы взаимно однозначным. 2) Матрица линейного оператора А в базисах (/i, /а, ..», /и) и (gi, g2, •-* > • •*> g«) составлена из коэффициентов разложения A/i = Cjxgi + c2ig2 + - • + Cnign 9 A/2 = Ci2gi + c22g2 + ... + cn2gn, Afn=Clng1 + C2ngz+ . . . +Cnngn. (1) Если оператор А —обратимый, то векторы A/i, A/2, SJ;, A/rt линейно независимы. В самом деле, если бы определитель матрицы (с/у) был равен нулю, то одна из строк матрицы (например, /-я) линейно выражалась бы через остальные, а -» ~> -> соответствующий вектор А// линейно выражался бы через векторы A/i, A/2, ..« -*-*■-»■ • «,, hfi-Ъ A//+I, ».s, А/„, что по предположению не имеет места. 3) Пусть определитель матрицы преобразования (1) не равен нулю; тогда си- -►-*-► стема векторов A/i, A/2, 88!, А/^ линейно независима. Действительно, если бы -» она была линейно зависимой, то вектор А// линейно выражался бы через остальные векторы. Тогда i-я строка матрицы (с/у) с теми же коэффициентами линейно выражалась бы через остальные строки и определитель был бы равен нулю, что на самом деле не имеет места. 2°; Альтернативы Фредгольма '* 2Теорема4 (альтернативы Фредгольма). Пусть Lj и L2—конечномерные линейные пространства, L\ и L2—сопряженные к Ним пространства, А—линейный оператор, отображающий Li в L2, а А*—сопряженный к А оператор, отображающий L\ в L\. Тогда справедливо одно из следующих двух' утверждений: 1) либо линейный оператор А имеет тривиальное ядро Кег А = {0} и область вначений линейного оператора А* совпадает с L\, т. е. ImA*=Z,J; 2) либо линейный оператор А имеет нетривиальное ядро и. область значений линейного оператора А* является собственным подмножеством в Ll. 'У 12*
356 Глава /*. Линейная, алгебра с элементами аналитической геометрии Доказательство. Для любого вектора х£Ь± и любой линейной функции y£Ll имеет место тождество {А*у)(х)=у(Ах). (2) Пусть ядро линейного оператора А нетривиально; тогда существует вектор х Ф О из Ьг такой, что Ах = 0. В этом случае из тождества (2) следует (А*у)х = 0, т. е. значения всех линейных на Lx функций вида А*у равны нулю, если в каче- стве аргумента взят вектор х. Очевидно, что при этом в области значений ли- нейного оператора А* не содержится линейной функции #, лринимающей на век- торе х значение, равное единице. Однако в Lj такая функция у существует, в чем можно убедиться следующим образом. Положим ех = х ф О и построим в L± -►-»•-*■ -» -►-»-»■ -> базис (е\, е2у ..., еп). Для всякого вектора г £ L имеем z = г^ + г2в2 + • • • + 2«^л» -» -»-».-»• где Zi, z2, *.., z„ — координаты вектора 2 в базисе (elt e2t ..., еп). Очевидно, -* -»• что z± является линейной функцией от г и zx(x) = \. Рассмотрим теперь случай, когда ядро линейного оператора А тривиально. Покажем, что область значений оператора А* совпадает с L\. Если предположить противное, то эта область является собственным подмножеством в L* и, в силу теоремы 2, линейным подпространством. Всякое линейное подпространство в ко- * -*• нечномерном пространстве Lx состоит из тех и только тех векторов уу которые -> -*• . удовлетворяют некоторой системе уравнений вида OL1(y) — 0i ос2(#)=0, s.. "*• * *.., &г(у)> гДе ai> «2> -••* аг —линейные функции на Li, являющиеся по определению элементами из (Li)*. Среди cti, а2, • ••> <*г по крайней мере одна линейная функция не равна нулю тождественно, иначе системе уравнений удовлет- ворял бы каждый вектор y^Lx и Li — lmA*. Пусть at Ф 0. Согласно лемме I § 1*.5, линейные пространства Li и (Ll)* изоморфны и, в частности, каждая ли- -> -»■ нейная функция а на L* (т. е. элемент из (L*)*] имеет вид а(у)—у(х), где х — -» -> некоторый вектор из L и х Ф 0. **• -*■ * Таким образом, всякий элемент А*у, y£L2 из ImA* удовлетворяет условию а (А*у) — 0, (А*у) (х) — 0. В силу равенства (2), у(Ах) — 0 для любого y£L2. Отсюда следует, что А* = 0 и ядро А нетривиально. Из полученного противоречия заключаем, что если ядро А тривиально, то область значений линейного оператора А* совпадает со всем линейным пространством L\. -± -> -»■ Пусть в линейных пространствах Лг и L2 выбраны базисы (/i, /2, *.., /„) и -►-»>-»• * * fei» ёг, • • t gn)- В пространствах Llt L2\ двойственных соответственно к Li и L2, выберем базисы (фх, ф2, ..., <p„), (%, iffc» • ••> "ф^^так, чтобы -* jl при » = /, -* /1 при *=/, *'We{o при 1Ф1 ^fe) = t0 при А*|.
§ 1*Л1. Ядро и область значений лин. оператора. Альтернативы Фредгольма 357 Матрицы А и А* линейных операторов А и А* в базисах (Д, /2, *.., /„), (gi> ^Га, .-., g«) и (фь ф2, ..., Ф„), (%, ^2, .... Ф«) транспонированы по отношению друг к другу. Действительно, если - А//= 2 а#£* (* = 1 > 2» •••» п)* то для x = ZjXjft имеем (А*г|>у) * = fy (А?) = if/ (A 2 *///) = ♦/ (2 xiaki8k) e =♦/ (2 аЛж-др/) Ь=2 а/м=2 «у/ф/ м- Это означает, что А*ф/ = 2а//Ф/'» т- е- матрицы А и А* линейных операторов А и А* взаимно транспонированы. Рассмотрим систему линейных однородных уравнений anxt + ai2x2 + ... + ainxn = О, 0*1*1 + Я22*2 + • • * + а2п*п =0, (3) Wl + Я/Я2*2 + • • • + Яжя*я = О, где (а/у)—матрица линейного оператора A: Lf—>L2 в базисах (fo f2, ***» /л) и (gi, ^2t • ••»£/»)• Ядро линейного оператора А нетривиально тогда и только тогда, когда система уравнений имеет нетривиальное решение: если #£КегА, то коэффициенты xi (*=1, 2, ..., я) разложения вектора х по базису (ft,/2 /„), удовлетворяют системе уравнений (3), и наоборот. Рассмотрим теперь систему уравнений ( OilW + «21^2 + ... + ami?m «= Ьи ,т I «f 201 + Я2202 + . . . + Я/«2#/Я =: ^2* >': (4) I 01«У! + Я2пУ2 + • • • + атпУт = *>л* где коэффициенты а,у те же, что и в системе (3), но матрица системы (4) транспонирована по отношению к матрице системы (3). Область значений линейного оператора А* совпадает с линейным пространством L\ тогда и только тогда,.когда система уравнений (4) имеет решение при всяком наборе чисел Ь±, b2i ..., bn* Действительно, если уъ у2, ,.., #Л — коэффициенты разложения^линейной функции ^£Lj по базису (%, if2, ..., г|)Л), т. е. ^ = 01% + У2$2 + ... + УвАт* то bi, b2t ..., ^ — коэффициенты разложения линейной функции А*г[) по базису (фЬ ф2,*..., фя). Если описать понятие ядра линейного оператора А и области значений линейного оператора А* с помощью систем линейных уравнений (3) и (4) так, как это было сделано выше, то получим утверждение теоремы 5 § 1.11.
35^ Глава I*. Линейная алгебра с элементами аналитической геометрии § 1*. 12- Собственные векторы и собственные значения линейных операторов 1°. Определение собственных векторов и собственных значений линейных операторов. Определение I. Собственным вектором линейного оператора А, дейст- вующего- в линейном пространстве L, называется ненулевой вектор x£L такой, что для некоторого числа Я» выполняется соотношение Ах = Хх. (1) Числа Я в этом случае называется собственным значением (числом) линейного one» ротора А; говорят, что, собственный вектор х принадлежит собственному зна* чению Я. Пусть л^—собственный вектор линейного оператора А, принадлежащий соб- -* -* -*• ствешюй^ значению Я,; (h* h* ...»/я) —базис в линейном пространстве L±t где действует оператор А; х°=хх ft+х2 f2 + ... + хп fn — разложение вектора х° по базису (fi, 72, • • .»?*); Afi = aiifi + a*if* + ... +an~ifn (i= 1, 2, ..., я) — разло- жение Afi па базису (/i, jF2, ...v /л). Рассмотрим систему уравнений ( anxi + a12x2 + ... + at»** = Ьгь Й2Й + <*22*2 + - • • + <**пХп = ^2, a*ixi+an2x2+... +annxn = faeni которую можно переписать в виде (ац — X) Xi -f a12x2 + ... + ai„x„ == 0t a21xi + (a22--l) x2+ ... -f a2wA:„ = 0, 0«i*i + 0/22*2 + • •. + font — &) Jf« = 0. Система (3) является однородной системой п линейных уравнений с п неизвестными х1р *2, ..., хп и в силу равенства (1) имеет нетривиальное решение Х\ = = *ь **=*** *..» хп=х%. Это значит, что векторы-столбцы матрицы (2) (3) Л— ХЕ= ( flii—^ Яга *-* ^1л #2i %г — * * • * atn ani ®П2 *•• ЛЛЯ V линейно зависимы (с коэффициентами х°, J& ...»*«) и, следовательно, det (Л—Я£)= = 0. Обратно, если при некотором X выполняется условие det (А — ХЕ) = 0, то система (3> имеет ненулевое решение х\> xl, ..., х%г и вектор x^^xlfi^-x^-jr + »..+*л/и является собственным вектором оператора А. Если базис (/i, /*, . ..»/в) фиксирован, то линейный оператор А однозначно определяется своей матрицей А в базисе (/$, /2, »••> f«)t а каждый вектор #—на*
§>1*.12. Собственные векторы а собственные значения линейных операторов 359 бором коэффициентов Xf, xg? ..„ хп разложения *=#i/i + *2f2 + ' **+xJn- При этом коэффициенты разложения Ах по базису (/х, /2, ••*> /й) вычисляются по правилу умножения квадратной матрицы Л на матрицу-столбец Если х— Собственный вектор линейного оператора Л, то Ах —foe, где через х обозначена матрица-столбец, составленная из коэффициентов х*, х%у ..., х„. Определение 2, Пусть Л—квадратная матрица размера пХп и х—нену- левая матрица-столбец *2 . Если при некотором Я» справедливо равенство Ах=%х, (4) то х называется собственным вектором матрицы Л, а %■—собственным значением («шелол), или корнем; говорят, что собственный вектор х принадлежит собственному значению Я. Для вычисления собственных значений и собственных векторов часто иеполь- зуют следующий прием. В линейном пространстве L, где действует линейный оператор А, выбирают базис (/ь f2> ...,/«), вычисляют матрицу Л линейного оператора А и рассматривают уравнение det (Л — Я£) = 0. (5) При заданных, коэффициентах а/у (*, /=1, 2 п) матрицы Л уравнение (5) представляет собой алгебраическое уравнение я-й степени вида (_!)» А» + лА,»-1+р*Х»-« + 8.. +рп = 0 (6) (числа pii р2, «•*» Р» однозначно определяются матрицей Л). Всякое решение X уравнения (5) обладает тем свойством, что соответствую? щая ему система уравнений (3) или эквивалентная система (2) имеет ненулевое решение Xi, х2, *.., хп. При этом вектор-столбец х2 является собственным век*
360 Глава /*. Линейная алгебра с элементами аналитической геометрии тором матрицы Л, а вектор x1f1-\- #2/2+ • • • +*nfn ~ собственным вектором линейного оператора А. Обратно, если выполнено условие (4), то Я удовлетворяет уравнению (5). Таким образом, уравнение (5) имеет важное значение при изучении собственных значений и собственных векторов линейного оператора А и соответствующих ему в различных базисах матриц Л. Определение 3. Для всякой квадратной матрицы А уравнение det (А—Я£)= = 0 относительно неизвестного Я называется характеристическим уравнением, а многочлен det (A — XE)—характеристическим многочленом. Из предыдущих рассуждений вытекает следующая теорема. Теорема 1. Собственные значения квадратной матрицы А являются кор* нями характеристического уравнения и обратно. Теорема 1 мотивирует следующее определение. Определение 4. Корни характеристического уравнения матрицы называются также собственными значениями, собственными числами и корнями мат* рицы. Определения 2 и 4 эквивалентны. 2°. Теоремы о собственных векторах и собственных значениях. Если матрица А рассматривается над/полем комплексных чисел С, то характеристическое уравнение det (Л — Я£) = 0 определяет в силу основной теории алгебры (см. § 5.4) п собственных значений (с учетом кратности) комплексных чисел Яь Я2, ..., Я„. Для вычисления собственного вектора, принадлежащего собственному значению Я, следует, как указано в п. 1°, найти ненулевые решения системы линейных уравнений вида (fall — Ц *1 + «12*2 + • • • + Of пХп = О, о21*1 + (я22 —ty*2+...+ a2nxn = 0, pj 0,21*1 -h о„2*2 + ... + (апп — Х)хп = 0. Такое решение существует, если det (А — ХЕ) = 0; координаты *Ь хъ iii? xn соб- ственного вектора #, принадлежащего собственному значению л, являются комплексными числами. Если матрица А вещественная, то ее собственные значения (корни характеристического уравнения) могут быть и не вещественными. Поэтому можно гарантировать существование ненулевого решения системы линейных уравнений (7) только в поле комплексных чисел С (вещественное решение этой системы может отсутствовать). Еще раз отметим следующее. Матрица А — вещественная, ее можно рассматривать как матрицу линейного оператора А, действующего в линейном пространстве L над полем R вещественных чисел. Матрица А имеет ровно п корней с учетом их кратности (возможно, комплексных). Каждому корню X матрицы А соответствует ненулевое решение системы (7), при этом комплексному корню А. соответствует комплексное решение х±, *2» • ••>*«• Ненулевое решение системы (7) определяет выражение xifi + xJt+...+x„fnt (8)
§ 1*J2. Собственные векторы и собственные значения линейных операторов 361 представляющее собой формальную линейную комбинацию векторов базиса (/i, /г> •••»/«)» в котором линейному оператору А соответствует матрица Л, с комплексными коэффициентами #i, x2i ..., хп. Строго говоря, выражение (8) лишено смысла, поскольку в линейном пространстве L векторы можно умножать лишь на вещественные числа (линейное пространство L рассматривается над полем R). В то же время выражение (8) при вещественных xit х2> . ••♦ хп (и при вещественном X) означает собственный вектор линейного оператора А. Поэтому естественно попытаться придать строгий смысл этому выражению. Определение 5. Пусть L — конечномерное линейное пространство над по- лем R и (/ь /2, ..., /я)— базис в L. Пусть, далее, Lr означает множество выражений вида cJi + c2f2+...+cnfm (9) где Cif с2, * i., сп — произвольные комплексные числа (два выражения c\fx-\-c2f2-\- + ... + cnfn и С\ fi~{-c2 /2+... +cnfn считаются тождественными тогда и только тогда, когда c1 = ci с2 = с2, ..., сп = сп). На элементах множества Lc определены операции сложения и умножения элемента из Lc на комплексное число, которые выполняются по следующим правилам: (cji+cj2 + ... + cnfn) + 0! + с2%+ ... + cnfn) = = (ci +*i) /i + (^2 +c2) /2+ • • • + (cn + cn)~fn\ HcJi+cj%+... +c,»7„)=(fei)7i+(fei)7i+. •.+<k»)7ii. Указанные операции удовлетворяют свойствам 1° — 8° (см. с. 292, 293) и превращают Lc в n-мерное линейное пространство над полем комплексных чисел, называемое комплексификацией я-мерного линейного пространства L над полем вещественных чисел. Формально линейное пространство 1У определено с помощью базиса (flt /2, ... ,.., /л) в линейном пространстве L. Однако нетрудно показать, что Lc не зависит от выбора базиса в L. Действительно, пусть в L заданы два базиса: (fl9 /2, •• -. *••» /л) и (gi, g2, ..., gn)9 причем gi = y£ai/fj (i=\, 2, ..., л). Тогда всякое / выражение Cigi + C2g2 + • • • +cngn однозначно определяет выражение 2 c*<Wi + 2 с*а*2^ + • • • +2 ckaknfn- k k k Мы получили отображение множества L% в L^, где через L^ и L? обозначены комплексификации линейного пространства L с помощью базисов (gx, £2» . • •, gn) и (/i» /2» • ••> fn) соответственно. Построенное отображение является взаимно однозначным и линейным, т. е. сохраняет операции сложения векторов и умноже-
362 Глава I*. Линейная алгебра с элементами аналитической геометрии ни я вектора на комплексное число. Это означает, что линейные пространства L*} и L^ изоморфны. Всякий линейный оператор А, действующий в линейном пространстве Lc, обладает свойством а 2 */Й=2 Л гДе (!ъ /г» 8* *t fn) — базис в Li a Cf, с2, **., с„^С. Поэтому оператор А одно- значно определен векторами Afi, A/2, *.., А/„. Теперь выражение (8) принимает следующий смысл: 2*//* есть вектоР из ^С такой, что А 2** Л' — ^2л:/^, т# е' вектор 2 */// является собственным и принадлежит комплексификации простран-. ства L. Множество всех собственных векторов линейного оператора А* принадлежащих собственному значению к, вместе с нулевым вектором образует линейное подпространство пространства L. Действительно, если х, y£L таковы, что А# = Ах, Ay — %yt то А (*+#) = = Адг-f А# = Я?+Я# = Л (*+#), A(\xx) = ii(Ax) = \x(kx) = k(ixx). Теорема 2. Пусть Sx и Sy,—линейные пространства, состоящие из собственных векторов оператора А, принадлежащих соответственно собственным ->•■ значениям К и ц (к Ф ц,), и нулевого вектора. Тогда Si f)Sn ={Q}.., ■ Д о каз а те л ьство. Пусть x^Sx П^М» тогда Ах = Хх н Ах=цх; значит» л# = цл:, (Я—\i)x = 0 и так как Я. Ф \i, то л:=0. , Следствие. Всякое множество собственных векторов, принадлежащих различным собственным значениям, является линейно независимым. Доказательство. Воспользуемся методом математической индукции. Пусть утверждение следствия доказано для всякого множества из k собственных векторов, принадлежащих различным собственным значениям. Утверждение теоремы 2 совпадает с утверждением следствия при k — 2. Рассмотрим множество hi, h2, *.., hk, hk+i, состоящее из k-{-\ собственных векторов линейного оператора, А с собственными значениями %i, Х2, ..., hk+i соответственно, причем %i Ф %j при (г, /= 1, 2, ..., k-{-1; i Ф /). Допустим, что указанная система век- торов связана соотношением h+1 = cfa + c2h2 +... -f ckhkf где Ci, c2i 8i., c#—некоторые числа. Имеем A hk+£ = cxЯх/ii + с2Я2/*2 + *! * + ct^kHt. -
§1*.12. Собственные векторы и собственные значения линейных операторов Z№ ^k+iflk+i = c1Kk+1 hx-\-c2^fc+i/i2+ ••• + £* ^fe+ifyb Последнее соотношение означает линейную зависимость множества собственных векторов {Ль /i2,...,^}> состоящего из k векторов, что противоречит индуктивному предположению. Следовательно, всякая система из k+l собственных векторов, принадлежащих различным собственным значениям, линейно независима. . О преде ление 6. Множество собственных значений матрицы А (с учетом их кратности) в поле комплексных чисел называется спектром матрицы А. Как известно, всякому линейному оператору А, действующему в линейном пространстве L, в котором выбран базис, соответствует матрица. Один и тот же линейный оператор в различных базисах описывается различными матрицами. Однако при этом множества собственных значений всех таких матриц совпадают. Приведем точную формулировку и доказательство этого факта. Теорема 3. Пусть А—линейный оператор, действующий в линейном ко- нечномерном пространстве L над полем вещественных или комплексных чисел\ (fi, -> ->.->-> -► /2» •••> fn) u (gi* £2» -"jgn)—два базиса в L\ А и В—матрицы линейного one- —> —> —> —>■ -* —> ратора А в базисах (fi,.f2, ...,fn) и (glt g2, . ..,£Л) соответственно. Тогда- спектры матриц А и В совпадают. 2 Доказательство. Очевидно, достаточно доказать, что характеристические многочлены матриц А и В совпадают. Известно, что элементами а,у и b[j матриц —> -> -> —*• —^ А и В являются коэффициенты разложения А// и Ag/ по базисам (/i,/2, ...,/«) и fei» #2» •'••» £*) соответственно; таким образом, А/7 = auh + a2if2 +...+anifn (/= 1, 2, ..., n), (10) Рассмотрим разлвжение векторов /,• по базису (gu g2f ..., £л) и векторе» &• по базису (/i, f2t ...,?«). Пусть ft = ci/gi + c2/g2 -f... +*«/£/! (/=1,2, .... п)< (12) gi^clif1+c2if2+...+cnifn 0=1, 2, ...,я). (13) Коэффициенты с/у (t\ /=1, 2, ..., я) образуют матрицу С, а коэффициенты CU (<» /==1, 2, ..., п) — матрицу С.
364 Глава /*. Линейная алгебра с элементами аналитической геометрии Покажем, что матрицы С и С—взаимно обратные, т. е. С^С-1 или СС = Е9 где £—единичная матрица. В самом деле, из равенств (12) и (13) имеем k k, S 2( 1 при i = s, и, следовательно, -jT- v 0 при 1 $£ s, Согласно определению произведения матриц, выражение 2^л^а/ представляет /г собой элемент произведения матриц СС с номером si. В силу равенств (15) произведение СС является единичной матрицей. Для того чтобы установить связь между матрицами А и В линейного опера- тора А в базисах (/ь /2, ..., /„) и (gi, g2t ..., gn), в равенстве (10) заменим ->■ -»• -» // на g/ (*=!> 2, *.., я), используя формулы (12) и (13). Тогда получим А// «=■ — 2а*'Ль или А ^2 csiSs]= 2 flfttoft&» (* = 1. 2. •.., я). \ s / k, s (16) Умножив левую и правую части этих равенств на с/у и сложив полученные результаты, имеем • А 2 CsiCijgs = 2 akicsi£ijgs- (17) s, t fc, s, i Учитывая равенства (15), получим Ag/= zl CskukiCj/ftsi кроме того, Ag/ = 2 bs/gs [см. равенство (11)]. Так как каждый вектор однозначно разлагается по базису, то из сравнения двух последних соотношений следует, что 2 csk4iCij = bSJ (s, /=1, 2, ..., л). (18) k, i Выражение 2 cskaki является элементом матрицы С А с номером si, а выражение k ^S I ^1 cskaki 1 fry—элементом матрицы С АС*1 с номером s/. Итак, / \ ft / Б-СЛС-1, (19) где А и Б —матрицы оператора А в базисах (/*, /2 fn) и (#ь ёГх» •••> gn) соответственно; С — матрица, составленная из коэффициентов разложения (12) векторов // (/=1, 2, ..., л) по базису (gi, g2> • ••> £«)'» С-1 —матрица, обратная С. Рассмотрим характеристические многочлены матриц А и В: РА (к) = det (А — Щ, Рв (Я) = det (В - КЕ). (20)
§ 1*.12, Собственные векторы и собственные значения линейных операторов 365 Учитывая равенство (19), имеем Рв (k) = det (В — Щ = det (САС^—ХЕ) = det С (А — %Е) С-1 = = det С det (А — ХЕ) det C-^det (A — ХЕ) = РА (X), (21) т. е. />в(А,) = Рд(Я). Из равенства (21) и теоремы 1 вытекает утверждение о совпадении спектров матриц А и В. 3°. Подобные матрицы. Определение 7. Две матрицы А и В размера пХп называются подобными, если существует такая невырожденная матрица С, что Как следует из доказательства теоремы 3, матрицы одного и того же линейного оператора А, действующего в линейном пространстве L, которые соответствуют различным базисам в L, подобны. Обратно, две подобные матрицы А и В = САС"1 задают один и тот же линей- ный оператор А в базисах (/1,-/2» ..., fn) и (gi> £2» •••» £«)> связанных между собой соотношениями //=2 **/2*» ?/=2^*, (22) где числа с#/ и 2?£/ (&, /= 1, 2, ..., га) образуют взаимно обратные матрицы. Действительно, если A = (а,у) — матрица линейного оператора А в базисе (fi> /2» . ••> /72) и В = (b;j)~-матрица линейного оператора В в базисе (gi, g2, ..» ..., g»), то A// = 2<W*. в£/*2**#* ('=*. 2> •••> *)- (23) Вычислим в(2^/£*) = В//. Имеем в2сА/£* =2с*А-/г£/-; так как В = САС-г, то 6гл = 2 CrsQstctk- Отсюда 5,/ Я// = 52 C*'*£* = 2l ckicrs<l$tCtkgr = fe fe, Г, S, t = 2 ( ^jckicrsastctkgr )= 2 Г2^*Г/,*а^г e r, s, А /г / r,s,t\ k J = 2 crs^sigr = ^asifs=^fi. (24) Здесь учтены равенства (23) и тот факт, что числа с#, ?^ (/, &, t=l, 2, ..., л) образуют взаимно обратные матрицы. Равенство (24) означает, что линейные опе- раторы А и В одинаково действуют на векторы базиса (/х, f2, ..., /я); отсюда следует, что А = В. Отметим, что отношение подобия является отношением эквивалентности. В самом деле: 1) А = ЕАЕ-1 (рефлексивность); 2) из В —С АС"1 вытекает А = С~гВС (симметричность); 3) если В = САС~Х и A^DFD-1, то В = = CDFD~1C~1 = (CD) F (CD)"1 (транзитивность).
366 - Глава /?. Линейная алгебра с элементами аналитический геометрии Доказательство теоремы 3 и определение 7 мотивируют следующий вопрос: какова «самая простая» матрица из всех матриц, соответствующая линейному оператору А во всевозможных базисах линейного пространства L? Ясно, что решение этого вопроса важно при изучении линейного оператора .А, поскольку это изучение часто связано с рассмотрением матрицы линейного оператора. Ответ на поставленный вопрос дает теорема о нормальной жордановой форме матрицы. Доказательство ее довольно сложно. Отметим, что основная трудность доказательства относится к матрицам специального вида. Что же касается матриц «общего положения» (ниже будет объяснен смысл этого термина), то вопрос о простейшей матрице среди всех подобных решается просто. А именно, справедлива следующая теорема. 3 Теорема 4 (о приведении матрицы линейного оператора А к диагональному виду). Пусть А —матрица размера пхп такая, что ее корни попарно различны. Тогда существует матрица В% которая подобна матрице А и является диагональной: (Ч В: Ki о о' • кп) причем числа Af, Я2, ..*> Ал образуют полный перечень (различных) корней матрицы А. Доказательство. Матрица А задает линейный оператор А такой, что Ah = Ah (каждый столбец h переходит в произведение матрицы А на вектор-столбец h). Пусть А*, А2, ..., Хп— множество всех корней матрицы Л, т. е. множество корней характеристического уравнения det (А—Я£) = 0. Согласно теореме 1, каждому X; соответствует ненулевой вектор-столбец А/ такой,, что «ЛЛ/ = А/Л/ (i=I, 2, ..., л). В силу следствия из теоремы 2, п векторов /if, /г2, it., hn образуют линейно независимую систему и, следовательно, (/if, h2t **., hn) — базис в пространстве L (или в его комплексификации Lc). Построим матрицу В линейного оператора А в этом базисе. Имеем М,- = ЯЛ- = 0.£ + 0.£+...+ (/=1, 2, 4.., п). Согласно определению матрицы линейного оператора в базисе, получим ь о в = О
§ 1*.1$.Собств;'векторы- и:'совете, -значения самосопряженный операторов 36£ § 1*. 13. Собственные векторы и собственные значения самосопряженных операторов. Теорема о полноте собственных векторов Определение. Пусть L—конечномерное линейное пространство над полем комплексных чисел и Я (х, у)—функция от пары векторов из L со значениями в поле комплексных чисел такая, что: R Н(хг + хг, y) = H(xiy у) + Н(х2, у) у*ь *2, yQ\ 20. Я(Хж, у) = 1Л(х, ~у) v£ y€L, X£C; Зо. Н(ху */i + t/2) = #(*> l?i) + tf (*. #2) V*. #ъ «/26^; 4°. Н(х, %у)~ХН(х, у) v*> #€^> л£С, где Я—комплексное число, со»ря*«- женное X; 5о. Я(^Л)^0; Я(*, *) = 0<Ф*=0. Линейное-пространство £ вместе с функцией Я (#, у), удовлетворяющей^ свойствам 1°—5°, называется эрмитовым линейным пространством (при этом функция Я (#, у) называется эрмитовым скалярным произведением). Теорема 1. Собственные значения вещественного самосопряженного оператора А, действующего в вещественном линейном пространстве^ являются действительными числами. I Доказательство. Пусть L—заданное линейное пространство над полем- вещественных чисел R, L^—его комплексификация и (х, у)— евклидово скалярное произведение в L. Определим в Lc эрмитово скалярное произведение с помощью формулы у !-\ у •—V - у mJ^ , ,у у —.v — у -у у а ^ Я(*. y) = H(xi + ixt9 yt + iy2) ={xit #i) + (*2, у2) + i(x2t yi)—i (xit y2)t м,у - у у у ^.у, —у , ,у „.у, , ,у г у , у , у где лг = ^!-Ь/лг2, y = yi+iy2, Xi, x2, yu y&L. Покажем, что Я (*, у) удовлетворяет условиям 1° — 5° определения. Справедливость свойств 1° и 3° очевидна. Проверим выполнение свойства 2°. Пусть Х = а + ф, a, P£R. Тогда Я {Хх, у) = Н ((а + ф) (Xi + *дг2), ^i + iy2) = Я (ад^—р*2 +«(Р** + ах2), ^ + /у2) = = («*i—-P*2, #i) + (P*i + a*2, #2) + *(P*i + a*2, Уг) — i (a*i—р*2, #2) = = (а + Ф)(*ь #i) + (a+'P)(*2, Уя) + *'(а + «'Р)(*я. 0i) —*(<* + #) Й. #2) = = (« + 1РЙ + С Й + 'Й = (а + «вР)Я(?, й = ЛЯЙ Й- Проверим теперь выполнение свойства 4°. Пусть Л,==а + Ф, а, P£R. Тогда- Н{х, Xy) = H(Xl + ix2, (a + /P) (^ iy2)) = H (x1 + ix2t o#i — P#2+*4P#i + a^})»= =(*i. ОДг-РЫ + (*2, P^i4-ai/2) + t (*2, a^i — P#2) — /(*!, pf/i + a^) = = (« — #) Й, 7i) + (« —*P) И. #2) + * (а--'Р)Й, £) — '(а — *P) Й, #2) = . = (« —#)[(*!> 0l) + (*2» ^2) + *(*2, 0l) —(*i. ^)J = = (a -;ft Я (*, ^) =lH (x, #).
368 Глава /*-. Линейная алгебра с элементами аналитической геометрии Проверим, наконец, выполнение свойства 5°. Имеем Я(я, *) = Я(д^ + &а» *i+**2) = = (*Ъ *l) + (*2, *2) + '(*2, *l) —*(*1". *2)=--(*Ъ *l) + to> *2)>0. Последнее соотношение справедливо, так как to, х2) = (х2, хг) и to» *x):^0, -»- -► -> -> to» *г)^0 по определению скалярного произведения в L. Кроме того, to, хг)= = 0^*1 = 0, (х2, х2) = 0&х2 = 0, откуда Я (*, x) = 0<=^to, хх)-\-(х2, *г) = = 0«Ф?1 = 0, ?2 = а Покажем, что Я (А?, у) = Я(*, А#). (1) Действительно, при х = х± + to, y = yi-\- iy2, *i, #2» #i» #2 €^ имеем . Я (A?, у) = Я (A to + /x2), yt + iy2) = Я (А*х + *A*2, #x + iy2) = = (Axi, t/i) + (Алг2, #2) + i (Ax2, «/0 — i (Ax±, y2). (2) Здесь использовано определение эрмитова скалярного произведения и тот факт, что линейный оператор А —вещественный, т. е. Ax£L, если x£L. Используя определение понятия самосопряженного оператора, "действующего в евклидовом пространстве L, т. е. формулу (А#, у) = (х, Ay) yx, y£Lt получим Я (A*, у) = (хг, Ауг) + (х2, Ay2) + i(x2, A^) — i(x1$ Ay2) = H (xt Ay), и, значит, формула (1) справедлива. Пусть теперь Я — собственное значение, и х—собственный вектор, принадлежащий собственному значению линейного самосопряженного оператора А. (Пока не доказано, что Я—вещественное, будем предполагать, что Я—комплексное число, т. е. Я = а + ф, а, P£R; при этом и собственный вектор х также является комп- лексным и может быть представлен в виде x = x1-{-ix2, *i, x2£L.) На основании равенства А* = Ял: имеем Я (Ал:, х) = ХН (х, х)\ с другой стороны, Н (Ах, х) = ->■ -» — -»•-»> -»•-»• — Н(х, Ах)=ХН(х, х) (здесь использовано свойство 4°). Учитывая, что (*, *) 7=0, -> ->• поскольку а: Ф О, и свойство 5°, имеем К —к, т. е. &gR. Теорема 2. Пусть А — самосопряженный вещественный оператор* действующий в вещественном конечномерном евклидовом пространстве Е. Множество Q собственных векторов линейного оператора А обладает следующим свойством (свойством полноты множества Q): в пространстве Е существует ортонормированный базис (fi, f2, ...,/«), составленный из векторов множества Q. 2 Доказательство. Пусть х£Е—собственный вектор самосопряженного оператора А, принадлежащий вещественному собственному значению Я, a Lx — множество всех векторов из Е, ортогональных вектору х. Это множество является
§ 1*.13. Собств. векторы и совете, значения самосопряженных операторов 369 линейным пространством. Действительно, если у, z£LXi т. е. (л:, у) = 0, (х, г) —О, ->-»>-»>-»-> -» -> то (х, у + г) = О и y + z£Lx; аналогично из y£Lx следует, что ccy^Lx: при -»•-»■ -»■ -► любом вещественном а имеем (*, ау) = <х(х, у) = 0. Покажем, что линейный самосопряженный оператор А обладает следующим ->•->■ -* ->-> -»-> свойством: Ay£Lx yy£Lx. В самом деле, если y£Lx, т. е. (л:, #)=0, то (Ау, *)= -*->-».-»■ -» = (#, А#) = л(у, #) = 0, так что Ay(£Lx. -» -» Для любых двух векторов у, z£Lx справедливо равенство (Ау, *) = £, АГ), (3> поскольку аналогичное равенство справедливо для любой пары векторов из £. Итак, линейное преобразование, которое определяет оператор А на LX9 является самосопряженным линейным оператором. Доказательство теоремы проведем индукцией по размерности п евклидова пространства, в котором действует самосопряженный оператор. Для евклидова пространства, размерность которого равна 1, теорема очевидна, так как в этом случае всякий ненулевой вектор является собственным и всякий вектор единичной длины представляет собой ортонормированный базис. Пусть теорема доказана для всех евклидовых пространств, размерность которых не превосходит п. Покажем, что теорема верна и в случае, когда размер- -> ность пространства Е равна л+1. Выберем в Е собственный вектор х (принадлежащий вещественному собственному значению %). Рассмотрим линейное пространство Lxt состоящее из всех векторов из £, ортогональных вектору х. Как было доказано выше, оператор А переводит линейное пространство Lx (размерности я) в себя и действует в этом пространстве как самосопряженный оператор, т. е. удовлетворяет условию (3). По индуктивному предположению в Lx существует ортонормированный базис (/ь /2, ..., /„), составленный из собственных векторов one- -*■-*■-»■-*■ -> ратора А. Очевидно, что система из д + 1 векторов х/\х\, /f, /2, -••> fn является ортонормированным базисом в Е, чем и завершается доказательство. Отметим один важный частный случай теоремы 2. Пусть самосопряженный линейный оператор А, действующий в евклидовом пространстве Е размерности я, имеет ровно п различных собственных значений Л*, Л2, ..., Хп- Тогда эти собственные значения являются вещественными и принадлежащие им собственные -> -> -*■ векторы Xi, #2, ..., хп образуют линейно независимую систему. Более того, эти векторы попарно ортогональны. Действительно, (A**, Xl) = Xk(xk, xt)y (Axk, */) = (**> А^) = Яг(д:Л, xt). (4) Из равенства (4) следует, что при Х^ Ф %t скалярное произведение (*£, */) = 0 (&, /=1, 2, ..., п). Следовательно, базис #i/|*il, х21\х2\, •••> хп/\хп\9 где 1##|—длина вектора xk (£=1, 2, ..., л), является ортонормированным.
370 Глав»:/*. Линейная-* алгебра с элементами аналитической геометрии § 1*.14. Преобразование матрицы линейного оператора при переходе к новому базису. Канонический вид самосопряженного оператора Пусть А—линейный оператор, действующий в линейном пространстве L; Q, Q.'— два базиса в L\ A (Q), A (Q')— матрицы линейного оператора А в базисах QhQ'' соответственно; С (Q, Q') — матрица перехода от базиса Q к базису Q', т. е. если е, = cnei +с21е2 -f-. * * +Степ* е2 ==^2ei +с22е2 + • • • +Сп&п* «л = Ci«^i+сгпег -f ... + сппеп % (О то C(Q, Q') = Ci£ С12 m Cin* C%i С22 ... С2я , с«1 ^я2 спп 4 (2) Теорема 1. Справедливо матричное равенство А ($') = С-1 (Q, Q') Л (Q) С (Q, Q'). Доказательство было приведено в § 1.14. Теорема 2. Пусть Линейный оператор А, действующий в линейном пространстве L, обладает тем свойством, что из его собственных векторов можно составить базис линейного пространства. Тогда в этом базисе матрица оператора А имеет вид л= 0 0 ъп) (3) Доказательство было приведено в § 1.14. Теорема 3. Пусть К—самосопряженный линейный оператор, действую* щий в евклидовом пространстве L. Тогда в пространстве L существует ортвнор* мированный базис Q, в котором матрица оператора А имеет вид (3), где Л*, &2, ...» kn—вещественные числа. Доказательство было приведено в § 1.14. I Теорема 4. Пусть А—линейный оператор, действующий в конеч» номерном линейном пространстве L над полем комплексных чисел. Тогда в L существует базис (ft, /2» «•*» fn) такой, что матрица линейного оператора А
§ J*?.f4.... Преобразование матрицы лин, оператора при переходе к новому базису 371 в &том базисе записывается в виде Л = I О О /* W где 1г (/=1, 2, ,«., k)—квадратные матрицы порядка г^ имеющие вид (h 1 ) h 1 О // = О 1 (5) (числа %i являются собственными значениями линейного оператора А и при различных / могут совпадать между собой). Матрица (4) линейного оператора А называется нормальной жордановой формой матрицы линейного преобразования А, а матрица вида (5) — жордановой клеткой. Утверждению теоремы 4 можно придать и другую форму. Пусть А— матрица линейного преобразования А в некотором базисе. Известно, что при замене ба- виса с помощью матрицы С матрица А изменяется по закону ...... .Д-*С-*АС. (6) Теорема 4 утверждает, что всякую (комплексную) матрицу А путем-преобразований (6) с помощью некоторой матрицы С можно привести к виду (4). Приведем примеры нормальных жордановых форм матриц: {к 1 0 0 к 1 0 0 к { к 1 0 к к{ \ |а 1 [ |0 [i/ Ьфр; П = 3, г2-2, г3=1, П=^2; -. А»1 ,= Л2 = Лз == kf A4==ft» А I к 1 к 1 к 1 А 1 к ц 0 I Oil) к фу,; /i = 6, r2 = r3=\; А,- == Я, i = 1,..., 6; к7 = к8 = ix. я и- м- i л <yj к Ф jr, к.Ф уу \i Ф v.; г± = г2 = г3=г4=Г5= 1; Ai =.A-2 = А, ^ . Я3 = Я4=ф, A5 = v.
372 Глава /*. Линейная алгебра с элементами аналитической геометрии Матрицы It (жордановы клетки) определяются по исходной матрице А однозначно с точностью до нумерации. Доказательство теоремы приведено в курсах высшей алгебры. § 1*. 15. Квадратичная форма. Матрица квадратичной формы. Приведение квадратичной формы к каноническому виду с помощью ортогональной матрицы 1°. Приведение квадратичной формы к каноническому виду. Определение 1. Числовая функция / от х = (х±у х2у ..., xn)£Rn вида • /(*) = / (*ь *2, • • •, хп) = 2 <*tjxixj, (1) i.j где а,у—заданные числа такие, что а/у = ау-/, называется квадратичной формой в R". Определение 2. Квадратная таблица, составленная из коэффициентов а/у квадратичной формы (1), называется матрицей этой квадратичной формы. Пусть переменные ylt у2, • ••■> Уп и xi> х2, • ••> хп связаны соотношениями *1 = СПУ1+ С12у2 + . . . +СыУп, У± = СцХ! + С12Х2+ . . . + С\п*п* х2 = спуг + с22у2 + • • • + с2пуп у Уг = ?2i*i + '-22*2 + --- + с2пхПУ ~ Хп = ^lf/l + Сп2У2 "f - • • + СппУп J </л = ?и1*1 + £, ЯГ2 + . . . + Сл л*л, где (с/у) и (с/у) — заданные (взаимно обратные) матрицы С и С""1. Положим £(</ъ #2, •••, Уп) = !(сцУ1 + с12у2+ ...+с1пуп, 0*&1 + С*&2+.--+ЪпУп> •> Сп1У1 + С„2У2+...+Сппуп). Функция g(yi, y2, ..., Уп). является, очевидно, квадратичной формой. Будем говорить, что квадратичная форма g получена из квадратичной формы f с по- _> _+. мощью матрицы С. Пусть А и В — матрицы квадратичных форм f (х) и g (у) соответственно. Теорема 1. Справедливо соотношение В — С'АС, где С — матрица, транс* панированная по отношению к С. Доказательство было приведено в § 1.15. Теорема 2. Всякую*квадратичную форму f (x) (с вещественными коэффи-* циентами) можно представить в виде f Й=g (у) = Kyl+^yl +... + Ку1 (3) где переменные х±, х2, ..., хп, yt, y2, ..., уп связаны соотношениями (2), причем матрицы С и С*1 ортогональны. Доказательство было приведено в § 1.15.
§ /*J5. Квадратичная форма. Приведение квадр. формы к каноническому виду 373 Теорема 3. Пусть f (х)—квадратичная форма с вещественными коэффициентами и матрицей Л. Тогда существует невырожденная матрица С такая, что С'АС = В, где В = п '\ —1 « ~1 1 1 1' 1 ; 1 \ 1 ' 1 у ° i 1 •Jj (4) Г > s h При этом числа г, s, t однозначно определены квадратичной формой f (x). I Доказательство. На основании теоремы 2 существует ортогональная матрица D такая, что D'AD = О о Рассмотрим матрицу (hi # = h2 О К) где hi^XlVTi при Л,/ > 0, /t/=l/Vr==T/ при Я/ < 0 и ft/=l при fy=0. Тогда, выбрав С = £>#, имеем (Л?*1 C'AC = H'D'ADH = h^ki 2^2 /\ О '• /*/Д« I (5)
374 ' Глот 1*. Линейная алгебра "с элементами аналитической геометрии и в силу сделанных предположений (1 при Я/ > О, —1 при Я/ < О, О при Л/=0 (i = l, 2, ,i4, я). Следовательно, матрица (5) имеет вид (4) и первое утверждение теоремы доказано. Допустим, что матрица А квадратичной формы / приведена к виду (4) двумя различными способами: Л1 = \ ^ У s ЛГ= Тогда должны выполняться равенства / (х) = yt+yl+ *.. +уг—уг+i —yhz — . * * —As, где yi = ^jPikXk (' = *> 2, .*., n)\ k (6) (7) (8) (9) Покажем сначала, что / = *'. Отметим, что значение квадратичной формы f(x), соответствующее набору Н* х2> *••» *п> можно выразить с помощью матричного умножения, а именно f(x) = x'Axt (10)
§J*J5, Квадратичная форма. Приведение квадр. формы к каноническому виду 375 —матрица-столбец, a x' = (xi, х2, »•*» хп)—матрица-строка. Рас- >хп' смотрим также функцию F (и, v) от двух наборов переменных (#£,. u2i ««*, «л)= =и и (z/j:, i>2> «*•» ^л) = ^ определенную формулой F(uiv) = u^A^ ' (И) где «' = (#£, н2* *«• ««)—матрица-строка, а р = [ ' ]—матрица-столбец. Ре- зультатом матричного умножения в равенствах (10) и (11) является матрица **• -*■ "*■ размера 1x1, т. е. число. Очевидно, что F (х, x) = f(x). Легко видеть, что F («, v)=f(u+v)— f (u)—f (v), поэтому функцию F (и, v) можно определить, не используя понятие матрицы квадратичной формы. Если в формуле (10) заменить x±t х2, ..., хп на уи у2, , «,8 yn [см. формулы (2)], то g(jfl = f (€&=$€'АСу^'В]?, (12) где квадратичная форма g(y) получена из / с помощью матрицы С§ а В—мат- -> рица квадратичной формы g (у). Аналогично, заменяя в формуле (И) и и и соответственно на Cm и Сг, получим F(Cto, Cz)=^w,CACz^w,B7i ' (13) где ш = 1 * )>z = [ ' J—матрицы-столбцы, a w' = (w±9 w2i . *«f шл)~матрицастрока. Для заданной квадратичной формы / (#) с матрицей А построим функцию F (и, у) вида (11) и рассмотрим множество всех векторов v таких, что для вся- кого к выполняется равенство F (ut v) = 0. Это множество является* линейным пространством. Обозначим размерность этого пространства через dti а само .пространство—через' L0. Отметим, что как само линейное пространство L0, так и его: размерность определены без использования понятия матрицы квадратичной фермы.
37§ Глава I*f Линейная алгебра с элементами аналитической геометрии Вычислим теперь d с помощью матриц квадратичных форм (6) и (7). Пусть и'Mv — 0 при любом и. Очевидно, что Mv = Oy иначе можно выбрать w так, чтобы «Mti $£ 0. При этом вектор v имеет вид 0 0 r+s (U) (звездочками обозначены произвольные вещественные числа). Множество всех векторов вида (14) представляет собой линейное пространство размерности t. Рассуждая аналогично относительно матрицы N, можно сделать следующий вывод: множество всех векторов v таких, что u'Nv = 0, для произвольного вектора и' является линейным пространством размерности f'. Поэтому t = d = tr. Покажем теперь, что r = r', s — s' [см. формулы (6) и (7)]. Предположим, что г > г'. Рассмотрим систему линейных однородных уравнений относительно *lf %2t • ••♦■*/!• {,,.=<) (« = r+l, г+2 r + s); 2/ = 0 (/=1, 2 г')- (15) Левые части в равенствах (15) представляют собой линейные функции (8) и (9) от хь х2, ..., хп. Эта система при г > г' содержит r'-\-s уравнений, что меньше, чем r+s. Поэтому размерность пространства решений этой системы уравнений больше, чем я—(r+s) = d. Приравнивая правые части соотношений (6) и (7) и учитывая равенства (15), имеем 2 , 2 г i 2 2 2 2 Так как переменные г/х, у2, ..., #«, *ь ^г» • ••> zw — вещественные, то Уг=0 (*=1, 2, ;.., г); гу = 0 (/ = г'+1, .... г'+ 8% (16) Отсюда следует, что каждое решение системы (15) является решением системы (16), т. е. решением объединенной системы у/ = 0 (i = l, 2, ..., r+s); г/==0 (/=1, 2, ..., r' + s'). (17)
§ P. 15. Квадратичная форма. Приведение квадр. формы к каноническому виду 377 При этом у имеет следующий вид: (18) Множество матриц-столбцов у вида (18) представляет собой d-мерное линейное пространство, в то же время пространство решений системы (15) имеет размерность большую, чем d. Получилось противоречие, поскольку линейное пространство большей размерности не может быть линейным подпространством в пространстве меньшей размерности. Следовательно, сделанное допущение, что г Ф г', неверно, т. е. г = г' и s = s'. 2°. Система координат в пространстве Rn. Определение 3. Множество упорядоченных наборов (лгь х2у ..., хп), где лг/gR (/=1, 2, ..., п) называется точечным координатным пространством, а всякий упорядоченный набор (xlt хъ ..., ...» хп)—точкой этого пространства. Точечному координатному пространству R" соответствует координатное линейное пространство Rw (см. определение 5 § 1.1). При таком соответствии вектором в R" называется упорядоченная пара точек A (xl, х\у ..., хп) и В (х\, х\, ..., Хп) из R72 (направленный отрезок). При этом направленный отрезок CD, где С=(рь у\, ..., у°п), D=^(y\, y'i, ..., уп), задает тот же вектор, что и АВ, тогда и только тогда, когда xl-xl = yl-yl х\-х\ = у\-у\, ..., ххп-х0^у1п-у°п. (19) Направленные отрезки АВ и CD называются эквивалентными тогда и только тогда, когда выполняются равенства (19). Формулы (19) задают отношение эквивалентности на множестве направленных отрезков в точечном пространстве ftn. Определение 4. Вектором в точечном координатном пространстве JR" называется класс эквивалентности (19) упорядоченной пары точек A, B£Rn (направленного отрезка АВ). Определение 5. Пусть О, А^ Л2, ..., Ап точки из Rn такие, что векторы OAi, OA2 ..., ОАп образуют базис линейного координатного пространства R". При этом каждой точке B£Rn соответствуют п вещественных чисел (xi, х2, ..., хп), являющихся коэффициентами разложения вектора ОВ по базису OAi, 0АЪ ..., ОАп\ OB^XxOAi + XzOT^ + oo.+XndAn.
378 Глава I*. Линейная алгебра с элементами аналитической. геометрии Тогда говорят, что точка О и векторы 0А±, ОА2, ..., 0Ап определяют в R* систему координат. Определение 6. Если в линейном координатном пространстве R7*, соответствующем точечному координатному пространству R72, определено скалярное произведение (т. е. данное пространство является евклидовым), то система координат О, ОЛх, 0А2, ..., ОАп, где векторы OAi, ОАъ ..., 0Ап образуют орто- нормированный базис, называется декартовой системой координат. Пусть в точечном координатном пространстве R72 заданы две декартовы системы координат О1, ОМ}, ОМ|, ..., 01А1п и О2, ОМ2., OML ..., 0?^; тогда каждой точке P£Rn соответствуют два набора координат: fa, x%, ..., хп) и (Уъ Уъ> •••» Уп)- Между числами х/ и #у (/, /=1, 2, ..., п) существует зависимость, описываемая следующим образом: (PP^^xi&M, <HP=%y/P%}; (20) Векторы О1 А] (/=1, 2 п) линейно выражаются через векторы базиса OUl 0UI ..., б*А2п. Пусть / Тогда из равенств (20) следует, что Если при этом 0Юг = 2j aj02A*t то из равенства (21) имеем / откуда, полагая cij—ац, получаем f/ = 29'*<+a/ 0=1» 2 л), (22) i т. е. вторую группу формул (16) § 1.15. Аналогично координаты хъ х2, ..., хп можно выразить, через координаты Уъ У г Уп- Именно, Xi^Wb + bi (*=1. 2, >.., п). ' (23) k Здесь bi (/=1, 2, ..., п) — коэффициенты разложения вектора Oi<?2 по базису ОМЬ OMf, ..., 01А]1, а матрица (C{k) является обратной к матрице (^.Действительно, xi (*=1, 2, ..., п) однозначно выражаются через yj (/=1, 2, ..., п) из системы уравнений (22), поскольку система векторов OMj, OML ..*, О1 An линейно независима и, значит, матрицы (а/у) и (с/у) —невырожденные.;
§ 1*.15. КвШртШчпая. форма. Приведение шадр.фирмы к кандничебкому виду'379 Проверим, что xt в выражении (23) являются решениями системы (22), если (су)— обратная матрица для матрицы (су). Подставляя (23) в (22), получаем У J = 2 9' &ьУк+*/>+ aj = yj+2 9 fy+af. (24) i, k i Здесь использовано правило умножения матриц и определение обратной матрицы, т. е. равенство* (1 при j = k, [О при / Ф k. Е^Но Равенство (24) является тождеством, если 6/ р=1, 2, ..., п) удовлетворяет условию 29А + в/ = 0. (25) i Так как det (с,у) ^ О, то числа Ь( (*=1, 2, *.., я) из системы {25) определяются однозначно. Значит, числа xt- в выражении (23) вместе с Ь{ (t=l, 2, ..., л), найденными ИЗ' равенств (25), действительно являются единственным решением системы уравнений (22). 2 Рассмотрим два частных случая формул (22) и (23), связывающих старые и новые координаты точки в точечном координатном пространстве. I с л у ч а й: О1 == О? (начала координат двух координатных систем совпадают). В этом случае а/ (/=1, 2, ..., п) в (22) и Ь( (* = 1, 2, ♦ ♦., п) в (23), очевидно, равны нулю. Имеем *1 = <1Ш +Cl&Z + • • • + ЧпЦпт У1 = СЦЧ-+ 5l*l + • » • + CinXtii *2 = *ttW +С«У* + • • • +С2пуп, у2 = CnXi + С12Х2 + . . . + С2пХп, : • • ._ j • (26) *п =cnlyi+cn2y2-{- Ycnnyn\ Уп = сп1х±+сп2х2-{-... +сппхп. Здесь (сф и (су)—-взаимно обратные матрицы. II случай: О* ^ О*, OMi==OM?, ОМ£ = ОМ1, .... ОМ^ = ОМ£ (так называемый параллельный перенос). Здесь матрицы (су) и (су) — единичные [поскольку единичной является матрица (ау)\ см. формулу (21)]. В этом случае формулы (23) принимают,в«д Xi = yi + ait x2 = y2+a2t ..., xn = yn + anf (27) где (af, a2, ..., яя)—координаты вектора ОЮЪ в базисе OMi, OMj, ..*, О1А\. Из соотношений (27) следует, что yi = Xi—ait y2 = x2—a2y ..., уп = хп — anf (28) где (—а*, —а2, ..., —а„)—координаты вектора ОЮ1 в базисе ОМ?, OMf, ...,0М£. • *•»
.380 Глава /*. Линейная алгебра с элементами аналитической геометрии § 1*. 16. Евклидова классификация кривых и поверхностей второго порядка 1°. Преобразование матрицы квадратичной формы при переходе к новой системе координат. Пусть дано уравнение второго порядка от п переменных: /M = Se//^/ + Sft№+c=°» F2 + Fi + F0 = 0. (1) Рассмотрим две матрицы (соответственно порядка п и п + 1), связанные с уравнением (1): Aji а21 а22 ... а2п \ ^ / j (2) V J \ ani ап2 ... апп Ьп/2 \ani ап2 ... апп/ \bJ2 bt/2 ... Ьп/2 с Пусть переменные х±, х2, ..., хп связаны с переменными у±, у2> ...,уп формулами *i = Cuyi + с12у2 + • • • + СыУп + 0i, х2 = c21yi + с22у2 +... + с2пуп + а2, ,^ хп = сп1ух + сП2У2 + • • • + СппУп+&п (как известно, формулы (3) выражают зависимость между координатами одной и той же точки в двух различных системах координат). I Покажем, что матрица В при переходе от координат Х£9 х2, -*.,хп к координатам ylt у2, ..^Уи. преобразуется по правилу В —► С'ВС, где матрица С имеет вид Г4) сц C2i cni 0 с12 ... с22 ... сп2 ... 0 ... Сщ с2п Спп 0 аг а2 ап 1 а С' —матрица, транспонированная по отношению к С, Действительно, g(y) = f (С11У1 + ci2y2 + ... + clnyn + аг\ c2lyi + с22у2 +.,. + -\-с2пуп-{-а2\ ...; Cmyt + Cn^+... + СппУп+ап)^ =2 аРя(%ср1У1+ар\ ^2%^/+^]+2^(2ся^+аП+с== = 2 apqCpicqjyiyj+ 2 арЯс^аяУ( + ^арЯСЯ/арУ/ + р, q, i. / Р> Я> i +2 аряарая+2 ьрар+с+2 ьр (2 v ^)= © = 2 арЯср!сЯ/У!У/+ 2 (арЯСр1аЯ + арЯСЯ1ар)У1 + Р, Я» i> / Р> <?» * +2 *л>#* + 2 аряарая+2 а А+с- Р. * Р. <7 Р
§1*..16. Евклидова классификация кривых и поверхностей второго порядка 381 Так как apq = aqp, то 2 apqcpif^q — ^ apqCqiap и, следовательно, матрица Bf имеет вид р> я р,я («li «12 ••• а1я Si/2) I а21 #22 • • • а2п ^2/2 \^ni аП2 •-. а>пп bn/2 \Ъф \Г 2... Ьп/2 "с ) ГДе а//= 2 apqcpicq/> Р, Я (6) У/=£ apqcpiaq + у £ VV = X apqcpiaP + f £ V>'» Р<7 р pq p * = 2 apqapaq = 2 V1 Я + С' Р><7 Р Непосредственно вычисляя матричное произведение С'ВС, убеждаемся, что оно совпадает с матрицей (6). Лемма 1. £о« Л и 5—матрицы, имеющие размеры mxs и sxn, то г (А)^г(АВ). ЕслиАиВ — матрицы, имеющие размеры sXn и mXs, to г(ВА)^ <г(Л). Доказательство. Столбцы матрицы А В являются линейными комбинациями столбцов матрицы А. Это непосредственно следует из правила умйожения матриц: (/-й столбец матрицы АВ является линейной комбинацией столбцов матрицы А, в которой коэффициент при первом столбце есть by, коэффициент при втором столбце есть b2j, ...; k-ft коэффициент этой линейной комбинации равен bkj, k—\, 2, ..., s). Пусть ранг матрицы А равен г. Это значит, что среди столбцов матрицы А можно выбрать г линейно независимых столбцов, но нельзя выбрать г+1 линейно независимых столбцов. Столбцы матрицы АВ принадлежат r-мерному линейному пространству, поскольку каждый из них может быть линейно выражен через столбцы матрицы Ли, следовательно,'через г линейно независимых столбцов этой матрицы. Среди столбцов матрицы АВ нельзя выбрать линейно независимую систему из г+1 векторов, поскольку в г-мерном пространстве не существует линейно независимой системы из г-\-\ векторов. Таким образом, г(А)"^ ^ г (АВ). Аналогично доказывается и второе утверждение леммы. Лемма 2. Пусть В и С — матрицы размера тХт, причем detC^O. Тогда г (В) = г (С'ВС). 2 Доказательство. Докажем сначала, что г (В) *= г (ВС) при условии detC?=0. Действительно, из леммы 1 следует г(В)^г(Вб). Кроме того, г (В) = = г (ВСС-1) <; г (ВС), откуда г (В) —г (ВС). В силу второго утверждения леммы 1 аналогично получаем г (В)=г (СВ) при условии det С Ф 0. Следовательно, г (С'ВС)= = г(ВС) = г(В).
382 Глава /*. Линейная алгебра с элементами аналитической геометрии 2°. Кривые второго порядка. Всякое уравнение второго порядка от' двух переменных при переходе к выбранной соответствующим образом декартовой системе координат может быть сведено к одному из канонических уравнений, приведенных в табл. на с. 142. Эти уравнения упрощают описание и изучение геометрических свойств кривых второго порядка. Рассмотрим подробнее кривые второго порядка, 1. Эллипс. Каноническое уравнение ■зг+4-1. » Кривая определяется двумя положительными параметрами а и Ь (а^Ь); она симметрична относительно осей координат. Точки Fi(—ct, 0), F2(c, 0), где c—Ya2 —№t называются фокусами эллипса. Для точек Р эллипса выполняется* следующее характеристическое свойство: |,FiP| + |-F^P| = 2a (это свойство выполняется для всех точек Р эллипса и только для них). Число е=с/а < 1 называется эксцентриситетом эллипса. Нормаль к эллипсу в произвольной точке Р является биссектрисой угла между векторами PFi и РР2. Согласно законам отражения света, луч света, выходящий из одного фокуса, отразившись от эллипса в произвольной точке, пройдет через второй фокус i; .:, .. т , .,...-. Каждая из планет Солнечной системы движется вокруг, Солнца по эллипсу, причем Солнце, находится в одном из фокусов эллипса. Этот факт может быть выведен чисто математически, исходя из закона всемирного тяготения Ньютона, утверждающего, что сила взаимного притяжения двух тел пропорциональна их массам и обратно пропорциональна квадрату расстояния между ними. s 2. Гипербола. Каноническое уравнение .,..,. я-б™1- (9> Кривая определяется двумя положительными параметрами а и Ь\ она симметрична относительно осей координат. Точки Fi=— (с, 0)t F% (с, О), где c="|/"a2+6?f называются фокусами гиперболы. Для точек Р гиперболы выполняется следующее характеристическое свойство: ||Pi^|-l^P|| = 2a. Число г — с/а> 1 называется эксцентриситетом гиперболы. Нормаль к гиперболе в произвольной точке Р является биссектрисой угла между векторами PFi й Р2Р« Прямые у—± (Ь/а)х называются асимптотами гиперболы/Точки асимптот и точки гиперболы, соответствующие одному и тому же х, неограниченно приближаются друг к другу при х—►<». :• 3. Мнимый эллипс Каноническое уравнение ■./". -arfi-1- : .. ." ;. (10) Этому уравнению не удовлетворяет ни одна точка с вещественными координатами. Название «мнимый эллипс» связано с тем, что точки Р с координатами х=Чи9
§J*J6. Евклидова классификаций кривых и лшрхнортей- второго порядка : $83 ^=*> удовлетворяют-уравнению (3) тогда и только тогда, когда (и, v) удовлетво- и2 t v2 t ряют уравнению -%-\-j-g=l. 4. П а р а бo-ji а. Каноническое уравнение у* = 2рх. (11) Кривая определяется- одним положительным параметром р и симметрична относите лвно оси Ох. Точка F (р/2, 0) называется фокусом параболы. Для точек F параболы выполняется следующее характеристическое свойство: расстояние от произвольной точки Р параболы до прямой х= —р/2, называемой директрисой, равно расстоянию PF. ^ Эксцентриситет параболы полагают равным единице (промежуточный случай между эллипсом и гиперболой). Согласно законам отражения света, луч света, исходящий из фокуса парабо-. лы, отразившись от параболы в произвольной точке, становится параллельным оси симметрии параболы» 5. Пара мнимых пересекающихся прямых. Каноническое уровне-— ние х х2 и2 ъ+ш=°- <12>. Единственной точкой вещественной плоскости, удовлетворяющей уравнению (6), является начало- координат. Название «пара мнимых пересекающихся прямых» - связано с тем, что-точки Р с координатами х=и, y—iv, и, v£R удовлетворяют*- уравнению (6) тогда и только тогда, когда х и у удовлетворяют уравнению х2 и2 а2 Ь2 6. Пара пересекающихся прямых. Каноническое уравнение х2 и2 S!-fe=0' 03) или, что-то-же^самоег У— ± (Ь/а)х. Уравнения у=(Ь/а)х и у=^ — (Ь/а)х определяют прямые, проходящие через начало координат и образующие с положительным направлением оси Ох углы, тангенсы которых равны соответственно Ь/а и —Ь/а. 7. Пара параллельных прямых. Каноническое уравнение х2/а2=1, (14) что эквивалентно уравнениям дг=± а, Кривая представляет собой пару прямых, параллельных оси Оу и проходящих через точку (± а, 0). 8, Пара мнимых параллельных прямых. Каноническое уровне-- ние —x2/a2=L (15) Уравнению (8) не удовлетворяет ни одна точка вещественной плоскости. Название «пара *мнимых параллельных прямых» связано с тем, что точки Р с координатами х ==i&, y=v удовлетворяют уравнению (8) тогда и только тогда, когда x2/a2=L .......
384 Глава /*. Линейная алгебра с элементами аналитической геометрии ■ , ■ I II.--!'. 9. Пара слившихся параллельных прямых. Каноническое уравнение *2 = 0. (16) Уравнению (16) удовлетворяют все точки прямой # = 0 и только они. Название «пара слившихся параллельных прямых» связано с тем, что уравнение #? = 0 есть предельный случай уравнения х2 — а?. при а—► (). Каждая из двух параллельных прямых, определяемых уравнением х2 = а2, при а—*0 стремится к прямой д: = 0 и при а —0 совпадает с ней. Общим свойством кривых второго порядка является то, что каждую из них можно получить в сечении конуса плоскостью. В связи с этим кривые второго порядка называют коническими сечениями. 3°. Поверхности второго порядка К Эллипсоид. Каноническое уравнение Поверхность определяется положительными параметрами а, Ь и с; она имеет три плоскости симметрии хОу, xOz и уОг. Сечение эллипсоида плоскостью представляет собой либо эллипс, либо точку, либо пустое множество. При а = 6 или & = с или а —с эллипсоид является поверхностью вращения. 2. Однополостный гиперболоид. Каноническое уравнение £+£-£-■• (18) Поверхность определяется тремя положительными параметрами а, Ъ и с; она имеет три плоскости симметрии хОу, xOz и уОг. Сечение однополостного гиперболоида плоскостью, параллельной плоскости хОу, является эллипсом, плоскостью, параллельной оси Ог, — гилерболой, а в некоторых случаях — парой пересекающихся прямых. Важным свойством однополостного гиперболоида является существование двух семейств прямых, целиком ему принадлежащих. Именно, через каждую точку (*о> Уо> 0) однополостного гиперболоида проходят две прямые, уравнения которых имеют вид х—х0__ у—уо __ г . х—х0 __у—Уо_ г ауо/Ь —Ьх0/а с * —ауф Ьх0/а с ' При а = Ь однополостный гиперболоид является поверхностью вращения. 3. Двуполостный гиперболоид. Каноническое уравнение а* Ъ2 с2""1* ^ Поверхность определяется тремя положительными параметрами a, b к с; она имеет три плоскости симметрии хОу, хОг и уОг. Поверхность состоит из двух несвязных частей, одна из которых принадлежит полупространству х > 0, а другая—полупространству х < 0.
§1*.16. Евклидова классификация кривых и поверхностей второго порядка 385 Сечение двуполостного гиперболоида плоскостью, параллельной плоскости yOz, представляет собой эллипс при |*| > а; точку при * = а; пустое множество при \х\ < а. При Ь = с однополостный гиперболоид является поверхностью вращения. 4. Мнимый эллипсоид. Каноническое уравнение X2 V2 22 -ar-fr-a--1- <20> Эта поверхность не содержит ни одной точки вещественного пространства R3. 5. Эллиптический параболоид. Каноническое уравнение х2 и2 H?+fr=2pZ. (21) Поверхность определяется двумя положительными параметрами уга2У(2р), УЬ2/(2р); она имеет две плоскости симметрии yOz и xOz. Сечение эллиптического параболоида плоскостью, параллельной плоскости хОу, представляет собой: эллипс при z > 0; пустое множество при z < 0; точку х = 0, у = 0 при z = 0. При а — Ь эллиптический параболоид является поверхностью вращения. 6. Гиперболический параболоид. Каноническое уравнение х2 и2 ш-Ь=2рг- <22> Поверхность определяется двумя положительными параметрами Уа2/(2р) и V~b2/(2p); она имеет две плоскости симметрии хОу и yOz. Сечение гиперболичен кого параболоида плоскостью, параллельной плоскости хОуу представляет собой гиперболу при z *£ 0 и пару пересекающихся прямых при z = 0. 7. Мнимый конус. Каноническое уравнение Поверхность состоит из единственной точки х = 0, # = 0, г = 0. 8. Конус. Каноническое уравнение v2 ,,2 у2 -+h--=°- ' <24> а2 ' № с2 Поверхность определяется двумя положительными параметрами а/с и Ь]с\ она имеет три плоскости симметрии хОу, xOz и yOz. Если точка (*0, Уо> z0) принадлежит конусу, то и все точки с координатами (txQ, ty0i tzQ) принадлежат конусу (вместе с каждой точкой конусу принадлежит и вся прямая, проходящая через эту точку и начало координат). Сечение конуса плоскостью, параллельной плоскости хОу, представляет собой эллипс при г^Ои точку * = 0, «/ = 0 при z = 0 (пару мнимых пересекающихся прямых). Как отмечалось выше, в сечении конуса плоскостью можно получить любую кривую второго порядка (за исключением пары параллельных прямых). При а — Ь конус является поверхностью вращения. 13 № 2636
38G Глава /*. Линейная алгебра с элементами аналитической геометрии 9. Эллиптический цилиндр. Каноническое уравнение - + 4=1. (25) Поверхность состоит из точек (л:, у, 2), где *, #—координаты точки яа« плоское- ти, удовлетворяющие уравнению эллипса -2+р-=1> а z—произвольное число. Вместе с каждой точкой (лг0, у0, z0) эллиптический цилиндр содержит и все точки (л:0, у0, г) при произвольном г (вместе с каждой точкой эллиптическому- цилиндру принадлежит и вся прямая, проходящая через эту точку и параллельная оси Oz). Поверхность имеет две плоскости симметрии xOz и yOz. При а = Ь эллиптический цилиндр является поверхностью вращения. 10. Гиперболический цилиндр. Каноническое уравнение 3r-£-L (26) Поверхность состоит из точек (*, у, г), где*, у—координаты течки на плоскости, удовлетворяющие уравнению гиперболы — — р*=1» a z—произвольное число. Вместе с каждой точкой (х0, у^ га) гиперболический цилиндр содержит и все точки (х0, #0, г) при произвольном z (вместе с каждой точкой гиперболическому цилиндру принадлежит и вся прямая, проходящая через эту точку и параллельная оси Oz). Поверхность имеет две % плоскости симметрии хОу и уОг. И. Мнимый эллиптический цилиндр. Каноническое уравнение %+ж—'• (27) Поверхность не содержит ни одной точки вещественного пространства R3. 12. Параболический цилиндр. Каноническое уравнение х* = 2ру. (28) Поверхность определяется одним положительным параметром р. Поверхность состоит иа точек вида (х> у, z), где г, у—координаты точки на плоскости, удовлетворяющие уравнению параболы х2 = 2ру> а г—произвольное число. Вместе с каждой точкой (*0, у0, z0) параболический цилиндр содержит и все точки (%, у^ г) при произвольном z (вместе с каждой точкой параболическому цилиндру принадлежит и вся прямая, проходящая через эту точку и параллельная оси Ог). 13. Пара мнимых пересекающихся плоскостей. Каноническое уравнение х2 и2 Поверхность состоит из точек вида #=0, у = 0, z £ R — произвольное.
§ 1*.16. Евклидова классификация кривых и поверхностей второго порядка 387 J4. Пара пересекающихся плоскостей. Каноническое уравнение зНг-0' <30) что эквивалентно уравнениям у=±(Ь/а)х. Каждое из уравнений у=(Ь/а)х и у=—ф/а)х определяет плоскость, параллельную оси Oz. Эти плоскости пересекаются по оси Oz. 15. Пара мнимых параллельных плоскостей. Каноническое уравнение -х2/а2 = 1. (31) Поверхность не содержит ни одной точки в пространстве R3. 16. Пара действительных параллельных плоскостей. Ка~ ионическое. уравнение х*/а*=1, (32) что эквивалентно уравнениям х = ± а. Каждое из уравнений х=а9 х=-—а определяет плоскость, параллельную плоскости уОг. 17. Пара слившихся параллельных плоскостей. Каноническое уравнение *2 = 0. (33) Поверхности принадлежат точки плоскости уОг и только они.
Глава II ВВЕДЕНИЕ В МАТЕМАТИЧЕСКИЙ АНАЛИЗ § 2М. Множества и функции. Логические символы 1°. Множества. Понятие множества является одним из основных понятий математики. Множество состоит из элементов. О каждом элементе (объекте) должно быть точно известно, принадлежит ли он множеству или нет (понятия элемента и принадлежности элемента множеству также относятся к числу основных (неопределяемых) понятий математики). Тот факт, что элемент а принадлежит множеству Л, обозначается так: а£А. Описание ответа на вопрос, принадлежит данный объект (элемент) данному множеству или нет, должно быть точным и недвусмысленным. При несоблюдении этого условия могут возникнуть противоречия (антиномии). Пример. Деревенский брадобрей бреет всех мужчин деревни, кто не бреется сам. Каково множество тех людей, которых бреет брадобрей? Это множество не определено, поскольку предположение о том, что брадобрей принадлежит этому множеству (т. е. бреет себя), противоречиво; также противоречиво предположение о том, что брадобрей не принадлежит этому множеству (т. е. не бг>еет себя). Из сказанного вытекает, что описание совокупности тех людей, которых бреет деревенский брадобрей, неудовлетворительно и не определяет множества. Этот пример носит шутливый характер: в то же время в математике известны примеры антиномий, связанных с вполне серьезными вопросами. Часто описание множеств дается с помощью некоторых утверждений относительно свойств элементов этих множеств. Такие утверждения называют высказываниями. Высказывания обладают (характеристическим) свойством быть истинными или ложными. Из простых высказываний можно составить более сложные с помощью так называемых логических операций. Дизъюнкцией высказываний А и В называется высказывание, которое истинно тогда и только тогда, когда истинно хотя бы одно из высказываний А или В. Дизъюнкцию обозначают так: А V В. Конъюнкцией высказываний А я В называется высказывание, которое истинно тогда и только тогда, когда истинны и Л, и В. Конъюкцию обозначают так: А А В. Используя введенные понятия и обозначения, приведем определения некоторых операций над множествами. Определение /.Множество Al)B = {x\x£A v x£B] называется объединением множеств А я В.
§2*.L Множества и функции. Логические символы ^ '' 389 Определение 2. Множество А(]В — {х\х^А Л х£В) называется пересечением множеств А и В. Определение 3. Множество А\В — {х\х^А Л х£В} называется разностью множеств А и В. Если А является подмножеством в В, то 5\Л называется дополнением А в В. На множестве всех подмножеств данного множества S определены операции объединения и пересечения подмножеств. Эти операции для любых В, A, CdS удовлетворяют следующим свойствам (которые легко проверить): 1°. (A[)B)\JC — A\J(B\JC) (ассоциативность объединения). 2°. (A(]B)(]C = A(](Bf]C) (ассоциативность пересечения). 3°. A\JB = B\JA (коммутативность объединения). 4°. Af]B = B(]A (коммутативность пересечения). 59. (A{jB)(]C = (A(]C)\J(Bf]C) (дистрибутивность пересечения по отношению к объединению). 6°. (A[)B)\JC = (A\JC)[)(B\JC) (дистрибутивность объединения по отношению к пересечению). 7°. Для каждого AcS существует единственное множество В czS такое, что А(]В — 0 и A\JB — S; этим множеством является S \ А. 8°. Множество SczS обладает свойством A(jS — S \McS; пустое множество 0 обладает свойством 0 П А = 0 у А с: S. Множество элементов, для которых определены операции U» П обладающими перечисленными выше свойствами, называется булевой алгеброй. Таким образом, множество всех подмножеств множества S является примером булевой алгебры. 2°. Функции. Понятие функции может быть логически сведено к понятию множества. Функция или, что то же самое, отображение / подмножества множества X в множество F, однозначно определяется подмножеством в множестве всех пар (х, у), х£Х, y^Yy удовлетворяющих следующему дополнительному условию: для всяких двух пар {х±, уг) и (х2, у г) из у± Ф у2 должно вытекать х± Ф х2 (иными словами, требуется, чтобы один и тот же х не находился в паре с разными игреками). Для двух высказываний А и В построим третье высказывание С = А —>- В, которое ложно тогда и только тогда, когда А истинно, а В ложно. Обозначение А—> В читается так: «из А следует В» или «если А, то £». Пусть X, Y—два множества. Множество / = {(*. У) I *€* A y£Y А {у± Ф у2 => *i Ф х2)} (1) называется функцией (отображением) некоторого подмножества множества X в множество Y). С помощью множества (1) для некоторых х£Х можно однозначно определить y£Y, а именно если в множестзе пар (#, у) есть пара вида (х, у), то в силу определения такая пара единственная и элементу х однозначно ^соответствует у • В этом случае пишут / (х) = у.
390 ' Г лат #/*. Введение # математический анализ 3°. Взаимно обратные н взаимно пративопояожетые теоремы. Необходимость и достаточность. Всякое математическое утверждение (в той числе я теерша) имеет следующий вид: «если 'А, то Я», где Л — условие теоремы» a В—заключение теоремы. Для всякой теоремы можно построить некоторое утверждение,, поменяв местами Л и В в утверждении «если А, то В». При этом подучим утверждение «есяя В, то Л», которое называете» теоремой, обратной к. данной. Очевидно, что теорема, обратная к обратной, совпадает с иежодашц вследствие чего две эти теоремы называются взаимна обратными* Если исходная (прямая) теорема верна, то обратная теорема может быть как верной, так и неверной. Для всякого утверждена» (высказывания) А обозначим через А высказывание, которое истинно тогда и только тогда, когда А ложно. . Для теоремы «если А* то В»9 утверждение «если Аг то Я», называется противоположной теоремой. Теорема, противоположная к противоположной, совпадает с исходной. Противоположная теорема эквивалентна обратной теореме. Это означает, что противоположная теорема верна тогда и только тогда, когда верна обратная теорема. Пусть верна теорема «геели Л, то В», В этом сду^ае говорят, что условие А достаточно для В, а условие В необходимо дли А. Пусть» также верна теорема, обратная к данной, т. е. «если В, то Л». В этом случае условие В является достаточным для Л, а условие А — необходимым для В. Таким образом, в рассматриваемом случае условие А необходимо и достаточно для В (а В необходимо и достаточно для А). Иначе говоря, условия Л и Я эквивалентны: Л имеет место тогда и только тогда, когда справедливо В. 4п. Понятие алгоритма. Алгоритмические w неалгоритмиче«кне доказательства. Понятие алгоритма являете» одним из основных математических йонтршЙ. Era не сводят к более простым, бхмее элементарным понятиям. Алгоритм* обобщает' понятие точного предписания, которое однозначно определяет вычислительный процесс, начинающийся с произвольных допустимых исходных данных « приводящей к получению конечного результата. Косвенное описание понятия алгоритма содержится в следующих примерах. Примеры алгоритмов. !. Правила умножения, деления, сложения и вьтчита- ния целых чисел «столбиком». 2. Алгоритм Евклида нахождения наибольшего общего множителя двух целых чисел. 3. Алгоритм вычисления значений функции „ /уч _ I fi (*) ПРИ * > °» *КХ)-\ h(x) при*<0, если fx и f2 — рациональные функции. 4. Правила построения перпендикуляра из данной точки к данной прямой, изучаемые в средней школе. Понятие алгоритма связано с конструктивным направлением в математике. Это направление возникло в связи с тем, что теория множеств, разработанная в конце XIX в., обнаружила противоречия—антиномии. Возникла мысль избе-
§ 2*.2„ Предел числ. последовать^-Предел функции в бесконечности и в точке 391 жать этих противоречий за счет сужения множества рассматриваемых объектов и перехода к так называемым конструктивным объектам* Конструктивный объект является результатом конструктивного процесса, т.е. результатом применения алгоритма определенного типа. Говоря о конструктивном: объекте, имеют в виду существование способа алгоритмического построения этого объекта. При этом не всякое множество является конструктивным объектом. Теоретико-множественное и конструктивное направления в математике по-разному интерпретируют доказательства теорем — в частности теорем существования (речь идет о теоремах, в которых доказывается существование некоторого объекта, обладающего данными свойствами). Доказательство в конструктивном направлении математики означает построение алгоритма для нахождения объекта (алгоритмическое доказательство). Доказательство в теоретико-множественном направлении математики означает логический вывод из аксиом без явного построения соответствующего алгоритма (неалгоритмическое доказательство). Примером неалгоритмического доказательства является доказательство теоремы Ролля (см. § 2*.6). В этой теореме утверждается существование на отрезке [а, Ь\ точки, удовлетворяющей определенным условиям, однако не дается алгоритм построения такой точки. В процессе трудовой и творческой деятельности человека часто используются различные алгоритмы. Так, можно говорить об алгоритме перевода с одного языка на другой, об алгоритме работы поездного диспетчера (перерабатывающего информацию о движении поездов в приказы), об алгоритме игры в шахматных автоматах, об алгоритме нахождения искомого объекта во многих математических задачах. Во многих случаях при решении различных проблем, возникающих в процессе трудовой деятельности, руководствуются известными правилами. Иногда эти правила допускают четкую формализацию и становятся алгоритмом. Вопросы формализации правил и составления алгоритмов особенно актуальны в настоящее время, когда задача автоматизации и оптимизации производственных процессов стала одной из важнейших. Построение алгоритмов, описывающих реальные процессы, обычно связано с двумя задачами: отысканием эффективных систем обработки информации и исследованием с помощью математических методов процессов функционирования данной системы. Реализация алгоритмов, т. е. фактическое применение предписаний к исходным данным, происходит на ЭВМ, обладающих большим быстродействием. § 2*.2. Предел числовой последовательности. Предел функции в бесконечности. Предел функции в точке. Свойства функций, имеющих предел 1°. Предел последовательности. Предел функции. Определение 1. Функция, областью определения которой является множество чисел (1, 2, ..., п, ...) (натуральный ряд), называется последовательностью. Если значение функции принадлежит множеству R вещественных чисел, то последовательность называется числовой. Значение функции, определяющей последовательность в точке /i£N, обозначается через ап и называется л-м членом последовательности. Последовательность fli, a2i ..., ап, ... кратко обозначают (ап).
392 Глава II*. Введение в математический анализ Определение 2. Число С£R называется пределом последовательности (ап), если для всякого 8 > 0 найдется такой номер N (зависящий от е), что все члены ап последовательности с номерами я, большими чем N', удовлетворяют условию \ап—С|<е. В этом случае пишут lim an = C (предел ап при п, стремящемся п-*со к бесконечности, равен С). Определение 3. Число С £ R называется пределом функции f (x), при х% стремящемся к (плюс) бесконечности, если для всякого 8 > 0 найдется такое число N (зависящее от е), что при всех х, больших N, выполняется неравенство \f(x)—C\ < е. В этом случае пишут limf (х) = С. О пред е ленив 4. Число СgR называется пределом функции f (x) при х, стремящемся к лг0, если Для всякого 8 > 0 существует такое б > 0, что при всех х> удовлетворяющих неравенству | х—х0 | < б, выполняется неравенство | / (х)—С | < 8Ф В этом случае пишут lim / (х) = С. х->х0 Определение 5. Число CgR называется левым (правым) пределом функции / (х) при ху стремящемся к х0, если для всякого е > 0 существует такое б > О, что при всех х, удовлетворяющих условиям \х—х0 | < б, х < х0 (х > х0), выполняется неравенство \f(x)—С|<8. В этом случае пишут lim /(*) = 0 / lim /(*) = С\. *->л:0-0 \х-+х0+0 ' В определении 5 предполагается, что функция f (х) определена в некотором множестве вида ]х0—Л, х0[ (соответственно ]x0i x0-\-h[), где h > О, в то время как в определении 4 подразумевается, что функция f (х) задана в некоторой е-окрестности точки лг0, за исключением, быть может, самой точки х0. Общее название для левого и правого пределов — односторонний предел. 2°. Теоремы о пределах. Теорема 1 (о пределе монотонной ограниченной последовательности). Монотонно неубывающая последовательность, ограниченная сверху, имеет предел. i Доказательство. При доказательстве теоремы обязательно должно быть использовано то или иное определение понятия вещественного числа. Будем считать, что вещественное число представляет собой сумму целого числа т и некоторого числа а, удовлетворяющего условию 0<:а < 1. Очевидно, что для определения вещественных чисел достаточно определить вещественные числа а, удовлетворяющие условию 0^а< 1. Каждое такое число будем считать заданным бесконечной десятичной дробью, т. е. выражением О, аха2...ап..., (1) где я/£{0, 1, 2, 3, 4, 5, 6, 7, 8, 9} и последовательность a*, a2, ..., ап> ... обладает тем свойством, что для любого N найдется п > N такое, что ап Ф 9. Будем считать, что каждая такая бесконечная десятичная дробь задает некоторое вещественное число а(0«^а< 1) и, обратно, каждое вещественное число а(0^а< 1) определяет бесконечную десятичную дробь, удовлетворяющую указанному выше условию. Описанное Еыше соответствие является взаимно однозначным. По существу, это соответствие есть одно из возможных определений понятия вещественного числа а (О ^ а < 1)*
§ 2*.2. Предел числ. последоват. Предел функции в бесконечности и в точке 393 С выражением (1) связана последовательность рациональных чисел m+To"' m+—юо-• т+ юбо • ё" (2) (в десятичной записи: О,^; О,^^; О^лдоз; • ••)• Последовательность (2) в свою очередь задает разбиение ъсего множества рациональных чисел на два класса А и Ву удовлетворяющих следующим условиям: 1°. A\JB — Q (Q—множество всех рациональных чисел); 20. Аф0,Вф0\ 3°. Vх£А, у£В справедливо неравенство х < у. Это разбиение определяется так: рациональное число х относится к классу Л, если в последовательности (2) найдется число, большее или равное х. В противном случае число х относится к классу В. Легко видеть, что условия 1°—3° при этом будут выполнены. Обратно, всякое разбиение множества Q на два подмножества А и В, удовлетворяющее свойствам 1°—3°, однозначно определяет вещественное число т-\-а, по следующим правилам: 1) т есть наибольшее целое число такое, что неравенство т^х выполняется для всех х£В; 2) числа ai, a2, ..., а„, ... определяются последовательно друг за другом. На каждом этапе вычислений множество (уже определенных) чисел а±, а2, ...,«« обладает тем свойством, что рациональное число т-\—г^" + тт^+ • • • Н~Т7^« не больше всякого числа из В, а рациональное число m+7FF~r" п72^"■•' ,~г"Т7^"^То» больше, чем некоторое число из В. При выполнении последнего условия число an+i выбирается как наибольшее из чисел 0, 1, 2, 3, 4, 5, ..., 9, для которого справедливо неравенство т~ьТо"~Поб~г * • • ^Tc^TcF** ^ * для всех х£В. Как легко видеть, при этом будет выполняться указанное условие (с заменой п т п+1). Изложенные выше правила позволяют по данному разбиению построить бесконечную десятичную дробь. Отметим, что при этом в результате не может получиться бесконечная десятичная дробь вида т, a±a2.. .a„999... (an ф 9), поскольку в соответствии с приведенными выше правилами вслед за числами alt a2, ..., ап_± должно находиться число a„ + l£{l, 2, 3, 4, 5, 6, 7, 8, 9}, а все остальные числа ат = 0 при т > п+1. Всякая монотонно возрастающая и ограниченная сверху последовательность &ъ &2> •••> °п, ... определяет разбиение множества Q на два класса Л и В, удовлетворяющие условиям 1°—3°, а именно: класс А состоит из тех #£Q, для которых существует некоторый член последовательности Ьт такой, что х^.Ьт\ класс В состоит из всех чисел x£Q, не принадлежащих А. При этом легко проверить, что условия 1°—3° выполняются.
394 Глава II*. Введение в математический анализ Итак, данная монотонная и ограниченная последовательность определяет разбиение множества Q на два класса Л и Б, для которых выполнены условия 1°—3°, и это разбиение задает вещественное число т + а. Покажем, что построенное вещественное число т + а является пределом данной монотонной и ограниченной последовательности. Пусть задано произвольное е > 0. Из построения числа т+а очевидно, что для всех /г, больших некоторого N, справедливо соотношение т+а-{т+^+т+•■■+!&)<е- Отметим, что число т + а определяется построенным разбиением, а последнее—исходной последовательностью Ьг, Ь2, ..., Ьп, ... Из правил построения вытекает, что все числа вида т+^+тр+- • -+Т?^ Vя > N принадлежат классу А. Среди чисел данной последовательности найдется число Ьм, большее или равное, чем m+"j^+~wp"~b' * *~Г"Т?Р (иначе бесконечная десятичная дробь и монотонная ограниченная последовательность давали бы разные разбиения). Вследствие монотонности последовательности очевидно, что для всех k^M. Учитывая соотношение (3) и неравенство &#^т + а (справедливое в силу правил построения разбиения и числа т + а), имеем т+а—8 < Ь^ < т + а при k > М, т. е. \bk— (т + а)| < е при k > М. Это и означает, что т+а есть предел данной последовательности. 2 Важным примером приложения теоремы 1 является последовательность ап = = f 1-|— ) . Докажем, что эта последовательность является монотонной и ограниченной. Будем использовать формулу бинома Ньютона (a + b)n = a*+Chan-1b + C2na'i-*b0-+ ... +сГ3а^-1+^, (4) где ^k_n(n-\)(n-2)...(n-k+\) Сп 1.2.3-....А ( ' ' ' ••" П)' Покажем сначала, что ап < an + i. Имеем а .(г | М"~1 I II я(я~!) 1 п(п-\)(п-2) , n(n—\),...(n — k+\) , п(п— \)(п — 2)...1_ •••~Т kin11 T-" I n\nn — _,+,+i(,-j.)+i- (._±) (-4)+- ••^('4)(-1)-('-^)+-+М'-г)(>-4)-('-¥)- (5)
§ Т*.2. Предел числ. последоват. Предел функции в бесконечности и в точке $$5 При переходе от п к я+1 число членов в правой части равенства (5) увеличивается на единицу и каждое из слагаемых -ту* ( I ) ( 1 ) • •••• ( 1 ) s $ возрастает, так как 1 < 1 —г (s=l, 2, ..., п—1). Следовательно, йп < ап+1, т-е. данная последовательность является монотонной. Покажем теперь, что аа < 3 (п—\, 2, ...). Имеем п(п — 1) , л (/г— 1)(я—2) „„.(,+1)"_,+1+л|51>+ 3! /г3 ^ * " , л(я—1)...(я —fe+1) ,. t n_(n—!)...! •••+ ~етг +—+ ~- л1пЯ—• (Ь) Увеличим каждый член в правой части равенства (6). заменив — т^Ц ~^~^ /г* 1 ~ на "zr-J**1!*' * Тогда получим в«<2+1Г+¥+-+7Г« Р) Заметим, что 1 ^ I "F^ 2*-i ' (В) поскольку Ь2.8.£^2'2. ..2. Учитывая соотношение (8), усилим неравенство (7): Л—1 раз Так как f r* , -I—L-*-f -i-^I (использована формула суммы геометрической прогрессии), то из неравенства (9) следует, что ап < 3. Тем самым доказано, что данная последовательность ограничена сверху числом 3. Теорема 2. Пусть f (x), g (x), я (#) три функции такие, что f (x)<g (x) •< ^ л (я). Пусть, кроме того, существуют и равны между собой пределы Jim / (л:) и limh(x). Тогда существует и предел lim g(x), причем х-+х9 х->*х0 lim / (л:) = lim g (x) = lim h (x). х-+х0 х-*х0 х-+х0 3 Доказательств о." Существование пределов lim f (x) = lim h(x) = C озна* х-+х0 х^х0 чает следующее: найдутся такие числа 6i и б2, что для всех дг, удовлетворяющих условиям \х—х%\ < 6i и | л:—дг0 | < 62, выполняются соответственно неравенства |/(*) —С| < е и \Н(х) — С\<г. Тогда для всех х, удовлетворяющих условию I*—*o| < min(6i, б2), (10)
396 Глава II*. Введение в математический анализ имеем \f(x) — C | < 8, \п(х) — С\ < 8, т. е. С—8</(*)<С + е, С—е </*(*)< С + г. (11) Так как f (x) *^ g (x) <ih (х), то из неравенств (11) вытекает, что С—8 < g (х) < < С+е, т.е. |*(*)-С|<е. (12) Таким образом, показано, что для всех х, удовлетворяющих условию (10), выполняется неравенство (12) и, значит, limg(x) = C. х-+х0 Теорема 3 (критерий сходимости Кош и). Если последовательность (ап) имеет предел, то выполняется следующее условие: для всякого 8 > О найдется такое N, что все члены последовательности с номерами р, q > N удовлетворяют неравенству \ар-ая\<в. (13) Обратно, если последовательность (ап) обладает тем свойством, что для всякого е> 0 найдется такое N', что все члены последовательности с номерами р, q > N удовлетворяют неравенству (13), то такая последовательность имеет предел. 4 Доказательство. Пусть последовательность (ап) имеет предел и 8 > 0 — заданное число. Рассмотрим число 8/2; по определению предела существует такое число N, что при всех п > N выполняется неравенство \ап — С\ < 8/2. Для любых р, q > N имеем \ар-С\<в/2, \ад-С\<в/2. (14) Из неравенств (14) следует, что \ap-ag\ = \(ap-C)-(aq-C)\<:\ap-C\ + )ag-C\ = e/2 + e/2==s. Таким образом, условие (13) выполнено при всех р, q > N. Обратно, пусть для всякого 8 > 0 существует такое N, что для всех р, q > N справедливо неравенство \ар — aq \ < 8. Докажем, что последовательность (ап) имеет предел. В силу данного условия для 8=1 существует номер N± такой, что все члены последовательности с номерами п > Nt лежат в интервале Joti, pi[, где а1 = а{х—1, р1 = а/,+ 1; <х—некоторый фиксированный номер такой, что i\ > N. Далее, для е=1/2 также найдется число N2 такое, что все члены последовательности с номерами п > N2 принадлежат интервалу ]а2, р2[, где а2 = я/2—1/2, р2 = а/2 + 1/2, f2—некоторый фиксированный номер такой, что i2 > N2. Аналогично можно построить систему интервалов ]а$, р*[, имеющих длину 22~Л и таких, что все члены последовательности начиная с некоторого Nk содержатся в этом интервале. Последовательности (а#) и (Р^) (k=\, 2, ...) являются ограниченными и монотонными, причем (а$) не убывает и ограничена сверху, а (р#) не возрастает и ограничена снизу. В силу теоремы 1 каждая из этих последовательностей имеет предел. Легко видеть, что эти пределы совпадают (действительно, в противном случае расстояние между а# и Р# оставалось бы больше некоторой положительной величины, что противоречит равенству р^—а^ = 2^"л). Итак, limaA= lim P# = C. (15) k-*-cn fe-^ao
§2*.2. Предел числ. последоват. Предел функции в бесконечности и в точке 397 Покажем, что lim а^ = С. Пусть задано некоторое 8 > 0. Из соотношений (15) следует, что существует такой номер N, что интервалы ]ап, рл[ при всех п > N содержатся в интервале ]С—е/2, С + 8/2[. В этом случае и все члены последовательности ар, aq с номерами р, q, большими, чем Nn, удовлетворяют условию \ар—aq\ < е, поскольку все эти члены принадлежат ]аПУ fin[ по построению. Таким образом, число С является пределом последовательности (ап), 3°. Свойства функций, имеющих предел 1°. Пусть f (*), g (х)—функции, для которых существуют lim f (х), lim g (x). x-*-x0 x->x0 Тогда: а) существует lim / (x) + g (х) и x-+x0 lim / (x) + g {x) = lim / (x) + lim g (*); x~*x0 x-+x0 x-*-x0 б) существует lim / (x) g (x) и x->x0 lim / (x) g (x) = lim / (x) • lim g (*); X-**X0 X-+Xq X-+X0 в частности, для всякой постоянной с lim cf(x) = c lim f (x); X-+X0 X-+X0 f (x) в) при lim g (x) Ф 0 существует lim ; :■ a K-fXo X-+Xo g \X) lim / (x) ltm * M — *-+** nm —тт—^г 7T* x-+x0g(x) hmg(x) x->x0 2°. Если f (x) < g (x), mo lim f (x) ^ lim g (x). X-*XQ X-*Xq 3°. Связь между функцией и ее пределом. Если lim f (x) = С, х-*х0 то lim [/ (#) —-С] = 0 ы, обратно, из lim [/ (дс)—С] = 0 следует, что lim / (я) = С. • Х~*-Х0 Х-+Х0 X-+Xq 4°. £сли lim f(y) — A, lim g (*) = y0, mo lim / (g (x)) = A #^r#o x-*-x0 x-**x0 5 Доказательство. Сначала докажем справедливость свойства 1° (а). Пусть е > 0 — заданное число. По определению предела найдутся такие числа бх > 0 и б2 > 0, что для всех х, удовлетворяющих условиям \х—х0\ < бх и \х—х0\ < б2, будут выполнены неравенства. |/(*)-Iim/(*)|<e/2, \g(x)-limg(x)\<e/2. (16) X—*"Xq X—^-Xq Тогда для х, удовлетворяющих условию \х—х01 < min (6i, 62), (17)
398 Глава //*. Введение в .математический анализ выполняются оба неравенства (16). Отсюда вытекает, что l/M + *W-lim/(*)- Шп£(*)| = х-+х0 х-+х0 = | (/ (х) - Km / (*)) + fc (ж) - lim g (x)) | < Х-+Хо <|/(ж) —lira/(дг)| + |^(дс) —lim (дг)|<е/2+е/2 = в. (18) Неравенство (18), справедливое при всех х, удовлетворяющих условию (17), означает, что число lim / (х) + lira g (х) является пределом функции f(x)+g(x) ПРИ х-+х0 х-+х0 х —>■ Xq, т. е. Ига f(x)+g (х) = lim / (*) + lim g (x). (19). X-+X0 X->X0 X-+Xq Докажем теперь, что 'верно свойство 3°. Оно является простым следствием формулы (19). Действительно, lim [/ (*)—C]=lim [/ (x)+(—C)] = lim f(x) + lim (—0= x->x0 x-+xQ x-+x0 x-+x0 = limf(x) — C = C—C = 0. Обратно, если lim [/(*) — С] = 0, то [lim /(*)]—C=0 и lim / (х) = С. Х~+Х0 Переходим к доказательству свойства 1° (б). Положим lira / (*) = А, lim g (x) = В, В силу свойства 3° имеем f(x) = A+<p(x), g (x) = В + if (*), где 1ипф(*) = 0, Jf-*JCe lim я£(я) = 0 (эти функции называются бесконечно малыми). Тогда f(x)g(x) = [A + cp(x)][B + y(x)] = AB + Aq(x) + By(x) + cp(x)y(x). (20) Нетрудно показать, что функция Aty (х) + Вер (х) + ф (х) tf (*) — бесконечно малая, т. е. lim [Лф (*) + #ф (х) -+- ф (*) ф (*)] = 0. Действительно, jiycib 8 > 0—заданное х-*х0 число. Потребуем, чтобы \4>(х)\<тт[-щщ, yj , |ф(*)|<т1п^щ, 1J , (21) Так как lim ф (х) = lim -ф (#) = 0, то неравенства (21) справедливы в некоторой X—^Xq X~^Xq окрестности точки х0> т.е. при всех таких, что \х—х0\ < б, где б—некоторое. положительное число. Из неравенств (21) вытекает, что \А\р(х) + В<р(х) + ср(х)Ц(х)\^\А\\Ц(х)\ + \В\\<р(х)\ + + |ф(*)1Ж*)|<|-+|Ч-у==е. (22) Неравенство (22) означает, что предел функции А ф (х) + В ф (х) + ф (х) ф (х) равен нулЮс Применяя к функции (20) доказанное свойство о связи между функцией в ее пределом, получаем Umf(x)g(x) = Um[A+<p(x))[B + Tp(x)] = X~^Xq X—>Xq = lim{AB + [Ay(x) + B(p(x) + <p{x)q(x)]}=AB = ]imf(x).]img(x). X->Xq X-+Xq X-+X0
§ 2*.$. W-ещр^ьтртсть фунщиш. Шт^ерштвт тновных элементарных функций &Ш Усггаившм сирявершвоеть свойства ¥*Щ. ¥1уст% Шт f{x) = Л, lim g{x}=B ф 0. f(x) Д _|_ а fo) Рассмотрим -44== д ; ^/ а » гДе «ФФ #(*) —такие фужщш*. что Лщ afo) = 0, g{x) s-jrp{x) x+xi lim ($(*)=&: Яхжажем, что разность х-+х9 ${х) А_Л+&, &_ъ£—$А g(x) B^B + $ S ~~ £ (Я+£) является бесконечно малой функцией. Пусть е > 0—заданное числа Потребуем, чтобы JaJJJSJ < е^ |fJ<U^I<8i» №J < 1^1/3 (здесь «!> 0 — некоторое число, которое будет определено в дальнейшем). По определению предела приведенные неравенства выполняются в некоторой 6-окресхности точки х& Из этих неравенств вытекает, что \Ш-А1<- ei + et 3&j Положим теперь е = Зе1/В2; имеем £1 = еВ2/3 > 0., так как по' условию В Ф 0. Итак, для всякого е > 0 в некоторой ^-окрестности точки х0 выполняется нера- \f(x) A\ ,. f(x) A венство -~т—~гг\ < е, а это и означает, что lim -Цг4 = -тг • Докажем еще, что справедливо свойство f °. В силу определения предела для любого е > 0 неравенства \f{x) — А | < е, \g(x) — В\ < е выполняются в некоторой б-окрестности точки х0. Иначе говоря, в той же окрестности справедливы неравенства Л-е </=(*)< Л+ е, В — e<g(x)<B+e. (23) Предположим, что В < Л. Тогда при е < | В —- Л |/2 имеем £-{-е<Л — ей из неравенств ^^ вытекает, что f{#) >g{#), а это противоречит условию. Значит, предположение В < Л неверно, т. е. Л ^£. Установим, наконец, справедливость свойства 4°. Имеем llmg(x) = y0, y=zg(x)\ х->х0 Следовательно, \у == g (x0 + ^x)—g (х0) = g {х0 + Ах) — у0 —► 0 при Д* = х—х0 —^0. Так как Шп/(*/) = Л, то А/ = /{у0 + &у) — А—>0 при Ду—>-0. Значит, если hx—► (), то £±у—+ 0, а при Д#—>0 имеем f(y) = f{g(x))—>A, § 2*Л. Непрерывность функция. Непрерывность основных элементарных функций Определение L Фуйкция /, определенная в некоторой окрестности точки х0, называется непрерывной в точке х0, если limf(x)=f(x0). х-*х0 Определение 2. Функция / называется непрерывной на множестве Q£R, если она непрерывна в каждой точке этого множества.
400 Глава IJ*. Введение в математический анализ Определение 3. Функция вида y = f (х) = Р^ (x)/Qi (х), где Р^ (х) и Qi (х)— многочлены от х соответственно k-й и /-й степени: PkW^Pifib+Pixt-i+t.i+Pu (Pi£R, i = 0, 1, 2, Si., k, р0Ф0), называется рациональной функцией. Определение 4. Функция вида y = f(x) = ax, где а > О, а Ф 1, называется показательной функцией. Определение 5. Функция вида у = / (х) = \oga х, где а > 0, а ф 1, называется логарифмической функцией. Определение 6. Функция вида y = f(x) = xp, где р ?= О—вещественное число, называется степенной функцией. Лемма 1. Рациональная^функция непрерывна во всех точках, в которых она определена. Доказательство. Воспользуемся непрерывностью функции y = f(х)=х (это утверждение очевидно). На основании свойств предела при Qt (х0) ф О имеем Pk(x) limPk(x) Х-+Х Л"0 Qi (*) ~~ lim Qi (x) * lint 7Гм=^7Гм. 0) для любого многочлена Rs (x) = 2 rlxi также в силу свойств предела получаем 1 = 0 lim Rs (*) = lim 23 *7** = 2 /,/Mm^=s 2 r« f lim *Y ^ 2ri*o« (2) Последнее равенство вытекает из непрерывности функции y = f(x) = x. Так как S 2 rixo==^s (хо)> то равенство (2) означает, что любой многочлен является непре- /=о рывной функцией для всех значений х. Используя это, запишем равенство (1) в следующем виде: Pk(x) limPk(x) Pk(x0) Pk(x) lim ^^ Qi(x) limQH*) Qi(x„) QiM (Qi (*o) Ф 0), (3) X=X0 что означает непрерывность рациональной функции в каждой точке, в которой знаменатель отличен от нуля. Лемма 2. Показательная функция у = ах (а > 0, а Ф 1) непрерывна во всех точках области ее определения, т.е. при всех #£R. Доказательство. Докажем, что lim ах = ах<> для всякого х £ R. Пусть х-+х0 г > 0 — заданное число. Рассмотрим неравенство |я*_0*о|<8. (4)
§ 2*.3. Непрерывность функции. Непрерывность основных элементарных функций 401 Преобразуем это неравенство следующим образом: a*o | ах~*ь — 11 < е; | ах~х<> — 1| < -^ j I""i'<^"A:o < 1+"^7; 1-<*«**-*•< !+8* (5) (здесь e,f = e/axo). Для каждого 8f >0 найдется такое натуральное N, что при всех п^ N выполняются неравенства l_8l<aiM< i+8f. (6) Действительно, при а > 1 неравенство а1/п<\—8f очевидно: так как а° = 1, то а1/п > 1 при любом натуральном п вследствие того, что функция ах при а > 1 возрастает. Покажем далее, что при а > 1, е$ > 0 выполняется неравенство аУп < 1 + 6Х. Отметим, что оно эквивалентно неравенству а<(1+вх)». (7) Последовательность значений (l-f-ex)" неограниченно возрастает при п—*оо. Это вытекает из соотношения (l + el)»> l+/i8f, (8) которое является очевидным следствием разложения бинома Ньютона (l+81)" = l+rt81+C„2821+...+8rt1. (9) В самом деле, если в правой части равенства (9) отбросить все (положительные) числа, начиная с третьего, то правая часть этого равенства уменьшится и мы получим неравенство (8). Итак, (1 + ех)" неограниченно возрастает при п—> оо; следовательно, для всех /г, больших некоторого числа W, выполняется неравенство (7), а значит, и неравенства (6). Ясно, что при 0 < х—х0 < 1//г неравенство (5) есть следствие неравенства (6). Аналогично можно показать, что найдется такое натуральное число М, что при всех т^М 1 — ei<flri/m< l+8i. (10) Очевидно, что при —1/т < х—х0 < 0 неравенство (5) является следствием неравенства (10). Положим теперь P = max(M, N). Будем считать, что х—х0 в неравенстве (5) удовлетворяет условию —\/Р<х-Хо< 1/Р, или |*-*0|<1/Р. (11) При этом условии в силу возрастания функции у — ах при а > 1 из неравенств (6) и (10) получим неравенства (5), или, что то же самое, (4). Итак, показано, что для всякого е > 0 существует б (а именно 5= 1/Р) такое, что при всех х, удовлетворяющих условию | х—х0 \ < 6, выполняется неравенство \ах — ахо | < е. Это и значит, что limax = ax° , т.е. что функция у = ах непре- X-+XQ рыв на в (каждой) точке Л'0.
402 Глава //*. Введение в математический анализ В доказательстве было сделано предположение о том, что ^ > 1. Случай 0 < < а < 1 легко сводится к рассмотренному: 1 1 1 а*~ /i mv! lima* = lim 7ГГТТ-= lim тггт7~=аАГо t (1/а)*' *_^0 j,_Xo (1/а)* х-^(1Уа)*» ° где использованы известные свойства пределов и то, что 1/а > 1 при а < I. Лемма & Логарифмическая функция у^Лщах (в > &t аф 1$ непрерывна при всех х из области ее определения, т. е. при ееех х >%. Доказательство. Пусть в > 0 — заданное число. Рассмотрим неравенство ]ln*—fn*0| < 8. (12) Преобразуем его следующим образом: 11п (*/*о)1 < в-, —в < 1и (дг/дго) < 83 е-е < х/х0 < ее ; х0е-е < х < х0& , (е-е _ 1) % < *-_*0 < *0 (ее — 1). (13) Неравенства (13) и (12) эквивалентны. Пусть &=*vniin (е8—1,1—е^). Тогда из условия |а:—лг01 < 6 вытекает неравенство (12), откуда lim ta#=ln#o, т.е. функ- Х->Х9 ция #=1плс непрерывна при всех х0 > 0. Из непрерывности функции #= In * вытекает непрерывность функции ^^l®^ # вследствие того, что logex — In x \ogaе. Лемма 4. Степенная функция y = f(x)~xP (pczft, р Ф 0) непрерывна при всех х, прьтв&яежащих области ее определения* Область определения Щр функции у^= f (х)= хр при различных р та*йвва: если ^—рациональное число (т.е. q = r/s и дробь r/s несократима^ то R Hf и s нечетном и r/s > 0, R\{0} ври s нечетном и r/s < 0, ыр ] [0, оо[ при s четном и r/s > 0, ]0, оо [ при s четном и r/s <0; если р—иррациональное число, то £^={0, осг[ при р > 0 и 0^ = 10, оо[ при Р<0. Доказательство. Пусть х > 0. Имеем *Я = е?1п*. В силу непрерывности показательной и логарифмической функции при л^ Ф 0 получаем р р1пд? limp In* р lim In л: pln*0 p lim* = lime = e*^*» = e *-**» = e = *0> что и доказывает непрерывность функции у = хР при л: > 0. Пусть х < 0, p = r/s, где s—нечетное. Тогда ^s={ —(—a:)1/s]/, = (—l)r (—*)r/s, откуда при #0 ?£ 0 получаем lim хП* = lim (—l)' (—xy/s = (—1)'' (—x0y/s = *0>vs.
§ 2*.$. Непрерывность функции. Непрерывность основных элементарных функций 403, Остается рассмотреть случай х0 = 0. Покажем сначала, что lim xp = 0 при х-±х0+0 любом вещественном р > 0. Пусть е > 0 —заданное число. Рассмотрим неравенства \хр—0| < 8, х^О или, что эквивалентно, 0<:ХР <8< Неравенство (14) выполняется для всех х, удовлетворяющих условию 0<*< eVp, (14) (15) так как функция у — хУР при х^О, р>0 возрастает. Действительно, хУр = s-= ewp)inx и, следовательно, если х < е1/?, то хР <(ъуР)Р = е. Таким образом, по заданному е > 0 найдено 6 > 0, а именно 6 = е1/Р, при котором из неравенства (15) вытекает (14), т.е. доказано, что lim хР = 0. *->о + о Покажем, что lim хР — 0, где p—r/s > 0 и s—нечетное. Находим *->о-о lim xP= lim (—\)r (—ху/* = lim (— 1)гуР-=0. Существование двух односторонних пределов, совпадающих между собой, эквивалентно существованию limxp; имеем ИтхР = 0, и непрерывность функции у=хР х->0 х-+0 в точке *=0 доказана как для иррационального р > 0, так и для рационального p = r/s<0 при нечетном s. Лемма 5. Тригонометрические функции y — sinx, у— cos x, y=tgx, у — ctgx непрерывны во всех точках х области определения, т.е. при всех #£R в случае всех y = sinx, cos л:, при есех #£R [хф -п-+я&, k£Z ) в случае y = tgx и при x£R (x Ф nk, k£Z) в случае y = ctgx. Доказательство. Для доказательства непрерывности функций у = sinx% y=cosx в точке *0£R, составим разности sin*—sinx0, cos л;—cos#o. Пусть е > 0—заданное число. Рассмотрим неравенства |sin*—sinлг0] < 8, | cosx—cosxqI < 8. *(16) Учитывая, что )sina|^|a| при любом а, имеем Jsinx—sinAr0I = ]cos*—cos#o 1 = n t X — X0 X + Xq 2 sin —7Г1- cos 2sini^Asin 2 x + x0 l<2 !<2 X — Xq 2 i x—xo 2 1 = \x—x0], (17) Следовательно, неравенства (16) выполняются при всех х, удовлетворяющих условию |х—*о|<6=е* Итак, функции y = s\nx и # = cos* непрерывны в любой точке #0£R.
404 Глава II*. Введение в математический анализ Непрерывность функций y=tgx, y=ctgx следует из равенств lim sin a: x^Xo & hm cos* cos*0 ° V 2 / X -* X0 lim cos x x-*xo urn sin* sin*0 ° vo ^ ' X -*■ Xq Здесь использованы свойства предела отношения и непрерывность функций у=* = sin х, y = cos х. Лемма 6. Обратные тригонометрические функции у= arcsin *, у = arccos *, t/=arctg*, *—arcctg* непрерывны во есех точках области определения, т. е. при *€[—1» 1] в случае у— arcsin*, # = arccos* м при все* *£R в случае у= arctg*, #= arcctg*. Доказательство. Функции # = sin * и у=tgx возрастают соответственно на [—я/2, я/2] и ]—я/2, я/2[. Это означает, что соответствие между А* и Ау = = */(*-(-А*)—у (*) является взаимно однозначным. Из непрерывности функций y=s'mx и y=tgx на множествах [—я/2, я/2] и ]—я/2, я/2[ следует, что Д*/ = = у (*-f-A*)—у (*) —у 0 при А* —> 0. В силу отмеченного взаимно однозначного соответствия верно и обратное, т. е. А*—► 0 при Дг/—j-О. Как известно, явное выражение * через у из соотношений y=sinx и y—igx имеет вид *=arcsin у и * —arctg#. Так как А*—► 0 при Ау—>0, то функции * = arcsin у и * = arctgy непрерывны соответственно на множествах f—1, 1] и ]—оо, оо[. Следовательно, непрерывность функций у = arcsin* и */ = arctg* доказана во всех точках области определения этих функции. Непрерывность функций у = arccos* и # = arcctg* соответственно на множествах [—1, 1] и ]—оо, +оо[ доказывается аналогично (при этом используется тот факт, что функции у —cos x и y = ctg x убывают соответственно на множествах [О, я] и ]0, я[. Определение 7. Функция, полученная из основных элементарных функций d помощью конечного числа композиций, операций сложения, умножения и деления, называется элементарной функцией. Теорема. Элементарная функция непрерывна во всех точках области опре- деления. Доказательство. Теорема является непосредственным следствием лемм 1—6, а также свойств 1°—4° функций, имеющих предел (см. п. 3° § 2*.2). § 2*.4. Бесконечно малые функции и их свойства Определение. Функция y = f (*) называется бесконечно малой при * —>■ х9 (*0£R, *0=± оо), если lim /(*) = 0. X -> Л'о Отметим следующие свойства бесконечно малых функций: 1°. Если lim /(*) = С, то lim [/(*) — С] = 0 и функция f(x)—C бесконечно х-*х0 х-+х0 малая. 2°. Сумма и произведение бесконечно малых функций являются бесконечно малыми функциями.
§2*.5i Бесконечно большие функции и их свойства 405 3°. Если f(x), h(x)—бесконечно малые функции и g (х) — функция, удовлетворяющая условию f (x)^g{xXh(x)y то функция g(x) является бесконечно малой. Эти утверждения непосредственно вытекают из свойств функции, имеющих предел (см. п. 3° § 2*.2). 4-°. Пусть f (х)—бесконечно малая функция при х—>х0, a g (x)—ограничен' ная функция в некоторой окрестности точки х0 (последнее означает, что существует такое число М, что для всех точек из указанной окрестности | g (х) | < М). Тогда произведение f(x)g(x) является бесконечно малой функцией. Доказательство. Пусть 8 > 0 — заданное число. Поскольку lim / (х) =0, х-+о существует б > 0 такое, что для всех х, удовлетворяющих условию \х—х0\ < б, выполняется неравенство \f (х)\ < г/М. Для тех же х имеем l/WfifWI = l/W|lfirWK(e/Af)M = e. Следовательно, lim f(x)g(x) = 0t т. е. функция f{x)g(x) является бесконечно х-+х0 малой. § 2*.5. Бесконечно большие функции и их свойства. Связь между бесконечно большими и бесконечно малыми функциями Определение. Функция /(*) называется бесконечно большой при х —► х0 (*0£R или #0=± оо), если lim /(#) = oo. х-+х0 Отметим следующие свойства бесконечно больших функций: 1°. Пусть f (х)—бесконечно большая функция при х—>xQ, a g(x) — такая функция, что g(x) > h > 0 в некоторой окрестности точки х0 (h—некоторое вещественное число). Тогда f (x)g (х)—бесконечно большая функция, т. е. lim / (х) g(x) — oo. х-*х0 2°. Пусть f (х)—бесконечно большая функция при х—>х0, a g(x)—функция, ограниченная в некоторой окрестности точки х0. Тогда f (х)-{-g (х) — бесконечно большая функция, т. е. lim / (x)-\-g(x) = oo. х->х0 3°. Если f(x) —бесконечно большая функция при х—у х0, то 1// (х) —бесконечно малая функция при х—> х0. Обратно, если f (х)—бесконечно малая функция при х —► х0, отличная от нуля в некоторой окрестности точки х0, за исключением, быть может, самой точки х0, то 1// (х)—бесконечно большая функция. Доказательство. 1°. Пусть N>0— заданное число. Поскольку lim /(я) = оо, найдется такое б > 0, что при всех х, удовлетворяющих условию х-+ х0 \х—л:0| < б, справедливо неравенство | / (х) \ > N/h. Если х принадлежит пересечению такой окрестности точки х0, в которой | g (х) \ > п, с такой окрестностью, в которой | / (х) | > N/h, то | / (х) g (х) | = | / (х) \, \ g (x) \ > N. Последнее неравенство и означает, что функция f(x)g(x) является бесконечно большой. 2°. Пусть N — заданное число. Поскольку lim /(#)=оо, найдется такое х-*х0 б > 0, что при всех х, удовлетворяющих условию | х—х0\ < б, выполняется неравенство \f(x)\>N-{-M, где М—такое число, что неравенство \g(x)\<M
406 ТлаШ IT*. Фъё&№№ « штмштжтй ашм& справедливо в некоторой шресгности "точки %. Тада дли каждого я, принадлежащего ттерееечению такай окрестности точки #0, в которой 1/{*Н >^ + $*» t такой окрестностью, в которой \%Щ\<М, шяеш l/W+gfcMSfclfW | — — I g (х) I > ^ + М — М = N. Это неравенство означает, что функций / (*) -irgifi является Зеекотечно большой. 3е. Пусть в >50—заданное число. Так «ж Um /{*)«*»■, то « некоторой окрестности точки хь имеем i/(*)J > 1/е* В той же окрестности выполняется неравенство \ \/f{x)\ < €. Это доказывает,, что lim 1// (х) — 0. х-*х0 Фбратио, иусть N—ааданеое *й*сло. Поскольку lim f(x)**=Q, в некоторой х-*- л'0 окрестности точки х0 выполняется неравенство \f (х)\ < 1/Af. Неравенство 11 jj{x)\ > N имеет смысл и выполнено в пересечении такой окрестности точки лг0, в которой f(x)\ < 1/Af, с такой окрестностью точки х0, в которой f (x) Ф 0. Справедливость свойства 3°, установлена. § 2*.6. Сравнение бесконечно малых. Эквивалентные бесконечно малые. Их использование при вычислении пределов Определение I. Пусть f(x) и g{x) — две бесконечно малые функции при х—>х0 и g(x) отлична от нуля в некоторой окрестности точки х9 (за исключением, быть может, самой точки х0). 'Тогда: если lim /(x)fg(x)—Q, то f{x) называется бесконечно малой $ож высжогф Х-+Х0 порядка, чем g(x), a g{%)— бесконечно малой "болте низкого порядки, чем?(4 В этом случае пишут f{x)^o(g\x))\4(x) <есть ь малое от g (*)»]; если Tim J (x)/g{x)=c Ф'Ъ, то f\x) называется бесконечно малой одного по- рядка с g(x); если lim flx)fg(x) — <u, то f Щ -называется 'бесконечно малой более низкого порядка, чем g(x), a g (х) — бесконечно малой более высокого порядка, чем f(x)„ Определение 2. Две бесконечно малые функции при х—> х0 функции f(x) и g(x) такие, что lim / (x)lg Щ = 1, называют эквталептными и пишут х-+х0 f{x)~g(x) при х—+х0. ' Две бесконечно большие функции при к —v хд функции f (х) и g {х) такие*, что lim f(x)[g{x)~\, называют эквивалентными и пишут f(x)~g(x) при х—>х0. х-+х0 Теорема 1. Пусть f (х) — бесконечно малая функция при х—> х0, g(x)— эквивалентная ей бесконечно малая функция и h (х) —функция, определенная в не" которой окрестности точки х0, за исключением, быть может, самой точки х$. Тогда lim f(x)h(x)= lim g(x)h(x)* X~*-X0 X-*-X9 Доказательство было приведено в § 2.6.
$2*.6. Сравнение бесконечно малых. Эквивалентные бесконечно малые 407 Имеют место следующие эквивалентности: sin х ~ х при х —> 0; 1 — cos л: — *2/2 при х—>0\ In (1 +*) ~ х при х —► 0; е*—\~х при х—> 0; (1 +*)*— 1 ~ &е при л: —> 0 (Л=1, 2,...); £/l -[-л: — 1 — jt/As при х—> 0; tg#~jr при х—*0; л 2 аьхп~* ~ аохп (а0ф 0) при х—► ос. (8) *=0 I Доказательство. 1) Имеем |ОЛ| = 1, AD=x, \AB\ = sinx, | ОВ | = = cos*, |CZ)|=:tg* (рис. 83). Площадь «Si треугольника AOD, площадь S2 кругового сектора AOD и площадь 5а треугольника OCD связаны соотношениями si < $2 < 5з> или \OB\.\AB\ \OD\* >g |;QDl.tCDl 9 < 9 Л1/ < 9 * т. е. i^2i£<4<-^ (*>0). Р) Раздели© каждую из частей неравенства (9) на sin.v получим cos х < sin х cos л; или sin* cos х < < 1 cos,* Так как cos*—► 1 и 1/cos*—> 1 при х—> 0, то в силу теоремы 2 § 2*.2е по- ,. sin д: 1 sin* sin (—х) лучим hm =1. На основании тождества = - имеем *_>o + o х х —х sin х sin x Jim =1 и, следовательно, lim =1, т. е. sin*~ x. Предел я-^о-о * х-+о х sin х lim ==1 называется первым замечательным пределом. х-+ о х 2) Имеем 1 — cos*_ 2 sin2 (*/2) *->0 х*/2 -™0 х*12 1 — cos* = 2sin2(*/2), lim „7^ " = lim " ~~ )Z'"' = lim ^Г=1, *2/2 "о *2/2 : т. е. i — cosjc — х2/2 при *—> 0. Здесь использована формула (1) и теорема 1.
408 Глава //*. Введение в математический анализ 3) Имеем—* *~ =1п (l+х)1^. Известно, что lim [1-]—) see. Пока- X л-> <х Ч п J жем, что lim ( 1-| ) =е. При п<у < я-f * получим #1 */ И _1_ I 7 ' И • */ „=7 п + 1 ' ~гп5==1_г7 ^"^FT* ('+4)"'*('Ц)'>('+4г)"- Если х—► <», то переменная у неограниченно возрастает. Легко показать, что / 1 \п+1 ( 1 \п lim (14 =е, lim \Л г-г =е. Действительно, n-^ooV 1 я у п-,оо\ я у V я / «->оо\ я/ «-* А я; _ Иш (l+'Y- lim ('+^)'^ V^n + l) __n+i-> со V ' fl+1/ _e 11+1- «o\ * П+1 J Применяя к функции (1-K#)* теорему 2 § 2*.2, имеем lim (1-|—) =е. Пола- гая у—1/х, получим lim (1 -j-^)1/^ = e, откуда #-» о lim 1п(1+дс) = lim in(i+jc)1/;f==ln lim (l+*)1/*=lne= 1 х-* о X х -+ о * -► о (здесь использована непрерывность натурального логарифма). 4) Положим е*—\=у\ тогда х — In (1+#). Далее, находим е* 1 w lim = lim -=—r^-.—г=1. х-+о х у^о In (1+0) Здесь использовано то, что у — ех—1—>0 при х—► О (непрерывность функции е*—1 в точке * = 0), и формула (3). 5) Имеем Иш <1+*)*-11 ит l+kx + C*x*+...+Cl-ix*-i + x*-l _ X -> Q X X -» О X = lim k+x(Cl + C£x+...+x*-1) = k х^О (здесь использована формула бинома Ньютона). Значит, (1+х)*—1 ~ kx при дг—^0.
§'2*.7. Св-ва функций, непрерыв. в точке. Предел и непрерыв. слож. функции 409 -о откуда k= 1,га ('+*>*-'= т у- 6) Положим (l+*)ft—1=У> тогда х=^/\+у — 1. Имеем lim , . У , t „-о у\+у—\ lim ,- . Здесь использовано то, что#—^0 при х—^0 (непрерывность функции (!+#)*—- 1 в точке *=0). Следовательно, ^/l+x — l~ x/k при *—*0. 7) Находим tgx ,. sin a: ,. sin л: v l , lim -£—= hm = lim lim ' х-» о x x-> о xcos x X-*Q x x -> о cos a: Здесь использованы первый замечательный предел, непрерывность функции # = cos* при х = 0 и свойство предела произведения функций. 8) Имеем » - —. ;+■■■+--^ (н^+^+.-.+^г)-.. Здесь использовано свойство предела суммы и то, что lim (l/**) = 0 при k = Х-> оо = 1, 2,« в i. Теорема 2. Пусть f(x), g(x)—dee эквивалентные бесконечно малые функции при х—> х0. Тогда функция f (х) — g (x) — является бесконечно малой^ более высокого порядка, чем f (х) и g(x), m. е. /(*)— g(x)=o(f (x)), f{x)—g(x)=o(g(x)). Доказательство было приведено в § 2.6. § 2*.7. Свойства функций, непрерывных в точке. Непрерывность суммы, произведения и частного* Предел и непрерывность сложной функции Теорема 1. Если функции f (х) и g(x) непрерывны в точке дс0, то функции f(x)-\-g(x) и f{x)g(x) также непрерывны в точкё]х^. Если g(x0) Ф 0, то функция f (х)1ё (х) является непрерывной в, точке дг0. Утверждение теоремы непосредственно вытекает из свойства функций, имеющих предел (см. п. 3° § 2*.2). Теорема 2. Если функция f (х) непрерывна в точке х0 и f (х) > 0, то существует такая окрестность точки х0, в которой f (х) > 0. Доказательство было приведено в § 2.7. Теорема 3. Пусть функция y — f(x) непрерывна в точке х0, а функция * = ф(0 непрерывна в точке /0, *0 = <р(/0). Тогда сложная функция y = f (q> (t)) непрерывна в точке t0. Доказательство. Так как функция f(х) непрерывна в точке х0, то lim f (x)—f (х0); далее, используя свойство 4° (см. § 2*.2), имеем lim /(<р(/)) =
410 Глава II*. Введение в математический анализ =/(*<>)• При этом значение функции / (q> (/)) при t = tQ есть /('<р(*о)) = / (*о)» поскольку ф (/<,) = *<>. Значит, lim / (Ф (0) = / (ф Со)) и сложная функция /"(ф(0) непрерывна в точке /0« § 2*.8. Односторонние пределы. Односторонняя непрерывность. Точки разрыва функции и их классификация Определения односторонних пределов функции (левого и правого) приведены в § 2*2. Справедливо следующее утверждение. Пусть функция f (х) определена в некоторой окрестности точки х99 за исключением , быть может, самой точки х0- Пусть, далееt существуют оба односторонних предела lim f(x) и lim /(#), причем lim /(*)= Km f(x) — C. #-»-*o-*o x->x0+o x-±x0-o x-+jc0+o Тогда существует и lim f(x), причем lim f(x)= lim /(*)= lim f(x) = C. x-+x0 x-+x9~Q х-+Хъ+0 x-+x0 I Доказательство. Пусть е>0—заданное число. Так как .существуют односторонние пределы, то найдутся такие числа 6t и 62, что для всех х, удовлетворяющих условиям 1 jc—л:0| < 6i, х < х0, выполняется неравенство \f{x)—С | < < 8f, а при. всех лг, удовлетворяющих условиям \х—х0 | < б2, х > х0,— неравенство \f(x)—С\ < 8. Если х удовлетворяет условию \х—х0\ < min (61э б2), то \f(x)—С\ < 8 независимо от того, что больше: х или х0. Тем самым показано, что для всякого 8 > 0 существует такое &, а именно 6 = min(6i, б2), что для всех xt удовлетворяющих условию \х—х0\ < 6, выполнено неравенство \f(x) — C\ < 8. Это и означает, что предел lim f (x) существует X -> Х0 # равен С. Определение 1. Функция /, определенная в некоторой окрестности точки х0 при х*^х0, называется непрерывной в точке х0 слева, если lim f (x) = f(x0). х->х0-о Функция /, определенная в некоторой окрестности точки х0 при x^zXp, называется непрерывной в точке х0 справа, если lim / (#) = / (*о)« х->хо+0 Общее название для функции, непрерывной слева или справа,— односторонняя непрерывность. Определение 2. Пусть функция f (х) определена в окрестности точки х0, за исключением, быть может, самой точки х^\ пусть также существуют оба односторонних предела lim f(x), lim /(*), причем lim f (x) Ф lim f{x).. x->x9-0 x-+x0 + 0 x->xo-0 x-+x0+Q Тогда точка х0 называется точкой разрыва первого рода функции f (х)ч . т Точка х0 называется точкой разрыва функции f (х), если функция не является в этой точке непрерывной. Приведем определение точки разрыва, не использующее отрицаний: точка х0 называется точкой разрыва функции f(x), определенной в некоторой окрестности этой точки, за исключением, быть может, самой точки *0» если / (х) не определена в точке х0 или если существует такое е > 0, что во всякой б-окрестности точки х0 найдется такая точка х, что \f{x)—/(*о)1 > 8. Определение 3. Точка х0 разрыва функции, не являющаяся точкой разрыва первого рода, называется точкой разрыва еторого рода*
§2*& €e&ficmm функций, нтрерьшных ни отрезке 4М &тр&&#&тп те 4. Шуеть функция yt=f(£p опр®8ё№й& ш тятФрок mpegfr ности точки Xq, за исключением, быть может, самой точки #a. Пусть также существуют и равны между собой левый и правый пределы: ffm f(x)= fim f{x) и при mem тб& фрйщш? f$») не е&ределеи® я точке ж0,- л&&> lirfr ?$$<** = lim f(x)^f(xQ). Тогда точка % называется точкой устранимого разрыва. #-*-#«+0 § 2*19. Свойства функций непрерывных на отрезке.7 ограниченность, существование наиболвшего й наименьшего значений, существование промежуточных значений* Непрерывные на отрезке функвдш обетадаюя важными* свойствами, сформулировтг- ными в следующих* теоремах. Теорема I. Если функция Цх) непрерывна & каждо'й точке Замкнутого) отрезка J#, Ь\> то функция f (je) ограничена на атом отрезке. 1 Доказательство. Допустим противное, а именно, что для всякого числа N на отрезке [а, о] найдется точка х> такая*, что f(x) > №. Полагая ЛГ= Г, 2, -. *» *.., /г, ..., получим последовательность точек xt, х2, ..., хп, ... £[0, U такум^ что f Qt$ > k и, следовательно, lim f(xk)=oo. Из последовательности точек х*, %Г„.>~гхп*... (фюжяФ шбраФБ' ящпоеледавш^л%«о^т%, садящееся* к" ящош* рой точке %££#;, 6fc Этот выбор* тошно туйьееттгь сгле^&вдш о#р®зом>. ffep®^ точку xi поДйоследавателвности выберем произвольно. Затем разделим отрезок far, Ё% подалжет » рассмотрим ту половину Дь которая содержит бесконечное кошч«етвте> vme« июследователвиостw, f#f (по крайней- мере одна* из двух половин бтрезка 'обладает таким свойством). В качестве второй точки х2 подпоследвватеяьности возьмем любую из точек последовательности (*),* принадлежащую рассматриваемой половине отрезка. Разделим отрезок Д* пополам й обозначим через Д2 ТУ половину, которая содержит бесконечное количество точек последовательности. (<*).. В качестве третьей точки % подаосле- довательноста выберем произвольную точку из А& Продолжая, эяот прои^се-^ ив- лучим последовательность вложенных друг в друга отрезков* A±Z) &xZ>h&z>. . .* *.. 3 Дя ZD.. ^ причем (Д^ |.= | Д. 1/2*, где |, Д# |—длина отрезка Дл> |, Д | —длина отрезка [в> 6J, а также последовательность точек гх, х& ..., хп, ... {каждаят Xk* ^= Ь 2, ..., .а, ... взята иэ последовательности (*)!• Шстроеяная* последовательность ехздггея, т. е. существует Um %. Действительно, обозначим через а^ и % левый и правый концы отрезка Д^. Очевидно, что последовательность- «ь «2» ...,лй, ... обладает свойством a^^^+i (&=1, 2, ..., л, ...) и ограничена сверху, а последовательность Ь±, Ь2, ..., Ьп, ...—свойством Ьк^Ьк+% (k~ I, 2r ..-., л, ..,) и ограничена снизу. Из теоремы о пределе монотонной ограниченной последовательности вытекает существование пределов lim ak = A, lim bk = B. (1) В силу того, что | Д#|—► () при &—► оо, имеем Л = #. Наконец, из неравенств ak<Xft+i<bk (k=l, 2, ..., /i, ,v.j, равенств (Г) и теоремы 2 § 2*.2 заклю.
412 Глава II*. Введение в математический анализ чаем, что существует предел lim х*ь и lim #£=Л£[а, Ь]. По условию теоремы k -> со k-+ со функция f (х) непрерывна в каждой точке отрезка [а, Ь], в частности в точке Л. Однако легко показать, что функция f (х) при сделанном предположении о ее неограниченности является разрывной в точке Л. Действительно, существует 8 (например, 8=1) такое, что для любого 6 > 0 в любой б-окрестности точки А найдется такая точка х, что \f(x)—/(Л)| > 8 (в любой б-окрестности точки А содержится некоторый интервал А#; л^+igAj; обладают тем свойством, что /(^+i), > k +1; отсюда / (##+1) — / (А) >k +1 — / (А) > 1 при всех достаточно больших k). Полученное противоречие доказывает, что функция f (х) ограничена сверху. Аналогично доказывается, что функция f (х) ограничена снизу. Из ограниченности функции / (х) сверху и снизу вытекает ее ограниченность по модулю, т. е. существование такого числа М, что \f {х)\ < М при всех х£[а> Ь]. Теорема 2. Пусть f (х)—функция, непрерывная на (замкнутом) отрезке [а, Ь]. Тогда на этом отрезке найдутся точки х и х такие, что для всякого х£[а, Ь] справедливы соотношения f (х) ^/ (х) ^ / (х). 2 Доказательство. Из теоремы 1 следует, что для всякой непрерывной на отрезке [а, Ь] функции / (х) существует такое число М, что f (х)<М для каждого х£[а, Ь]. Обозначим через М$ наименьшее из чисел М, обладающих этим свойством. Докажем, что такое число М0 действительно существует. Разобьем множесто вещественных чисел R на два непересекающихся множества R = A[)B, Af]B = 0, отнеся к множеству В все числа М, такие, что для каждого х£[а, Ь] выполняется неравенство f(x)*s^M, а к множеству А—все остальные числа. Из 'ограниченности функции f(x) вытекает, что оба этих множества являются непустыми. Рассмотрим отрезок [а, о], выбрав а£А, Ь£В. Разделим [этот отрезок пополам и из двух половин выберем тот отрезок, левый конец которого принадлежит множеству А, а правый конец — множеству В; обозначим этот отрезок через .Ai. Затем разделим отрезок Aj пополам и из двух половин выберем тот отрезок, левый конец которого принадлежит множеству Л, а правый конец — множеству В; обозначим этот отрезок через А2 и т. д. Получим последовательность вложенных друг в друга отрезков Ai Z) A2Z>.. .:эА„ Z).... При этом левые концы отрезков, т.е. числа flit ^2» **•» ап> *••» образуют монотонную и ограниченную сверху последовательность; (аь<^аь+%у k=l, 2, ..., я, s..) и принадлежат множеству Л; правые концы отрезков, т. е. числа Ь±, Ь2, ..., Ьп, ..., образуют монотонную и ограниченную снизу последовательность (6ft^6ft+f* k=\, 2, ...,п, ...)и принадлежат множеству В. Согласно теореме о пределе монотонной ограниченной последовательности существуют пределы lim а^ — М± и lim Ь^ — М0. Так как £ -►<» £-> со lim (ад — fyfc) = 0, то Mi = M0. Покажем сначала, что М0 принадлежит множе- k-> со ству Б. Допустим, что М0£Л. Это значит, что 7 (*) > М0 для некоторого х£[а, Ь]. Тогда f (х) > М+ е для некоторого 8 > 0 ( например, для е= j t В то же время из равенства lim Ь^==М0 вытекает, что М0 < Ъ^ < Мо + 8 для k -> со
§2*. 9. Свойства функций, непрерывных на отрезке 413 достаточно больших k. Отсюда f (х) > М0-\-г > Ь^у что противоречит условию bfg(ZB. Таким образом, М0£В. Покажем теперь, что М0 — минимальное из чисел множества В. Предположим, что существует М£В такое, что М0 > М. Тогда из равенства lim а^ = М0 вытекает, что а^> М£В для достаточно больших k. k-+ 00 При этом так как М > f (х) для всех х£[а, Ь], то и а^ > f (x), x£[a, Ь], и а^В по определению множества В. Полученное противоречие показывает, что сделанное предположение неверно, т. е. М0—минимальное из чисел множества В. Покажем, наконец, что функция f (х) принимает значение М0 в некоторой точке х£[а, Ь]. Для этого рассмотрим функцию y=-rj гтт . Предположим, мо — / \х) что М0—f (х) не обращается в нуль на отрезке [а, Ь]. Тогда эта функция непрерывна на [а, Ь] и в силу теоремы 1 ограничена на [а, Ь]. Однако вследствие того, что разность М0 — / (х) принимает на отрезке [а, Ь] сколь угодно малые значения, рассматриваемая функция принимает на [а, Ь] сколь угодно большие значения и поэтому неограничена. Полученное противоречие означает, что функция М0—f (х) обращается в нуль на [а, Ь] и, следовательно, существует такое х£ [a, b]t что f(x) = M0, т. е. f(x)^f(x) для любого х£[а, Ь]. Согласно доказанному для функции—/ (л:) существует такая точка х£[а, Ь], что —f(x)^s—f (х) для любого х£[а, Ь]. Следовательно, f (x) ^f (х), х£[а, Ь]. Теорема 3. Пусть функция y — f(x)y непрерывная на (замкнутом) отрезке [а> Ь], принимает в точках х = а и х—Ь соответственно значения А и В (А ф В). Тогда для любого числа С, заключенного между А и В, найдется такая точка х0, принадлежащая отрезку [а, Ь], что f (х0) = С. 3 Доказательство. Пусть для определенности А > В. Разделим отрезок [ау Ь] пополам и из двух половин выберем тот отрезок Дь для которого значение функции / в левом конце больше С, а в правом конце—меньше С. Это можно сделать всегда, когда значение / (х) в середине отрезка [а, Ь] не равно С. Если же f(d) — C, то утверждение теоремы, очевидно, справедливо. Разобьем отрезок Ai пополам и из двух половин выберем тот отрезок А2, для которого значение функции / в левом конце больше С, а в правом конце—меньше С и т. д. Продолжая процесс, получим последовательность At D Д2 D ... А&З..., вложенных друг в друга отрезков А^ = [^, Ь^\ таких, что длина Д# стремится к нулю при k—>»оо, или на каком-то шаге получим точку d^ такую, что f(d^) = C, Числовые последовательности а1у а2, ...,ап, ... и bi, b2, ..., bn, ... являются монотонными {ak<ak+i, bk^bfr+i, k=l, 2, ...) и ограниченными. В силу теоремы о пределе монотонной ограниченной последовательности существуют lim a^ и k -»- оо lim bfa Так как lim (а^—&#) = 0, то lima^== lim Ь&= х0у a^^x0^b^f k -> да k -> оо £->со k -> со *=i; 2, ..., n Используя эти соотношения и непрерывность функции / (я), имеем lim / (я#)= k -*■ 00 = / (*о), Игп^ f (bh) = / (аг0) , т. е. "** lim f(ak)^C,C^5 lim f (bk). (2) k -> 00 fe-> 00 Из неравенств (2) следует, что f(xQ) = C.
Глава III* ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ § 3*Л. Производная функции, ее геометрический и механический смысл. Производная суммы, произведения и частного. Производные основных элементарных функций 1°. Определение производной. Свойства производных. Определенце. /. Пусть /(#)—функция, определенная в некоторой окрестности точки я0. Производной функции / (л:) в точке х0 называется число, равное Иш /(*Wfo)t (1) к-+х0 х хо если этот предел существует, и обозначаемое /' (лг0). Предел (1) существует только в точке х0 непрерывности функции / (х); если х0—точка разрыва, то п£и Ах = х—х0 —> О А/ = / (*)—/ (х0) не стремится к нулю, в силу чего предел (1) не существует. I Однако предел (1) может не существовать и в точках непрерывности функции f (х). Так, функция у—\х\ непрерывна при каждом x£R, в частности при х0 = 0. Вместе с тем предел (1) для функции f(x) = \x\ в точке х0 — 0 не существует, поскольку односторонние пределы в этой точке не равны друг другу: lim m-m lim £=li lim tv>-mm lim .=*_._, x -► o+o x — U x -> o+o x x -* o-o x—U #-* о—о х (здесь учтено, что \х\=—х при х < 0). Непрерывная в точке х0 функция может не иметь в этой точке производной вследствие того, что односторонние пределы вообще не существуют, Например* функция f* sin (\/х) при х Ф 0, 0 при * = 0 непрерывна в точке дг = 0. При этом ,. f(x)—f(0) ,. *sin(l/x) .. , /t, ч lim i-^—?г^= lim L_Li.= lim sin(l/#). X -> 0 X U X -+ 0 X X -+<> Однако последний предел, как и пределы lim sin(l/*) и lim sin(l/#), не *-»-о + о *->о-0 существует. /=/(*)={"
$3*.l. Производная функции. Производные основных элементарных функций 415 Отметим, что существуют такие функции y~f{%), которые непрерывны в каждой точке отрезка {а, Ь], но не имеют производной ни в одной точке. Определение 2. Пусть /(х)—функция, определенная на некотором открытом множестве Q в R такая, что /' (х) существует в каждой точке x£Q. Функция /' (г), определенная в каждой точке x{£Q формулой „/ч r f(x + Ax)-f(x) П*)= lim Ar' называется производной функцией от функции f (x), Геометрический смысл производной. Пусть */ = /(х) —функция, определенная в некоторой окрестности точки х0, в которой существует /'<(*0) = t t у\ t / у V = lim -^— v ° ♦ Производная функции в точке х0 равна тангенсу угла, обра- х -*-х0 х хо зова иного касательной к кривой y = f{x) в точке (лг0, /г(*о)) и положительным направлением оси Ох. Механический смысл производной. Производная функции /(х) в точке #о равна скорости движения, определяемого законом движения y = f(x) (#—координата движущейся по числовой оси точки в момент времени х). Свойства производных 1°. Если производные функций f и g в точке х0 существуют, то существует и производная суммы f-{-g в этой точке, причем (f+gY(Xo) = f'(xo)+g'(xo). 2°. Если производные функций f и g в точке % существуют, то существует и производная произведения fg в этой точке, причем (fgY (*b) = /' (*)*(*q) + /(*o)*' (*o). 3°. Если производные функций f и g в точке х0 существуют и g (л:0) ^ 0, то существует и производная частного f/g в этой точке, причем g2(*o) (*)'«■ 2 Доказательство. Имеем: 10 lim (/+g)fa+A^)-(/ + g)fa)_ ' Д* -* 0 Л* в lim f(xo+bx)+g(xo+\x)—f(xo)—g(x0) _ Um f(xo + Ax)—f(x0) . bx-+o Ax Ддг-^о A* Ал; -* 0 A* 2o lim (fe) (*» + **)-(/*?) fro) ^ , ' д.г_0 • A* . = lim f(Xo±Ax)g(x0 + Ax) — f{x0)g(x0) ^ Hm f(x0 + Адг) [g(x0 + A*) —gfa)! Да: -* о A^ дл; ^ о Ах —
416 Глава III*. Дифференциальное исчисление функций одной переменной + Иш g(*o)I/fr, + A*)-f(*.)1 = Jim ]im g(Xo + Ax)-g(Xo) Д* - о Д* Д* - о д* -* о Л* + g (*о) Urn ^±MzLW=f w , w +/, w w# Дл; -* о 1лХ 3o lim (//g) (xq + Ax) — (f/g) (x0) = ]im / (x0 + Дд:) g (x0) —g(x0 + Ax) f(x9)_ ' Ax^o Ax A*-*o Axg(x0 + Ax) g(x0) e lim / (*p + Ax) g (*o) — f (Xp) g (X0) — [g (Xp + AX) f (x0) - f (X0) g (X0)] _^ д*^о Axg(x0 + Ax) g(x0) = lim / /fa) лч Г/(*+^)-/(*о>1 ]im /(;o) x Ax~*0 g(X0)g(x0JrAx) l AX J Ajf->0 ^Wg(^0+^) v g (Xp + Ax) — g(x<>) _ g (x0) f' (x0) f (x0) g' (x0) _ /' (x0) g (x0) — f (x0) g' (x0) Ax g*(x0) g*(x0) ~ g2(x0) 2°. Вычисление производных основных элементарных функций. Справедливы следующие формулы для вычисления производных основных элементарных функций: 1) (xvy^ax*-1 (где a^R); 2) (a*)'= a* In я; 4) (sinx)'=cos x; 5) (cos x)' — — sin x\ 6) (tgx)'=l/cos2x; 7) (arcsinx)' = l/V"T^~x2'; 8) (arccosx)' = — l/yT^x2; 9) (arctgx)'=l/(l-b*2). Доказательство. 1) Сначала покажем, что формула справедлива при любом натуральном <х = п. Имеем / «ч/ 1. (х + Ах)п—хп (хи)' = lim v ^ ' — Ах -> о Ах ^ + n^-1Ax+2-^^^-2Ajc2+ ... +Ахп- = lim "Дл:^0 Ах « lim их"-^^"^1^-^ д(л^^ Дх-*о V , ^ <*' / Теперь покажем, что эта формула справедлива при любом a£R, x > 0. Имеем pa In (х+ Ах) pa In х (д*)' = (е«1"*)'= lira -г- = Ад:-> 0 ^* aln(i+-^\ еа In tt+Ax)-aln лг 1 , р ^ * - —1 .- lim ealn^^ - •=- lim ealn* т * Д*-*0 Ax Д*->0 AX aln ( 1+ ) При заданном a и Ax —► 0 функция е ч x J — 1 является бесконечно малой; «1„(1+**Л lim e >> x J — l = ealnl— 1 = 0в силу непрерывности элементарной функ- Д*-*0
§ 3* J. Производная функции. Производные основных элементарных функций 417 aln ( i+ ) ции у — е ^ х Л Известно, что еР — 1 ~ Р, если р— бесконечно малая функция. Применяя теорему 1 § 2*.6, получим (jca)'= Km o<x.\nx± = lim е**1"*- x д*-о Ax ax^o Ax = lim ealn^^— iim j^-^^a-i. Д*-+0 X &x-+0 X 2) Для функции у = ах находим ах+&х ах е(х+Ах) In a едс In a у'— iim = lim г =s д* ^ о Ал; д* - «> Ах еД* In a 1 , Ax\na = lim e**™ _- um ex\na — rse^^^lna^a^lna. Д* -* о Ал: д* _► о Ал; Здесь использованы эквивалентность еа—1~а при а—*0 и теорема 1 § 2*.6. 3) Для функции y = \ogax имеем ,= lim log.fr+y-toe.^ Иш log"('+—)^ Д* -* о Ал; Да: _* о А* r ln(1+^r)'°gae r Л* , logfle = hm г—- = lim —r-logfle = —^— , д*-»о Ал; д*-*о хАх ьа х Здесь использованы формула Ioga л;=1пл;1о£д е, эквивалентность ln(l-|-a)~ ~а при a—*0 и теорема 1 § 2*.6. 4) Найдем производную функции y = sinx. Имеем ,. sln(x + Ax) — slnx ,. "°"х 2 WM*+ 2 ) у'= lim -—l—rL = lim ^ — = 2 sin -7Г- cos I Ax -* о Ал: Да: -* о Ал: 0 Ал: / . Ал; \ 2—cos(^+—j (*-¥)-• = lim r^ — = lim oos I xA—jt- =cosa:. Дл-о Ал: Длг-^о Здесь использованы формула sin л:—sin у~ 2 sin—^ cos—^-^-, эквивалентность sin a~a при a—>0 и непрерывность функции cos*. 5) Найдем производную функции y = cosx: Ах , ,. cos (л; + Ал:) — cos x _. 2 У'= lim i !__i : == ljm ^2sin-^sinfx+^-) д* » о Ax Ax _> о Ал: .. —2Ал; . / . Ал; \ ,. . / , Ал; \ = lim ол sin [x-\—jr- =— hm sin л;-]—— = — sinx. &x^o 2Алг V2/ Д*-о V2/ 14 № 2636
418 Глава III*. Дифференциальное исчисление функций одной переменной Здесь использованы формула cos х— cos у = —2 sin —^- sin —~-£- , эквивалентность sin а ~ а при а—>0, теорема 1 § 2*.6 и непрерывность функции sin л:. 6) Для функции # = tg* находим cos х cos* + sin* sin x 1 v \ COS X J COS2* COS2* Здесь использованы правило дифференцирования частного и формулы (sin *)' = «= cos *, (cos *)' = — sin *. 7) Найдем производную функции # = arcsin*. Имеем Иш arcslnfr+y-arcsto*^ P-g A*-o А* р-^а sinp — sin а 1 где обозначено p = arcsin(*+A*), a = arcsin*, A*=(* + A*)—* = sinP — sina; очевидно, Р —► а при А* —► 0. Далее находим / v р —а ,. р —а «г= lim —^ : == lim 5— з— s4 р^а sinp-sma в^а 2cin Р-а CQC Р+<* lim —5 5— = lim р^а2_Р-а_со8_Р + а p^«cosl+a_ 1 = 11 cos a cosarcsin* у\ х2 Здесь использованы формулы sin Р~sina = 2 sin p~ cos Т" -, cos (arcsin*)= s=Vrl—*3 , эквивалентность sin "7 ~ р~Га при Р—^ а и непрерывность функции cos*. 8) Найдем теперь производную функции # = arccos*: , .. arccos (*+A*) —arccos* ,. Р—а у'= hm -—i-т-^ = lim 5 =5 >д#-*о A* p ^a cos p — cosa r P—« = lim : т^- 5— t Р-с,_28Ш1^асоз_Р + а.1 где обозначено arccos (*+A*) ==P, arccos* = a, A*=(* + A*)—*= cos P —cosa; очевидно, Р—* а при A*—> 0. Следовательно, , .. P —a .. p —a # = lim £ в lim — p^a cosp-cosa 3-» a ocin P~a cin P + a, P-a2l^sinl+5L 3—8tai + « -1 ^ —1 = 1 sina sin arccos* j/~i x%, *
§3*.2. Производная сложной функции. Производная обратной функции 419 Здесь использованы формулы cos р — cos а = 2 sin Р а sin 9 а- , sin arccos x = = |^1— х2 , эквивалентность sin ^—^— ~ -^— при Р—► а, теорема 1 § 2*.6 к непрерывность функции sin л;. 9) Найдем, наконец, производную функции y — arctgx: , arctg(* + A*) — arctgx Р — a у = lim т = lim -т—-q—tz— i где обозначено P*=arctg (лг+Дл;), a=arctg*; очевидно, Р—> а при Але—► (). Значит, (»— atgp—tga 6^« sin (ft—а) Э-а,о_а) cos p cos a cos P cos a = lim cosPcosa = cos2a = cos2(arctg#) = - 2 Здесь использованы формулы tg a —tg Р = - ~-, cos2 (arctg дг) =—-—- s ^ r J tot^ cos a cos P \ & / l -f-jc« * эквивалентность tg(a—p) ~ (a— P) при p.—► a, теорема 1 § 2*.6 и непрерывность функции tg#. \: Заметим, что при выводе формул (яггя!п*)' = . — Т (arccos *)'= г 1 х =* ,- j (arctg*) = 2 мы пользовались приемом, с помощью которого будет доказана теорема о производной обратной функции (см, теорему 2 § 3*.2). § 3*.2. Производная сложной функции. Производная обратной функции. Производные обратных тригонометрических функций Теорема 1 (правило дифференцированиясложной функции). Пусть y = f(u)> и = у(х)—две функции и определена сложная функция у (х) = = /(ф(д:)). Если функция и —<р(х) дифференцируема в точке x=xQ, а функция y = f(u) дифференцируема в точке н0 = ф(*о)» т° сложная функция y=f(q>(xQ) дифференцируема в точке х0, причем у' (лг0) = /^(ф (х0)) ф^ {xq). I Доказательство. По" определению /' (и0) = Ит ' *"6 а • Дм -► & Ли На основании свойства 3° (см. § 2*.2, п. 3°) заключаем, чта /(«0 + А«)-/Ы=/,(Ио) + е(Ац)< (Ц где е(Аи)—► 0 при Аи—^0, т. е. / (uQ + Au)-f (u0) = f (ц0) Ды +е (An) A«. (2) Функцию e(Aw), не определенную при Ди = 0, доопределим, полагая 8(0) = 0. Тогда е(Аи) будет непрерывна при Дц=0. 14*
420 Глава III*. Дифференциальное исчисление функций одной переменной Разделим левую и правую часть равенства (2) на Ах Ф 0: Ал: v и/ Ад: ' v ' Ах В равенстве (3) перейдем к пределу при Ад:—► 0. Тогда в его левой части получим (f[u (я)])' \x=Xq> а в правой /' (и0) ф' (х0), поскольку lim 8(Ам)-^-== lim е(Аи). lim -^^О-ф'^о^О. Ля -> о ал: &х ~+ о Д# -► о ал: Здесь учтено, что Аи—>0 при Д#—► (), вследствие чего lim е(А«) = lim e(Aw) = 0. Дл:-*0 Ди->0 2 Пусть функция у = (р(х) взаимно однозначно отображает область определения на множество значений. Это означает, что различным значениям аргумента хг и х% соответствуют различные значения функции, т. е. ф (л^) Ф ф (л:2). В этом случае каждому у из множества значений функции ф (л:) соответствует однозначно определенный х из области определения функции ф (л:), а именно тот самый лг, для которого ф (*) = #. Такое соответствие у—>х определяет функцию, называемую обратной к функции у —у (х) и обозначаемую через ф-1; по определению ф-1(у) = = x&y = q>(x). Если функция # = ф(л:) — строго монотонная, то она взаимно однозначно отображает область определения на множество значений и, следовательно, определена обратная функция х = у~1(у). Графики функций у = у (х) и л: = ф"'1 (у) совпадают. Если же обозначить аргумент и значение функции ф*-1 общепринятым образом, т. е. аргумент через л:, а значение функции через у, то график функции у — (р-1(х) симметричен графику функции у=(р (х) [ относительно биссектрисы I и III координатных углов. Теорема 2 (о производной обратной фун к ц и и). Если функция у = (р(х) непрерывна, строго монотонна в некоторой окрестности точки лг0, дифференцируема в этой точке и ф' (л:0) Ф 0, то и обратная функция л: = ф""х (у) дифференцируема в точке Уо = у(х0), причем (ф""1)» (Уо) = 1/ф^ (л:о). 3 Доказательство. Имеем Обозначим Xi = ф " г (у0 + Ау); при этом Ау = (у0 + Ау)—у0 = у (х{) — ф (л:0). Покажем, что Xf—>■ х0 при Ау—► 0. Действительно, Ау—^0 при хг—> лг0 вследствие непрерывности функции у = (р(х) в точке л*0; так как функция ф строго монотонна, то Ал: и Ау взаимно однозначно соответствуют друг другу, откуда Х\—>хь при Ау —► 0. Далее, имеем ^у >™ Хх+ Хо ф (*!> — ф (хо) Xi _> Хо Ф(*1)-ф(*о) Ф' (*0) х1— хо Используя теорему 2, легко найти производные обратных тригонометрических функций. Функции arcsinA:, arc cos xy arctg* являются обратными к функциям y = sinx, y = cosx, y = tgx, рассматриваемым на множествах [—я/2, я/2], [0, я],
§3*.4< Дифференциал функции. Инвариантность формы дифференциала 421 ]—я/2, я/2[, где эти функции строго монотонны. Это означает, что на указанных множествах из y = s'mx следует # = arcsin#, из y = cosx следует x=arccosy, из y = tgx следует * = arctgr/. Находим: 1 1 1 (arcsin у)' (у0) -- 'У ™' (sin х)' х=х0 cosxo cos (arcsin r/o) j/"l— у2 ' W/ * 1 1,1 1 (arcCOSf/)' (y0)—- %/ / . = : =rr—i—; =* ; ^ (cosa:^(^0) — sinjeo —sinarccos^/o \f\—y% (arctg „); ы = (tgx;:(,0)=—}—a c°s2 (arctg^=-нЬг * cos2 *0 Заменяя #0 на лг0, получим (arcsin х)'Ха = -pf==: ("«cos ^ = "p==- S (ar<=tg *>*—ПП£ • § 3*.3. Гиперболические функции, их свойства и графики. Производные гиперболических функций qX Q-X Определение. Функция у — ^ называется гиперболическим синусом и обозначается y = shx. е* _|_е-* Функция у— -? называется гиперболическим косинусом и обозначается сп х. qX е~ЛГ Функция # = -—■ — называется гиперболическим тангенсом и обозна- e*-j-e~* чается у = th x. Функции sh x, ch x, th x обладают следующими свойствами: sh х ch2jc — sh2*=l, sh2jc = 2shA:chA:, thx=—r—f chx sh (—*) = — sh#, ch (—*) = ch#, th (—x) — — th#, (shAr)' = ch*, (chjt)'==shA:, (th#)' = —р—t Графики функций y — shx, y = chx, y — thx приведены на рис. 49. § 3*.4. Дифференцируемость функции. Дифференциал функции. Связь дифференциала с производной. Геометрический смысл дифференциала. Линеаризация функций. Дифференциал суммы, произведения и частного. Инвариантность формы дифференциала 1°. Дифференциал функции. Определение 1. Функция y — f(x) называется дифференцируемой в точке лг0, если приращегие функции Д/ = / (*0 + Дл:) —-/ (л:) в этой точке можно представить в виде Д/ = ЛДл'+о(Дл:), (1)
422 Глава III*. Дифференциальное исчисление функций одной переменн&й где А — некоторое число (не зависящее от Дя), а о (Ах)—функция, бесконечно малая более высокого порядка, чем Ах. Определение 2. Пусть функция y = f (х) дифференцируема в точке х0. Тогда выражение А Ах в разложении (1) называется главной линейной частью приращения функции f в точке х0 или дифференциалом функции / в точке лг0 (обозначение: df = AAx или dy = AAx). I Покажем, что коэффициент А в равенстве с!/ = ЛДл: равен f (х0). Действд- тельно, из соотношения (1) получаем Следовательно, df = f'(x)Ax и так как dx = (x') kx=Ax, то df = f'(x)dx. (2) 2°. Инвариантность формы дифференциала. Для сложной функции у = f (<p (х))\ где y—f (и), а = ср (х)—функции, дифференцируемые соответственно в точках и0 = <р(х0) и х0, на основании равенства (2) получим &У = (/ (ф (*)))' d* = f'„ (Ф Ы) ф' (*о) <**• (3) Так как q/ (x0)dx = duf то равенство (3) примет вид &У = Ги (У (*о)) ф' (*о) dx = /; (и0) du. эд Формула (4) выражает свойство, называемое инвариантностью формы дифференциала относительно преобразования независимой переменной. 3°. Геометрический смысл дифференциала. Уравнение касательной, проведенной к графику кривой y = f(x) в точке (x0i f(x0)), имеет вид У—|/о = П*о)(*—*о). (5) Приращение касательной в точке х0, т. е. разность у—у0 = у— {(лг0), есть }'(х0)(х—х0) = Г (x0yAx=df. Таким образом, значение дифференциала равно приращению ординаты касательной. В этом состоит геометрический смысл дифференциала. 4°. Линеаризация функций. Для всякой дифференцируемой в точке х0 функции f (х) формула Af = f'(x0)Ax+o(Ax), или f(x) = f(x0)+f,(xo)^c+oi(Ax) ,,,, ■ (6>
§ 3* .5., Производные и дифференциалы высших порядков. Формула Лейбница 423 определяет линейную функцию / (л*0)+Г (л*0) (х—х0), значение которой при л:, близких к х0, отличается от f (x) на функцию о (Ад:), бесконечно малую более высокого порядка, чем Ад:. Представление функции f (х) в виде (6) называется . линеаризацией функции / (х) в точке х0, ' 5°. Дифференциал суммы, произведения и частного. Для функций f(x),g (*), дифференцируемых в точке лс0, справедливы формулы d (/+£) = d/ + d£, d[j) P Эти свойства являются непосредственными следствиями -формулы (2) и правил вычисления производных. § 3*.5. Производные и дифференциалы высших порядков. Формула Лейбница. Неинвариантность формы дифференциала порядка выше первого Если существует производная от производной /' (х) функции / (х), то она называется второй производной функции / (х) и обозначается /" (х): Производная я-го порядка /<w) (x) функции / (*) определяется по индукции; f»> W = (F»-» (*))«, я«1. 2, ... разумеется, если (f{n~l) (х))' существует). Производной функции / нулевого порядка считается сама функция / (/<°> = /). Теорема (формула Лей б ни ц а). Если функции f(x)ug(x) имеют все производные до п-го порядка включительно, то №п) W = 2 <U/W (х) &»-» (х). (Г) /=о I Доказательство. Формула (1) справедлива при я=1, так как Допустим, что формула (1) верна при некотором n = k. Докажем, что соотноше-
424 Глава III*. Дифференциальное исчисление функций одной переменной ние (1) выполняется и при n — k-\-\\ = 2 [с1кР1+г)£*-1)+с1кР1¥*-1+г)] = = 2 ci/^+Mg<*-')+2 cip«<*-'+i)= = 2 <*/"+»*<*-'> + 2 4+7«+1)£<*-<> = = 2 с^+^-^+р+^ч- +2 ci+v^v^+w*4-**- / = o = 2 ^+cn/</+^^0+^+^0)+/(VA+1) = = 2 c^+1i/a+;L)^A"o+/(/?+1,^<0J+/(0)^(A+1)= /=-1 J = 0 Здесь учтено, что c£ + c£+1 — Cfc+i- На основании принципа математической индукции формула (1) справедлива для любого п. Пусть y = f (х) —функция, имеющая п-ю производную. Выражение dnf = = /<">(#) (Д*)и, где A# = *—#0> называется n-м дифференциалом (или дифференциалом п-го порядка) функции f (x) в точке х0. Для независимой переменной х справедлива формула &»f=fW(x)(dx)n. (2) Однако если y = f(x) и x=u(t), то, вообще говоря, d«/ (х (0) = / (х (t))T\^)n Ф № (х) Wn, п > 1 (неинвариантность формы дифференциала порядка выше первого). § 3*.6. Теоремы Ролл я, Лагранжа, Коши, их применения. Правило Лопиталя Теорема 1 (теорема Ролл я). Пусть функция f (х) определена и непрерывна на отрезке [а, Ь] и дифференцируема в интервале ]а, Ь[, причем f(a) = f(b). Тогда существует точка с£]ау Ь[ такая, что /' (с) = 0. I Доказательство. В силу теоремы 2 § 2* .9 функция / (х) достигает на
§3*.6. Теоремы Ролля, Лагранжа, Коши. Правило Лопиталя 425 отрезке [а, Ь] своего наименьшего и наибольшего значений. Пусть х и х—точки из [а, Ь] такие, что f {x)^f (x)^f (х) для всякого х£[а, Ь]. Если обе точки х и х совпадают с концами отрезка [а, Ь], то наименьшее и наибольшее значения функции равны между собой и, следовательно, функция f (х) является постоянной. В этом случае производная /' (х) равна нулю в каждой точке [a, b]y и утверждение теоремы выполнено. Рассмотрим случай, когда по меньшей мере одна из точек х и х является внутренней точкой отрезка [а, Ь]. Пусть такая точка для определенности есть х. Имеем /(Г+Дд)'-/®<о. (1) Отсюда iim ra+^-fOo ^о (2) Х-+Х-0 *Х lim ti*+t*-f<* <0. (3) Х-+Х+0 Д* Так как производная /' существует в точке лГпо условию, то из неравенств (2) и (3) вытекает, что Um /(*+A*W(D= ljm f(x+Ax)-f(x) =a X-+Z-0 Д* x^lc+o Да: Таким образом, f (x) = 0, х£]а, 6[, и существование внутренней точки, в которой производная равна нулю, доказано. Теорема 2 (теорема Лагранжа). Пусть функция f (x) определена и непрерывна на отрезке [а, Ь] и дифференцируема в интервале ]а, Ь[. Тогда су- ществует точка с£]а, Ь[ такая, что 2 Доказательство. Рассмотрим функцию <?(x)=f(x)-f(b)bZfa(a) (x-a)-f(a). Очевидно, что ф (а) = ф (&) = 0, функция ф (х) непрерывна на [а, Ь] и дифференцируема на ]а, Ь[. В силу теоремы Рол ля, существует точка с£]а, Ь[ такая, что ф'(с) = 0. В данном случае и, следовательно, f'(c) = J-^-i—,—^-^ b—а
42$ Глава III*. Дифференциальное исчисление функций одной переменной Теорема 3 (теорема Ко ши). Пусты 1) функции fug непрерывны на отрезке [а, Ь] и дифференцируемы в интер* еале ]а, Ь[\ 2) g' (х) Ф О в каждой точке х£]а, Ь[. Тогда существует точка с£]а, b[ такая, что f(b)-f(a) _ Г (с) g(b)-g(a) g'(c)* {0) 3 Доказательство. Рассмотрим функцию Здесь g(b)—g(a) Ф О на ]а, Ь[; в противном случае g(b)=g(a) и в силу теоремы Ролля выполнялось бы равенство gf(c) — Q для некоторого c£]at b[, но но условию g' (х) Ф О для любого *£]а, Ь[. Функция ф (х) непрерывна на [а, 6], дифференцируема на ]а, Ь[ и ф (&) = ф (а). -По теореме Ролля найдется такая точка с£]а, Ь[у что ф' (с) = 0. В данном случав V V g{b)-g{a) g кч u' Теорема 4 (п р а в и ло Лопиталя). Пусты 1) функции f(x) и g (х) определены в окрестности точки х&, причем f (xQ) = = g(Xo) = Q; 2) существуют производные /' (#0), g' (#0), причем g' (x0) ф®, f (х) Тогда существует предел lim ) ' и х-+х0 g{x) f(x) _/'(*) Х-»Х0 4 Доказательство. Имеем gW g (x) *' lim Ш--т /j*ww Iim r,fa)y+»ij4 /'(*.)- о (Д*) ,. Ax _/'(*<>) = JUni ■ 77—v-:=—Г7—T"« *' W" Д* Теорема 5. Пусть: 1) функции f(x) и g (x) определены и дифференцируемы в некоторой окрест* ности точки #о, ва исключением, быть может, самой точки х0\ 2) lim /(*)= lim g(*) = 0; Х^-Xq X-+Xq 3) g' (*0) ^Oe некоторой окрестности точки х$, за исключением, быть ма* жет, самой точки х0. \
§3*.6. Теоремы Ролля, Лагранжа, Коти. Правило Лопиталя „ 427 4) существует конечный или бесконечный (равный -foo или ..оо) предел х-»х0 g (х) f (х) Тогда существует предел lim ' ) ' и х->х0 g(x) шЩ=шШ-. - р) 5 Доказательство. Положим 7,Y\-j f(x) ПРИ *^*о, Z(r\—J 8(х) ПРИ *5**d. 'w"\0 при х = х0, gw""\0 при * = лг0. Функции^*), #(*) определены и непрерывны в точке л:0. Применяя к этим функциям теорему Коши на отрезке [*0> х], получим f(x) = f(x)-f(Xo) = /W = Г (с) *<*> g[x)-g(x0) g(x) g'(c)' Если а:—>x0, то с—> x0 и, следовательно, lim ж. Um JH2.« Hm т.. x-+x0 g \X) c-+x0 g' (с) х->хй g \X) Теорема 6 (правило Лопиталя). Пусты 1) функции f (x) и g(x) определены и дифференцируемы в некоторой окрест» ности точки х0, за исключением, быть может, самой точки х0; 2) lim f(x)= lim g(*)=oo; x->x0 x-*x0 3) g§ (x) 9^0 в окрестности точки х0, за исключением, быть может, -самой точки х0', 4) существует конечный или бесконечный (равный +оо или —оо) предел Х-*Х0 g W fix) Тогда существует предел lim . ' и ' х-*х0 g\X) х^х0 g (X) х-+х0 g (X) 6 Доказательство. Пусть сначала lim , . [ Ф 0. Имеем х->х08 (х) х-*х0 g (x) x->x0 Uf (X) [ . \ .АЛ,- Функции l/g(*) и 1//(*) стремятся к нулю при х—► х0 и функция ( , 1 =3 /2М в некоторой окрестности точки х0, за исключением самой точки xQ,
428 Глава 111*. Дифференциальное исчисление функций одной переменной отлична от нуля ( если бы /' (x)/f2 (x) обращалась в нуль в каждой окрестности точки л:0, то тем же свойством обладала бы /' (х), что противоречит предположе- f (х) \ нию lim ■ , Ф О 1 . Применяя к функциям l/g(x) и 1// (х) теорему 5, получим х->х0 ё \х) У х-*ха V / (*) g2 (*) J х^Ха Г (х) х^х, g* (х) Отсюда; Мш 4Й—Мш Ш, или lim iW -Иш Щ. Пусть теперь lim i^=0. Тогда lim iLW+^M^i ^ о, функции f+g х-*х0 § \х) х-+х0 ё \х) и g удовлетворяют условиям теоремы 6. По доказанному lim /('>+f(*>=limn*)+g'(*)=1) х-»Хо ё(х) х->х0 g (х) fix) откуда lim -гт^—О. х-+х0 ё\х) § 3*.7. Формула Тейлора с остаточным членом в форме Лагранжа. Представление функций е*, cos x, sin x, In (1 + •*)» О + *)* по формулам Тейлора Теорема 1 (формула Тейлора с остаточным членом в форме Пе а но). Для всякой функции f (х), определенной в окрестности точки х^ и имеющей в этой точке производные f (x0)y f" (л:0), ..., /<w> (x0)y справедлива формула Ж=/(*о)+-^Д*+-^ (1) I Доказательство. Рассмотрим предел fix)- 2 fm <*> ^w- / w- 2 f{* <**> ^^ lim rr-rz = bm д*->0 (А^)я *->*0 (*—*o)" Числитель ф (а:) и знаменатель ty(x) выражения, стоящего под знаком предела, удовлетворяют условиям теоремы 4 § 3*.6. Следовательно,
§3*7. Формула Тейлора 429 Функции <р' (л:) и i|/ (х) удовлетворяют условиям той же теоремы; поэтому lim фМ ]im Ш^та £М х-»х0 * (х) х^Хо У (х) х^Хо i|>" (*) Аналогично получаем lim 1W«„M Ф'М_цт Ф"(*) _»„, Ф(Л,« lim Ф' (*) *-**„ ф" (*) ==...== lim ,_^0 ip> (x) ' Проверим, что функции <р<*' (х), Щ1) (х) удовлетворяют условиям теоремы 4 § 3*.6 при / = 0, 1, 2, ..., п— 1: л ч*'> (*)=/">(*)-£ M^~1)^;^~/+1)P>(^o)(^^o)fe^; я|><'> (х)=Л (я — 1).. .(/г—/ + 1) (х—дго)72-^; /-1 ф"> w - /«» (*„)-2 ft (*-!)• ^-/+1) р)(Xe) (Мо)*-/ А=0. x-x0 X — Xq Среди всех слагаемых правой части отличны от нуля только два: /<*> (х0) и Слагаемые вида —* —~ !—- /(А> (х0) (х—дг0) ( при & < / обра- щаются в нуль, так как в произведении k (k—/)...(&—/+1) имеется множитель, равный нулю, а при k > I они также обращаются в нуль, поскольку (*-*о)*-Ч^о=о*-<===о. Итак, Ф(|>(*о)=Л'>(*о)-/</)(^о)=0 (/ = 0, 1, 2, ..., /|); ^)(A:0) = n(n-l)...(Ai-/ + l)(A:-^)rt***4A:=Aro = 0 при / < я. Отсюда на основании правила Лопиталя имеем ,. фМ ,. <р{п)(х) 0 л так как lim <p<">(*) = 0, lim i|)(/2) (х) = п\. Теорема 2 (формула Тейлора с остаточным членом в фю р м е Лагранжа). Для всякой функции f (х), определенной в некоторой окрестности тонки Xq и имеющей в этой точке производные f' (x0)t /" (#0), ..., frn) (*0)> о, в некоторой окрестности этой точки—производную f{n+1)(x)1 справедлива формула /M = /(*o)+^A*+^W+-. f(n) (xn) ftn+14c) 1 {Хо)(Ах)п+',м , ДуСА*)"*1, (2) еде с—некоторая точка, принадлежащая интервалу ]х0, х[.
430 Глава III*. Дифференциальное исчисление функций одной переменной <-£/<*+>Ч0^+£ W)^^4^QM= 2 Доказательство. Обозначим через Rn разность / (х) — У, /(/f) (xQ) X Х-—аГ^"~* Полагая Rn (х) = /п ■ i\i Q (*)> рассмотрим функцию Jfe=0 v ' Очевидно, что функция F (/) дифференцируема на отрезке [#о, х] и F (x) = F (х0) = О* Применим к этой функции теорему Ролля, для чего сначала вычислим F' (/): k=0 k=l =_/<»+« (/) ^Lzpi^il^pl q (x). В силу теоремы Ролля существует точка c£]x0i x[ такая, что ^'(с) = 0, т. е. откуда Q (х) = Рп+1) (с). Тогда формула принимает вид /w- Е** W ^4г^ V+У J***"(c)' с€1*°' * Для функций е*, cos л:, sinx, ln(l+*), (1+*)а справедливы следующие фор- мулы, вытекающие из теорем 1 и 2: *=о fe=o cos,= ±(_1)*-|^+о(*П со.,- Sc-D-^r+^jM)»*»*...
§3*.7. Формула Тейлора ,431 X2n+2 , v3 v5 Y2n + l +(-1)"^a+^-(n+1Mn(i+^)=^-4+---+(-1)'j+1|+«»w. /:=0 (»+^-E/(a~1)--/~fe+1)^+x"+laVJ;r(CT~")(i+g)g-"-1. (1+^11^«+£^^+.,.+а<«-!)-^-"+!)^+л,(^
Глава IV* ИССЛЕДОВАНИЕ ФУНКЦИЙ С ПОМОЩЬЮ ПРОИЗВОДНЫХ § 4*.1. Условия возрастания и убывания функций. Точки экстремума. Необходимое условие экстремума. Отыскание наибольшего и наименьшего значений непрерывной на отрезке функции 1°. Возрастание и убывание функций. Точки экстремума. Определение U Функция / (х), определенная на интервале ]а, Ь[, называется возрастающей (убывающей) в точке Хо€1а> Ч» если в некоторой 8-окрестности этой точки выполняется неравенство f (хь—h) < / (х0) < / (x0-\-h) [соответственно / (x0 — h)>f (x0) > f (x0+h)] при любом 0 < h < 8. Функция f (х) называется возрастающей (убывающей) на интервале ]а, Ь[, если для любых двух точек *i, x2£]a, h[ при хг < х2 выполняется неравенство / (хг) < < / (*г) [соответственно / (*i) > / (х2)]* Теорема 1 (достаточные условия возрастания и убывания функции в точке и винтервале). Если функция f (x) дифференцируема в точке х0£]а, Ь[ и f (х0) > О (/' (д:0) < 0), то функция f (x) возрастает (убывает) в точке х0. Если функция f (х) дифференцируема в каждой точке #0(ЕК Ч и /'(*) >0 (f' (х) < 0) для всех х£]а, Ь[, то функция f (х) возрастает (убывает) в интервале ]а, Ь[. I Доказательство. Согласно определению производной, имеем rM=limf^ + hl-fM. (1) h -*■ о п Так как разность между функцией '— ° и ее пределом является бесконечно малой при h —> 0, то /(*+*)-; (*>=/, (Хо)+а (Хо< Л)> (2) где а(#0, h)—► 0 при Л —> 0. Если /' (*0) > 0, то при достаточно малом h выполнено неравенство /' (х0)-{-а(х0, К) > 0, откуда, используя соотношение (2), получим f(x0 + h)-f(x0) п >и- (<Ч
§4*.l. Условия возрастания и убывания функций. Точки экстремума 433 Из неравенства (3) следует, что / (x0-{~h) > f (х0) при h > О и / (x0+h) < f (x0) при h < О, т. е. / (*о-Л) < Нхо) < f (xo +h), h>0. ~ * (4) Это и означает, что функция / (х) возрастает в топке #0. Аналогично доказывается, что если /' (л:0) < 0, то функция / (х) убывает в точке х0. Докажем теперь, что если в каждой точке интервала ]а, Ь[ выполнено условие /' (х) > О, то f(xi)<f(x2) (5) для любых Xi и х2 таких, что х± < х2. Предположим противное. Пусть для некоторых Xi и х2 таких, что xi < x2i неравенство (5) неверно, т. е. / (#i) £г / (х2) • Разобьем отрезок [xlt х2] на две части [хъ х3] и [лг3, х2], где х3 — середина [х^ x2]. Тогда по крайней мере для одного из двух отрезков [х±, х3], [х3, х2] не будет выполнено утверждение теоремы, т. е. значение функции / в правом конце отрезка окажется не больше, чем ее значение в левом конце этого отрезка. Тот отрезок, для которого указанное свойство имеет место, снова разделим пополам; тогда хотя бы одна из двух его половин является таким отрезком, что функция / (х) в левом его конце имеет не меньшее значение, чем в правом. Если процесс деления отрезков пополам продолжать неограниченно, то при этом можно получить отрезок * сколь угодно малой длины. Из теоремы о вложенных отрезках вытекает, что найдется точка *€[хь х2], принадлежащая каждому из отрезков построенной последовательности. В точке ~х производная /' (#) > 0 (по условию /' (х) > О для всех точек х£]а, Ь[). По доказанному в некоторой е-окрестности точки х справедливо неравенство / (хг) < / (х2), если Xi < х2 и Xi, x2 принадлежат этой 8-окрестности. При этом 8-окрестность точки х не может содержать какого-либо отрезка, в котором значение функции в левом конце было бы не меньше, чем значение функции в правом конце. Мы пришли к противоречию, поскольку в построенной последовательности вложенных отрезков найдется столь малый отрезок (содержащий х), что он целиком принадлежит 8-окрестности точки х, и такой, что значение функции f (х) в левом конце этого отрезка не меньше, чем ее значение в правом конце. Полученное противоречие показывает, что в интервале ]а, Ь[ не существует точек Xi и х2 таких, что Xi < х2 и f (Xi)^*f(x2). Значит,- при всяких х^ и х2 таких, что Xi < x2, справедливо неравенство / (лгх) < / (х2). Аналогично доказывается, что если в каждой точке интервала ]а, Ь[ выполнено условие /' (я) < 0, то функция убывает в этом интервале. Определение 2. Точка х0 называется точкой экстремума функции /(#), если значение функции / (х0) является наибольшим (или наименьшим) значением в некоторой 8-окрестности точки х0. При этом значение / (л:0) называется экстре* мумом функции. В случае наибольшего значения точка экстремума называется точкой (локального) максимума, а в случае наименьшего значения-— точкой (локального) минимума.
434 Глава IV*. Исследование функций с помощью производных В этом определении предполагается, что функция определена в некоторой окрестности точки х0. Теорема 2 (необходимое условие экстремума). Если xQ — точка экстремума функции f (х), то либо /' (*0) = 0, либо производная функции f (x) не существует в этой точке. 2 Доказательство. Рассмотрим е-окрестность точки дг0, в которой значение является максимальным или минимальным. Если производная функции f (х) в точке х0 существует, то она не может быть положительна в этой точке. В противном случае функция / (х) в точке х0 возрастала бы и в некоторой е-окрестно- сти точки х0 были бы справедливы неравенства f (х0—К) < f (xQ) < / (x0 + h) для всех h таких, что 8 > h > 0 и значение f(x0) не было бы максимальным во всякой окрестности точки х0, содержащейся в указанной е-окрестности. Аналогично можно показать, что если производная функции / (л:) в точке х0 существует, то она не может быть отрицательна в этой точке. Таким образом, остаются две возможности: либо /'(л:0)=0, либо производная функции / (я) в точке х0 не существует. 2°. Правило отыскания наибольшего и наименьшего значений непрерывной на отрезке функции с конечным числом критических точек. Для отыскания наибольшего и наименьшего значений (абсолютного максимума и абсолютного минимума) непрерывной на отрезке [а, Ь] функции f (х) следует: 1. Найти критические точки функции f (х) (т. е. такие точки, в которых производная р (х). равна нулю или не существует). 2. Для каждой критической точки х0 определить знак производной f (x) слева' и справа от х0. Если f (х) изменяет знак с — на + при переходе аргумента х через точку х0 слева направо, то х0 является точкой локального минимума. Если f (х) изменяет знак с + на —, то х0 является точкой локального максимума. Если знак f (х) слева и справа от точки х0 не изменяется, то х0 не является ни точкой локального максимума, ни точкой локальнвго минимума. 3. Найти наибольшее из чисел /(а), / (х[), f(x£), ..,, f(x'k), f (b) и наименьшее из чисел /(а), f(xl), f{xl), ..., /(*/), f(b)t где Хъ х2, ..., Xk—множество точек локальных максимумов, а х\, х2, ..., х\—множество точек локальных минимумов. Первое из найденных чисел является абсолютным максимумом, а второе — абсолютным минимумом функции f (х) на отрезке [а, Ь]. 3 Доказательство. Очевидно, что в результате вычислений, которые' должны быть выполнены в п. 1 и п. 2, будут найдены все локальные экстремумы данной функции на отрезке [а, Ь] (это следует из теорем 1 и 2).- Остается показать, что действуя согласно п. 3, мы действительно найдем наибольшее и наименьшее значения функции на этом отрезке. Заметим, что в силу теоремы 2 § 2*.9 всякая непрерывная на отрезке [а, Ь] функция достигает своих наибольшего и наименьшего значений. Таким образом, на отрезке [а, Ь] существуют точки абсолютного максимума и абсолютного минимума. Если точка х0 абсолютного максимума не совпадает с одним из концов отрезка,' то она должна совпадать с одной из точек локального максимума. Действительно, если х0 не является точкой локального максимума, то даже в сколь угодно малой ' е-окрестности этой точки значение / (х0) не будет наибольшим; поэтому если дг0
§4*-2. Исслед. функций на выпукл, и вогнут. Точки перегиба. Асимптоты 435 не .является точкой локального максимума, то она не будет и точкой абсолютного максимума. Следовательно, х0 совпадает с одной из точек а, х[, х%, •«*» *ь Ь. При этом, очевидно, что наибольшее из чисел /(a), f(x'i), /ОО» ***> f(x'k), f Ф) и есть наибольшее значение функции на отрезке [а, Ь]. Аналогично можно показать, что наименьшее из чисел / (а), /(*]'), /(*£)> »»• • «*> /(*/)> f Ф) является наибольшим значением функции на отрезке [а, Ь]. § 4*.2. Исследование функций на экстремум с помощью производных высшего порядка. Исследование функций на выпуклость и вогнутость. Точки перегиба. Асимптоты кривых. Общая схема построения графиков функций 1°. Исследование функций на экстремум с помощью производных высшего порядка. Теорема 1. Пусть функция / (*) определена в некоторой г-окрестности точки хц, причем /' (#о) = 0, f (х0) = 0, *.., /<*-i) (#о) = 0 и /(*> (х0) Ф 0. Тогда критическая точка х0 является точкой локального максимума, если k—четное и /(Л) (х0) < 0, и точкой локального минимума, если k—четное и fik) (х0) > 0. Если k—нечетное, то критическая точка х0 не является точкой локального экстремума; в точке х0 функция f (x) возрастает при /(ft) (x0) > 0 и убывает при /<*> <*б) < 0. I Доказательство. Воспользуемся формулой Тейлора для функции / (х) в точке х0: f(x) = f (*о) +^У^ (х-х0)* + о (х-хд*. (1) В формуле (1) учтено, что /' (*<>) = /* (х0) = *.. =/(Л"1) (#о)=0. Прв х, достаточно близких к х0, слагаемое о(х—х0)к, являющееся бесконечно малой более высокого порядка малости, чем (х—#0)Л, меньше по абсолютной величине, чем ненулевое слагаемое ■ J (*— Xq)K Поэтому знак f(x)—f(x0) совпадает со знаком ь\ (х~~~хо)к> т* е- со знаком /(А) (Хо) (х—х0)к. При четном k знаки /<*> (#0) и /<Л) (хй) (х~-х$)к совпадают всюду в малой окрестности точки Хц. Следовательно, если /(Л) (х0) >0, то f (x)—/(*©) > 0> откуда вытекает, что х9—точка локального минимума. Если же /<*> (х0) < 0, то f(x)—f(x0) < 0, откуда вытекает, что х0 — точка локального максимума. Наконец, если k—нечетное, то из совпадения знаков чисел f (х)—f (х0) и ь! (х—х0)к следует, что в случае /<*> (xQ) > 0 разность f(x)—f(x0) поло- жительна при х > х0 и отрицательна при х < х0, т. е. функция / (х) возрастает в точке #о*» в случае /(А) (х0) <0 разность f(x)—f(x0) отрицательна при х > х$ и положительна при х < #<>, т. е. функция / (х) убывает в точке х0. 2°, Исследование функций на выпуклость и вогнутость. Точки перегиба. On ре* деление 1. График функции y=f(x), определенной на отрезке [а, Ь], называется выпуклым вверх (вниз) на этом отрезке, если для всяких трех чисел я-i,
436 Глава IV*. Исследование функций с помощью производных *о» *i€[a> ЭД таких, что x-i < х0 < х1у справедливо неравенство /(*oW(*-i) > /faWfo) (2) #0— АГ— J ^ — #q или соответственно неравенство f(xo) — f(x-i) < f(x1)—f(x0) ,3) х0 — х _ 1 л^ — д:0 График функции y = f(x), определенной в некоторой е-окрестности Q точки х0, называется выпуклым вверх (вниз) в этой точке, если для некоторой замкнутой 81-окрестности Q точки х0 условие (2) [соответственно (3)] выполнено для всех tf-i, *o> *i таких, что х„ъ х0, j^gQ, *_i < xQ < xv Отметим, что условие (2) [соответственно (3)] выполняется тогда и только тогда, когда значение / (л:0) больше (меньше) значения линейной функции y = f (хх) + 4~ — ~ (х—#_i) в точке х — х0\ график этой функции представляет собой Х\ — ДГ 1 прямую, проходящую через точки (#_ь / (*-i)) и (*i, f (#x)). Если функция f (x) определена в некоторой е-окрестности точки х0 и дифференцируема в этой точке, то приведенное выше определение равносильно определению выпуклости из § 4.2. Теорема 2 (достаточное условие выпуклости). Пусть функция у — f (х) определена и дважды дифференцируема в интервале ]а, Ь[. Тогда если f" (*о) < 0, х0£]а, Ь[, то в точке х0 график функции является выпуклым вверх, а если f" (#0) > 0 — выпуклым вниз. При выполнении условий f" (x) < О (f" (x) > 0) для всех х£]а, Ь[ график функции y = f(x) является выпуклым вверх (вниз) в интервале ]а, Ь[. 2 Доказательств.о. Воспользуемся формулой Тейлора с остаточным членом в форме Пеано для функции f (х) в точке х0 при п = 2: / (*) = f Ы+Г (х0) (*-*о) + ^ {x-x,f + o {x-xtf. (4) Функция о(х—#0)? является бесконечно малой более высокого порядка малости, чем (х—л;0)?. Поэтому в некоторой 8-окрестности Q точки х0 знак разности / (х) — — f (х0)—f'(x0)(x—л:0) совпадает со знаком г>1 » а также со знаком f" (х0). Как известно, уравнение у = f (х0)-\-f (х0) (х—х0) задает касательную к графику y = f (х) в точке х0. При /" (х0) < 0 имеем f (х) < f (#0)+Г (*о) (х — х0). Следовательно, если х-.\, x±£Q и х~± < х0 < х1у то / (*-i) < f (*о) + /' (х0) (x-i-xo); (5) / (xi) < f (*o) + /' (*o) (xi ~ xo). (6) Поскольку х0 является внутренней точкой отрезка [*_i, %], для некоторых положительных чисел а и Р таких, что а + р=1, справедливо неравенство ах^1 + Рхг = х0. (!) Действительно, легко установить, что для выполнения равенства (7) можно взять а = Xl~~x° , p = i2Zl£zi. (8) Х\ — #_ 1 Х\ — #_ 1
§4*.2. Исслед. функций на выпукл, и вогнут. Точки перегиба. Асимптоты 437 Умножая обе части неравенства (5) на а, обе части неравенства (6) на р и складывая полученные результаты, с учетом соотношения (7) находим a/(*-i) + P/(*i)</(*b). (9) Отсюда, используя равенство (8), имеем <«-**1<*->> + <*-*->>ГЫ<ГМ, (.0) Х\ — X _ 1 Х-± — X _ 1 что эквивалентно неравенству (2). В самом деле, из неравенства (10) получаем (*i—x0)f (*-i) + (*o— *-i)/(*i) < / (*о) (^f—*-i); (x1 — x0)f(x_1) + (x0—x-1)f(x1) < f (xQ)l(xi—x0) + (x0—x_1)]; (*0—*-i) [f (xj—f (x0)] < (Xi—x0) [f (*o)—/ (*-i)]; f(*b)-/(*-i) > /(*iW(*o)y 1 Xq—Л". i Л'1—#o т. е. неравенство (2). Аналогично можно доказать, что в случае Г (х0) >0 в некоторой 8-окрест- ности точки х0 выполняется неравенство (3), т.е. график функции / (х) является выпуклым вниз в точке х0. Остается Доказать, что для дважды дифференцируемой на отрезке ]а, Ь[ функции в случае f" (х) < 0 для всех х£]а, Ь[ график является выпуклым вверх, и в случае f"(x) >0 — выпуклым вниз. Воспользуемся формулой Тейлора с остаточным членом в форме Лагранжа для функции / (х) в точке х0 при я—1: / (*) = f (*6)+f Ы (х-Хо) + £р- (х-х0)\ (11) где с—внутренняя точка отрезка [х0, х]. Если f" (х) <0 для всех х£]а, Ь[у то /(*)</(*о)+П*о)(*-*о) (12) для любого х£]а, Ь[. В частности, при х = х_г < х0 и x — Xi>x0 из формулы (12) получим / (*-i) < f (*о) +f' (хо) (x-i-x0), f (хг) < / (*0) +/' (х0) (xi—x0)t т. е. неравенства (5) и (6). Тогда из этих неравенств, полностью повторяя приведенные выше вычисления, получим неравенство (2). Это и означает, что в рассматриваемом случае график функции / (х) является выпуклым вверх. А Аналогично можно показать, что в случае /" (х) >0 для всех х£]а, Ь[ график функции / (х) является выпуклым вниз. 3 Определение 2. Пусть y = f(x)— функция, определенная в" некоторой 8-окрестности Q точки х0 и дважды дифференцируемая в этой точке. Тогда если в каждой точке х > х0 некоторой ei-окрестности точки х0 график функции является выпуклым вверх (вниз), а в каждой точке х < х0 — выпуклым вниз (вверх), то х0 называется точкой перегиба. Теорема 3 (необходимое условие перегиба). Пусть f (x) — функция, определенная в некоторой г-окрестности Q точки х0 и дважды дифференцируемая в этой точке. Тогда если х0 является точкой перегиба, то f" (,t0) = 0. 4- Д о к аз а те л ьств о. Пусть х0—точка перегиба и график функции f (х) является выпуклым вниз при х < х0, x£Q и выпуклым вверх при х > x0t x£Q. Если, кроме условий теоремы, предположить непрерывность второй произ-
438 Глава /У*. Исследование функций с помощью производных' водной в точке х0, то утверждение теоремы может быть доказано следующим простым рассуждением от противного. Пусть /" (х0) Ф 0; тогда в силу непрерывности f" (х) сохраняет постоянный знак в некоторой окрестности точки х0 и на основании достаточного условия выпуклости (теорема 2) слева и справа от точки х0 график функции имеет одинаковое направление выпуклости, т. е. он является либо выпуклым вверх (Г (*о) < 0)> ли0° выпуклым вниз (?' (х0) > 0). Последнее противоречит определению точки перегиба, который по условию является х0. Докажем теперь справедливость утверждений теоремы без дополнительного предположения о непрерывности f"(x) при х = х0. Итак, пусть х0—точка перегиба; пусть для определенности график функции f (х) при х < х0 является выпуклым вниз, а при х > х0 — выпуклым вверх в некоторой 8-окрестности Q точки х0. Заметим, что существование второй производной при х = х0 означает существование первой производной в некоторой окрестности точки х0. Без ограничения общности можно считать, что первая производная f (x) существует в 8-окрестности Q точки х0. Покажем сначала, что производная /' (х) возрастает в точках х < х0, x£Q и убывает в точках х > х0у x£Q. Действительно, пусть #0£Q, х0 < х0. По определению для точек #_£, х0, #i, принадлежащих некоторой е^окрестности Qi точки х0 и таких, что х^± < Xq < хи в силу выпуклости вниз графика функции / (х) при х < х0 имеем f(xo)—f(x-j) < f(xi)—f(xp) (13) Xq ЛГ—1 Х\ — Xq Так как пределы левой части неравенства (13) при #_i—> х0 и правой части неравенства (13) при Ici—hlto равны /' (#0), то f(%)-f(^-i)</,(;o)<^%-/fa)< (,4) Xq ЛГ_]] Xi Xq Исследуем зависимость /' (*0) от х0. Для этого вычислим производную левой части неравенства (14) по переменной х0 при постоянном х^± в точке х0: Г (*о) (xo—x„i) — (f (xQ)—f (*_i)) (15) (XQ-X.tf Согласно неравенству (14), /' (х0) (х0—*_ 1)^!(х0) — f(#li); поэтому числитель дроби (15) неотрицателен, и найденная производная также неотрицательна. Та- f (xo) — f (x-i) * ким образом, выражение —^-= ^ не убывает при постоянном л;_| и передо —X— i ~ д f(xi)—f(x0) менном х0. Аналогично можно установить, что величина i—Lv при по- Xi — Xq стоянном 1с± и переменном х0 является неубывающей. Так как jiro ffc>-f£-i) =r$_Di _щ f &>-[&) =f,(~i)t (Щ Х0-*Х _t XQ X-i Xq-+Xi Xi Xq to /' (£_i) < /' (xq) < /' (%) для любых трех чисел JLf, x0, х\, таких, что !c-i,
§ 4* .2. Исслед. функций на выпукл. 4i вогнут. Точки перегиба. Асимптоты 439 #0,*i€&, £-1, #о> *i€&i и I_i < х0 < *ь тем самым доказано, что /' (х) возрастает в окрестности Q. Аналогично можно доказать, что функция /' (х) убывает в окрестности Q при х > х0. Рассмотрим предел lim n*, + A*)-/'(*,)t по определению равный f (x0). С одной стороны, этот предел неотрицателен, поскольку при А*—►—О имеем /' (x0-\-Ax)—f (х0) < 0 и Ах < 0; с другой стороны, он неположителен, так как при Ах—^ + 0 имеем }' (дг0 + Ал:) — /' (х0) < 0 и Ах > 0. Следовательно, предел (17), существующий по условию теоремы, равен нулю. Теорема 4 (достаточное условие п е р е г и б а). Пусть f (х)— функция, определенная в некоторой ^-окрестности точки х0 и дважды дифференцируемая в этой окрестности; пусть также f"(x0) = 0 и вторая производная f (х) изменяет знак при переходе аргумента х через зту точку. Тогда х0 является точкой перегиба. Доказательство было приведено в § 4.2. 3°. Асимптоты кривых. Определение 3. Прямая называется асимптотой кривой, если расстояние от переменной точки кривой до прямой стремится к нулю при удалении этой точки в бесконечность* Теорема 5. Пусть функция f (x) определена для всех достаточно больших х и существуют пределы lim Щ-=К lim (f(x)-kx) = b. (18) Тогда прямая y = kx~\-b является наклонной асимптотой кривой y=f(x) при Х—^ + оо. Аналогично, если существуют пределы lim -Ц^-=К lim <f(x)-kx) = b, (19) то прямая y — kx+b является наклонной асимптотой кривой y=f (х) при х —► — оо. Если же не существует хотя бы один из пределов (18) и (19), то кривая не имеет наклонных асимптот. Пусть функция y=f(x) определена в некоторой г-окрестности точки х0 при х<х0 (х > х0) и lim f(x) = po ( lim /(*) = осЛ. Тогда прямая х=х0 яв- ляется вертикальной асимптотой. 5 Доказательство. Пусть пределы (18) существуют. Рассмотрим прямую y = kx+b. Покажем, что расстояние от точки (х, f (x)) графика кривой до этой прямой стремится к нулю при х—> + оо. По условию lim (/ (*) — kx—b) = Q. Число f (x)—kx—b по абсолютной величине равно длине отрезка от точки (ж, kx-\-b) до точки (х\ f (х)). Расстояние от точки (х, f (х)) до прямой y = kx-\-b равно |/ (х) — kx—b\ cos а, где а — угол наклона прямой y—kx-\-bк положительному направлению оси Ох. Очевидно, что f (x) — kx—b и \f(x)—kx—&|coscc (а Ф Л/2) стремятся к нулю при х —> + оо одновременно.
440 Глава IV*. Исследование функций с помощью производных Аналогично можно доказать, что из существования пределов (19) вытекает существование асимптоты при х—> — оо. f (х) Если не существует lim , то предел lim (f(x) — kx—b) не сущест- Х-> + оо X х-+ + со вует при любом k и Ь, в частности не равен нулю. Действительно, предполагая противнее, имеем lim (f(x)-kx-b)= lim *Ш£1—*--—\ (20) #->+оо Х->+<х> X Поскольку первый множитель в правой части равенства (20) стремится к оо, ^ - fix) и b втЪрои множитель А-1^-—k должен стремиться к нулю. При этом lim ( — k =0 и lim i-i-J = &. Это противоречит предположению о том, *->+со\ X X J #->oo X f (х) lim —— не существует. Следовательно, в этом случае график кривой не х->+ оо X имеет наклонной асимптоты. f (х) Если lim существует и равен k, а предел lim / (х) — kx не существует, Х-++СО X х-*-+со то предел lim (/ (х) — kx—b) не существует ни при каком Ь> и график кривой #->+оо у = f (х) снова не имеет наклонных асимптот. Утверждение теоремы в случае х—► — оо доказывается аналогично. Если функция f (х) определена в некоторой е-окрестности точки х0 при х < х0 и lim /(#)=оо,то прямая х = х0 является вертикальной асимптотой. Действи- х->х0 — 0 тельно, точка (х, f (х)) при х—► х0 — 0 удаляется в бесконечность, т. е. расстояние от этой точки до начала координат стремится к бесконечности. Расстояние от точки (ху f (х)) до прямой х = Хц равно х0 — #, т. е. стремится к нулю при х—*х0 — 0. Таким образом, прямая х — х0 удовлетворяет условиям определения 3 и является асимптотой кривой y — f{x). Доказательство для случая х—^#0 + 0 аналогично. 4°. Общая схема исследования функций и построения их графиков. Для построения графика функции удобно использовать следующую схему: 1. Найти естественную область допустимых значений аргумента (область определения функции). 2. Найти точки разрыва и определить их характер. 3. Найти асимптоты графика функции. 4. Найти производную функции и с ее помощью определить интервалы возрастания и убывания функции. 5. Найти точки максимума и минимума, а также максимальные и минимальные значения функции. 6. Найти вторую производную и с ее помощью определить интервалы выпуклости и точки перегиба графика функции. 7. Используя все полученные результаты, построить график функции. Примеры построения графиков были приведены в § 4.2.
Глава V* ВЕКТОРНЫЕ И КОМПЛЕКСНЫЕ ФУНКЦИИ ДЕЙСТВИТЕЛЬНОЙ ПЕРЕМЕННОЙ § 5*.1. Векторная функция скалярного аргумента. Производная 1 Определение 1. Отображение f: D —> Кп, где D — подмножество в R, а Кп — векторное координатное пространство над полем /С, называется векторной функцией скалярного аргумента. Понятие векторной функции скалярного аргумента употребляется чаще всего для /C=R и« = 3. 2 Для функций /: D —> R3 определены следующие операции: 1. Сложение векторных функций / и g\ обозначение: f-\-g. По определению, (7+3(0=7(0+2(0. 0) 2. Умножение векторной функции f на скалярную функцию ф(0> в частно- -> сти на постоянную; обозначение: /<р. По определению, (7фмо=ф(о7(о. (2) 3. Скалярное произведение векторных функций / и g; обозначение: (f, g). В результате получается скалярная функция. По определению, (7, 3(о ==(7(0,1(0). (3) 4. Векторное произведение векторных функций fug; обозначение: f Xg. По определению, (7x5(0=7(0x^(0. (4) Правые части формул (1) — (4) определены как соответствующие операции над векторами в R3. Формулы (1) — (3) определяют операции над векторными функциями со значениями в R". Предел векторной функции определяется с помощью формулы Km f (0=2 lim **W**' (5)
442 Глава V*. Векторные и комплексные функции действительной переменной где функции xk(t) (&=1, 2, iiit л)—коэффициенты разложения вектора /(/) по базису (eit e2, ..., 7п). 3 Формула (5) задает одно и то же значение lim / (t) при использовании раз- t->t0 личных базисов в R". Действительно, пусть (е±% е2, iiif en) и (/i, /2, Si., /л)—два базиса в R*. ~^ ->—►-> ~> —> -> Найдем lim/(/) в базисе fa, et,,,,,en) и в базисе (fb /2 /л)- Пусть f (0 = 2 *ft (0 в», ? (О = 2 № (0?*; тогда liraf(0 = 2lim%(04 (6) limf(0 = 2limt/H0^. (7) Предположим, что базисы (е±, е2, ***, ей) и (/*, /a, Sii, /„) связаны следующими соотношениями: /) = 2<7/?/(Ь=1. 2. .„, л). (8) Имеем lim 7 (0 = 2 Ит #Л (О /* = 2 lim y^fr. t-+t0 t-*-t0 t->t0 Отсюда вытекает, что пределы (6) и (7) совпадают, поскольку коэффициенты X((t), yj(t) (i, /=1, 2, iS., л) вследствие равенств (8) связаны соотношениями я lim xi (/) = 2 lim ys (0 <^« <-> Определение 2. Производной векторной функции f: D —у Rn называется векторная функция /': D—> Rn, определяемая для каждого значения t£D формулой -* tt-+t *i—* 4 Из определения вытекает, что если производная векторной функции существует, то формула (4) § 5.1 определяет ее однозначно. При этом если ?(o=2fl*<o£ (10)
§ 5* Jr Векторная функция скалярного аргумента. Производная 443 — разложение вектора f (t) по базису (е*, е2> ..., еп) в линейном пространстве Rw, то f(/)=2fl*W^ (П) £=1 Действительно, / (/х) = 2 а& (*i) ^ и в силУ соотношения (5) имеем •р _ llm 2 **('*> **-Z **<*>«* __ ' {t) -tt-+t h-t п ^(4(ti)-ak{t))tk n Отметим, что формула (9) справедлива при любом выборе базиса в R72. Так как производная векторной функции определена однозначно (если, конечно, она суг ществует), то формула (11) в различных базисах задает одну и ту же функцию. 5 Свойства производных векторных функций 1°« (/+£)' = /'+#'> если V и g' существуют. Действительно, ^.иш Тм+ею-т«)-?а>_ lim щ=м+шы=1 h-+t h—t tx-+t h—t ltl_+t h—t 2». (%f)'z=%f'. В самом деле, f ,im HM-U(t) ,ХИш Ы^Ж^ # 0i 3°. (f, #)' = (?'» !) + (/» ?)> *^ш /'> ^'существуют. Имеем <£ *)'- lint V{ti)' g ^»^^(0, g(0) _ e lim (fa), g(ti))-(?(ti). g(t)) + (?(h), g(t))4f(t), g(t))^. = h.m (Ы, bm-1®) (ш-Пп Ы . /^* : h—t tl_+t ti — t
444 Глава V*. Векторные и комплексные функции действительной переменной 4°. (fXg)' = /'Xg + fXg', если /', g' существуют. Имеем elim T(ti)xg(t)-TVi)xg(t)+ T(h)xF(t)-?V)xg(t) _^ tx-+t h — t =Iim ^ibMx|(0+Iim7(/l)x£^bfW= - =T'(t)Xg(t) + T(t)Xg'(t). § 5*.2. Параметрические уравнения кривой на плоскости и в пространстве. Функции, заданные параметрически, их дифференцирование Определение. Пусть у — кривая в R3 и х (t), y(t), z(t) — три непрерывные функции вещественной переменной t. Пусть также выполнено следующее условие: точка Р (х; у\ z)£R3 принадлежит кривой у тогда и только тогда, когда при некотором t *=*(*), y=yV), z = z(t). (l) В этом случае уравнения (1) называются параметрическими уравнениями кривой у. Всякая тройка непрерывных функций x(t), y(t), z(t) определяет кривую в R3, a x — x(t), y = y(t), z = z(t) являются ее параметрическими уравнениями. Аналогично, каждая пара непрерывных функций x(t), у (t) задает кривую на плоскости R2, a x = x(t), y = y(t) — параметрические уравнения этой кривой. I Пусть x0 = x(t0), yo = y(to) и х' (to) Ф 0 (предполагается, что производные *(*)» У (t) существуют в малой окрестности точки ^0)- Обозначим через Т и X малые окрестности точек t0 и х0 соответственно. В силу известной теоремы дифференциального исчисления функций одной переменной, при х' (t0) ФО функция x(t) монотонна в малой окрестности точки t0, так что для некоторых (достаточно малых) окрестностей Т и X точек t0 и х0 отображение х: Т -+ X взаимно однозначно. Композиция обратного отображения л:-1 и функции у: Г-^R, т. е. отображение yox"1: X = R, определяет (однозначную) функцию y~f(x). При этом говорят, что равенства x — x(t)y y = y(t) задают параметрические уравнения функции у — f(x). Лемма. Производная y' = f'(x) функции y = f(x), заданной параметрическими уравнениями x = x(t), y = y(t), имеет следующие параметрические уравнения: у*=Ш' x=x{t)- (2) 2 Доказательство. Имеем Дд;->0 А* At-*0 х КЧЫ-гЧ (3)
§5*.3. Алгебраич., тригонометрии, и показат. формы комплексного числа 445 Здесь использованы известные формулы дифференциального исчисления: Ау = = y'(/)A/ + ei, Ах — х' (t) At-\-e2, в которых x(t), у (t)—дифференцируемые в точке t функции, a 8i, 82 —бесконечно, малые функции более высокого порядка малости, чем At. Из соотношения (3) следует 1Jfll //№A/ + 8i,(/fflA/ + e2\ y'(t) т. е. параметрические уравнения производной у;: имеют вид (2). § 5*.3. Комплексные числа, их изображение на плоскости. Модуль и аргумент комплексного числа. Алгебраическая, тригонометрическая и показательная формы комплексного числа. Операции над комплексными числами. Формула Муавра 1°. Определение и свойства комплексных чисел 1 о п ре деление. Комплексным числом а называется всякая упорядочен-, ная пара вещественных чисел (а, Ь). При этом определены две операции: 1) сложение двух комплексных чисел <х = (а, b), р = (с, d), обозначаемое а-рР- По определению, а + Р —(а + с, b-\-d)\ 2) умножение двух комплексных чисел а, Р, обозначаемое оф. По определению, ар = (ас—bd, be-{-ad). Приведенное определение превращается в определение § 5.3, если упорядоченной паре вещественных чисел (а, Ь) поставить в соответствие число а-\-Ы. При таком соответствии сумма а + Р = (а, b)-\-(c, d) переходит в сумму (а+Ы)-\- + (c-\-di)\ a произведение ар = (а, Ь) ус, d) — в произведение (а + Ы) (с-\-di) = = ас—bd + i (be -\-.ad). Данное определение имеет преимущество перед определением § 5.3, содержащим символ i, поскольку введение этого символа связано с преодолением некоторых логических трудностей. Множество комплексных чисел, в котором определены указанные операции сложения и умножения, обозначается через С. 2 Операции сложения и умножения комплексных чисел обладают следующими свойствами. 1°. а + р = р + а уа, PgC. 2о. (а + р) + ? = а + (р + 7) va, p, y€c. 3°. a(PY) = (aP)v V«, P. \y&. 4«. a(P+T) = ap + aY ya, p, YgC. 5°. Существует элемент 0£С, удовлетворяющий условию 0 + a = a yagC [это—элемент 0 = (0, 0)J. 6°. Для каждого a£C существует Р£С такой, что a-fp = 0 [это—элемент р = (-в, -ад 7°. Существует элемент 1£С, удовлетворяющий условию Ьа = а уа£С [это —элемент 1 = (1, 0)]. 8°. Для каждого agC (a^O) существует элемент р£С такой, что аР = 1. Доказательство. 1°. Пусть а = (а, b), Р = (с, d). Тогда a+P = (a+c, b+d), p + a = (c+a, d+b).
446 Глава V*. Векторные и комплексные функции действительной переменной 2°. Пусть а = (а, b), р = (с, d)9 y=(e, /). Тогда (а + р) + у = (а_|-с + е, b + d+f), а + ф + у) = (а + с+е, b + d + f). 3°. Пусть а = (а, 6), Р = (с, d), 7= (г, /). Тогда a(pY) = («, b)(ce—dft de + cf) = *=(ace—adf—bde—bcf, bce—bdf + ade + acf)f (<x$)y=(ac—bd, bc + ad)(et /) = = (are—tate—to/—adf, te + acte + acf—M/). 4°. Пусть a = (a, fc), P = (c, d)t y~(e, f). Находим (a + P)v=(fl+«. b+d)(e,f) = (ae + ce-bf-df, be+de+af+cf)f aY+PY=(a, *)(«. f) + (*. 4)(«. /) = (<*-*/, ^ + a/) + + (<*—#, de+cf) = (ae—bf + ce—df9 be + af+de + cf). 5°. (0, 0) + (a, Q = (a+0, £+0) = (a, 6). 60. (a+Q + (_af —6) = (0, 0). 7°. (1, 0).(a, Q = (a. 1+^-0, 0-a+fc.l) = (a, *). 8°. Пусть a = (a, b)\ тогда P = f fla , b% * — аъл_ъ2 ) • Действительно, ft_f g-a 6(— b) —ab t afr ^/^ m a' \а2+^ a? + 62 » fl?+« + a?+fc2) {i h Множество К элементов, в котором определены операции (сложение и умножение), удовлетворяющее свойствам 1°—8°, называется полем. Выше было установлено, что € является полем. Легко проверить, что множество вещественных чисел R, множество рациональных чисел- ф относительно обычных операций сложения и" умножения являются- полями. Множество R вещественных чисел может быть вложено в С следующим образом: х-+(ху 0), x£R, (#, 0)£С. При таком вложении «сохраняются» операции сложения и умножения. Это значит, что если х->(х> 0), у->(у, 0), то (х+у) -*• *-> (x + 0) + (yt 0) и ху ->- (х, 0) (у, 0) (R является подполем поля С). 2°. Алгебраическая, тригонометрическая и показательная формы комплексного числа. Комплексные числа принято изображать точками на плоскости. Именно, комплексному числу a = (a, b) (или, что то же а-\-Ы) ставится в соответствие точка Р (a, b) (в прямоугольной декартовой системе координат). Запись комплексного числа а в виде а+Ы называется алгебраической формой комплексного числа. Длина отрезка ОР (О — начало координат) называется модулем, а угол между вектором ОР и положительным направлением оси Ох—аргументом комплексного числа а. Запись комплексного числа а = а + Ы в виде a = а+Ы = Y &+b2 (cos ф + i sin <p) = r (cos ф + i sin ф), (1) где г— Уа2 + Ь2—модуль, а ф—аргумент комплексного числа a ( cos ф =—== ♦ \ У а2+Ъ\ sitt(t>=— ) , называется тригонометрической формой комплексного числа, •,. . Va*+bl)
§5* А. Комплекснозн. функции действ, перем. Основная теорема щгебры 447 Справедлива следующая формула (формула Муавра): (cos ф + i sin <р)и = cos n<p-{-i sin яф, (2) где п — целое число. Доказательство было приведено в п. 2° § 5.3. 3 Определим функцию ez для комплексного значения аргумента z = a-{-bi следующим образом: e* = efl(cos&-Hsin&). ч (3) Укажем основные причины, мотивирующие это определение: 1) функцию е* можно разложить в ряд по степеням х и затем рассмотреть этот ряд для комплексного значения аргумента г = а-\-Ы\ в результате получается ряд для функции еа (соаб+'i sin 6); 2) функция ezx является решением дифференциального уравнения fe (x) — zf(x) при условии / (0)= 1; функция / (х) = еах (cos bx-j-isin bx) удовлетворяет тому же уравнению при том же условии; 3) функция е* обладает свойством еЛ-е& = еа + &, аналогичное свойство имеет и функция (3). Учитывая равенство (3), комплексное число z — a-\-bi ф0 можно представить в виде 2r = eInr+t*arS2t (4) где r=V'^2+b2i argz — аргумент комплексного числа г. Равенство (4) задает показательную форму комплексного числа. * - § 5*.4. Комплекснозначные функции действительной переменной, их дифференцирование. Многочлены в комплексной области. Теорема Безу. Условие тождественности двух многочленов. Корни ». многочлена. Основная теорема алгебры. Разложение многочлена с действительным коэффициентом на линейные и квадратичные множители 1°. Комплекснозначные функции действительной переменной. Определение 1. Отображение /: Z)->-C, где D — подмножество в R, называется комплекснозначной функцией действительной переменной. Всякая комплекснозначная функция действительного аргумента f(t) связана с двумя действительными функциями x(t)t y(t): f(t) = x(t)+iy(t)! , (1) Предел комплекснозначной функции f действительной переменной t лри t-^t0f обозначаемый lim f (t), определяется с помощью формулы lim / (t) = lim x (t) + i lim у (t). t^h t^-t0 t~>t0 • '•» Пределы комплексно? начных функций обладают рядом свойств, вытекающих из соответствующих свойств действительных функций. Отметим наиболее важные
448 Глава V*. Векторные и комплексные функции действительной переменной из них: Jim (/ (t)+g (/))=lim / (/)+lim g (t), если lim / (t), lim g (t) существуют; t->t0 t-+t0 t-+t0 t-*t0 t-+t0 lim / (t) g (t)=lim f (t) lim g (t), если lim f (t)y lim g (t) существуют; t-+t0 t->t0 t-*t0 м0 t->tQ f(t) Iim/(0 lim LLL^f J^Li , если lim f (t), Vim g (t) существуют и Vim g (t) ?£ 0. t-*t0g(t) Hmg(/) t-+tu t-*h t-*h Функция / называется непрерывной в точке t, если lim f (h) = f (t). Функ- tt-*t ция / называется непрерывной в интервале ]а, &[<zR, если она непрерывна в каждой точке интервала. Непрерывные функции обладают рядом свойств, непосредственно вытекающих из соответствующих свойств пределов: сумма, произведение и частное двух непрерывных комплекснозначных функций f и g являются непрерывными функциями (кроме f(t)lg(t) в точке /0, где g(t0) = 0). Определение 2. Производной комплекснозначной функции f действительного аргумента t называется комплекснозначная функция /' действительней переменной t, определяемая для каждого значения t формулой /'(0 = Ит f{tl)-f{t). (2) h-+t h — t I Если функция / (/) задана в виде (1), то П0=*'(0 + &'(0. (3) Действительно, имеем /' (/) = ИшШ±Ш= lim x(ti) + iy(ti)-[x(i) + iy(t)]_^ u-*t h—t tt-*t h—t = lira *ft>-'0+]te 1У«г)-уУ)^х. (t) + ¥ h-*t h—t h — t (0. Здесь использованы свойства комплексных чисел (см. § 5*.3), а также равенство lim a (h) + ib (*i) = lim a (h) + i lim b (h)9 tt-+t tr+t tx-*t являющееся определением понятия Hm a (t\) + ib (/1). Формула (З) доказана в предположении существования производных х' (/), у' (t). Отметим некоторые свойства производных комплекснозначных функций действительного аргумента: (/(0 + g(0)' = /'(0 + g'(0. если /'» ё' существуют; (f (t)g(t))' = f'(t)g(t) + f(t)g' (0, если /', g' существуют; [/ (Ф (0)]' = /' (Ф (0) Ф' (0. если /' (Ф (0) и ф' (0 существуют. Здесь/ и g—комплекснозначные функции действительной переменной, а ф — вещественная функция вещественной переменной. Последнее свойство называется правилом дифференцирования сложной функции. Доказательство указанных свойств производных комплекснозначных функций аналогично доказательству соответствующих свойств производных действительных функций.
§5*.4. Комплекснозн. ..функции действ, перем. Основная теорема алгебры 449 2°. Теорема Безу. Основная теорема алгебры. Комплекснозначная функция комплексного аргумента z, имеющая вид Р (z) = aQzn +а1г»-1 + ... +a„_i* + fl„! называется многочленом я-й степени. Здесь а0, ai, ..., ап — комплексные числа (а0 ф 0). Целое неотрицательное число п называется степенью многочлена. Комплексное число z0 называется корнем многочлена Р, если Р (z0) = 0. Справедливо следующее утверждение. Теорема 1 (теорема Безу). Комплексное число z0 является корнем многочлена Р (z) тогда и только тогда, когда существует такой многочлен Q (г), что Р(г) = <Цг)(г-г0). Доказательство теоремы было приведено в § 5.4. Однако в этом доказательстве использовано правило деления многочленов с комплексными коэффициентами. Это правило заключается в следующем. Пусть P(z) = a0z"+a1zn-1+...+an„1z-\-an, Q (z) = ^«+^-4 ... +Ьт_1г + Ът } — два многочлена с комплексными коэффициентами а0 ф 0, at, а2, ..., ап\ Ь0 ф 0, °Ь • ••> Ьт> имеющие соответственно степени пит, причем п^т. Тогда для многочленов Р (г) и Q (z) существуют такие многочлены S (z) и R (г), что P(z)=Q(z)S(z) + R(z), (5) и при этом степень многочлена R (г) меньше, чем степень т многочлена Q (г). 2 Отметим сначала, что справедливо тождество *(*) = QW-^ *»-»+/?i(*)f (6) где i?i (z) —многочлен меньшей степени, чем п. Действительно, п т Ri(z)=P (г)_^г»-« Q (г)=£ а*г»-*—J^ г»-« £ 6,*»-* = £=0 /=0 /г / т ч — X^2"-* + a0z"-^-z"-^U0zw + X» ^2т""г )=* п т п т *=£ а*гя-*+2 blz>*-i+(a0zn-a0z»)=y£d ^2»-* + ^ ^г/й"'- /г=1 / = i k=i / = i Отсюда следует, что многочлен Ri (z) имеет меньшую степень, чем п. Запишем теперь тождество (6) для многочленов Ri (z) и Q (г). Это возможно, если степень многочлена Ri(z) больше или равна степени многочлена Q (z): Ri(z) = Q(z)Si(z) + R2(z). (7) Здесь 5i (z) имеет вид Лг^, где А — отношение коэффициентов при старших степенях многочленов Ri(z) и Q (г), а ^ — разность степеней этих многочленов. Мно- 15 к» 2636
450 Глава У*. Векторные и комплексные функции действительной переменной гочлен R2 имеет степень меньшую, чем степень многочлена R±. Аналогично получаем равенства Ri(z) = Q(z)Si(z) + R2(z)i R2(z) = Q(z)S2(z)+RB(z)i Rk(z) = Q(z)Sk(z)+Rk+i(z), (8) где «$! (г), S2 (z), ;i., Sk (г) — некоторые многочлены; степень многочлена Rt больше степени многочлена Rl+1(l=\, 2, ..., k)\ степень многочленов Rlt R2i ... ..., Rk-i не меньше степени многочлена Q, а степень многочлена R^+i меньше степени многочлена Q. Из равенств (8) следует P(«) = Q(z)51(z) + Q-(«)Si(z)+... + Q(2)S/kW + «*+i=sQ(2)5W + /?(z)f где S (z) = St + S2 + ... + Sk, a R(z) = Rfi+* (2). Степень многочлена Я^+f меньше степени многочлена Q (г). Лемма (условие тождественности двух многочленов). Д^е функции Pi (г) = о0* + аггП-1 + ... +^^2 + ^, P2 (2) = b02'«+612w-1 + •.. +Ьм-гг + Ья (9) совпадают тогда и только тогда, когда т — п и a0 = b0t ax = bi, ..., an — bn. 3 Доказательство. Из условий леммы вытекает Pi (2) = Р2 (z) V £ С. В частности, если 2 = 0, то Далее получаем Pi—an Рь — йп (Ю) V2£C и при 2 = 0 имеем bm^± — an^i. Воспользуемся методом математической индукции. Предположим, что для некоторого k справедливы равенства ап = Ьт, ап — Ът, an„i — bm-i> .. -t a,z-fc=&/»-.fc [при Лг = 0 эти предположения выполняются в силу равенства (10)]. Тогда Pi (z)—а„-kz*—an-k+iz*-1— • • ■ — g/i _ 2* + * _ Р2 (2)-frCT.fe2* — bm^k+tZ*-1- . . . — 6„ -c В частности, при 2 = 0 имеем an„k-i = bm-k-i. Таким образом, индуктивные предположения справедливы и для £+1. Теорема 2 (основная теорема алгебры). Всякое уравнение вида a0zn + aiZn-1+.i.+an_1z + an = 0, где л^1, а а0 Ф 0, at, аъ 3ii, ап—комплексные числа, имеет решение в поле С комплексных чисел.
§5*.4. Комплексном, функции действ, перем. Основная теорема алгебры 451 3°. Разложение многочлена на линейные и квадратичные множители. Теорема 3 (о разложении многочлена на линейные множители в п о- ле комплексных чисел). Всякий многочлен Pn(z) = a<>zn + aiZn-1+'.-+an-1z + any (а0 ф О, ait а2у iiif an£C) может быть представлен в виде Pn(z) = ao(z-Zi)*>(z-Z2)** ... (г — гт)*т, (И) где Zi, г2, •. -.;, zm, Z{ Ф zj(i Ф /, i, /= 1, 2, ..., т) —некоторые комплексные числа [корни многочлена Рп (г)], a &i, k2, ..., &m— ^&ше положительные числа. Разложе* ние (И) единственно с точностью до порядка множителей. Следствие. Всякий многочлен P(z) = a0zn + a1zn-1+... + an_1z + an с вещественными коэффициентами а0фО, аъ а2, *.., ап может быть представ" лен в виде Р (г) = Ао (г-*!)* (z-z2)«* ..., (z-zr)*rx где Zi, z2, a.y zr, г; Ф zj(i Ф j, i, j — 1, 2, ..., z) —вещественные корни многочле* на P(z)\ pi, <7i,p2, ?2, ..., ps, qs[(pi, qd Ф (p/, qj), 1ф j, i, /=1> 2, ..., s] — действительные числа; каждый из квадратных трехчленов z*--\-pmz-\-qm (m=l, 2, i i., s) имеет два комплексно сопряженных корня zm = xm-\-ymi и zm — xm—ymit являющиеся корнями многочлена Я (г); klt k2i ..., &Г, ll9 /2, ..., /$— целые положительные числа, причем k± + k2 + ... + kr + 2 (/х + /2 + • • • + h) — п* Разложение (12) единственно с точностью до порядка множителей. 4 Доказательство. Утверждение следствия вытекает из теоремы о разложении многочлена на линейные множители. Действительно, если zm — xm-\-iym (Ут i1 0) —комплексный корень многочлена, то сопряженное число zm = xm — iym также является корнем многочлена Р (z) в силу соотношений (а + р) = а + Р, (а + Р)=^а*Р, справедливость которых легко проверить (черта над комплексным числом означает комплексное число, сопряженное данному). Отсюда (z—zm)(z—7m) = z2 — (zm+7m)z + zI^zm = z2+pmz+qm, где zm + zm и zmzm — вещественные числа. Значит, Р (z)/(z2—pmz + ^ — вещественный многочлен, корни которого служат корнями многочлена Р (г). Для завершения доказательства воспользуемся методом математической индукции. Ясно, что для многочленов нулевой степени доказываемое утверждение выполняется. Пусть оно справедливо для всех многочленов, степень которых меньше некоторого целого числа п. Тогда из приведенных выше рассуждений следует, что оно выполняется и для многочленов степени п. Доказательства теорем 2 и 3 приведены в курсах высшей алгебры. 15*
Глава VI* ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ § 6*.1. Функции нескольких переменных. Область определения. Предел функции. Непрерывность 1°. Функции нескольких переменных. Функцией f нескольких переменных будем называть отображение /: D -> /С, где D — подмножество в Rn (точечном координатном пространстве), /(—поле R вещественных чисел или поле С комплексных чисел. Для P(xi, *2, ..., xn)£Rn символ f'(P) = f(xlt хг, *.., хп) означает значение / в точке Р. Определение U Число А£К называется пределом функции нескольких переменных f: D -+ К при Р —> Р0, если для любого вещественного е > 0 найдется такое б > 0, что для всех точек Р таких, что р(Р, Р0) < б [р (Р, Р0) —расстояние между точками'Р и Р0] выполняется неравенство |/ (Р)—-f (Р0) | < е. Обозначение: lim /(Р) = Л. Определение 2. Функция / нескольких переменных называется непрерывной в точке Р, если lira /(Pi) = /(P). Функция / называется непрерывной на Р^Ро множестве D, если она непрерывна в каждой точке P£D. Определение 3. Множество точек Р таких, что расстояние р(Р, Р0) между Р и Р0 меньше e(e£R, 8 > 0), называется е-окрестностью точки Р0. Определение 4, Пусть D — подмножество в Rn. Точка Р0 называется предельной для множества D, если в любой е-окрестности точки Р0 содержатся точки области D. Определение 5. Множество D в R" называется замкнутым, если оно содержит все свои предельные точки. Определение 6. Множество D в Rn называется открытым, если вместе с каждой точкой P0£D оно содержит и некоторую 8-окрестность точки Р0. Определение 7. Множество D называется связным, если любые две его точки можно соединить непрерывной кривой, целиком принадлежащей этому множеству. Определение 8. Множество D в Rn называется ограниченным, если оно принадлежит некоторой е-окрестности точки (0, 0, ... 0). Определение 9. Открытое связное множество в R* называется областью.
§6*.l. Функции неск. переменных. Обл. определения. Предел. Непрерывность 453 I 2°. Свойства непрерывных функций 1°. Сумма и произведение непрерывных функций являются непрерывными функциями. Частное от деления двух непрерывных t функций есть непрерывная функция во всех точках, где делитель не обращается в нуль. Доказательство. Отмеченные свойства вытекают из соответствующих свойств пределов: lim f(Pi) + g(Pi)= lim f (Pi) + Km g (Pi) = f (P) + g (P); Px-+P Pt-+P pt-+p lim f(P1)g(P1) = lim f(Px) lim g(Pi)=f (P) g (P); Px-+P Pi-+p pt-+ p Рг - P g (Pi) lim g (Pi) g (P) ' 8 {P) * U' Pt-> p 2°. Пусть функция f (x±, x2, ..., xn) непрерывна в области D и Xi — Xi(uiy «2» •••» О» *2 = *2("i, «2» •••> У. •••» ^л = *л("1. "2» •••, ит) непрерывны в области D'. Тогда функция f(xi(ui, и2, ..♦, ит), х2(и+, и2у ..♦, ит), Si. ..., хп(иь и2, ..., ит)) непрерывна в D' как функция переменных Ui, u2i iti *.., ит\ если точки хг(и^ и2, ..., ит), х2(и±, и2у ..., ит), ..., хп(и±, и2, iis .. ., ит) принадлежат области D. Доказательство. В силу непрерывности функции f (х±, х2, *.., хп) для любого 8 > 0 найдется такое б > 0, что для всех точек Pi(x[, x2, .*., xn), расстояния которых до точки Р (х1у х2, ..., хп) меньше чем б, выполняется неравенство \f(P)—/ (Pi) | < 8. Внутри 6-окрестности точки Р fa, x2, ..., хп) рассмотрим множество точек xlt х2» • • • > хп таких, что| Х{—Х[ \ < Ь/Уп (/=1, 2, .. ■., п). Поскольку каждая из функций xi (и±, и2, ..., ип) непрерывна, для любого 8f > 0 найдется такое 6Х > 0, что для всех точек (иъ и2, ..., ит), расстояние которых до точки (и-i, и2, ..., ит) меньше, чем бь выполняется неравенство \х;(и'ъ и2, ..., Um)—Xi(ul9 иъ ..., um)\<Zi. Если в качестве ех выбрать число б/У^я, а в качестве б—число бх, то для любого 8 > 0 и для всех точек (и[, и2у ..., ит) расстояние которых до точки (ulf u2t ..., ит) меньше 6 = 6i, справедливо неравенство \f(Xi(uu и2, ..., ит), x2(u'lt и2, ..., ит)*..., хп(и'и и2, ..., ы,л)) — • —/>l(«l. «2» •-., U>m)> X2(Ui, U2 ит)9 ..., Xn(Ui, U2t ..., Um)) |<8, т. е. функция f(xi(ui, иъ ..., ит)у x2(uf, и2, ...,ит) хп (и*, u2i ..., ит)) непрерывна в точке (uf, u2, ..., ит). 3°. Функция f: D —>- R, непрерывная на замкнутом и ограниченном множестве D, достигает в D своих нижней и верхней граней. Доказательство. Докажем сначала, что множество значений функций / на ограниченном замкнутом множестве ограничено. Если бы это было не так, то существовала бы последовательность точек Р±, Р2, ..., Р«, ... ($) таких, что lim f(Pn) — co' Из каждой последовательности точек в ограниченном множе- П -*• со стве в R" можно выбрать подпоследовательность, имеющую предельную точку. Действительно, пусть точка Р^ (k=\, 2, ..., m, *..) имеет координаты
454 Глава VI*. Функции нескольких переменных (*ь #2, ..., хп). Последовательность точек Ръ Р2, ..., Рт, ... порождает п числовых последовательностей: ххъ х*9 ..., х? ... («i); xh х*, ..., A'?7, i;i (a2); ..., Я. ... («л). О) Если последовательность Р^(^=1, 2, ..., т, ...) ограничена, то ограничены и все числовые последовательности (1). Согласно теореме Больцано — Вейерштрас- са, каждая ограниченная числовая последовательность содержит сходящуюся подпоследовательность. Воспользуемся теоремой Больцано—Вейерштрасса многократно. Из последовательности (р) выберем подпоследовательность (рх) такую, чтобы последовательность первых координат точек из (рх) сходилась. Из последовательности (Pi) (очевидно, ограниченной) выберем подпоследовательность (р2) такую, чтобы сходилась последовательность вторых координат точек из (Р2). Аналогичным образом построим последовательности (Р3), (Р4), ..., (Р„). Последовательность (Р„) обладает тем свойством, что числовые последовательности первых, вторых, ... , гг, л-х координат точек из фп) являются сходящимися. Значит, и последовательность (р„) также сходится, т. е. в R" существует предел {р„)—точка Р. Вследствие того,'что множество D — замкнутое, P£D и функция / не может быть непрерывной в точке Р, поскольку lim / (Pi) не существует. Следовательно, Pi -> р непрерывная функция / в замкнутом ограниченном множестве DcR" ограничена. Пусть С—верхняя грань ограниченного множества значений функций / на D. По определению верхней грани существуют значения функции /, отличающиеся от С меньше, чем на произвольно заданное число. Пусть C-fr< 1/2, С-/2<Д/4, ... C-~fn < 1/2", ..., где // = /(/>/), P&D. При этом последовательность точек Р/ (i— 1, 2, ..., m, ...) содержит сходящуюся подпоследовательность Q±t Q2t ...» Qm, ... . Пусть, далее, Q—предел этой последовательности. Тогда lim f(Qi) = f(Q) = C. Q.-+Q Таким образом, верхняя грань С множества значений функции / на множестве D является значением функции / в некоторой точке Q£D. Для доказательства утверждения о достижении функцией f нижней грани достаточно рассмотреть функцию —/. Эта функция по доказанному достигает в некоторой точке Еерхней грани. В этой же точке функция / достигает нижней грани. § 6*.2. Частные производные. Дифференциал, его связь с частными производными. Инвариантность формы дифференциала. Геометрический смысл дифференциала 1°. Частные производные. Дифференциал Определение 1. Пусть /(хъ #2, ..., хп)—функция п переменных, определенная в точке Pq(xu х\, ...9хп) и в некоторой е-окрестности этой точки. Частной производной функции / по переменной */(i = l, 2, *.., п) в точке Р6
§6*.2. Частные производные. Дифференциал 455 называется предел lim / (*ь *2, • ••> Xj-ъ Xj> Xj+i* •••» Хп) — / (*ь х2> ..., xj, ..., хп) Ч-*Л Х1-х\ если он существует. Определение 2. Пусть /(*i, х2, «• •» л:л)—функция п переменных, для которой в точке (*х, хъ ..., хп) существуют частные производные ~- (i = \s 2, ..., /г). Тогда если функция е fa, x2l ..., xn-t Aa*i, Ax2i ..., Ахп), определяемая равенством А/ = /(*1 + Л*ь х2 + Ах2, -...9xn + lixn) — f(xl9 х2, ..., xn)=^^-Axi + s1 (1) является бесконечно малой более высокого порядка малости, чем V Ах\-\-Ах\-\-... -\-Ахп> то функция / называется дифференцируемой в точке (#1, Х2, . . ., A*„). Функция, дифференцируемая в каждой точке области D, называется дифференцируемой в области D. Определение 3. Для функции / (#i, #2, i*;, #л), дифференцируемой в области £>, выражение *-£2л (2) называется дифференциалом. Так как для функции F fa, х2у -. ■.., хп) = #/ (/ = 1, 2, ; s *, я) имеем~ dF == d*/ = n = Ал:/, то выражение (2) можно представить в виде d/= 7 л ^— dxj. i Теорема 1. Если частные производные ^— (i = 1, 2, г * 4, л) функции f (х\, х2, ..., #„) существуют в некоторой е-окрестнссти точки (л:*, #2, ..., хп) и непрерывны в этой точке, то функция f является дифференцируемой в точке (л*1, *2» • • •» хп). I Доказательство. Имеем A/ = /(x! + A^i, *2 + Ax2, ..., xn + Axn) — f(xi, х2, i5., *„)== где Abf = f(xi, x2y ...,**_i, *Л + Д*А, xft+i + A**+i, ..., хп + Ахп) —f (xlt x2, ..-. ..., jcA_lf *ftf ^ft+i + A^ft+i» •••> *я + Д*л). £=1> 2> •••> л. Рассмотрим следующие аргументы функции AfJ: *i, x2, ..., хь-i, хь+i, *.., *«. А*Л+Ь A^+2, ..., Axn. (3) Функция /(jcx, *a, ..., **-i, *Л, ^+i + A^+i, ii;, *„ + Aa:,7) при фиксированных значениях переменных (3) является функцией одной переменной xk. Поэтому к ней можно применить теорему Лагранжа:
456 Глава VI*. Функции нескольких переменных Akf = f(xi> х2, ..., xk-i> xk + Axkl xk+1 + Axk+1, ..., хп + Ахп) — —f(xi, x2l .... *а-ь xk, xk+1 + Axk+lt ..., *„ + A*J=, (4) ~~dx~(Xi' *2' •'" Xk"19 *k* ^+1 + Дл:А+ь •••» *« + A*«)A**> где ^ — вещественное число из промежутка ]xk, ^ + Ал>[. Частные производные df ^— в точке (xlt х2, ..., *„) непрерывны и, значит, разность ля €* = gj-(*i> х2, ..-, **-i, Ч, xk+i + Axk+i, ..., ^П + Ддр„) — —"fa~(xi> x2, ..., ял) (5) является величиной бесконечно малой при V Ах\ + Дл| + ... + Ах?г—^0. Далее, используя формулы (4) и (5), находим ~ 1дч Обозначив 2 8fcA*A в равенстве (6) через 8, получим =]Li 'XT fa* *2' '> *«) Axb—jL е* Axb- (6) A/==Ilg|A** + e> (7) где e = 28/*A*fc—величина бесконечно малая более высокого порядка малости, чем У Axl-{-Axl~\~ - • • + А*;!, поскольку,.как было показано выше, е#—>0 (£=1, 2, ... ..., п). Формула (7) и означает, что функция /(лг*, х2, ..., хп) дифференцируема в точке (#!, х2, ..., дгл). 2°. Правило дифференцирования сложной функции. Отметим следующие свойства частных производных от функций f (хъ х2, ..., хп) и g (х1у х2, ..., *л) /г переменных: d(f+g) df . dg df dg \ 6/.=—j—f-rr-2- если ~- , -r-^- существуют; dxk dxk^dxk дхк дхк у J dW) i df df . „ -Ъч~кЩ' если ^ сУ*ествУет> *€R: d(fe) # , t dg df dg i^=^+/4' если дч* ass существуют; d f f \ dxk* дхь df dg / о о o\ , л ^ ( g) B g* • еСЛИ ufe ' ^ сУществУют и * U. *..-.*.) ?- 0; здесь (*?, #<>, . ..,#«)— точка, в которой вычисляются производные ^—( )• Особое место среди свойств частных производных занимает правило дифференцирования сложной функции. Пусть f (*i, x2, ..., хп)—функция п переменных^ du(p<pepeH^pyeMaK в точке (*i, х2, ..., л:«), а
§6*.2. Частные производные. Дифференциал 457 Xi = Xi(Ui, tt2, ..., Um), X2 = X2(Ui, U2, ..., Um), ..., Xn=Xn(Ui, U2, ..., Um) — п функций от т переменных и±, и2, ..., ит, дифференцируемые в точке (и?, «2, ...,««), где выполняются равенства х1=хг(и1, и2 ит)> х2 = = *2(иъ «2, ..., ит), ..., Xn~xn(ul, u°2, ..., Um). Тогда п /г= 1 Здесь Ф(«£, u2i ..., um) = f(xi(ui, u2i ..., нл), -M^i, «2, ...» «л). . •» хп{щ, и2, ..., И/»)) |о — сложная функция, отображающая область D пространства Rm переменных u±t и2у ..., ит в R. Отображение Ф (и±, и2, ..., ит) области D в R (сложная функция) по определению есть композиция отображений D—*D' и £>'—*R, где D' — область в пространстве R» переменных #i, #2> ••• ..., хп\ отображение D—>D' задано функциями JC/ = x/(«lf «2» •••» ит), t = = 1, 2, ..., m, а отображение D'—► R — функцией / (лгх, *2, ..., хп). 2 Доказательство. Из дифференцируемости функции / (*ь #2, ..., хЛ) в точке \хи #2, •*., %) следует *-Е£ Д*/+в, (9) где lim - = 0. Дифференцируемость функции Х1 = Х((щу V Дд£ + Д*|+...+Д*л «2» ...» и>т) в точке (их, и2, ..., и„) (t=l, 2, ..., п) означает, что m где lim = 0. Подставляя выражение (10) в правую часть К Да? + Ди5Ч-...+Д|#| формулы (9), имеем п т где а=2*<э£- 8* + 8> пРичем 1;~., а 0 (12) Из равенств (11) и (12) при Awi = 0, Д«2 = 0, ..., Аа,.4 = 0, A«J+i = 0, .., ,.., Ди„ = 0 следует, что Да, Zd dxklodUsU^ Aus* <13> Л= 1
458 Глава VI*. Функции нескольких переменных В пределе при Aus—>0 из равенства (13) получим du*L~~2*dxuLdtiJ' № dus |о ^ dxk f0 dus\9 3°. Инвариантность формы дифференциала. Пусть y~f(xi, х2, ***, хп)—дифференцируемая в точке Р{х\, х\, ..., х°п) функция, и *l = *l(tti, И2, *.., Um), X2 = X2(U1, U2, ..., Um), ..., Xn=Xn(Ui, U2, *.., Um) — функции, дифференцируемые в точке (и?, и\, ..., uQm) такой, что х\ = хг{и\, «2, ...,«т), *2 = *2("ь «2, ..., «т), ..., */j = */i(«i, "2, -.., ^т). Дифференциалы фуНКЦИЙ f(xlt Х2, ..., Хп) И Ф(ИЬ «2, ..., tt«)=/(Xi(tti, И2, •«». «»). •M«i, «2, *•♦> "*)» • ••> *я ("ь и2» •••> "«)) имеют вид «v-ES:**. (is) *>=£SW <16> Справедливо следующее утверждение: если в правую часть выражения (15) вместо Xfr подставить зд (#!, w2, •••» «/я)> я вместо дхь подставить дх& = = 7 ^ -у^- dn/ (&—1, 2, ..., я), то получится правая часть выражения (16). Это утверждение называется инвариантностью формы дифференциала относительно выбора переменных. Доказательство. Выполнив указанную подстановку, получим п т т / п \ т Здесь на последнем шаге была использована формула (8). 4°, Уравнение касательной гиперплоскости к графику функции. Графиком функции y = f(xlt х2, ..., хп), определенной в области DczRn, будем называть множество точек в пространстве Rn+1 переменных (х\, х2> ..., хп> у) таких, что y = f(xiy х2, ..., хп). Касательной гиперплоскостью к графику функции y = f (хъ х2, ..., хп) в точке (#?, х°2, ..., x0n)£D(zRn будем называть множество (xv x2, ..., хп, у) точек в Rn+1, удовлетворяющих уравнению y—y0 = A1(x1—Xi) + A2(x2—x°2)+... +Ап (хп — х0п) (17) и таких, что разность }(хъх2, ..., хп) — [tjo + ^Akixk—**)] = « (18) является величиной бесконечно малой более высокого порядка малости, чем V(x\—*i)2 + (*2—xt)2+...+(xn — Хп)2, при стремлении точки (**, х2, ..., хп) к точке (xl, x2i ..., хп).
§6* .3. Части, производные и дифференц. высших порядков. Формула Тейлора 459 Преобразуем равенство (18) к виду где Af = /(*i, *2, .... x„) — f(xl, xl, ,.., x%) = f(xit x2i >..-, хп)-у0* Л** = = xk-x°k (Л=1, 2, ,.., n). Для дифференцируемой в точке (*?, х°2, *.., 4) представление А/ в виде (19) единственно и может быть записано так: ■*-£!:**+* Действительно, полагая в равенстве (19) Axi = 0> Д#2=0, .-.., Axfc-i = 0, A^+i = 0, iit, Дл:„=0, получаем Д/=^ЛДх* + е. Далее, имеем 8ft А**' дхк = lim -У- = А*> поскольку lim -^£-=0. Теперь уравнение (17) принимает вид У—Уо'- дхг (xi—х0) + дх2 (*-4) + ...+ ж. дхп \хп — XtiJt (20) где EL дхи df означает ^- (*?, л:?, 8**, лг«), 6=1, 2, . *., п. Уравнение (17) является уравнением касательной гиперплоскости к графику функции y=f(xi, х& «•»» хп) в точке (*ь *°, ..., дрл. у) поскольку оно удовлетворяет соответствующему определению. В частности, при я = 2 получаем уравнение касательной плоскости к поверхности y=f(xi, JGg) в точке (*?, xl). § 6.*3. Частные производные и дифференциалы высших порядков. Формула Тейлора Iе. Частные производные и* дифференциалы высших порядков. Определи ние /. Частная производная по любой из независимых переменных от частной производной (т— 1)-го порядка (т = 2, 3, ...) функции f (хи *а> ».*, хп) называется частной производной т-го порядка. Частные производные первого порядка— JL JL д± дх± ' дх2 ' ""' д#„ ' Теорема К Пусть функция y=f (jti, #г, это своими частными производными V- , т^-» ^—^— dx^ dxt dxkdxt -.., *„) определена вместе се з—з— в некоторой г-окрест* OXi OXfc ности точки Р0(х[у х\, ..., дг®), причем точке. Тогда d2f d*f дхк dxi д*г dxk дЦ дхгдхк непрерывны в этой dxt dxk /00 0\ \Хи Х-2у .п. #/i/.
460 Глава VI*. Функции нескольких переменных I Доказательство. Пусть Akf = f(Xi, х2, ..., **-£, **+А#£, xk+i> • • •» хп) — — /(*ъ *2> • ••> *«)• Положим &kif = &k№if) = &k(f(xi> *2, ...,**-!, л* + Д*£, *z+i, ...,*„) — f(xi,x2y ...,*„)= =[/(*ь *2, .... **-i, ^ife + Axfc, *ft+i, ..., л:/-!, */ + A*,, *j+i, ..., хп) — —/(*ь *2, .... **-i, ** + Адг*, **+i> .... *«)] — — Ufa, xtt ..., ^_i, Xt + Axi, xi+i, ..., *„) —/(**, x2, .,., *„)]. (1) Легко проверить, что A«f = A/*f. (2) ■ Обозначим <р(**) = /(*?, д5, .**, 4-i, xkf *?+ь **., 4-ь *? + А*/> *J+b ... 0\р/00 0 0 00' °\ А 7 »..» */г/—/ \*ь #2» ..., *£-ъ Xfc, Xk + i> ..., #/-i, ^4, Xi+i, ...» #л>Г, Л, * = = 1, 2, *.., /г. Очевидно, что A«/ = ф (4 + A**) — Ф (*k). (3) По теореме Лагранжа имеем &klf = q>'&k)bxk> (4) где #£—число из промежутка ]х%, х%-\- Ал^[. Примем во внимание, что //~\^f/00 0 *0 0 0, л» ф (**) = §£-(*ь xit .•*, Xk-u xk, Xk+u .*., *z-t, */+A*£ + t 0 0\ w / 0 0 0 • 0 0 0 0 0\ /сч +*m, **., *n)—gj-(*i. *2, .-, *a-i, **, **+i, ..., xi-i, xlt xi+l9 ..., xn). (5) Отсюда по теореме Лагранжа (относительно переменной xt) получим / Г \ &I /00 0~0 0 ~ О 0\А /«V ф (xk) = dx дх (*Ь *2. ...» **-Ь *Ь *А+Ь ...» *f-b XU Xi+u ..., *«)A*j, (6) где xi—число из промежутка ]*?» */+A*j[. Из равенств (4) и (6) получим А*^ = дГдГ^' **' "' **~ь *k> *k+u ***, Xi-i, xh x°i+lt **., *2)Д*АД*г. (7) Аналогично находим Aikf = dx дх (*ь 4, ..., 4-ь xL 4+ь **.. *?-ь **', 4+ь •*., 4)Ал:АА^, (8) где хь, Ic'i — числа соответственно из промежутков ]д£, 4 + A#ft[ и ]*?, 4 + АлгД. Сравнивая формулы (7) и (8), учитывая равенство (2) и переходя к пределу лор -\о г при Axfr—► (), Ахг—>0, в силу непрерывности ^—^— и -^—^— в точке (*?> 4, ..» . 4., Хп) получаем V*l, #2, **i> Хп)=д Л W» ^2» *•*» ^л). dxidxk v -» i4i» л/ dxfrdxi
§6*.t3. Части, производные и дифференц. высших порядков. Формула Тейлора 461 Следствие. Пусть все частные производные т-го порядка функции f (xlt x2i *•*> хп) непрерывные точке (*?, х2\ ..., хп). Тогда (*ь x2t ..., *„)=-— -— (xlt х2, **., хт), (9) дхидх(г... dxim ' 3' ''" dXjdxJ2 ... dxim если упорядоченный набор чисел /*, /2, ..., jm получен из набора ii, i2t **., i„ перестановкой. 2 Доказательство. Из теоремы 1 непосредственно вытекает равенство d"f (Х\ , Х2, • ••» Xn)s=s дх{ дх,. .. .дх, дх{ ...дх,. н ч lk lk+i lm /im &*f /о о оч (1U' —dx, dxt .. .dx£ dxt ...dxt KXu *2' "' *nh dm-k-U Действительно, применяя теорему 1 к функции -г -? - , имеем 1 — J (11) дх: дх, dxf .. .дх.. дх{ дх{ дх. .. .дх. 9 причем равенства (11) справедливы в любой точке (х±, x2i ..., хп), в которой частные производные (10) непрерывны. Дифференцируя (11) последовательно по переменным х£ „, х£ , ..., х{ , получаем равенства (10). Для доказательства справедливости равенств (9) достаточно учесть, что всякая перестановка может быть получена многократной перестановкой пар соседних символов. Определение 2. Выражение Amf — V* т' —- Axkt Axk*. А**и (\2) где суммирование ведется по всем упорядоченным наборам (k±t k2i ..., kn) целых неотрицательных чисел таких, что ki-\-k2-\~ ... +&« = т, называется дифференциалом т-го порядка функции /(#!, х2, ..., хп). 2°. Формула Тейлора. Теорема 2. Пусть f(xx, x2i ..., хп)—функция, определенная в некоторой е-окрестности точки P0(xi, x2i ..., хп) и имеющая непрерывные частные производные до т-го порядка включительно. Тогда справедливо равенство f(£ + Axl9 *; + Ах„ *.., x°n + bxn)-f(4, xl ,., *£)- -Е d*/ ft! + гЛ(Ддц, Ax2, ..., Д*„),] <■ (13) /2=1 где rm(Axi, Алг2, ..., Ад:„) — бесконечно малая более высокого порядка малости,
462 Глава VY*.! Функции нескольких переменных Выражение d*/ |0 означает d*/ при х± = х\, х2 = х\, .iiy хп = х%. Доказательство. Рассмотрим функцию <P(0 = /(*f + *A*i» x2 + tAx2, iity xn + tAxn). По формуле Тейлора для функции ф одной переменной t имеем f(xl + tbxi, x°2 + tAx2f 5i., x°n+t A*„) = поскольку Ф?°|о = <1*/|0. (И) ^я-х + ^-1(0. (15) (16) Справедливость формулы (16) будет доказана ниже. При t=l равенство (15) примет вид /(*i+A*f, х2 + Ах2, .;., xn + Axn)—f{xu х2, .**, xrl) = m-l fc d*f| &=1 +/»-i(i>. 3 Как известно, остаточный член rm^i (I) можно представить в виде r,«-i(l)=^f(*i + eA*i, 4 + ЭА*2, !,,хй + 9А%Л)=^(Р), где 0£]О, 1[. Далее, имеем Amf _ dOTf I d^M '.-iO)-yco-4if|.+4r|.- Теперь формула (17) запишется так: /Ui + A*i, х°2 + Ах2, ..., 4 + А*„) — /W» *2, ml (17) (18) *я. й- 1Г о+"тГ(Р)-"тГ</,в (19) Покажем, что Sm = —^ (Р) р (Р0) является бесконечно малой функцией от Axf, Ах2, ..., Ал:п, имеющей более высокий порядок малости, чем (К A*i + Ал:1 + ... + Ахп) . Для этого воспользуемся формулой 5.= '" =2- *i! Ы ...ka\ \дх^ djr*. .. Mkn {Р) ~дхЬ dxk, .. _дхкп ( o)JX (20)
£6*.3. Части, производные и дифференц. высших порядков. Формула Тейлора 463 где суммирование ведется по всем упорядоченным наборам неотрицательных целых чисел (k±% k2, ... , kn) таких, что k1 + k2-\-... + kn — m. Имеем Sm {VAx\ + Axl+...+AxW - v m! Г dmf] (P) dmf (р )Ь La kt\ k2\ ...kn\ [дх^ dxk2 шшвдякп ^> д^дхкЛ я л t dxkn I *>\ m.. • .*»• (21) где Ax*1 Ax\* ... Axknn АЫг...кп = (X/r . ч 2 .Tij»* @2) \V Aa:i + Aa:|+...+A^; Величина Л^ ^ # ^ k ограничена при max Ax;—>0, поскольку каждая из величин Ах\ -f- Ах\ + ... + Ах\ (* = 1, 2, ..., я) по абсолютной величине не превосходит единИ1 в точке Р0, то dmf восходит единицы и &1+&2 + • • .-\-кп = т. Так как —г г г-непрерывна дх*1 дху ... дх?/* дх\>- дх\* ... дх*п дх*1 dxkJ ... дхкпп ° Справедливость формулы Тейлора (13) доказана, если верно равенство (16). Чтобы установить справедливость равенства (16), воспользуемся методом математической, индукции. Пусть для некоторого натурального k верна формула ^ = d^(xl + tAxit x°z + tAxz, :.., xn + tAxn). (23) Для k=\f дифференцируя (14), имеем %=^^(xl + tAxi, xl + tAxz» *<*, x% + tAxn)Axi. Ы1 l Это означает, что равенство (23) верно при k~\m Покажем, что из равенства (23) вытекает равенство v?+1> = d*+1/W + /Axb xi + tAxb ..., x°n+tAxn). (24) Дифференцируя равенство (23) по t, имеем ф' + ^^[Х^!^! ...kn\ X -£д'«>и,...in dxi,dxit dx,„ (*'+'**. 4+<Дд^ дй-идОх X Д*'/ Д*£! • • • Д*?,"- (25)
464 Глава VI*. Функции нескольких переменных' Здесь суммирование ведется по всем упорядоченным наборам неотрицательных целых чисел (/i, /2, .*., 1п) таких, что /i+/2+. ** +/„ = £+1. Коэффициент Вц л j равен сумме всех слагаемых вида li! /,!... /,_х! (/,— 1)! /,+1! .../„I (s=1' 2' iiiJ П)> (26) где /.s ^ 0. Вместо суммы слагаемых вида (26) при условии ls ф 0 можно взять сумму всех (без исключения) слагаемых вида V«.../,-iiVW .../«Г (27) поскольку выражения (26) и (27) совпадают при ls ф 0, и выражение (27) равно нулю при /5 = 0. Итак, п п Я --V k\ls k\ v^ /х!/2! .../л! /х! /я! .../„!' что доказывает справедливость равенства (24). § 6*.4. Неявные функции. Теоремы существования. Дифференцирование неявных функций Теорема 1 (о неявной функции). Пусть функция F (х, у) двух переменных определена в некоторой г-окрестности точки (х0, у0) и F (х0, у0) — 0; пусть также частные производные F'x{xy y)y Fy(xf у) существуют и непрерывны в этой г-окрестности и Fy(x0, у0) ф 0. Тогда в достаточно малой окрестности Q точки х0 существует одна и только одна непрерывная функция y = f (х)> удовлетворяющая соотношениям Уо = ?(Ч)> F[x, /W) = 0 (*£Q), (1) причем f (x) дифференцируема и y'(x) = -F'x(x,y)/F'y(x, у), x£Q, y = f(x)J- (2) I Доказательство. Для определенности будем считать, что F'y(#0, у0) > 0 [случай Fy(x0, у0) < 0 сводится к случаю F'y(xQ,y0) > 0 заменой функции F (х,у) на —F (х, у)]. Обозначим егокрестность точки (х0> у0), в которой частные производные Fx(xt у), Fy(x,y) непрерывны и Fy (я, у) > 0, через Q. Покажем, что такая егокрестность существует. Рассмотрим пересечение двух е-окрестностей Qi и Q2, в первой из которых частные производные Fx, Fy непрерывны, а во второй Fy (х, у) > 0. (Если значение непрерывной функции в некоторой точке Р положительно, то существует такая окрестность точки Р, в которой значения функции положительны.) Это пересечение содержит точку (х0, у0), а следовательно, и некоторую егокрестность Q.
§6*.4. Неявные функции. Дифференцирование неявных функций 465 Так как F (х0, у0)=0 и F'y(x0, у0) > О, то функция F (х, у) возрастает в точке у0 при возрастании у (и убывает при 'убывании у). Следовательно, существует такой отрезок [yi, У*1 что yt<y0< у2у F (х0, уг) < О, F (*0, у2) > > 0. При этом можно считать, что точки (х0, Уду (*о> Уъ) принадлежат окрестности Q. Функции F (х, уг), F (х, у2) непрерывны в точке х0, следовательно, они сохраняют постоянный знак в некоторой окрестности этой точки, т. е. F (*. Уг) < 0, F (х, у2) > 0, (3) Рис. 84 для всех х£]а, Ь[. Можно считать, что для всех х£]а, Ь[ точки (л:, у{) и (х, у2) принадлежат окрестности Q (рис. 84). Докажем, что в интервале ]а, Ь] существует единственная непрерывная функция y — f(x)> удовлетворяющая условиям (1) и (2).J Для всякого х£]а, Ь[ определим число f (х) следующим образом: так как функция F (х, у) (при фиксированном х) является возрастающей на [у^ у2]9 то из неравенств (3) следует, что существует единственное значение / (х) такое, что F (x, f (х)) = 0. Очевидно, что f(x0)=y0, поскольку F (х0, у0) — 0. Функция y=f(x), определенная выше, является непрерывной. Для доказательства этого рассмотрим последовательность чисел х\, х2, ..., хп, ..., стремящуюся к х [где х;£]а, b[, i=\, 2, ..., п, ...], а также последовательность точек Pt (xi9 f (х)), Р2 (*2, f (x2)), ..., Р„(хп, f (*„)), .... Для множества точек {Pi fa, /(*/), *£N} этой последовательности существует и притом единственная предельная точка Р (х, у). Существование предельной точки Р(х, у) вытекает из того, что множество {Р/ (*}, у (xt), *£N} ограничено (оно содержится в 8-окрестности Q). Единственность предельной точки можно доказать так: из непрерывности функции F (х> у) и определения функции у (х) следует, что F (х;, у(х{)) = 0, и для предельной точки (х, #*) имеем F (х, #*) = 0. Значит, y*z=y(x), но функция у определена однозначно, поэтому у = у*. Докажем теперь дифференцируемость функции у — у(х). Имеем F (х, */(*)*) =0 и АУ7 = 0 на кривой у = у(х); Так как F (х, у) дифференцируема, то аг dF л 1 dF а . где е —бесконечно малая более высокого порядка малости, чем УАх*-\-Ау*. Далее, получаем '(х)= lim -^ = lim (— — /—4-—\ = ~ — /— У д^о Ад: д^о V дх I дУ А*) дх j ду ' Последняя формула не только доказывает дифференцируемость функции у (х)> но dF dF и устанавливает явное выражение производной ух через -^— , -=—«
466 Глава VI*. Функции нескольких переменных Обобщением теоремы 1 является следующее утверждение. Теорема 2. Пусть система уравнений ( Fifri, х2, ...» хп, Уй У*> •••» Ут) = 0, F2(xlt х2, ..., хп, уъ уъ • •» ^) = 0, { Fm(xl9 *2> • ••» хп, ylt Уъ ...» #/я) = 0 такова, что: 1) точка Р0(х°ъ х°2, ..., х°п, у°ъ у%, ...,у°т) удовлетворяет этой системе; 2) частные производные ^ , -^ (i, /= Ь 2, *. ., m\ k=\, 2, ..., п) непрерывны в точке Р0; 3) определитель матрицы 'dFi/dyt dFt/dy% ... дРг1дут dFzfdy± dF2/dy2 ... dF2/dym кдРт/ду± dFJdy2 ... dFm/dy№ в точке Р0 отличен от нуля. Тогда существует малая ъ-окрестность точки (хъ *2» ..., л$) и непрерывные а этой окрестности функции #i=#i(a?i, хъ ..., хп), #^(*ь х2> ..., хп), ..., Ут~Ут{хъ x2f ..., *й)> удовлетворяющие условиям О /frO 0\ 0 /00 0\ 0 а 00 0\ Ух=*&1хъ **> •'»»*!>» fe^Hfttat ^> .-.г^/г>> ..., Ут=Ут№\> <%» ..., *„} (4) Fi(XuXit ..**Хп> tfr(X& X& . r^Xnk §fc(x& Хъ> ..;*„)> --->Ут C*f, *2> ...» */г))=0, ^l(**» *2 */*»#! (*1»*2. • w*A?fc(*b<*t> ...»*«), ...» Ут(Хъ *Ъ ....» Дь«))=0, *л (*£» х* *..,хп,у± (*lf *2 хп), у% (хь х2, ..., хп), ..., #Л (*ь лг2, ..., *„))=(/ (5) Яра з/тш функции у^ yt2, ..., #w являются дифференцируемыми. Существует только один набор непрерывных функций уь у2, ..., ут, удовлетворяющих в некоторой е-окрестности точки (х±, х°2, ..., 4) условиям (4) и (5). Следствие (теорема обобратном отображении). Пусть функции Fit F2t ..., Fm имеют вид1 Fi(xit x2l ..., хт, уи y2i ..., ym) = Xi—gi(iji, уъ ,.., ym)t F2(xi, x2, ..., xm, yu уъ ..., ym) = x2—g2(ylt y2, ..., ym), Fm{xb x2t .*.> xm, yi, y2 Ут) = хт— gm (yit ..., y2, ym)
§6*>5. Экстремумы функциий нескольких переменных 467 и выполняются следующие условия: ЛМ, xl .... xL yl yl ..., yl) = xl-gl{yl yl ..., <A) = 0, F2(xlt x2t ..., *«, Уъ yl, ..., 0m) = *2 —£2(01, 02» ...,0m) = O, ^й W, 4, ..., 4z, У?, 02, ..., ym) = Xm — gm(yi> 02, ..., 0m) = O; /^i/tyi dF1/dy2 ... 0/Vty»' (— l)w det [ dF2/dyt ^2/^02 • • • dF2/dy№ \dFm/dyi dFm)dy2 ... dFm/dym (dgi/dyt dg±/dy2 ... dgxjdymy dg2/dyt dg2fdy2 *.. dg2/dym, dgm/dyi dgm/dy2 ... dgjdym уЬА У°т 7^0; A-A A частные производные —^ (I, j — 1, 2, . s., m) непрерывны. У/ Тогда в точке (yl, у\> ..., ут) существует единственный набор непрерывных в некоторой окрестности точки (#?, xt, *.., Хт) функций 0i = 0i(*i, х2 хт), y2(xit x2i iiit хт\ iiit ут(хх, x2, .si, xm) (6) такой, что о /oo о \ . « п т—т\хи х<1, ..*, хт), *=i, 2, iiS, m, и Xi = gi(yi(Xi, X2, ..., Хт), y2(Xi, X2i 5i., Xm), ,t!i9 Ут(Х1, *2, •••, Xm))9 f== 1, 2, ;.., m. Отображение (**, *2» — > *«)—► (01% #2» *••> 0/»)* заданное формулами (6), является обратным к отображению (у±, у2, ,.., ут)—► (xt, x2t i#i, *ffi), описываемому формулами xi = gi(yi, 02, ..., ут)* *'=1, 2, ..., т. Теорема устанавливает существование и некоторые свойства обратного отображения. § 6*.5. Экстремумы функций нескольких переменных. Необходимое условие. Достаточные условия Определен и е. Точка Р0 (#?, xt, *.., хп) называется точкой Локального максимума функции /(*!, *2> •...» Хп), если существует такая е-окрестность Q точки Р0, что функция / определена в Q и f(P<,)>f(P), P, P0£Q. Р«ФР. 0) Точка PQ (xl, х2, ..., Хп) называется точкой локального минимума функции f (xi, x2f -..., xn), «ели существует такая «-окрестность Q точки Р0, что функция / определена в Q и f(Po)<f(Ph P, Р0£®> Ро^Р- (2)
466 Глава VI*. Функции нескольких переменных Точка Р0(х1, х\> ..., хп) называется точкой локального экстремума, если она является либо точкой локального максимума, либо точкой локального минимума. Теорема 1 (необходимое условие локального экстремума). Если P0(xi, х2, ..., Хп)—точка локального экстремума функции f (xlt х%, •••> хп), имеющей непрерывные частные производные-— (/=1, 2, ..., п) в OXi этой точке, то §;Ы*1 *«)-0. /=1,2 п. (3) Доказательство. По формуле (13) § 6*.3 при т—\ имеем Д/ = /(*1 + А*ь *2 + Д*2, ..., x°n + &xn)—f(x\, х\, ..., 4) = /el ' где е—величина бесконечно малая более высокого порядка малости, чем V A*i+ Л*2+...+Д*л> при A**, Ах2 Ихп—+Ъ. Допустим, что функция У*;гМ*ь *2> ..., Хп) Axi не есть тождественный нуль, т. е. хотя бы одно из чисел -^-{х\, х\, ..., хп) (i= 1, 2, >.., я) не равно нулю. Будем рассматривать Д/ в столь малой 8-окрестности точки Р0, чтобы знак п Д/ совпадал.со знаком V -г-^- (#?, я®, ..., *£) Д*/ (этого можно добиться, так i=i ' как 8—бесконечно малая величина более высокого порядка малости, чем У Д*1+ Ах2-\- ...+Длгя. Если Р0 является точкой локального экстремума, то В силу неравенств (1) и (2) Д/ сохраняет знак в малой окрестности точки п [xi, xl, ..., Хп). Однако знак выражения ^ ^— (х°1у х\, ..., хп) Д#/ (этот знак *=1 ** совпадает со знаком Д/) изменяется при замене Дл:/ на —Длг/. Таким образом, в точке локального экстремума выражение УУ^Н^**' Л°' "" *") ^** Т0ЖАест' венно равно нулю, т. е. -^-(*i, xl, ..., хп) = 0, /=1, 2, ..., п. OXi Теорема 2 (достаточное условие экстремума). Пусть ffa, х2, ...,*и)—функция, определенная в некоторой окрестности течки Р0(х\, х\, ..., хп) и имеющая в этой точке непрерывные частные производные второго порядка ^—£г— (i, /=1, 2, ..., л). Пусть, кроме того, в точке Р0 (#J, С/Л7 ow / *?t •* •> *°) выполняются необходимые условия экстремума: ^- =0; /=1,2, ... Я*/ 1^е
§6*.6. Условный экстремум 469 ..., п. Если при этом квадратичная форма п _d*f о i. /= 1 d2^=E i£kl.AxiAxj является знакоопределенной, то Р0 есть точка локального экстремума: в случае, когда квадратичная форма d2/ положительно определенная, — точкой локального минимума, а в случае, когда она отрицательно определенная, — точкой локального максимума. Д'ока з а тел ь ство. По формуле 13 § 6*.3 при т — 2 получим где г2— бесконечно малая более высокого порядка малости, чем Ах\ + Ах\ + ... + Ах%) , при Axf, Ах2, ..., Ахп —» 0. В достаточно малой 8-окрестности точки Р0 знак А/ совпадает со знаком второго дйЩ)еренциала п d«/ (Ач. Д*2) ..., Д*я) - 2 ^ |р0Лдг' Д*>' так как по условию первый дифференциал d/(A*f, Адг2, «*., A*„) = /и-^- Axt\ ~-~ ОХ( |Р0 1= Г равен нулю. Таким образом (при V Ах\-\- Ах\-\-... +Ах% > О/, А/ > 0, если квадратичная форма d2/ положительно определена, и А/ < 0, если d2/ отрицательно определена. В первом случае Р0 есть точка локального минимума, во втором—локального максимума. § 6*.6. Условный экстремум Пусть: z = f(xi> х2 хп)—функция п переменных х±, х2, ^., хпщ, множество АаЯп состоит из точек Р(хг, х2, ..., хп), координаты которых о^, х2, ..., хп удовлетворяют системе уравнений Щ(х±, х2, .,., хп) = 0, cp2(xi, xt *л) = 0 q>m fa, x2, ,.., хп)=0; (1) точка Р0 (хъ х%, ..., Хп) удовлетворяет системе уравнений (1); Q — е-окрестность точки Р0; A — Q(]A. Предполагается, что функции ft, <pf, ф2, ii;, фй определены в Q и имеют в А непрерывные частные производные по всем *,- (/=1, 2, ..., п). Точка Р0 называется точкой локального условного экстремума, если / (Р0) > / (Р), Р0 Ф Р, Р£А (локальный максимум) или /(Л>) </(P)t Pq^P* Р£А (локальный минимум)
470 Глава VI*. Функции нескольких переменных Теорема. Если Р0 — точка локального условного экстремума функции при виях (1), то няются условия условиях (1), то при некоторых вещественных значениях yi, yt, ..., Ут выпол- EL\ _V и ^L dxt I о Z± У/ dxi I Доказательство. Обозначим m =0 (i=\t 2, ..., n). (2) _ df I V *P/ , *=1, 2, ii;, n. (3) « .o /= 1 Умножая левую и правую части равенства (3) на Ах; и суммируя по /, получаем п ' п т п д Выберем Axtj Длг2. ...» Алг„ так, чтобы точка (#? + A*i, Л2 + Адг2, »**, #rt+A*rt) удовлетворяла системе уравнений (1). Тогда из соотношения (4) следует, что п 2^AAr/ = Af + 8, ф (5) где 8—бесконечно малая более высокого порядка малости, чем V Ах\-\-Ах\-\- •. • +А*я. В самом деле, в силу сделанного выбора А*/(/=1, 2, *.., л), выполняются равенства Аф/- = 0 (/ = 1, 2, ..., п). Выражения v^ ftP/ I > -5— Ддс/ (дифференциалы функций фу) отличаются от Аф^= 0 на величины ы\ Xl '° бесконечно малые более высокого порядка малости, чем V Ах\-{- Ах\ +... -\-Ах%'г дх; 1=1 ' (5). В случае локального условного экстремума А/ имеет постоянный знак в Л. Если же хотя бы одно из чисел al9 a2, ..., в,, не равно нулю, то знак п Д/v совпадающий со знаком 2%^'» не может быть постоянным вД: он из- меняется при замене А*/ на —Ад:/ (i=L,. 2, ...г д). Значитг в случае локального условного минимума все д/ (t=l, 2, ..., га) при подходящих значениях Уъ УЬ> •••> Ут равны нулю. Очевидно, что числа x\t х\, ..., Хп, уь Уь "ч Ут удовлетворяют системе уравнений ^4*1, хъ ;..! хп% Ух, уъ >>.., ym) = Q, *=U 2, ..it n; AT -ЩГЛ** *ъ ••> хп, Уъ У%> ..., Ут) = ®> J'=l> 2> •••> ™> где L(xt, х2, ,iif xnt yif уъ *.., ym) = f(xi, дг2, ..., хп)-~ т — 2у/ь(х*> *2> ...» *л). /=i то же верш- и в отношении А/, с$ = \^~-Алг/. Отсюда и вытекает равенство
ОТВЕТЫ К УПРАЖНЕНИЯМ Глава I § 1.1. 6. а) Да; б) нет; в) нет; г) да. ^J 1.2. 1.^| = ^Т4, Да2| = 2, \a3\ = VX \ъ\ = У2. 2. аъ <£ = 2я/3, -» -* -* -> -> -> -*■ ->• -> -» ~> -> «1, а3 = я/2, al9 а4 = я/2, а2, а4 = я/2. 4. пр^/ = 5,5аь пр_>/ = 3,5а2, пр_»/ = 2,5а3, #i a2 а3 пр_>/ = —1,5а4. 5. / = 5,5а1 + 3,5а2 + 2,5а3 — 1,5а4, ^ = 0-а1 + 0-а2 + 0-а3 + 6а4. 6. |яЦ=/*13, |^| = 1^13, |а3| = /"2; cosjfe, а^)==0, со^(аь а3) =2/^267 cos(a2, а3) = — 3/^26. 7. а) 0; б) 0. 8. а) ^ #^я/3; б) *, */ = я/2. 9. /i (*) = = д«+^ 10. /i(*) = *»--g-± J^3j! § 1.3. 1._а) я/2; б) arccos_(4/^30). 2. агссс^(—13/^238). 3. arcsin (6/У42), arcsin (5/}^51), arcsin (4/^70), arcsin (2/^85). 4. х=—1,5/+2,5, i/=/, г = = / + 4. Л \ § 1.4. 1. а) Да; б) нет; в) да. 2. '0 И- (г 5 !)'4' ВС=(о з)' ВА = (-* ~j -J). СВ=(3 J)- 5. ЛВ = -*Л. «. Л = (1 J -Г /2 0 1\ /7 3 13\ _> н. -> 4 В = ( 1 10, ВА = [ 5 0 1 . 7. a) А* = 7<?1 + 5г2 + 22£>3 + 31е4; б) Ах = \0 1 0/ \2 —1 —1/ = (*i + 2*2) <?i + (2*1 + *з) ^2 + (■— х2 + 3*4) ея + (х3 + 4*4) е4; в) А* = 2ех + ^ + / 2 16 8\ / 2 24 20 \ + 5г2—9е3 — 11е4. 8. а) 21 0 9 ; б) 14 0 15); \10 5 —10/ \ 4 3 —10/ /bn + Kb8i b12 + Xb32 b13 + kb33\ /ап а12 Aaii + ai3\ /1 О ON В) I Ь2г Ь22 Ь23 ] РГ) f «21 «22 ^21 + ^23 J . 9. ( О О 0^ \b3i bZ2 b:i3 J \a22 a32 ha31 + a33/ v> 0. 0*y (созф — sin9 0 \ cos ф sin ip cos ф cos if» — sin ф J. sin ф sin if sin ф cos \p cos ф / § 1.6. 1. a) —5; 6) —12; в) 0; г) 12. 2. a) +; 6) —; в) +; г) +. 3. a) 177; б) —2. 4. a) —15; б) 0. 5. a) 2; б) 1. 6. A12 = 0, AA3 = -^2t Л55 = — З. § 1.7. 1. a) 2; (J J) ; 6) 2; (J *) ; в) 2; (J J) . 2. a) 2; 6) 2; в) 3; г) З. 3. Я = 2 ± УТ. 4. а) Да; б) нет. 5. 1. § 1.8. 1. а) _7?-2/+5Л; б) 0; в) -2k 2. а) 1; б) -2. 3. {£ГК^5г--2 = 0 4. 3/2. 5. * = 7*-+15, y = —6t—10, г = — /. § 1.9. L Совместна. 2. Несовместна. 3. Несовместна. 4. Совместна. 5. х± = «=—1,5дта+1,8, *8 = —М, a:26R. 6. Xi = 0,2*3 +-3,4, *2 = 0,4л:3 + 0,8, *3£R.
472 Ответы к упражнениям 7. *! = —2, лг2 = 3. 8. Система несовместна. 9. #х=1, #2=1, #з=1. 10. # = — cxi + см #! = (—4/3, —11/3, 1, 0), #2 = (1, 2, 0, О; И- *=*1*1 + *л, *i =■ = (1, 2, 1, 0), #2 = (—1, *» 0, 1). 12. # = с#ь #i = (l, —3, 2, 1). 13. #=c#i, #i =* -(0,-1, 1). §1.10. 1. #i = 3/4, #2 = 3/4. 2. #i = 73/38, #2 = 71/38, #3 = 89/38. 3. #i=l, / 1/3 0 1/3\ / 3/11 —1/11 —4/1IX *2=1, #3=1. 4. а) (—1/3 0 2/3); б) -1/11 4/11 5/11 ; V—1/3 —1 5/3/ Ч—1/11 4/И —6/11У / j2 2 13\ в) [ 19 3 —20 |. 5. #i = 31, #2 = — 34, #з=—3. 6. #х = 2, #2 = — 5, #3 = — 6. Ч —1 о 1/ 7. #i=l, #2=1, #3=1. 8. Х=(~75 ~2 —з)' 9-Х==( ° Ч- 10- Х== /_40 —50 43 \ ^Ч 29 36 — 31 У* §1.12. 1. лх=1, &х = ег\ А2 = 3, ft = e2; л.з = — 4, Яз = ^з; ^4 = 5, ft = e4. 2. ^i==l, ё1 = ег\ Я2 = 3, ft = ei + e2; Ая = — 4, ft = — ^—15^2 + 35^; Я4 = 5, g4 = = 146^+12^-16?з + 72?4. 3. >,i=l, ^ = (4, -1); Ь2 = -2, ft = (l, -1). 4. Х1== «-I. ft = (l. 1); Я,«5, ft = (2, -1). 5. Xi = -1, ft = (2, 0, 1); Х2 = 4, ft = = (3, 5, -1); Я3 = 3, ft = (0. 1, 0). 6. ^=1, ft = (40f 14, 2, 9); Л2,3 = 9, ft = = (0, 1, -2, 0), g3=(0, 0, 2, -1); Я4—9, £ = (0, 2, 1, 2). 7. Да. 8. Да. 9. Нет. 10. Нет. § 1.13. 1. Я*=1, gt = {\lY\ I/O); Я3=3 ft = (1/1/" 2, -I/O). 2. Лх_= = 0,ji = (l//*5, -2/^5); ^2 = 5, J2 = (2/^ 5, 1 /f 5). 3. ^= 1, ft = (l/K 2, 1/^2);^Я2 = -1, ft = О/К 2, -I/O). 4. *i = 0, ft = (0,64; 0,48; 0,6); ^2 = = 625, ft = (—0,6; 0,8; 0); u3 = —625, g3 = (—0,48; —0,36; 0,8). 5. ^ = 30,^ = = 0/06, 2/05, 3/^30, 4/j/"^); Я2 = Я3 = Я4 = 0, ft = (2/0, -I/O, 0, 0), _ft = (3/^70, 6/^70, -5/1^70, 0), ft = (2/05, 4/}/"T05, 6//T05; —7/^105). § 1.14. 1. Н-пЯП! 0 0 1 0> 0 0, . 3. /2 3 3 4 0 0 ' 60 -209 15 -52 1 0 0 0 2 0 0 0 3 rt+1 tl+\) 0 2 5* 8 4—1 1 2 3 »({ !)••■• (J 8) •* (8 ?)• / 4 12\ 2 /-12 -26\ з /12 6\ 4 *i V12 35/' Ze V— 26 —48;- ^ V 6 36/' 4e (j/7/8)2 1.15. 1. Jkr2 v2 a:2 r2 r2 9 1 2 1 2 /уГ~ч2 =1* 5* "^"^"ir^1, 6# "3l—Ь (3/2)2в1, 7e ^1 = 2* ^2=1, Я3 = "
Ответы.к упражнениям 473 э. _ л,1=о, а,2=з+Уз, 1//2\ /о О 2\/1/У"2 О О 0 10 0 1 1ЛГ2/Ч2 ° °А 1/^-2 о Хз = 3-^3. -1/У2ч /2 i/ViA^ /2/Г5 2/^5 _l/^5\/i 2\ 2/^JV2 4J 2/^3 -l/УВ 1 Уз 1 1 1 У 3 _ —1 —У 3 2 У"3 1—т/"з 1 Уз _ -i+Уз У 3 2J/"3 2 УЗ i+Уз "2^3 1/Уб\ /о о\. 2/у-5Г^0 В> /2—2 0\ —2 3 —1 X V 0 -1 \) X 1 Кз 1 1 Кз 1 ' Кз —1-Кз 2К"3 -1+К~з Кз -Кз 2КЗ i+Кз КЗ 2V"3 Кз о з+К~з о з-Кз § 1.16.1. х\ 8/(К5-1) 4. *£= 18 *i У2 х2 1/4 1/4_ *3 _, « J>_q Кб 8/(К 5 + 1) =0. 6. = 1. 2. *} = 2-^*1. V2 *3 у2 хг А 1/2 5/2 4 = 1. У2 #1 У2 Xi О О *2 +^=1. 2 *2 5/8 » 5/4 Глава II § 2.2. 1. 1/2. 2. 1/2. 3. 8/3. 4. —1. 5. 0. 6. со. 7, § 2.3. 1. 1. 2. 1/2. 3. —1. 4. —79. 5. 3/2. 6. 3. \/а. 4. е*. 0. 8. 0. 9. 2. 10. Ке. 11. 2. —1. 7. 1. 8. я/2. 9. оо. 10. 0. 5. l/cos2a. 6. JLa<i-*>/*. 7. е-2. § 2.6. lo cos a. 2. —sin a 8. ect*a. 9. е~1/2. 10. е1/2, § 2.8. 1. +оо; —оо. 2. +оо; 0. 3. х= 1—точка разрыва первого рода (устранимого); х = —1, *=—3—точки разрыва второго рода. 4. * = 0—точка разрыва первого рода (неустранимого);: * =—1—точка разрыва второго рода. 5. х = 0 — точка разрыва второго рода. Глава III § 3.1. 1. a* In a. 2. — logae. 3. cos*. 4. — sin* 7. 2х cos x—х2 sin x. 8. З+З*2 —8*3 — 9*4—x6 (**+l)2 — x sin x ex+x cos * e*. 3r?ln*+*2. 12, 0. 13. — . 5. 1/cos2*. In* 6. 5/~ * 10. bxV 7x«—10*4 + 3*2 1 YT- -xi xi arccos*. 14. cos*e* —
474 Ответы к упражнениям с on 1 о . 9 о 2 sin* —л: cos* ' 1 , * х . V х §3.2. 1. 3 sin2 л: cos*. 2. -■ 3. _-Intg—H—-. ♦ 2sin*)/^sin* 2 У х 2 sin* 4.e*l"*(ln*+l). 5.**(ln*+l).6. (cos*)ln*f lnc°s* —ln^tg^V 7. —sinarctg2*X у . 2 . 2 = , ~4* 8. #' = — -. 9. y' = —1. 10. #' = 2* (* + */) —1. § з.З. 1. 2-^-. 2. Ich24-sh4. 3. —2 4^-. 4. 4sh*ch*. 5. ch2* + * ch2* 2 2 2 sh22* * + sh2 *. § 3.4. 1. 1,004. 2. 0. 3. tf. 4. jt/180. 5. 0,03. 1 *2 § 3.5. 1. 6sin* cos2*,—3 sin3*. 2. — . -. a. fl")(r) = пР^ях Y i + x'1 (/1 + *2) /2 = 0, 1, 2,..,. 4. /<4*>(*) = 24*sin2*, /(4*+х>(*) =24*+x cos2*, /<4*+2> (*) = = —24fe+2sin2*, /<4Л+3>(*) = —24*+3cos 2*, 6 = 0, 1, 2,... . 5. /t«> (*) = (— l)""^ Х(я — 1)!*-», n=l, 2,... . 6. Г(*) = 4*3, /"(*) = 12*2, /"'(*) = 24*,/<4>(*) = 24, /<«>(*) = 0, n^5. 7. /<«>(*) = *е* + яе*, n = 0, 1, 2,... . 8. /' (*) = * + 2* In*, П*) = 3 + 21п*, р>(*) = (-1)^з2(^~?! ,я = 3, 4, ... . § 3.6. 1. —1. 2. —1/4. 3. oo. 4. oo. 5. oo. G. oo. 7. К 8. —1/9. 9. 1/80. 10. 1. § 3.7. 1. (a — b)/2. 2. oo. 3. 1. 4. oo. 5. 2. 6. —1/5040. 7. —1/3. 8. —1. 9. e. 10. 1/e. Глава IV §4.1.J.* = 3,/_(*) = — 54;7= 10, /(7) = 730. 2._*= 1, /(*) = -26;7=0, /(7) = 0. 3. * = 0, /(*) = 0; 7=-l, /(7) = 26. 4. £ = — 10, /(*) = -730; 7=—3, /(*) = 54. Б. * = л/2, /(£) = 0; 71==0, *2 = я, /(^)==/(7а)=1. 6. * = я/6, /(£) = /"3/3; 7= я/3, /(*)=j/"3. 7. £=l/e, /(£) = — 1/e; 7=3, /(7) = 31n3. 8. * = e, /(*) = — 1; 7=1, /(7) = 0. 9. *=1, /(*)=1; 7=10, / (7) = 19,99. 10. *=1/10, /(*) = —890; 7=1, /(7)=l. Глава V 5.1. 3. etZ + jZ + JYT^; y.J—Z+3shi'3t.et. 4. (tg)f^ f t -, e*(l-fl . In/-2 /?4,:5/_/ * —ln* i e^l-2/) \^ 1+lnf 2^Г eHl+2Q-> 7= ^3 2// fpTf- ^-^-sr-H=^jF)s- •e2 + §5.2. 2. (*_i)/(_i)^ft,_ 1)/1 = (г-р)/1. 3.>; = ^, *=*2; ^ = -J-f * = *2. §5.3. l._i + |/. 2. 4-+TT^ 3' 2=^2(cos^+^in|). 4.г = 26Х X( cosarccos^+i staarcsin-=■*-) . 5. z = 2 ( cos^+ista ~ ] . 6. —278 — 29/. ч 13 > — 13y - ---^-6-r^^g 7. —237 + 3116/. 8. /. 9. cos^+/sin-^, £ = 0, 1, 2, 3, 4, 5. 10. Y~2x
Литература 475 X fros" + g^+,sta£+**.V ft=o. 1, 2, 3, 4, 5, 6, 7. И. ^2Х 8 ^"ш 2 У £+2я* ' £+2*ft\ X^cos^-g + fsln 5 - у1. fe = 0- 1. 2, 3, 4. Глава VI § 6.2. 1. -g-=12** + 20*«A ^-=20r«y+lV. 2. -J- = l, -f--0. 3. <iz = ° *U7»)^ *+^У" ^ 4- ^=cos(,+y)(d,+ d,). 5. 5,0036. 6. 0,7849. § 6.3. 3. df = (e>+ye*) d* + (*e? + e*) dy, d2/ = ye* d.*2 + 2 (e* + e^) dx dy + + я*Уду*, d*f^yexdx*+3e*dx*dy+3eydxdy*+xeydy*. 4. a) 1+л;+у = 1- #2 — (*+У) + (*+#)2+М*> У); б) cos(*-y2)=l g-+ra(*, у). § 6.5. 1. Минимум при # = 0, у—О. 2. Экстремумов нет. 3. Максимум при дг=0, у = 0. 4. Минимум при х = 3, у = 0. 5. Минимум при д^= —1, у=0. §6.6. 1. Экстремумов нет. 2. Условный максимум при *=1/4, у=1/6. 3, Условный минимум при я=1/3, у=1/3, г= 1/3. Литература 1. Беклемишев Д. В. Курс аналитической геометрии и линейной алгебры.— М.: Наука, 1980, 1984. 2. Бугров Я* С, Никольский СМ. Высшая математика. Элементы линейной алгебры и аналитической геометрии.— М.: Наука, 1980, 1984. 3. Бугров Я. С, Никольский СМ. Высшая математика. Дифференциальное и интегральное исчисление.— М.: Наука, 1980, 1984. 4. Бугров Я* С, Никольский С М. Высшая математика. Задачник.— М.: Наука, 1982. 5. ДанкоП. Е., Попов А. Г., Кожевникова Т. Я~ Высшая математика в упражнениях и задачах.— М.: Высшая школа, 1980, 1986, ч. I, II. 6. Ефимов Н. В. Квадратичные формы и матрицы.—М.: Наука, 1964—1975. 7. Задачи и упражнения по математическому анализу для втузов/Под ред. Б. П. Демидовича.—М.: Наука, 1964—1978. 8. К лете ни к Д. В. Сборник задач по аналитической геометрии.— М.: Наука, 1965—1980. 9. Пискунов Н. С Дифференциальное и интегральное исчисления для втузов.—М.: Наука, 1970—1985, т. 1, 2.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Абелева группа 293 Абсолютный максимум 233 — минимум 233 Алгебра над полем 318 Алгебраическая форма комплексного числа 259, 446 Алгебраическое дополнение 60, 336 Алгоритм 390, 391 Альтернативы Фредгольма 99, 100, 355—357 Аргумент 156 — комплексного числа 259, 446 Асимптота 240, 349 Асимптоты гиперболы 382 Базис линейного пространства 16, 298 Бесконечно большая функция 175, 405 — малая функция 174, 404 более высокого порядка 176, 406 низкого порядка 176, 406 Бесконечно малые одного порядка 176, 406 Бесконечномерное пространство 298 Биективное отображение 158 Булева алгебра 389 Вектор 9, 288, 289 — n-мерного координатного пространства 12, 45, 295, 377 Векторная функция скалярного аргумента 249, 441 Векторное произведение 72—74, 343 — пространство 295 Вертикальная асимптота 240 Вещественная часть комплексного числа 258 Возрастающая функция 232, 432 Второе сопряженное пространство 324 Второй замечательный предел 167 Выделение главной части 178, 179, 228 Выпуклость вверх 238, 435, 436 — вниз 238, 435, 436 Вырожденный линейный оператор 97 Высказывание 388 Геометрический смысл дифференциала 206, 422 функции двух переменных 274 производной 191, 415 векторной функции 255 Гипербола 133, 142, 382 Гиперболический параболоид 137, 143, 385 — косинус 201, 202, 421 — синус 201, 202, 421 — тангенс 201, 202, 421 — цилиндр 138, 144, 386 Гиперплоскость в R" 30, 31, 311, 312 Главная диагональ 47 — линейная часть приращения функции 204, 422 — часть бесконечно малой 179 функции 227, 228 Гладкая функция класса Ck 209 Годограф векторной функции 254 График функции нескольких переменных 458 Двойственный сопряженный базис 323 Двуполостный гиперболоид 136, 143, 384 Декартова система координат 287, 378 Диагональная матрица 51 Дизъюнкция высказываний 388 Директриса параболы 383 Дифференциал 204, 422 — высшего порядка 211, 276, 424, 461 — функции нескольких переменных 271, 455 Дифференцируемость векторной функции скалярного аргумента 250, 251 — функции 204, 421 нескольких переменных 271, 455 Длина вектора 22, 305, 307 Дополнение множества 155, 389 Достаточное условие 161, 390 8-окрестность 267, 452 Естественный изоморфизм 324 Жорданова клетка 371 Замкнутое множество 267, 452 Значение функции 156 Изоморфизм 304 Изоморфные линейные пространства 304 Изотерма 268, 269 Инвариантность формы дифференциала 205, 206, 273, 274, 422, 458 Инъективное отображение 158 Истинное высказывание 388 Канонический вид квадратичной формы 124 линейного оператора 119, 120 самосопряженного оператора 120, 121 уравнения второго порядка 131 Касательная 191 — гиперплоскость 458
Предметный указатель 477 Квадратичная форма 123, 372 Класс эквивалентности 289 Коллинеарные векторы 17 Комплексификация 361 Комплекснозначная функция действительной переменной 262, 447 Комплексное число 257, 445 Композиция отображений 157, 197 Конечномерное пространство 298 Конические сечения 384 Конус 136, 143, 385 Конъюнкция высказываний 388 Координаты вектора 10, 289 в базисе 301 — точки 9, 287 Корень матрицы 104, 106, 359, 360 — многочлена 449 — л-й степени из комплексного числа 260 Кривая второго порядка 129 Критерий сходимости Коши 168, 169, 396, 397 Критическая точка 233 Левая тройка векторов 71 Левый предел 181, 392 Линеаризация функций 206, 422, 423 Линейная комбинация векторов 14, 297 — оболочка 302 Линейно зависимая система векторов 13, 297 — независимая система векторов 13, 297 Линейное многообразие 31, 313 — подпространство 15 над полем 296 — пространство 13 над полем 295 Линейный оператор в линейном пространстве 34 из одного линейного пространства в другое 316 Логарифмическая функция 171, 400 Логические символы 159, 160, 292 Ложное высказывание 388 Локальный максимум 233, 282 — минимум 233, 282 Матрица 37 — квадратичной формы 123, 372 — линейного оператора 37, 317 — пересечения базисов 117 — системы уравнений 78, 346 Матрично-векторные уравнения 91 Метод выделения главной части 227— 229 — Гаусса 78—82, 346—348 — исключения 78—82 — обратной матрицы 91, 94 Механический смысл векторной функции и ее производных 251, 252 производной 192, 415 Минор &-го порядка матрицы 60, 336 — элемента 60, 336 Мнимая часть комплексного числа 258 Мнимый конус 136, 143, 385 — эллипс 133, 142, 382, 383 — эллипсоид 136, 143, 385 — эллиптический цилиндр 138, 144, 386 Многочлен 449 — Тейлора 224 Множество 153, 388 — значений функции 156 Множитель Лагранжа 286 Модуль комплексного числа 259, 446 Монотонная функция 158 Наибольшее значение функции 233 Наименьшее значение функции 233 Наклонная асимптота 240 Направленный отрезок 9, 287 Направляющие косинусы 26 Невырожденный линейный оператор 97 Необходимое условие 161, 390 — и достаточное условие 161, 390 Неоднородная система 77 Непрерывность векторной функции скалярного аргумента 250 — комплекснозначной функции действительного аргумента 448 — функции в точке 170, 171, 399 слева, справа 182, 410 нескольких переменных 266, 452 Неравенство Коши — Буняковского 23, 307 Несобственное линейное подпространство 296 Нетривиальная линейная комбинация 14 Нечетная подстановка 55, 331 — функция 243 Неявная функция 281 /z-мерное координатное евклидово пространство 27 линейное пространство 12, 13 Нормальная жорданова форма матрицы 371 Нормальный вектор плоскости 32 Нормирующий множитель 315 Нуль-вектор 292 Область 267, 452 — значений линейного оператора 96, 354 — определения функции 156 Обратимый линейный оператор 354 Обратная матрица 89, 318 — теорема 160, 390 — функция 158, 159, 200, 420 Обратное отображение 158
478 Предметный указатель Общая схема исследования функций и построения их графиков 242, 243, 440 Объединение множеств 155, 388 Ограниченная бесконечно малая по отношению к другой 178 — функция 174, 405 Ограниченное множество 267, 452 Одинаковая ориентация базисов 342 Однополостный гиперболоид 136, 143, 384 Однородная система 77 Определитель второго порядка 53, 54 — третьего порядка 53, 54 — п-го порядка 56, 331,;, 332 , вычисление приведением матрицы к треугольному виду 57—59 9 — разложением по строке или столбцу 60, 61 Ортогонализация базиса 308, 309 Ортогональная матрица 48 — проекция вектора на подпространство 308 Ортогональный базис 24 — линейный оператор 47, 48 Ортонормированный базис 24, 307 Оси координат 287 Основные эквивалентности 177, 407 — элементарные функции 171, 172, 400 Остаточный член формулы Тейлора 224, 278, 279 в форме Лагранжа 225, 429 Пеано 224, 428 Открытое множество 267, 452 Отношение эквивалентности 288, 289 Отображение 156, 389 Парабола 133, 134, 142, 383 Параболический цилиндр 139, 144, 386 Параллельный перенос осей координат 130, 131, 146, 379 Параметрические уравнения кривой 254, 255, 444 Пара мнимых параллельных плоскостей 139, 144, 387 прямых 134, 142, 383 пересекающихся плоскостей 136, 144, 386 прямых 132, 133, 142, 383 — параллельных плоскостей 139, 144, 387 прямых 134, 142, 383 — пересекающихся плоскостей 136, 138, 144 387 ' прямых 133, 142, 383 — слившихся параллельных плоскостей 136, 139, 144, 387 прямых 134, 142, 383 Первый замечательный предел 168 Пересечение множеств 155, 389 Плоскость в R3 30, 311 Поверхность второго порядка 129 — уровня 268 Поворот осей координат 130 Подмножество 154 Подобные матрицы 108, 365 Подстановка 55, 327 Показательная форма комплексного чис* ла 262, 447 — функция 171, 400 Поле 445, 446 Последовательность 161, 391 Правая тройка векторов 71 Правило дифференцирования сложной функции 197, 198, 272, 273, 419, 420, 448, 456 — «дождя» 239 — замены переменной 181 — Лопиталя 215, 218, 426—428 — отыскания наибольшего и наименьшего значений функции 233, 234, 434 — Сарруса 53 — треугольника И Правый предел 181, 392 Предел векторной функции скалярного аргумента 250, 441, 442 — комплекснозначной функции действительного аргумента 262, 263, 447 — отношения многочленов 163—165 — последовательности 162, 163, 392 — функции при х-+х0 166, 167, 392 лг-Н--00, *-*~<х>, |д;|_>оо 165, 166, 392 п переменных 266, 452 Предельная точка множества 267, 452 Приращение 189, 270 Произведение вектора на число И, 12, 291, 295 — линейного оператора на число 38, 317 — линейных операторов 38, 317 — матриц 38, 39, 3.17 — матрицы на число 38, 39, 317 — множеств 156 — подстановок 327 Производная 189, 19Q, 414 — векторной функции скалярного аргумента 250, 442 — высшего порядка 209, 263, 423 —, геометрический смысл 191, 415 —, дифференцирование основных эле* ментарных функций 194, 416—419 — комплекснозначной функции дейс1« вительного аргумента 263, 448 —, механический смысл 192, 415 —, правила дифференцирования 192^ 197, 200, 419, 420 — функции, заданной параметрически 256, 444 — функция 190, 263, 415
Предметный указатель 479 Противоположная ориентация бааисов 342 — теорема 161, 390 Противоположный вектор 292 Прямая в R" 31, 312, 313 Прямое произведение множеств 288 Пустое множество 155 Равенство направленных отрезков 9, 10. 289, 290 — комплексных чисел 257 — множеств 154 Разложение вектора по ортонормировав- ному базису 25 — многочлена на множители 264,265,451 — определителя по строке (столбцу) 61, 336 — функций по формуле Тейлора 225— 227, 430, 431 Размерность линейного пространства 17, 301 Разность множеств 155, 389 Ранг квадратичной формы 128 — матрицы 63, 66, 339 , вычисление приведением ее к ступенчатому виду 67—69 Раскрытие неопределенностей 170, 215— 218, 220, 221 Расстояние между двумя скрещивающимися прямыми 315 точками 23, 266, 306 — от точки до гиперплоскости 315 Расширенная матрица 78, 346 Рациональная функция 171, 400 Решение системы уравнений 77 Самосопряженный оператор 46, 327 Свободные переменные 83 Связное множество 267, 452 Сигнатура квадратичной формы 128 Симметрическая матрица 47 Система координат в R" 377, 378 — линейных уравнений 77 в матрично-векторной форме 88, 89, 352, 35а Скалярное произведение 21, 22, 45, 305, 306,325 Сложная функция 157, 197 Смешанное произведение 74, 75 Собственное значение линейного оператора 102, 103, 358 матрицы 104, 106, 359, 360 Собственный вектор линейного оператора 102, 103, 358 матрицы 104, 359 Сопряженное комплексное число 258 Сопряженный оператор 46, 322, 326 Спектр линейного оператора 108 — матрицы 108, 363 Степенная функция 171, 400 Ступенчатый вид матрицы 67, 347 Сумма векторов 11, 291, 295 — линейных операторов 38, 317 — матриц 38, 39, 317 — множеств 156 Суперпозиция линейных операторов 38 — функций 157 Сюръективное отображение 158 Таблица кривых второго порядка 142 — поверхностей второго порядка 143, 144 — производных основных элементарных функций 194, 199 Теорема Безу 263, 264, 449 — Коши 2Г4, 215, 426 — Кронекера — Капелли 82г 83, 350— 352 — Лагранжа 213, 214, 425 — о базисном миноре 65, 66, 342 возрастании и убывании функции в точке и на интервале 232, 432, 433 выделении главной части 178, 409 достаточном условии дифферен- цируемости функции нескольких переменных 271, 272, 455, 456 количестве векторов базиса 16, 298—300 линейном подпространстве в Ln 15, 16, 301—304 матрицах сопряженных линейных операторов 46, 47г 327 матрице ортогонального линейного оператора 48, 49 независимости частных производных от порядка дифференцирования 276, 459, 460 непрерывности элементарных функций 172, 404 пределе монотонной ограниченной последовательности 167, 392—394 производной обратной функции 200, 420 сложной функции 197г 419, 420 разложении многочлена на множители 264, 265, 451 — об асимптотах 240, 241, 439, 440 изменении матрицы квадратичной формы при переходе к новому базису 125, 126, 372 линейного оператора при переходе к новому базису 118, 119, 370 эквивалентных бесконечно малых 177, 406 — основная алгебры 264, 450 — Ролл я 213, 424, 425 Теоремы о выпуклости, вогнутости и точках перегиба 238f 239, 436—439
480 Предметный указатель Теоремы о матрицах линейных операторов 39, 40, 320, 321 неявной функции 281, 464—466 приведении к каноническому виду матрицы квадратичной формы 127, 129, 372—377 линейного оператора 119, 370, 371 самосопряженного линейного оператора 120, 121, 370 собственных векторах и собственных значениях линейного оператора 106—108, 360, 362—365 самосопряженного линейного оператора 112, 367—369 структуре общего решения системы линейных уравнений 83, 84, 97—99 существовании пределов 167—169, 392—397 функциях, непрерывных в точке 180, 181, 409, 410 , — на отрезке 186—188, 411— 413 ядре и области значений линейного оператора 96, 97, 354, 355 — об обратной матрице 90, 353, 354 экстремумах 233, 237, 238, 434, 435 функций нескольких переменных 283—286, 468—470 Тождественная подстановка 55 Точечное координатное пространство 377 Точка абсолютного максимума 187 минимума 187 — координатного пространства Rn 377 — локального максимума 233, 282, 433, 467 -. минимума 233, 282, 433, 467 — перегиба 239, 437 — разрыва 183, 410 второго рода 183, 410 первого рода 183, 410 — устранимого разрыва 185, 411 Траектория движения 254 Транспозиция 55, 327 Транспонированная матрица 47 Треугольник Паскаля 210 Треугольный вид матрицы 57, 58 Тривиальная линейная комбинация 14 Тригонометрическая форма комплексного числа 259, 446 Убывающая функция 232, 432 Угол между векторами 22, 306, 307 Уравнение гиперплоскости в векторной форме 311, 312 координатной форме 311, 312 — касательной 206 гиперплоскости 459 — плоскости в векторной форме 30, 311 координатной форме 30, 311 Уравнения прямой в векторной форме 31, 312 параметрической форме 31, 312 Условный экстремум 285, 286, 469 Фокус параболы 383 Фокусы гиперболы 382 — эллипса 382 Формула бинома Ньютона 210 — Лейбница 209, 212, 423 — Маклорена 224, 279 — Муавра 259, 447 — Тейлора 223, 224, 278, 428, 429 — Эйлера 261 Формулы Крамера 87, 352 Функция 156, 389 — действительной переменной с действительными значениями 156 ] — Лагранжа 286 — нескольких переменных 266, 452 Характеристический многочлен линейного оператора 108 матрицы 106, 360 Характеристическое уравнение матрицы ; 106, 360 Цепная линия 202 Цикл 328 Цилиндрическая поверхность 137 Частная производная 269, 454, 455 высшего порядка 275, 459 Частное приращение 270 Четная подстановка 55, 331 — функция 243 Число е 167 Числовая последовательность 161, 391 Член последовательности 162, 391 Эквивалентные бесконечно большие 176, 406 малые 176, 406 Экстремум 233, 433 —, достаточное условие 237, 283, 284, 435, 468—470 —, необходимое условие 233, 283, 434, 468 Эксцентриситет гиперболы 382 — эллипса 382 Элементарная функция 172, 404 Элементарные преобразования матриц 67, 79, 346 Эллипс 132, 133, 142, 382 Эллипсоид 135, 143, 384 Эллиптический параболоид 137, 143, 385 — цилиндр 138, 143, 386 Эрмитово линейное пространство 367 — скалярное произведение 367 Ядро линейного оператора 96, 354