Text
                    ГМ. Фихтенгольц
КУРС ДИФФЕРЕНЦИАЛЬНОГО И ИНТЕГРАЛЬНОГО ИСЧИСЛЕНИЯ
ТОМ1
Содержание
ВВЕДЕНИЕ
ВЕЩЕСТВЕННЫЕ ЧИСЛА
§ 1.	Область рациональных чисел	11
1.	Предварительные замечания	11
2.	Упорядочение области рациональных чисел	12
3.	Сложение и вычитание рациональных чисел	12
4.	Умножение и деление рациональных чисел	14
5.	Аксиома Архимеда	16
§ 2.	Введение иррациональных чисел. Упорядочение области вещественных
чисел
6.	Определение иррационального числа	17
7.	Упорядочение области вещественных чисел	19
8.	Вспомогательные предложения	21
9.	Представление вещественного числа бесконечной десятичной дробью 22
10.	Непрерывность области вещественных чисел	24
11.	Границы числовых множеств	25
§ 3.	Арифметические действия над вещественными числами	28
12.	Определение суммы вещественных чисел	28
13.	Свойства сложения	29
14.	Определение произведения вещественных чисел	31
15.	Свойства умножения	3 2
16.	Заключение	34
17.	Абсолютные величины	34
§ 4.	Дальнейшие свойства и приложения вещественных чисел	35
18.	Существование корня. Степень с рациональным показателем	35
19.	Степень с любым вещественным показателем	37
20.	Логарифмы	39
21.	Измерение отрезков	40
ГЛАВА ПЕРВАЯ. ТЕОРИЯ ПРЕДЕЛОВ
§ 1.	Варианта и ее предел	43
22.	Переменная величина, варианта	43
23.	Предел варианты	46

24. Бесконечно малые величины 47 25. Примеры 48 26. Некоторые теоремы о варианте, имеющей предел 52 27. Бесконечно большие величины 54 § 2. Теоремы о пределах, облегчающие нахождение пределов 56 28. Предельный переход в равенстве и неравенстве 56 29. Леммы о бесконечно малых 57 30. Арифметические операции над переменными 58 31. Неопределенные выражения 60 32. Примеры на нахождение пределов 62 33. Теорема Штольца и ее применения 67 § 3. Монотонная варианта 70 34. Предел монотонной варианты 70 35. Примеры 72 36. Число е 77 37. Приближенное вычисление числа е 79 38. Лемма о вложенных промежутках 82 § 4. Принцип сходимости. Частичные пределы 83 39. Принцип сходимости 83 40. Частичные последовательности и частичные пределы 85 41. Лемма Больцано—Вейерштрасса 87 42. Наибольший и наименьший пределы 89 ГЛАВА ВТОРАЯ. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ § 1. Понятие функции 93 43. Переменная и область ее изменения 93 44. Функциональная зависимость между переменными. Примеры 94 45. Определение понятия функции 95 46. Аналитический способ задания функции 98 47. График функции 100 48. Важнейшие классы функций 102 49. Понятие обратной функции 108 50. Обратные тригонометрические функции 110 51. Суперпозиция функций. Заключительные замечания 114 § 2. Предел функции 115 52. Определение предела функции 115
53. Сведение к случаю варианты 117 54. Примеры 120 55. Распространение теории пределов 128 56. Примеры 130 57. Предел монотонной функции 133 58. Общий признак Больцано—Коши 134 59. Наибольший и наименьший пределы функции 135 § 3. Классификация бесконечно малых и бесконечно больших величин 136 60. Сравнение бесконечно малых 136 61. Шкала бесконечно малых 137 62. Эквивалентные бесконечно малые 139 63. Выделение главной части 141 64. Задачи 143 65. Классификация бесконечно больших 145 § 4. Непрерывность (и разрывы) функций 146 66. Определение непрерывности функции в точке 146 67. Арифметические операции над непрерывными функциями 148 68. Примеры непрерывных функций 148 69. Односторонняя непрерывность. Классификация разрывов 150 70. Примеры разрывных функций 151 71. Непрерывность и разрывы монотонной функции 154 72. Непрерывность элементарных функций 155 73. Суперпозиция непрерывных функций 156 74. Решение одного функционального уравнения 157 75. Функциональная характеристика показательной, логарифмической и степенной функций 76. Функциональная характеристика тригонометрического и гиперболического косинусов 77. Использование непрерывности функций для вычисления пределов 162 78. Степенно-показательные выражения 165 79. Примеры 166 § 5. Свойства непрерывных функций 168 80. Теорема об обращении функции в нуль 168 81. Применение к решению уравнений 170 82. Теорема о промежуточном значении 171
83. Существование обратной функции 172 84. Теорема об ограниченности функции 174 85. Наибольшее и наименьшее значения функции 175 86. Понятие равномерной непрерывности 178 87. Теорема Кантора 179 8 8. Лемма Боре ля 180 89. Новые доказательства основных теорем 182 ГЛАВА ТРЕТЬЯ. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ § 1. Производная и ее вычисление 186 90. Задача о вычислении скорости движущейся точки 186 91. Задача о проведении касательной к кривой 187 92. Определение производной 189 93. Примеры вычисления производных 193 94. Производная обратной функции 196 95. Сводка формул для производных 198 96. Формула для приращения функции 198 97. Простейшие правила вычисления производных 199 98. Производная сложной функции 202 99. Примеры 203 100. Односторонние производные 209 101. Бесконечные производные 209 102. Дальнейшие примеры особых случаев 211 § 2. Дифференциал 211 103. Определение дифференциала 211 104. Связь между дифференцируемостью и существованием производной 105. Основные формулы и правила дифференцирования 215 106. Инвариантность формы дифференциала 216 107. Дифференциалы как источник приближенных формул 218 108. Применение дифференциалов при оценке погрешностей 220 § 3. Основные теоремы дифференциального исчисления 223 109. Теорема Ферма 223 ПО. Теорема Дарбу 224 111. Теорема Ролля 225 112. Формула Лагранжа 226
113. Предел производной 228 114. Формула Коши 229 § 4. Производные и дифференциалы высших порядков 231 115. Определение производных высших порядков 231 116. Общие формулы для производных любого порядка 232 117. Формула Лейбница 236 118. Примеры 238 119. Дифференциалы высших порядков 241 120. Нарушение инвариантности формы для дифференциалов высших порядков 121. Параметрическое дифференцирование 243 122. Конечные разности 244 § 5. Формула Тейлора 246 123. Формула Тейлора для многочлена 246 124. Разложение произвольной функции; дополнительный член в форме _ Пеано 248 125. Примеры 251 126. Другие формы дополнительного члена 254 127. Приближенные формулы 257 § 6. Интерполирование 263 128. Простейшая задача интерполирования. Формула Лагранжа 263 129. Дополнительный член формулы Лагранжа 264 130. Интерполирование с кратными узлами. Формула Эрмита 265 ГЛАВА ЧЕТВЕРТАЯ. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ § 1. Изучение хода изменения функции 268 131. Условие постоянства функции 268 132. Условие монотонности функции 270 133. Доказательство неравенств 273 134. Максимумы и минимумы; необходимые условия 276 135. Достаточные условия. Первое правило 278 136. Примеры 280 137. Второе правило 284 138. Использование высших производных 286 139. Разыскание наибольших и наименьших значений 288
140. Задачи 290 § 2. Выпуклые (и вогнутые) функции 294 141. Определение выпуклой (вогнутой) функции 294 142. Простейшие предложения о выпуклых функциях 296 143. Условия выпуклости функции 298 144. Неравенство Йенсена и его приложения 301 145. Точки перегиба 303 § 3. Построение графиков функций 305 146. Постановка задачи 305 147. Схема построения графика. Примеры 306 148. Бесконечные разрывы, бесконечный промежуток. Асимптоты 308 149. Примеры 311 § 4. Раскрытие неопределенностей 314 150. Неопределенность вида 0/0 314 151. Неопределенность вида оо / оо 320 152. Другие виды неопределенностей 322 § 5. Приближенное решение уравнении 324 153. Вводные замечания 3 24 154. Правило пропорциональных частей (метод хорд) 325 155. Правило Ньютона (метод касательных) 328 156. Примеры и упражнения 331 157. Комбинированный метод 335 158. Примеры и упражнения 336 ГЛАВА ПЯТАЯ. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ § 1. Основные понятия 340 159. Функциональная зависимость между переменными. Примеры 340 160. Функции двух переменных и области их определения 341 161. Арифметическое n-мерное пространство 345 162. Примеры областей в n-мерном пространстве 348 163. Общее определение открытой и замкнутой области 350 164. Функции п переменных 352 165. Предел функции нескольких переменных 354 166. Сведение к случаю варианты 356 167. Примеры 358 168. Повторные пределы 360
§ 2. Непрерывные функции 362 169. Непрерывность и разрывы функций нескольких переменных 362 170. Операции над непрерывными функциями 364 171. Функции, непрерывные в области. Теоремы Больцано—Коши 365 172. Лемма Больцано—Вейерштрасса 367 173. Теоремы Вейерштрасса 3 69 174. Равномерная непрерывность 370 175. Лемма Боре ля 372 176. Новые доказательства основных теорем 373 176. Производные и дифференциалы функций нескольких переменных 373 177. Частные производные и частные дифференциалы 375 178. Полное приращение функции 378 179. Полный дифференциал 381 180. Геометрическая интерпретация для случая функции двух переменных 181. Производные от сложных функций 386 182. Примеры 388 183. Формула конечных приращений 390 184. Производная по заданному направлению 391 185. Инвариантность формы (первого) дифференциала 394 186. Применение полного дифференциала в приближенных вычислениях 396 187. Однородные функции 399 188. Формула Эйлера 400 § 4. Производные в дифференциалы высших порядков 402 189. Производные высших порядков 402 190. Теорема о смешанных производных 404 191. Обобщение 407 192. Производные высших порядков от сложной функции 408 193. Дифференциалы высших порядков 410 194. Дифференциалы сложных функций 413 195. Формула Тейлора 414 § 5. Экстремумы, наибольшие и наименьшие значения 417 196. Экстремумы функции нескольких переменных. Необходимые условия 197. Достаточные условия (случай функции двух переменных) 419
198. Достаточные условия (общий случай) 422 199. Условия отсутствия экстремума 425 200. Наибольшее и наименьшее значения функций. Примеры 427 201. Задачи 431 ГЛАВА ШЕСТАЯ. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ § 1. Формальные свойства функциональных определителей 441 202. Определение функциональных определителей (якобианов) 441 203. Умножение якобианов 442 204. Умножение функциональных матриц (матриц Якоби) 444 § 2. Неявные функции 447 205. Понятие неявной функции от одной переменной 447 206. Существование неявной функции 449 207. Дифференцируемость неявной функции 451 208. Неявные функции от нескольких переменных 453 209. Вычисление производных неявных функций 460 210. Примеры 463 § 3. Некоторые приложения теории неявных функции 467 211. Относительные экстремумы 467 212. Метод неопределенных множителей Лагранжа 470 213. Достаточные для относительного экстремума условия 472 214. Примеры и задачи 473 215. Понятие независимости функций 477 216. Ранг матрицы Якоби 479 § 4. Замена переменных 483 217. Функции одной переменной 483 218. Примеры 485 219. Функции нескольких переменных. Замена независимых переменных 220. Метод вычисления дифференциалов 489 221. Общий случай замены переменных 491 222. Примеры 493 ГЛАВА СЕДЬМАЯ. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ К ГЕОМЕТРИИ § 1. Аналитическое представление кривых и поверхностей 503
223. Кривые на плоскости (в прямоугольных координатах) 503 224. Примеры 505 225. Кривые механического происхождения 508 226. Кривые на плоскости (в полярных координатах). Примеры 511 227. Поверхности и кривые в пространстве 516 228. Параметрическое представление 518 229. Примеры 520 § 2. Касательная и касательная плоскость 523 230. Касательная к плоской кривой в прямоугольных координатах 523 231. Примеры 525 232. Касательная в полярных координатах 528 233. Примеры 529 234. Касательная к пространственной кривой. Касательная плоскость к поверхности 235. Примеры 534 236. Особые точки плоских кривых 535 237. Случай параметрического задания кривой 540 § 3. Касание кривых между собой 542 238. Огибающая семейства кривых 542 239. Примеры 545 240. Характеристические точки 549 241. Порядок касания двух кривых 551 242. Случай неявного задания одной из кривых 553 243. Соприкасающаяся кривая 554 244. Другой подход к соприкасающимся кривым 556 § 4. Длина плоской кривой 557 245. Леммы 557 246. Направление на кривой 558 247. Длина кривой. Аддитивность длины дуги 560 248. Достаточные условия спрямляемости. Дифференциал дуги 562 249. Дуга в роли параметра. Положительное направление касательной 565 § 5. Кривизна плоской кривой 568 250. Понятие кривизны 568 251. Круг кривизны и радиус кривизны 571 252. Примеры 573
253. Координаты центра кривизны 577 254. Определение эволюты и эвольвенты; разыскание эволюты 578 255. Свойства эволют и эвольвент 581 256. Разыскание эвольвент 585 ДОПОЛНЕНИЕ. ЗАДАЧА РАСПРОСТРАНЕНИЯ ФУНКЦИЙ 257. Случай функции одной переменной 587 258. Постановка задачи для двумерного случая 588 259. Вспомогательные предложения 590 260. Основная теорема о распространении 594 261. Обобщение 595 262. Заключительные замечания 597 Алфавитный указатель Алфавитный указатель Бесконечно большая величина 54, 117 --классификация 145 --порядок 145 - малая величина 47, 117 --высшего порядка [обозначение Абсолютная величина 14, 31, 34 Абсолютный экстремум 469 Алгебраическая функция 448 Аналитический способ задания функции 97, 98 Аналитическое выражение функции 98 - представление кривых 503, 517 - - поверхностей 517 Аномалия (эксцентрическая) планеты 174 Аргумент функции 95, 341 Арифметическое значение корня (радикала) 36,103 - пространство 345 Арксинус, арккосинус и т. д. 110 Архимед 64 Архимеда аксиома 16, 34 Архимедова спираль 512, 529 Асимптота 309 Асимптотическая точка 513, 514 Астроида 506, 511, 526, 546, 573, 583 Барометрическая формула 95 Бернулли, Иоанн 206, 314 - Яков 38 - лемниската 515, 530, 575, 577 Бесконечная десятичная дробь 22 - производная 209 600 О(а)] 136, 137 ---классификация 136 ---леммы 57 ---порядок 137 ---эквивалентность 139 Бесконечность (+оо,-оо) 26, 55 Бесконечный промежуток 94, 308 - разрыв 309 Бойля—Мариотта закон 94 Больцано 84 Больцано метод 88 Больцано—Вейерштрасса лемма 87, 367 Больцано—Коши теоремы 1-я и 2- я 168, 171, 182,366 - - условие 84, 134 Бореля лемма 181, 372 Варианта 44, 344 - возрастающая (неубывающая) 70 - имеющая предел 52 - как функция значка 96
- монотонная 70 - ограниченная 53 - убывающая (невозрастающая) 70 Вейерпгграсса—Больцано лемма 87, 367 - теоремы 1-я и 2- я 175, 176, 183, 369, 370, 373 Вертикальная асимптота 309 Верхняя граница числового множества 26 - — точная 26 Вещественные числа 19 - - вычитание 31 - - деление 34 - - десятичное приближение 22 - - непрерывность области 24 - - плотность (усиленная) области 21 - - равенство 19 - - сложение 28 - - умножение 31 - - упорядочение области 19 Вивиани кривая 521, 535 Винтовая линия 521, 534 - поверхность 523, 535 Вложенные промежутки, лемма 83 Внутренняя точка множества 350 Вогнутые (выпуклые вверх) функции или кривые 295 - — условия вогнутости 298 - строго функции или кривые 298 Возврата точка 539, 541 Возрастающая варианта 70 - функция 133 Вращения поверхность 522 Выпуклые (выпуклые вниз) функции или кривые 294 - — условия выпуклости 298 - строго функции или кривые 298 Высшего порядка бесконечно малые [обозначение о(а)] 136,137 - - дифференциалы 241 ---функции нескольких переменных 410 - - производные 231, 232 ---связь с конечными разностями 245 ---частные 402 Гармоническое колебание 208 Гаусс 74, 439 Гельдера—Коши неравенство 275, 302 Географические координаты 522 Геометрическое истолкование дифференциала 214 - - полного дифференциала 386 - - производной 190 Гипербола 506, 575, 580 -равнобочная 102, 103 Гиперболическая спираль 529 Гиперболические синус, косинус и т. Д. Ю7 - функции, непрерывность 149 - - обратные 108—109 - - производные 205 Гипоциклоида 509 Главная ветвь (главное значение) арксинуса, арккосинуса и т. д. ПО, 114 - часть (главный член) бесконечно малой 141 Гладкая кривая 594 Горизонтальная асимптота 309 Градиент функции 394 Граница области 351 - числового множества (верхняя, нижняя) 25—28 ---точная 26 График функции 100 - - построение 305 - - пространственный 343 Гюйгенса формула 260 Дарбу теорема 224 Движения уравнение 187 Двойная точка кривой 538 Двойной предел функции 360 Двух переменных функция 341 Дедекинд 17 Дедекинда основная теорема 25
Действительные числа, см. Вещественные числа Декартов лист 507, 538 Десятичное приближение вещественного числа 22 Десятичные логарифмы 79 Диаметр точечного множества 371 Дирихле функция 99, 102, 153 Дискриминантная кривая 545, 550 Дифференциал 211, 215 - порядка, 1-го, 2-го, тг-го 241 - геометрическое истолкование 214 - дуги 562, 567 - инвариантность формы 216 - полный 382 - - порядка, 1-го, 2-го, и-го 410 - - геометрическое истолкование 386 - - инвариантность формы 394 - - метод вычисления (при замене переменных) 489 - применение к приближенным вычислениям 218, 220, 396 - частный 378, 411 Дифференцирование 215 - параметрическое 243 - правила 215, 395 Дифференцируемая функция 212, 382 Дифференцируемость неявной функции 451 Длина отрезков 40 - плоской кривой 560 ---аддитивность 560 - пространственной кривой 567 Дополнительный член формулы Тейлора 249, 257, 415 — Лагранжа 263 ---Эрмита 266 Дробная рациональная функция 103 ---непрерывность 148 ---нескольких переменных 353 е (число) 78, 148 - иррациональность 82 - приближенное вычисление 81 Единица 14, 32 Зависимые функции 478 Замена переменных 483 Замкнутая область 351 - сфера 351 Замкнутое множество 351 Замкнутый параллелепипед 351 Замкнутый промежуток 93 - симплекс 351 Заострения точка 539 Затухающее колебание 208, 282 Знаков правило (при умножении) 16, 32 Йенсен 295 Йенсена неравенство 301 Измерение отрезков 40 Изолированная точка кривой 536, 539 Инвариантность формы дифференциала 216, 394 Интерполирование 263 Интерполирования узлы 263 - - кратные 266 Интерполяционная формула Лагранжа 263 ---дополнительный член 265 - - Эрмита 266 ---дополнительный член 267 Иррациональные числа 19 Кантора теорема 179, 184, 370, 374 Кардиоида 510, 515, 530 Касание кривых 542 - - порядок 551 Касательная 188, 210, 386, 523, 530, 533,555 - односторонняя 209 - отрезок 524 - - полярный 528 - плоскость 384, 532 - положительное направление 567 Касательное преобразование 485, 487, 493, 500 Касательных метод (приближенного решения уравнений) 328 Кассини овал 515 Квадратичная форма 423
- - наибольшее и наименьшее значения 476 - - неопределенная 425 - - определенная 423 - - полуопределенная 427 Кеплера уравнение 174 Клапейрона формула 340, 377 Класс гладкой кривой 594 Классификация бесконечно больших 145 - - малых 136 Классы функций 102 Колебание гармоническое 208 - затухающее 208, 282 - функции 177, 370 Комбинированный метод (приближенного решения уравнений)335 Компрессор 433 Конечные разности 244 Конечных приращений формула 227, 390 Конус го, порядка, 2, 535 Координатные линии (поверхности) 520 Координаты «-мерной точки 345 Корень из вещественного числа, существование 35 - уравнения (функции), существование 170 - - приближенное вычисление 170, 324 Косинус 103 - функциональная характеристика 160 - гиперболический 107 - - функциональная характеристика 160 Косеканс 103 Котангенс 103 - гиперболический 107 Коши 67, 69, 84, 192 Коши—Больцано теоремы 1-я и 2-я 168, 171, 182,366 - - условие 84, 134 - форма дополнительного члена 257 - формула 229 Кратная точка кривой 505, 519, 538, 540 Кривизна 568 - круг 571 - радиус 571 - средняя 568 - центр 571 Кривые, см. соответствующее название - в пространстве 517, 518 - в «-мерном пространстве 347 - на плоскости 503, 508, 511 - переходные 576 Кронекер 99 Куб «-мерный 348 Кусочно-гладкая кривая 595 Лагранж 192, 257, 470 Лагранжа интерполяционная формула 263 ---дополнительный член 265 - теорема, формула 226, 227 - форма дополнительного члена 257, 415 Лебег 181 Лежандра многочлены 240 Лежандра преобразование 487, 499, 500 Лейбниц 192, 215, 241 Лейбница формула 238, 241 Лемниската Бернулли 515, 530, 575, 577 Логарифм, существование 39 - десятичный 50, 79 - натуральный (или неперов) 78 - - переход к десятичному 79 Логарифмическая спираль 514, 529, 574, 581 - функция 103 - - непрерывность 155, 174 - - производная 195, 197
- - функциональная характеристика 159 Ломаная (в «-мерном пространстве) 347 Лопиталя правило 314, 320 Маклорена формула 247, 251 Максимум, см. Экстремум Матрица функциональная (Якоби) 444, 478 --ранг 468, 471,479 Матрицы умножения 444 Мерз 44 Минимум, см. Экстремум Минковского неравенство 276 Многозначная функция 96, 109, 341, 447, 453 Множество точек замкнутое 351 - - ограниченное 352 - числовое, ограниченное сверху, снизу 26 Множители неопределенные, метод 470 Модуль перехода от натуральных логарифмов к десятичным 79 Монотонная варианта 70 - функция 133 - - непрерывность, разрывы 154 Монотонности функции условие 270 п переменных функция 352 «-кратная точка кривой 540 «-кратный предел 360 «-мерная сфера 349, 351 «-мерное пространство 345 «-мерный параллелепипед 348, 351 «-мерный симплекс 349, 351 Наибольшее значение функции 176, 286 — нескольких переменных 427 Наибольший предел варианты 89 - - функции 136 Наименьшее значение функции 176, 289 — нескольких переменных 427 Наименьший предел варианты 89 - - функции 136 Наименьших квадратов метод 438 Наклонная асимптота 310 Наложение функций 114 Направление на кривой 558 Натуральный логарифм 78 Независимость функций 478 Независимые переменные 94, 341, 352 Неопределенности раскрытие 62, 314 - вида 0/0 60, 314 - - оо/оо 61, 320 - - 0 * со 61,322 - - оо-оо 62, 323 - - Г°,0°,оо° 166,323 Неопределенные множители, метод 470 Непер, неперовы логарифмы 78 Непрерывность области вещественных чисел 24 - прямой 42 - функции в области 365 - - в промежутке 148 - - в точке 146, 362 - - односторонняя 150 - - равномерная 178, 370 Непрерывные функции, операции над ними 148, 364 - - свойства 168—185, 365—374 - - суперпозиция 114, 364 Неравенства, доказательство 122, 273, 302 Неравенство Коши 275, 346 - Коши—Гельдера 275, 302 - Йенсена 301 - Минковского 276 Несобственные числа (точки) 26, 55, 355 Неявные функции 447, 453 - - вычисление производных 460 - - существование и свойства 449, 451,453
Нижняя граница числового множества 26 - — точная 26 Нормаль к кривой 523 ---отрезок 524 - — полярный 528 Нормаль к поверхности 532, 534 Ньютона метод (приближенного решения уравнений) 328 Относительный экстремум 467 Отрезок, измерение 40 - касательной, нормали 524 — полярный 528 Оценка погрешностей 220, 396 Область в «-мерном пространстве 350 - изменения переменной (переменных) 95, 341 - замкнутая 351 - определения функции 95, 341 - открытая 350 - связная 352 Обратная функция 108 - - непрерывность 172 - - производная 196 - - существование 172 Обратные тригонометрические функции ПО — непрерывность 156, 174 ---производные 197 Обыкновенная точка (кривой или поверхности)504, 505, 520 Овалы Кассини 515 Огибающая семейства кривых 543 Ограниченная варианта 53 Ограниченное множество точечное 352 - - числовое 26 Ограниченность непрерывной функции, теоремы 175, 183, 369, 373 Однозначная функция 96, 341 Однородная функция 399 Односторонние непрерывность и разрывы функции 150 Односторонняя касательная 209 - производная 209 - - высшего порядка 232 Окрестность точки 115 - - «-мерная 348, 349 Определитель, производная 388 - функциональный (Якоби) 441 Особая точка (кривой или поверхности) 504, 505, 517, 518, 519, 531,533,535, 537 - - изолированная 536 - - двойная 538 - - кратная 505, 519, 538, 540 Остроградский 442 Открытая область 350 - сфера 349, 350 Открытый промежуток 93 - параллелепипед 348, 350 - симплекс 349, 350 Относительная погрешность 140, 218, 397 Парабола 64, 103, 525, 546, 575, 579 Параболоид вращения 344 Параллелепипед «-мерный 348 Параметр 217, 504 Параметрическое дифференцирование 243 - представление кривой 217, 504, 512 ---в пространстве 518 - - поверхности 519 Пеано форма дополнительного члена 249 Перегиба точка 303 Переменная 43, 93 - независимая 94, 341, 352 Переменных замена 483 Переместительное свойство сложения, умножения 12, 14, 29, 32 Перестановка дифференцировании 405, 407 - предельных переходов 361, 406
Переходные кривые 576 Периодическая десятичная дробь 24 Поверхность 343, 517, 519 - вращения 522 Повторный предел функции нескольких переменных 360 Подкасательная 207, 524 - полярная 528 Поднормаль 524 - полярная 528 Подпоследовательность 85 Пограничная точка 351 Погрешность абсолютная, относительная 139, 140, 218, 221, 397 Показательная функция 103 - - непрерывность 149, 155 - - производная 194 - - функциональная характеристика 158 Полное приращение функции 378 Полный дифференциал 381, 396 - - высшего порядка 410, 413 - - геометрическая интерпретация 386 - - инвариантность формы 394 - - применения к приближенным вычислениям 396 Полукубическая парабола 506, 540, 548, 579 Полуоткрытый промежуток 93 Полярная подкасательная, поднормаль 528 Полярное уравнение кривой 511 Полярные координаты 493, 495, 512 Полярный отрезок касательной, нормали 528 Порядок бесконечно большой величины 145 - - малой величины 137 - дифференциала 241 - касания кривых 551 - производной 231 Последовательность 44 Постоянства функции условие 268 Правило, см. соответствующее название Предел варианты 46, 48 - - бесконечный 55 - - единственность 54 - - монотонной 71 - - наибольший, наименьший 89 - - частичный 86 - отношения 59 - произведения 59 - производной 228 - разности 59 - суммы 59 - функции 115, 117 - - монотонной 139 - - наибольший, наименьший 135 - - нескольких переменных 354, 357 - — повторный 360 - - частичный 135 Предельный переход в равенстве, в неравенстве 56 Преобразование Лежандра 487, 499, 500 - точечное (плоскости, пространства) 485, 493 Приближенное решение уравнения 324 Приближенные вычисления, применение дифференциала 218, 220, 396 Приближенные формулы 140, 143, 218, 257—263 Приращение переменной 147 - функции, формула 199 - нескольких переменных полное, формула 379 ----частное 375 Приращений конечных формула 227, 390 Произведение вариант, предел 59, 61 - функций, предел 129, 130 - - непрерывность 148, 364 - - производная и дифференциал 200, 216, 236, 241, 395
Произведение чисел 14, 31 Производная см, также, название, функции, 189 - бесконечная 209 - высшего порядка 231 ---связь с конечными разностями 245 - геометрическое истолкование 190 - несуществование 211 - односторонняя 209 - по заданному направлению 391 - правила вычисления 199 - разрыв 211 - частная 375 - - высшего порядка 402 Промежуток 82 - замкнутый, полуоткрытый, открытый, конечный, бесконечный 93, 94 Промежуточное значение, теорема 171 Пропорциональных частей, правило 325 Простая точка (кривой или поверхности)505, 520 Пространственный график функции 343 Пространство «-мерное (арифметическое) 345 Прямая в «-мерном пространстве 347 Равномерная непрерывность функции 178, 370 Радикал, арифметическое значение 36, 103 Радиус кривизны 571 Разность вариант и т. д., см. Сумма - чисел 13, 31 Разрыв производной 211 - функции 146 - - монотонной 154 - - обыкновенный, рода, го, и, го, 1, 2, 151 - - нескольких переменных 362 Ранг матрицы 468, 471, 479 Раскрытие неопределенностей 62, 314 Распределительное свойство умножения 15, 34 Распространение функций 587 Расстояние между точками в п- мерном пространстве 345 Рациональная функция 102 - - непрерывность 148 - - нескольких переменных 353 - — непрерывность 358, 563 Рациональные числа, вычитание 13 Рациональные числа деление 15 - - плотность 12 - - сложение 12 - - умножение 14 - - упорядочение 12 Риман 154 Ролля теорема 225 Роша и Шлемильха форма дополнительного члена 257 Связи уравнения 467 Связная область 352 Сгущения точка 115, 116, 117, 351 Секанс 103 Семейство кривых 542 Сечение в числовой области 17, 24 Сигнум (функция) 29 Сила тока 192 Сильвестр 423 Симплекс «-мерный 349, 351 Синус 103 - гиперболический 107 - предел отношения к дуге 122 Синусоида 106, 304 Скорость движения точки 186 - в данный момент 187, 190 - средняя 186 Сложная функция 115, 353 - - непрерывность 156, 365 - - производные и дифференциалы 202, 216, 242, 386, 395, 413, 414 Смешанные производные, теорема 404
Соприкасающаяся кривая 554 - прямая 555 Соприкасающийся круг 555, 571 Сочетательное свойство сложения, умножения 13, 14, 29, 32 Сравнение бесконечно малых 136 Среднее арифметико-гармоническое 74 ---геометрическое 74 - арифметическое 275, 430 - гармоническое 74, 303 - геометрическое 74, 275, 303, 430 - значение, теорема 227 - - обобщенная теорема 230 Средняя кривизна 568 - скорость 186, 190 Стационарная точка 277, 418 Степенная функция 103 - - непрерывность 156 - - производная 194 - - функциональная характеристика 158 Степенно-показательная функция (двух переменных) 353 Степенно-показательная функция предел 358, 359 - — непрерывность 363 - — дифференцирование 376 Степенно-показательное выражение, предел 165 - — производная 206, 388 Степень с вещественным показателем 37 Сумма вариант, предел 59, 62 - функций, предел 129, 130 - функций, непрерывность 148, 364 - - производная и дифференциал 200, 216, 233,395 - чисел 12, 28 Суперпозиция функций 114, 353, 364 Сфера 344 - «-мерная 349, 350 Сферические координаты 495 Сходимости принцип 84, 134 Табличный способ задания функции 97 Тангенс 103 - гиперболический 107 Тело геометрическое 345 Теплоемкость 191 Точка, см. соответствующее название Точки функции 352 Точная граница (верхняя, нижняя) 26 Тригонометрические функции 103 - - непрерывность 149 - - производные 195 Тройная точка 540 Тройной предел 360 Тейлора формула 246, 249, 257, 415 Убывающая варианта 70 - функция 133 Угловая точка 209 Узлы интерполирования 263 - - кратные 266 Уитней 590 Улитка 514, 529 Уравнение кривой 100, 230, 503, 511, 518 - поверхности 343, 517, 519 - приближенное решение 170, 324 - существование корней 170 Ускорение 191, 231 Ферма теорема 223 Форма квадратичная 423 Формула см, также, соответствующее, название, 97, 98 Функциональная зависимость 94, 340 - матрица 444, 478 Функциональное уравнение 157, 158, 160 Функциональный определитель 441 Функция см, также, название, функции, 95 - исследование 268 - нескольких переменных 341, 352 - от функции (или от функций) 115, 353
Характеристическая точка на кривой 539 Хестинс 590 Ход изменения функции 268 Хорд метод приближенного решения уравнений 325 Целая рациональная функция 102 — непрерывность 149 ---несколько переменных 353 -----непрерывность 358, 363 - часть числа [Др)] 48 Центр кривизны 571, 577 Цепная линия 207, 505, 573 Циклоида 508, 526, 574, 581 Цилиндр проектирующий 518 Частичная последовательность 85 Частичный предел варианты 86 - - функции 135 Частная производная 375 - - высшего порядка 402 Частное вариант, предел 59, 60 - значение функции 96 - приращение 375 - функций, предел 129, 130 - - непрерывность 148, 364 - - производная и дифференциал 201, 216, 395 - чисел 15 Частный дифференциал 378, 411 Чебышева формула 262 Числа, см. Рациональные, Иррациональные, Вещественные числа Числовая ось 42 - последовательность 44 Шварц 407 Шлемильха и Роша форма дополнительного члена 257 Штольца теорема 67 Эвольвента 578, 582—583, 585 -круга511, 527, 574 Эволюта 579, 582, 583, 585 Эйлер 78 Эйлера формула 401 Эквивалентные бесконечно малые величины (знак ~) 139 Экстремум (максимум, минимум) 277 - правила отыскания 277, 278, 284, 287 - собственный, несобственный 277 - функции нескольких переменных 417 ----абсолютный 469 ----относительный 467 Электрическая сеть 436, 474 Элементарные функции 102 - - непрерывность 155 - - производные 193, 197, 233 Эллипс 448, 506, 525, 547, 575, 579 Эллипсоид 535 Эрмита интерполяционная формула 266 ----дополнительный член 267 Эпициклоида 509, 527 Якоби 376 - матрица 444, 478 - определитель (якобиан) 441
ВВЕДЕНИЕ ВЕЩЕСТВЕННЫЕ ЧИСЛА § 1. Область рациональных чисел 1. Предварительные замечания. Из школьного курса читателю хорошо знакомы рациональные числа и их свойства. В то же время, уже потребности элементарной математики приводят к необходимости расширения этой числовой области. Действительно, среди рациональ.т ных чисел не существует зачастую корней даже из целых положи- тельных (натуральных) чисел, например, }/2, т. е. нет такой рацио- нальной дроби (где р и q — натуральные числа), квадрат ко- торой был бы равен 2. Для доказательства этого допустим противное: пусть существует такая дробь у, что = 2. Мы вправе считать эту дробь несо- кратимой, т. е. р и q лишёнными общих множителей. Так как pi = 2q‘it то р есть число чётное: р=2г (г—целое) и, следовательно, q — нечётное. Подставляя вместо р его выражение, найдём: ^* = 2г4, откуда следует, что q — чётное число. Полученное противоречие доказывает наше утверждение. Одновременно с этим, если бы мы оставались в области одних лишь рациональных чисел, в геометрии заведомо не все отрезки могли бы быть снабжены длинами. В самом деле, рассмотрим квадрат со стороной, равной единице длины. Его диагональ не мо- жет иметь рациональной длины £, ибо, в противном случае, по теореме Пифагора, квадрат этой длины был бы равен 2, что, как мы видели, невозможно. В настоящем введении мы ставим себе задачей расширить область рациональных чисел, присоединив к ним числа новой природы — иррациональные. Вместе с тем мы покажем, что в расширенной области останутся справедливыми все привычные свойства рациональ- ных чисел, относящиеся к арифметическим действиям над ними и к сочетанию их с помощью знаков равенства и неравенства. Для того чтобы сделать реально возможной проверку упомянутых свойств для расширенной числовой области, очень важно выделить наименьшее
12 ВВЕДЕНИЕ. ВЕЩЕСТВЕННЫЕ ЧИСЛА [3 количество основных свойств, из которых все остальные выте- кали бы уже как формально-логические следствия: тогда про- верке будут подлежать лишь эти основные свой- ства. В связи с этим мы приводим ниже перечень основных свойств области рациональных чисел. Попутно мы на ряде примеров показы- ваем, как другие известные их свойства выводятся из основных совершенно формально. Говоря о «числах», мы здесь всегда имеем в виду рациональные числа: буквы а, b и т. д. обозначают именно их. 2. Упорядочение области рациональных чисел. Условимся с са- мого начала, что равные числа мы будем- рассматривать, как одно и то же число в разных формах. Иными словами, для нас понятие «равно» (=) означает «тождественно». Поэтому мы не пере- числяем свойств равных чисел. Упорядочение рациональных чисел достигается с помощью понятия «больше» О), с которым связана первая группа свойств: I 1° для каждой пары чисел а и b имеет место одно, и только одно, из соотношений а = Ь, а~^>Ь, Ь^>а‘ I 2° из а~^>Ь и Ь~^>с следует а^>с (транзитивное свой- ство знака I 3° если а~^>Ь, то найдётся также такое число с, что а^>с и с^> Ь* (свойство плотности). Понятие «меньше» «) вводится уже как производное. Именно, Говорят, что а<^Ь в том, и только в том, случае, если Ь">а. Легко видеть, что из а<^Ь и Ь<^с следует, что а<^с (транзитивное свойство знака <Q. Действительно, неравенства а b и b <4 с равно- сильны, по условию, неравенствам Ь~^>а и сотсюда следует с^>а (I 2°) или, что то же, а<^с. Дальнейшие свойства понятия «больше», связанные с арифмети- ческими действиями над рациональными числами, будут указаны ниже. 3. Сложение и вычитание рациональных чисел. Вторая группа свойств связана со сложением, т, е. с операцией нахож- дения суммы двух чисел. Дла каждой пары чисел а и b существует (единственное) число, называемое суммой ан b (его обозначают а 4-6). Это понятие обладает свойствами: II 1° a-\-b = b а (переместительное свойство сло- жения)', * В этих условиях говорят также, что число с лежит между числами а и Ь; очевидно, таких чисел будет бесчисленное множество.
3] § 1. ОБЛАСТЬ РАЦИОНАЛЬНЫХ ЧИСЕЛ 13 II 2° (a -J- Z>) -J- с = а -|- (6 -J- с) (сочетательное свойство сложения). Особая роль нуля характеризуется свойством: И 3° а-}-0 = а; кроме того, II 4° для каждого числа а существует число — а (симме- тричное ему), такое, что а-|-(—а) = 0. На основе этих свойств, прежде всего, исчерпывается вопрос о вычитании, как действии, обратном сложению. Если разностью чисел а и Ь, как обычно, называть такое число с, для которого с b = а *, то встаёт вопрос о существовании такого числа и о его единственности. Положив с = а-|-(—Ь), получим [II 2°, 1°, 4°, 3°]: с + й = [а + (_й)] + й==а + [(_й) + й] = = а -|- \Ь -|- (— 6)] = a -j- 0 = а, так что это число с удовлетворяет определению разности. Пусть, обратно, с' есть разность чисел а и Ь, так что с’ b = а. Прибавив к обеим частям этого равенства по (—Ь) и преобразуя левую часть [II 2°, 4°, 3°]: (с’+ь)+(- ь)=е+\ь+(- эд=+о=с’, заключим, что с' = а -(- (—Ь) = с. Таким образом, доказаны существование и однознач- ность разности чисел а и Ь\ обозначают её а — Ь. Из однозначности разности вытекает ряд следствий. Прежде всего, из II 3° следует 0 = а— а, и мы заключаем, что, кроме числа 0, не существует числа, которое обладало бы свойством, аналогичным II 3°. Далее, отсюда же вытекает единственность числа, симметричного данному: —а = 0— а. Так как из а -)- (—я) = 0 следует (—a)-J-a = 0 [II 1°], то ока- зывается, что а — — (—а), т. е. числа а и—а являются взаимно симметричными. Установим ещё такое свойство симметричных чисел: - (а-|-й) = (-а)-[-(-&); для этого достаточно доказать, что («+*)+[(-а)+(-*)]=о, а это вытекает из II 1°, 2°, 4°, 3°. Наконец, приведём ещё одно свойство, связывающее знак со знаком суммы: II 5° из а^>Ь следует а -|-сb -|-с. * Ввиду II 1°, это равенство, определяющее разность, можно написать и так: Ь-\-с = а.
14 ВВЕДЕНИЕ. ВЕЩЕСТВЕННЫЕ ЧИСЛА 14 Оно устанавливает право к обеим частям неравенства прибавлять поровну; с его помощью доказывается равносильность неравенств а=-Ь и а-Ь>0. Далее, из а>Ъ следует -а< -Ъ. Действительно, а>Ь влечет за собой а-Ь>0; но а-Ь = а + (-2>) = (-Ь)+ «=(-/>)+ [- (-«)] = =(-Ь)-(-а), так что неравенство это можно переписать так: (-!>)- (-а) > О, откуда -й=--аили -а-^-Ь. В частности, из а>0 следует -а<0, и из а-=0 следует -а>0. Если а#0, то из двух взаимно симметричных чисел а, -а одно (и только одно) будет больше 0; его именно и называют абсолют- ной величиной как числа а, так и числа - а, и обозначают символом а[ = |-а|. Абсолютную величину числа нуль полагают равной нулю: | 0 | = 0. На свойстве II 5° основывается возможность почленного склады- вания неравенств: из а>Ь и od следует a+ob + d. В самом деле, из а>Ь следует а + с=-Ь + с; в свою очередь, из odследует c + b^-d+b или [II 1°] b + ob + d, а тогда, в силу I 2°, окончательно получаем a+ob + d. 4. Умножение и деление рациональных чисел. Третья группа свойств связана с умножением, т. е. с операцией на- хождения произведения двух чисел. Для каждой пары чисел а и b существует (единственное) число, называемое произведе- нием а и b (его обозначают а • b или просто ab). Это понятие обла- дает свойствами: III 1° ab = ba (переместительное свойство умножения)', III 2° (ab)c—a(bc) (сочетательное свойство умножения). Особая роль единицы характеризуется свойством: III 3° а- 1=а; кроме того, III 4° для каждого числа а, отличного от 0, существует число ^(обратное ему), такое, что а-±=1. Вопрос о делении, как о действии, обратном умножению, ре- шается на основе свойств умножения так же, как выше был решен вопрос о вычитании на основе свойств сложения. Обратное число здесь будет играть ту же роль, какую там играло симметричное число.
41 § 1. ОБЛАСТЬ РАЦИОНАЛЬНЫХ ЧИСЕЛ 15 Назовем частным чисел а и b (где делитель b всегда предпо- лагается отличным от 0) такое число с, что *) С’Ь-а. 1 Этому определению можно удовлетворить, положив с=а^, так как [III 2°, 1°, 4°, 3°]: Обратно, если число с’ удовлетворяет определению частного чи- сел а и Ь, так что с'-Ь = а, то, умножив обе части этого равенства на | и преобразуя левую часть [III 2°, 4°, 3°]: , 1 получим, что с =а Таким образом, доказаны существование и одно- значность частного чисел а и b (при условии, что b # 0); обозначают его а : b или |. Из однозначности частного выводим, что, кроме числа 1, нет числа, которое обладало бы свойством, аналогичным III 3°. Затем отсюда, как и выше, вытекает единственность обратного числа (как частного 1 и а); кроме того, легко устанавливается, что числа а и ± являются взаимно обратными. Следующее свойство связывает оба основных арифметических действия - умножение и сложение: III 5° (а + Z>)‘С = а-с + Ъ-с {распределительное свойство умножения относительно суммы). Отсюда легко вывести и распределительное свойство умножения относительно разности: {а-Ъ)'С=а'С-Ъ’С. По определению разности, это прямо следует из того, что (а - Ъ) • с + Ъ • с = [(а - Ь) + Ь] • с=а • с. Применим еще свойство III 5° к доказательству того, что -0=0-Z>=0. В самом деле [II 3°] a+0 = a, {a + 0)-b = a-b + 0-b=a-b, откуда следует 0 • Ъ = 0, а также [III 1°] b • 0 = 0. *) Ввиду III 1°, это равенство, определяющее частное, можно написать и так: b • с = а.
16 ВВЕДЕНИЕ. ВЕЩЕСТВЕННЫЕ ЧИСЛА 15 Обратно, если а - Ь = 0 и Ь^О, то необходимо а=0. Действительно, а=£, но одновременно и 0 = ^ (так как Ь-0 = 0), а частное един- ственно. Наконец, укажем свойство, связывающее знак > со знаком произ- ведения: III 6° из а>Ъ и с>0 следует а-с^Ь-с. На этом основывается почленное перемножение неравенств с по- ложительными членами. Отсюда же получается, что при о>0 и Z>=-0 также и а •/>>(). Заметим, что ( - а) • Ь = - (а • Ь); это следует из того, что а • Ъ + ( - а) • Ъ = [а т ( - а)} • Ъ = 0 • b = 0. Теперь нетрудно видеть,что, еслиа<0,6>0, такчтоа= - |а|,6 = |А|,то a-Z> = (-|a|)-|Z>| = -(|a|-|Z>|)<0; то же будет при а>0, Z><0. Если же а<0, 6-=0, то а.г>=(-Н)-(-Н)=ЧН-(-Н)] = = -[-(Н-И1=1«1-Н>о. Таким образом, мы полностью восстановили известное правило знаков при умножении, которое является логическим следствием перечисленных свойств рациональных чисел. Иными словами, пра- вило знаков принудительно навязывается нам, если мы хотим соблюдения упомянутых свойств. То же можно сказать (как это выяснено выше) и относительно правила умножения на 0. Имея в своем распоряжении свойства сложения и умножения, мы теперь могли бы доказать то свойство плотности области ра- циональных чисел, которое мы сформулировали выше в числе основ- ных свойств [I 3°]. Именно, с помощью их можно показать, например, , а-уЬ , что из а>Ь следует 5. Аксиома Архимеда. Заключим наш перечень основных свойств рациональных чисел следующим простым и важным утверждением, которое не вытекает из перечисленных свойств: IV 1° каково бы ни было число с>0, существует натураль- ное число п, которое больше с {«аксиома Архимед а»). В действительности Архимедом было высказано геометри- ческое предложение, которое и известно под именем «аксиомы Архи- меда»: если на прямой даны любые два отрезка А и В, то можно А повто- рить слагаемым столько раз, чтобы сумма была больше В: А+А + ... +А=А-п>В. п раз
б] § 2. ВВЕДЕНИЕ ИРРАЦИОНАЛЬНЫХ ЧИСЕЛ 17 Если перефразировать это утверждение для положительных чисел а и Ь, то оно сведется к существованию такого натурального числа и, что а+а+ ... +а = а-п>Ъ. п раз Это неравенство, если использовать уже изученные свойства рацио- b с нальных чисел, оказывается равносильным такому: обозна- Ь < а чив частное - через с, мы и получим ту формулировку, которая дана выше. § 2. Введение иррациональных чисел. Упорядочение области вещественных чисел 6. Определение иррационального числа. Множество рациональ- ных чисел со всеми их свойствами, перечисленными в § 1, считается данным. Мы изложим теорию иррациональных чисел, следуя Дедекинду (R. Dedekind). В основе этой теории лежит понятие о сечении в области рациональных чисел. Рассмотрим разбиение множества всех рациональных чисел на два не пустые (т. е. действи- тельно содержащие хоть по одному числу) множества А, А'. Мы будем называть такое разбиение сечением, если выполняются условия: 1° каждое рациональное число попадает в одно, и только в одно *), из множеств А или А'; 2° каждое число а множества А меньше каждого числа а' мно- жества А'. Множество А называется нижним классом сечения, мно- жество А' - верхним классом. Сечение будем обозначать А | А'. Из определения сечения следует, что всякое рациональное число, меньшее числа а нижнего класса, также принадлежит нижнему классу. Аналогично, всякое рациональное число, большее числа а' верхнего класса, и само принадлежит верхнему классу. Пример 1. Определим А как множество всех рациональных чисел а, удовлетворяющих неравенству 1, а к множеству А' при- числим все числа a', для. которых а'эЛ. Легко проверить, что таким образом мы действительно получим сечение. Число 1 принадлежит классу А' и является, очевидно, в нем наименьшим числом. С другой стороны, нет наибольшего числа в классе А, так как, какое бы число а из А мы ни взяли, всегда можно *) То обстоятельство, что каждое рациональное число попадает только в один из классов, вытекает, впрочем, из требования 2°. 2 Г. М. Фихтенгольц, т. I
18 ВВЕДЕНИЕ. ВЕЩЕСТВЕННЫЕ ЧИСЛА [6 указать рациональное число аг, лежащее между ним и единицей, следовательно, большее а и тоже принадлежащее классу А. Пример 2, К нижнему классу А отнесем все рациональные числа а, меньшие или равные 1: к верхнему - рациональные числа а', большие 1: а' >1. Это также будет сечение, причем здесь в верхнем классе нет наи- меньшего числа, а в нижнем есть наибольшее (именно, 1). Пример 3. Отнесем к классу А все положительные рациональ- ные числа а, для которых а2 <2, число 0 и все отрицательные ра- циональные числа, а к классу А' - все положительные рациональные числа а', для которых а'2 >2. Как легко убедиться, мы опять получили сечение. Здесь ни в классе А нет наибольшего числа, ни в классе А' - наименьшего. Докажем, например, первое из этих утверждений (второе доказывается анало- гично). Пусть а - любое положительное число класса А, тогда а2 <2. Покажем, что можно подобрать такое целое положительное и, что 1 с так что и число а+- будет принадлежать классу А. Это неравенство равносильно таким: а2 2а £ п + п2 2а 1 п п2 fl Последнее неравенство и подавно будет выполнено, если п удов- 2а+1 л п летворит неравенству —— <2-п2, для чего достаточно взять а это всегда возможно [по «аксиоме Архимеда», IV 1°]. Итак, ка- ково бы ни было положительное число а из класса А, в этом же классе А найдется большее его число; так как для чисел a=sO это утверждение непосредственно очевидно, то никакое число класса А не является в нем наибольшим. Легко понять, что не может существовать сечение, для кото- рого одновременно в нижнем классе нашлось бы наибольшее число а0, а в верхнем классе — наименьшее а'о. Пусть, в самом деле, такое сече- ние существует. Возьмем тогда, пользуясь плотностью области рациональных чисел [I 3°], любое рациональное число с, заключаю- щееся между а0 и а'о: а0<с<а'о. Число с не может принадлежат! классу А, ибо иначе а0 не было бы наибольшим числом в этом классе и по аналогичной причине с не может принадлежать классу A’, i это противоречит свойству 1° сечения, входящему в определени! этого понятия.
7] § 2. ВВЕДЕНИЕ ИРРАЦИОНАЛЬНЫХ ЧИСЕЛ 19 Таким образом, сечения могут быть только трех видов, иллюстри- руемых как раз примерами 1, 2, 3: 1) либо в нижнем классе А нет наибольшего числа, а в верхнем классе А' есть наименьшее число г; 2) либо в нижнем классе А имеется наибольшее число г, а в верх- нем классе А’ нет наименьшего; 3) либо, наконец, ни в нижнем классе нет наибольшего числа, ни в верхнем классе - наименьшего. В первых двух случаях мы говорим, что сечение производится рациональным числом г (которое является пограничным между классами А и А’) или что сечение определяет рациональное число г. В примерах 1, 2 таким числом г была 1. В третьем случае пограничного числа не существует, сечение не определяет никакого рационального числа. Введем теперь новые объекты - иррацио- нальные числа, условившись говорить, что всякое сечение вида 3) определяет некоторое иррациональное число а. Это число а заменяет недостающее пограничное число, мы как бы вставляем его между всеми числами а класса А и всеми числами а' класса А'. В примере 3) это вновь созданное число, как легко догадаться, и бу- дет /2. Не вводя для иррациональных чисел никаких однотипных обозна- чений *), мы неизменно будем связывать иррациональное число а с тем сечением А]А' в области рациональных чисел, которое его опреде- ляет. Для однообразия нам часто удобно будет то же сделать и по от- ношению к рациональному числу г. Но для каждого числа г суще- ствует два определяющих его сечения: в обоих случаях числа а<г относятся к нижнему классу, числа же а'>г - к верхнему, но само число г можно по произволу включить либо в нижний класс (тогда г там будет наибольшим), либо в верхний (и г там будет наименьшим). Для определенности мы условимся раз навсегда, говоря о сечении, определяющем рациональное число г, включать это число в верх- ний класс. Числа рациональные и иррациональные получили общее название вещественных (или действительных) чисел. Понятие вещественного числа является одним из основных понятий математи- ческого анализа. 7. Упорядочение области вещественных чисел. Два ирра- циональных числа а и ft, определяемых соответственно сече- ниями А\А' и В \ В', считаются равными в том и только в том *) Речь идет о конечных обозначениях; со своего рода бесконеч- ными обозначениями иррациональных чисел читатель познакомится в 9. Чаще всего индивидуально заданные иррациональные числа обозначают в зависимо- сти от их происхождения и роли: )л2, log 5, sin 10° и т. п.
20 ВВЕДЕНИЕ. ВЕЩЕСТВЕННЫЕ ЧИСЛА [7 случае, если эти сечения тождественны', впрочем, достаточно потре- бовать совпадения нижних классов А и В, ибо верхние классы А' и В' тогда совпадут сами собой. Это определение можно сохранить и в случае, когда числа а и /? рациональны. Иными словами, если два рациональных числа а и jj равны, то определяющие их сечения совпадают, и, обратно, - из совпадения сечений вытекает равенство чисел а и При этом разумеется, следует учесть условие, заключен- ное выше насчет рациональных чисел *). Перейдем теперь к установлению понятия «больше» по отноше- нию к вещественным числам. Для рациональных чисел это понятие уже установлено. Для рационального числа г и ир- рационального числа а понятие «больше» было, собственно, установлено в 6: именно, если а определяется сечением А\А', мы счи- таем, что а больше всех рациональных чисел, входящих в класс А, и в то же время все числа класса А' больше а. Пусть теперь имеем два иррациональных числа а и /?, при- чём а определяется сечением А|A', aft- сечением В\В'. Мы будем считать то число большим, у которого нижний класс больше. Точ- нее говоря, мы будем считать «>[}, если класс А целиком содержит в себе класс В, не совпадая с ним. (Это условие, очевидно, равносильно тому, что класс В' целиком содержит в себе класс А', не совпа- дая с ним.) Легко проверить, что это определение может быть со- хранено и для случаев, когда одно из чисел а, или даже оба — ра- циональны. Покажем, что для вещественных чисел выполняются свойства I 1° и 2°. I 1° Для каждой пары (вещественных} чисел а. и имеет место одно, и только одно, из соотношений'. х=Р, Если сечение А\А', определяющее число а, совпадает с сечением В\В’, определяющим число (3, то х=Д Если эти сечения не совпа- дают, то либо А целиком содержит в себе В, и тогда а либо этого нет. В последнем случае существует элемент Ьо класса В, попадающий в класс А'. Тогда для любого элемента а класса А имеем а<60. Поэтому класс В содержит класс А, не совпадая с ним, и мы имеем Р >а. I 2° Из а>Д, $>у следует, что а>у. Пусть числа а, р, у (среди которых могут быть и рациональные) определяются сечениями А|Л', В\В', С|С'. Если то по опре- делению понятия «больше» класс А содержит в себе класс В, не сов- падая с ним. В свою очередь, раз р >у, класс В содержит в себе класс *) Без этого условия, например, сечения, рассмотренные в примерах 1 и 2 [6], оба определяли бы одно и то же число 1, не будучи тождественными.
8] § 2. ВВЕДЕНИЕ ИРРАЦИОНАЛЬНЫХ ЧИСЕЛ 21 С, не совпадая с ним. Следовательно, класс А целиком содержит в себе класс С, не совпадая с ним, т. е. а>у. Понятие «меньше» устанавливается теперь, как и в 2: мы говорим, что а < /3, если /3 =-а. Точно так же знак < обладает транзитивным свойством, подобно знаку >. 8. Вспомогательные предложения. Установим теперь свойство плотности области всех вещественных чисел (ср. I 3°); точнее, мы докажем следующее утверждение: Лемма 1. Каковы бы ни были два вещественных числа х и S, причем x>ft, всегда найдется рациональное число г, заклю- ченное между ними: у.>г>11 (а следовательно - бесчисленное мно- жество таких рациональных чисел). Так как а>/3, то нижний класс Л сечения, определяющего число а, целиком содержит в себе нижний класс В для числа /3, не совпадая с В. Поэтому в А найдется такое рациональное число г, которое не содержится в В и, следовательно, принадлежит В'; для него (равенство могло бы иметь место, лишь если /3 рационально). Но так как в А нет наибольшего числа, то, в случае надобности, увеличив г, можно исключить равенство. Замечание. Установив, что между вещественными числами а и /3 (если a >/?) необходимо содержится рациональное (а не только вещественное) число, мы фактически доказали более сильное свойство области вещественных чисел, чем плотность. В дальнейшем нам придётся пользоваться этой усиленной плотностью. Отсюда непосредственно получается Лемма 2. Пусть даны два вещественных числа а и ft. Если, какое бы ни взять число е >0, числа хи ft могут быть заключены между одними и теми же рациональными границами s и s': s'^x^s, s's^ft^-s, разность которых меньше е: s' - s^e, то числа х и ft необходимо равны. Доказательство будем вести от противного. Пусть, на- пример, a >ft. По лемме 1, между а и ft можно вставить два рацио- нальных числа г и г'=-г: Тогда для любых двух чисел s и s', между которыми содержатся х. и ft, будут, очевидно, выполняться неравенства s' >r'>r>s, откуда s’ - s>r'-r>0,
22 ВВЕДЕНИЕ. ВЕЩЕСТВЕННЫЕ ЧИСЛА [9 так что разность s' - s, вопреки условию леммы, не может быть сде- лана, например, меньшей числа е = г'-г. Это противоречие доказы- вает лемму. 9. Представление вещественного числа бесконечной десятич- ной дробью. Мы имеем в виду такое представление, при котором дробная часть (мантисса) положительна, в то время, как целая часть может оказаться как положительной, так и отрицательной или нулем. Предположим сначала, что рассматриваемое вещественное число а не является ни целым числом, ни какой-либо конечной десятич- ной дробью. Станем искать его десятичные приближения. Если оно определяется сечением А] А', то прежде всего легко убедиться, что в классе А найдется целое число М, а в классе А' - целое же число N>M. Прибавляя к М по единице, необходимо придем к таким двум последовательным целым числам Со и Со +1, что Cq ос' - Cq +1. При этом число Со может оказаться положительным, отрицательным или нулем. Далее если разделить промежуток между Со и Со+1 на десять равных частей числами Со,1; С0,2;...; С0,9, то а попадет в один (и только в один) из частичных промежутков, 1 „ „ 1 и мы придем к двум числам, разнящимся на : Со, сх и С0,с;, для которых С0,с1<жС0,с1 + до . Продолжая этот процесс дальше, после определения цифр с1; с2, ..., cn_i, мы и-ю цифру сп определим неравенствами Cfl ’ ^1^2 ’ • Сп < ОС -< Cq ,^1^2 ... Сп + . (1) Таким образом, в процессе нахождения десятичных приближений числа а мы построили целое число Со и бесконечный ряд цифр с,, с2,... ..., сп,... . Составленную из них бесконечную десятичную дробь, т. е. символ Сд,^ ... ••• (2) можно рассматривать как представление вещественного числа а. В исключенном случае, когда а само является целым числом или, вообще, конечной десятичной дробью, можно подобным же об- разом последовательно определить число Со и цифры сх, с2, ..., с„, ..., исходя из более общих, чем (1), соотношений C0,CiC2 ... cn=sa=sC0,CjC2 ... сп +. (la)
9] § 2. ВВЕДЕНИЕ ИРРАЦИОНАЛЬНЫХ ЧИСЕЛ 23 Дело в том, что в некий момент число а совпадет с одним из кон- цов промежутка, в который мы его заключаем, с левым или с пра- вым - по нашему произволу; начиная с этого момента, соответственно, слева или справа в (1а) уже постоянно будет иметь место равен- ство. Смотря по тому, какая из этих возможностей осуществляется, последующие цифры окажутся все нулями или все девятками. Таким образом, на этот раз число а имеет двоякое представление - одно с нулём в периоде, а другое - с девяткой в периоде, например, 3,826 = 3,826000... =3,825999..., -3,826 = 4,174000... =4,173999.... Пусть теперь, наоборот, по произволу задана бесконечная деся- тичная дробь (2); покажем, что всегда найдется вещественное число а, для которого именно эта дробь и служит представлением. С этой целью рассмотрим отрезки дроби (2) С„ = С0, с^с2 ... сп, (3) которые служат как бы «приближенными значениями по недостатку» для искомого числа, а также его «приближенные значения по избытку» Сп = Со, CjCj ... сп + до,, . (4) Нетрудно видеть, что каждое Сп меньше каждого С'т (не только при т—п, но и при т^п). Теперь мы следующим образом произведем сечение в области рациональных чисел: к верхнему классу А’ отнесем такие рациональные числа а’, которые больше всех Сп (например, все числа С„), а к нижнему А - все остальные (например, сами числа С„). Легко проверить, что это - сечение; оно определяет веществен- ное число а, которое и будет искомым. Действительно, так как а является пограничным числом между двумя классами, то, в частности, Сп^ос^Сл, т. е. число а удовлетворяет всем неравенствам вида (1а). Этим и до- казано, что взятая по произволу дробь (2) является представлением найденного числа. Разность между десятичными приближениями (4) и (3) по избытку 1 с и по недостатку, равная , с возрастанием п может быть сделана меньшей любого рационального числа е>0. Действительно, так как 1 натуральных чисел, не превосходящих числа существует лишь ко- нечное число, то неравенство 10л <е | или равносильное ему: ji-s=<3
24 ВВЕДЕНИЕ. ВЕЩЕСТВЕННЫЕ ЧИСЛА ЦО может выполняться лишь для конечного числа значений и; для всех же остальных будет Это замечание, ввиду леммы 2, позволяет заключить, что число отличное от а, не может удовлетворять всем тем же неравенствам (1) или (1а), что и а, и следовательно имеет представление в виде беско- нечной десятичной дроби, отличное от представления числа а. Отсюда, в частности, следует, что представление числа, не рав- ного никакой конечной десятичной дроби, не имеет ни нуля, ни девятки в периоде - поскольку каждая дробь с нулем или с девяткой в периоде явно выражает конечную десятичную дробь. Отныне читатель может представлять себе вещественные числа как бесконечные десятичные дроби. Из школьного курса известно, что периодическая бесконечная дробь изображает рацио- нальное число и, обратно, каждое рациональное число раз- лагается именно в периодическую дробь. Таким образом, изображениями вновь введенных нами иррациональных чисел служат непериодические бесконечные дроби. (Это представление также может быть отправной точкой для построения теории иррациональ- ных чисел.) Замечание. В последующем нам не раз придется пользоваться рациональными приближениями а и а' к вещественному числу а: разность которых произвольно мала. Для рациональ- ного а существование чисел а и а' очевидно; для иррационального же а в качестве а и а' можно было бы, например, использовать деся- тичные приближения Сп и С'п при достаточно большом п. 10. Непрерывность области вещественных чисел. Обратимся теперь к рассмотрению одного весьма важного свойства области всех вещественных чисел, которое ее существенно отличает от области чи- сел рациональных. Рассматривая сечения в области рациональных чисел, мы видели, что иной раз для такого сечения в этой области не находилось пограничного числа, про которое можно было бы сказать, что оно производит сечение. Именно эта непол- нота области рациональных чисел, наличие в ней этих пробелов и послужили основанием для введения новых чисел - иррациональ- ных. Станем теперь рассматривать сечения в области всех веществен- ных чисел. Под таким сечением мы понимаем разбиение этой области на два не пустых множества А, А', при котором: 1° каждое вещественное число попадает в одно, и только одно *), из множеств А, А'~, *) Ср, сноску на стр. 17,
И] § 2. ВВЕДЕНИЕ ИРРАЦИОНАЛЬНЫХ ЧИСЕЛ 25 2° каждое число а множества А меньше каждого числа а! мно- жества А'. Возникает вопрос: всегда ли для такого сечения А|А' найдется - среди вещественных чисел - пограничное число, производящее это сечение, или в этой области существуют пробелы (которые могли бы послужить основанием для введения еще новых чисел)? Оказывается, что на деле таких пробелов нет: Основная теорема (Дедекинда). Для всякого сечения А|А' в области вещественных чисел существует вещественное число ft, которое производит это сечение. Это число ft будет 1) либо наиболь- шим в нижнем классе А, 2) либо наименьшим в верхнем классе А'. Это свойство области вещественных чисел называют ее пол- нотой, а также - непрерывностью (или сплошно- сть ю). Доказательство. Обозначим через А множество всех ра- циональных чисел, принадлежащих к А, а через А’ - множе- ство всех рациональных чисел, принадлежащих к А'. Легко убедиться, что множества А и. А' образуют сечение в области всех рациональных чисел. Это сечение А\А' определяет некоторое вещественное число ft. Оно должно попасть в один из классов А, А'; предположим, что ft попадает, например, в нижний класс А, и докажем, что тогда осу- ществляется случай 1), а именно, ft является в классе А наибольшим. В самом деле, если бы это было не так, то на- шлось бы другое число а0 этого класса, большее ft. Вставим (опираясь на лемму 1) между а0 и ft рациональное число г: <*0>r>ft; г также принадлежит классу А и, следовательно, принадлежит классу А. Мы пришли к противоречию: рациональное число г, принадле- жащее нижнему классу сечения, определяющего число ft, больше этого числа! Этим доказано наше утверждение. Аналогичное рассуждение показывает, что если ft попадает в верх- ний класс А', то осуществится случай 2). Замечание. Одновременное существование в классе А наи- большего числа и в классе А' наименьшего - невозможно; это уста- навливается так же, как и для сечений в множестве рациональных чисел (с помощью леммы 1). 11. Границы числовых множеств. Мы используем основную теорему [10], чтобы здесь же установить некоторые понятия, игра- ющие важную роль в современном анализе. (Они понадобятся нам уже при рассмотрении арифметических действий над вещественными числами.) Представим себе произвольное бесконечное множество вещественных чисел; оно может бытв задано любым образом. Такими
26 ВВЕДЕНИЕ. ВЕЩЕСТВЕННЫЕ ЧИСЛА U1 множествами являются, например, множество натуральных чисел, множество всех правильных дробей, множество всех вещественных чисел между 0 и 1, множество корней уравнения sinx = |, и т. п. Любое из чисел множества обозначим через х, так что х есть типовое обозначение чисел множества; само же множество чисел х будем обозначать через № = {х}. Если для рассматриваемого множества {х} существует такое число М, что все x=s.M, то будем говорить, что наше множество огра- ничено сверху (числом М); само число М в этом случае есть верхняя граница множества {х}. Например, множество пра- вильных дробей ограничено сверху числом 1 или любым числом =>1; натуральный ряд сверху не ограничен. Аналогично этому: если найдётся такое число т. что все х^т, то говорят, что множество {х} ограничено снизу (числом т), а само число т называют нижней границей множества {х}. Например, натуральный ряд ограничен снизу числом 1 или любым числом <1; множество правильных дробей ограничено снизу числом О или любым числом <0. Ограниченное сверху (снизу) множество может быть при этом как ограничено, так и неограничен© снизу (сверху). Так, множество пра- вильных дробей ограничено и сверху, и снизу, а натуральный ряд ограничен снизу, но не ограничен сверху. Если множество сверху (снизу) не ограничено, то за его верхнюю (нижнюю) границу принимают «несобственное число» +~ (-“) От- носительно этих «несобственных» или «бесконечных» чисел мы считаем, что — ОО < -( О° И —СО < -< со каково бы ни было вещественное («конечное») число а. Знаки + ~ и — ~ читаются так: «плюс бесконечность» и «минус бесконечность». Если множество ограничено сверху, т. е. имеет конечную верх- нюю границу М, то одновременно оно имеет и бесконечное множе- ство верхних границ (так как, например, любое число >М, очевидно, также будет верхней границей). Из всех верхних границ особый ин- терес представляет наименьшая, которую мы будем называть точной верхней границей. Аналогично, если множество ограничено снизу, то наибольшую из всех нижних границ будем называть т о ч н о й нижней границей. Так, для множества всех правильных дро- бей точными границами будут, соответственно, 0 и 1. Является вопрос: всегда ли для ограниченного сверху (снизу) множества существует точная верхняя (нижняя) граница ? Действи- тельно, так как верхних (нижних) границ в этом случае бесконечное множество, а среди бесконечного множества чисел не всегда найдется
llj § 2- ВВЕДЕНИЕ ИРРАЦИОНАЛЬНЫХ ЧИСЕЛ 27 наименьшее или наибольшее *), то самое существование такого наи- меньшего (наибольшего) числа из всех верхних (нижних) границ рас- сматриваемого множества требует доказательства. Теорема. Если множество X = {%} ограничено сверху (снизу), то оно имеет и точную верхнюю (нижнюю) границу. Доказательство. Проведем рассуждение по отношению к верхней границе. Рассмотрим два случая: 1° Среди чисел х множества X найдется наи- большее х. Тогда все числа множества будут удовлетворять не- равенству x=sx, т. е. х будет верхней границей для X. С другой сто- роны, х принадлежит X; следовательно, для любой верхней границы М выполняется неравенство x=sM. Отсюда заключаем, что х есть точная верхняя граница множества X. 2° Среди чисел х множества нет наиболь- шего. Произведём сечение в области всех вещественных чисел сле- дующим образом. К верхнему классу А' отнесём все верхние границы а' множества X, а к нижнему классу А - все остальные вещественные числа а. При этом разбиении все числа х множества X попадут в класс А, ибо ни одно из них - по допущению - не будет наибольшим. Таким образом, оба класса А, А' непусты. Это разбиение действи- тельно является сечением, так как все вещественные числа распреде- лены по классам и каждое число из класса А' больше любого числа из класса А. По основной теореме Дедекинда [10], должно су- ществовать вещественное число fj, производящее сечение. Все числа х, как принадлежащие классу А, не превосходят этого «пограничного» числа [}, т. е. /3 служит верхней границей для х, следовательно, само принадлежит классу А' и является там наименьшим. Таким образом, /3 как наименьшая из всех верхних границ и есть искомая точная верхняя граница множества Х = {х). Совершенно так же доказывается и вторая половина теоремы (от- носящаяся к существованию точной нижней границы). Если М* есть точная верхняя граница числового множества Х = {х}, то для всех х будет х^М*. Возьмем теперь произвольное число а, меньшее М*. Так как М * - наименьшая из верхних границ, то число а наверное не будет верхней границей для множества X, т. е. найдется такое число х' из X, что х' Этими двумя неравенствами вполне характеризуется точная верхняя граница множества X. ’) Как их нет, например, среди всех правильных дробей.
28 ВВЕДЕНИЕ. ВЕЩЕСТВЕННЫЕ ЧИСЛА Ц2 Аналогично, точная нижняя граница т* множества X харак- теризуется тем, что для всех х из X xs^m* и, каково бы ни было число /?, большее т*, найдется число х" из X такое, что Для обозначения точной верхней границы М* и точной нижней границы т* множества чисел X употребляют символы М* =sup X=sup {х}, т*=inf $7=inf {%} (по-латыни: supremum - наивысшее, infimum - наинизшее). Отметим одно очевидное умозаключение, которое часто будет встречаться в дальнейшем: если все числа х некоторого множества удовлетворяют неравен- ству х^М, то и sup {x}=sAf. Действительно, число М оказывается одной из верхних границ множества, а потому наименьшая из всех верхних границ его не превосходит. Аналогично, из неравенства х=»т следует, что и inf {х}^т. Условимся, наконец, если множество X = {%} не ограничено сверху, говорить, что его точная верхняя граница есть +==: sup {х}=+~. Аналогично, если множество X = {х} не ограничено снизу, то говорят, что его точная нижняя граница есть inf {х}= - =». § 3. Арифметические действия над вещественными числами 12. Определение суммы вещественных чисел. Обратимся теперь к установлению понятия о действиях над вещественными числами. Греческие буквы а, /?, у в последующем означают именно веществен- ные числа, как рациональные, так и иррациональные. Пусть имеем два вещественных числа а и /?. Станем рассматривать рациональные числа а, а' и Ъ, Ь', удовлетворяющие неравен- ствам: а<а<а' и (1) Суммой а. + $ чисел а. и назовем такое вещественное число у, - которое содержится между всеми суммами вида а + Ь, с одной сто- роны, и всеми суммами вида а' + b', — с другой: а + Ь-<у<а’ + Ъ'. (2) Удостоверимся, прежде всего, что такое число у существует для любой пары вещественных чисел а, fl.
13J § 3. АРИФМЕТИЧЕСКИЕ ДЕЙСТВИЯ 29 Рассмотрим множество всевозможных сумм а+Ъ. Это множество ограничено сверху, например, любой суммой вида а' + Ъ'. Поло- жим же [И] y=sup {« + &}. Тогда а + b^y и, в то же время, y=sd + Ь'. Так как, каковы бы ни были рациональные числа а, Ь, d, Ь', удов- летворяющие условиям (1), всегда можно числа а, b увеличить, а числа а’, Ъ' уменьшить с сохранением этих условий, то в по- лученных только что неравенствах, соединенных с равенствами, р а- венства на деле ни в одном случае быть не мо- жет. Таким образом, число у удовлетворяет определению суммы. Возникает, однако, вопрос, однозначно ли сумма у=а. + р определяется неравенствами (2). Для того чтобы убедиться в един- ственности суммы, подберем, по замечанию в 9, рациональные числа а, а', Ъ, Ъ' так, чтобы было d-а<е и Ъ' — Ь'-е, где е - произвольно малое рациональное положительное число. От- сюда (d + Z>') - (а + b) = (d-а) + (Ь' -Ь)< 2е, т. е. и эта разность может быть сделана сколь угодно малой*). А тогда, по лемме 2, существует только одно число, содержа- щееся между суммами а+b и d + Ь'. Наконец, заметим, что если числа а и /? оба рациональны, то их обычная сумма у=а + £, очевидно, удовлетворяет неравенствам (2). Таким образом, данное выше общее определение суммы двух вещественных чисел не противоречит старому определению суммы двух рациональных чисел. 13. Свойства сложения. Легко удостовериться, что для веще- ственных чисел сохраняются свойства: II 1° a + 0=0 + a; II 2° (а+£) + у=а + (£ + у); II 3° а + 0 = а. Докажем, например, последнее. Если рациональные числа a, d, b, Ъ' таковы, что то, очевидно, а + b •' а - а -= d - d + b'. *) Число 2е становится меньшим любого числа е'=-0, если взять е-=—- .
30 ВВЕДЕНИЕ. ВЕЩЕСТВЕННЫЕ ЧИСЛА [13 Таким образом, а есть вещественное число, заключенное между числами вида а + b и а' + Ь', между которыми заключена, по опре- делению, и сумма а + 0. Но такое число может быть только одно; поэтому а + 0=а, что и требовалось доказать. Обратимся к свойству II 4° и докажем, что для каждого веще- ственного числа а существует (симметричное ему) число -а, удовлетворяющее условию а + (-а) = 0. При этом достаточно ограничиться случаем иррациональ- ного числа а. Предполагая, что число а определяется сечением А\А’, мы опре- делим число —а следующим образом. К нижнему классу А числа -а мы отнесем все рациональные числа - а’, где а’ - любое число класса А’, а к верхнему классу А’ этого числа отнесем все числа - а, где а - любое число класса А. Нетрудно видеть, что построенное разбиение есть сечение и, действительно, определяет вещественное (в данном случае - иррациональное) число: это число обозначим - а. Докажем теперь, что оно удовлетворяет указанному выше усло- вию. Пользуясь самим определением числа -а, видим, что сумма а + (-а) есть единственное вещественное число, заключенное между числами вида а-а' и а' -а, где а и а' рациональны и Но, очевидно, a-а' <Q<ar-а, так что и число 0 заключено между только что упомянутыми чи- слами. Ввиду единственности числа, обладающего этим свойством, имеем а 4- ( - а) = 0, что и требовалось доказать. Наконец, установим свойство: II 5° из следует a.+y^fi+y. Если а то между ними можно вставить два рациональных числа г± и г2: а По замечанию в 9, существуют такие два рациональных числа с и с', что С<у^с' И с'-с-<г}- г2. Отсюда гх + ог2+с', а по определению суммы а + уз-^ + с, r2 + c’>fl + y. Сопоставляя все эти неравенства, мы и приходим к требуемому за- ключению. Таким образом, по отношению к сложению область веществен- ных чисел обладает всеми основными свойствами II 1° - 5°, которые в 3 были первоначально сформулированы для рациональных чисел.
14] § 3. АРИФМЕТИЧЕСКИЕ ДЕЙСТВИЯ 31 Следовательно, на вещественные числа автоматически переносятся и все формально логические следствия из этих свойств. В частно- сти, для вещественных чисел может быть буквально повторено все, сказанное в 3 непосредственно после изложения II группы свойств, т. е. могут быть доказаны существование и однознач- ность разности а-/? чисел а и /?, установлено понятие абсолютной величины числа а (для которой мы сохраняем обозначение | а |) и т. д. 14. Определение произведения вещественных чисел. Перейдем к умножению вещественных чисел, ограничиваясь сначала по- ложительными числами. Пусть же даны два таких числа а и Д Мы здесь также станем рассматривать всевозможные рациональные числа, удовлетворяющие неравенствам (1), но и эти числа предпо- ложим положительными. Произведением tx.fi двух положительных вещест- венных чисел а и fi назовем такое вещественное число у, которое со- держится между всеми произведениями вида ab, с одной стороны, и всеми произведениями вида а'Ь’, - с другой'. ab<y<a'b'. (3) Для доказательства существования такого числа у возьмём мно- жество всевозможных произведений ab; оно ограничено сверху лю- бым из произведений вида а'Ь'. Если положить y=sup {ab}, то, конечно, ab^y, но одновременно и у^а’Ь'. Возможность увеличить числа а, б и уменьшить чи- сла а', Ъ' (как и в случае суммы) позволяет исключить здесь знак ра- венства, так что число у удовлетворяет определению произведения. Единственность произведения вытекает из следующих со- ображений. Подберем, по замечанию в 9, рациональные числа а, а! и Ъ, Ь' так, чтобы было а'-а<е и Ь'-Ь<е, где е - произвольно малое рациональное положительное число. При этом можно считать, что числа а и Ь положительны, а числа а' и Ь' не превосходят, соответственно, некоторых наперед фиксированных чисел а'о и Ь'о. Тогда разность а'Ь' -ab = а'(Ь' -Ь) + Ь(а' -а)^ (а0 + бд) • е, т. е. также может быть сделана сколь угодно малой *), а этого, по *) Заметим, что {а0+Ь'0)е становится меньшим любого числа е' =-0, если взять е' е-~-у.
32 ВВЕДЕНИЕ. ВЕЩЕСТВЕННЫЕ ЧИСЛА Ц5 лемме 2, достаточно для утверждения, что неравенствам (3) может удовлетворять только одно число у. Если положительные числа а и j3 оба рациональны, то их обычное произведение у = а/? удовлетворяет, очевидно, неравен- ствам (3), т. е. получается таким же и по общему определению произ- ведения двух вещественных чисел - противоречия нет. Наконец, для того чтобы определить произведение произвольной пары вещественных чисел (не обязательно положительных), заключим следующие соглашения. Прежде всего, условимся, что а*0 = 0>а = 0, каково бы ни было а. Если же оба множителя отличны от 0, то положим в основу обыч- ное «правило знаков»: ос-/?=|ос]-|/?[, если а. и [3 одного знака, «.•[3 = -(|а|• 1), если а. и [3 разных знаков (что означает произведение положительных чисел ]ос| и |[31 - мы уже знаем). Эти соглашения, как мы видели в 4, в некотором смысле обяза- тельны для нас, если мы хотим, чтобы действия над вещественными числами обладали всеми основными свойствами действий над рацио- нальными числами. 15. Свойства умножения. Как и в случае рациональных чисел, для любых вещественных чисел сохраняются свойства: III 1° а •/? = /?-а; III 2° (a-j3).y = «.(j3.y); III 3° a-l=a. Для примера докажем второе из них, начав со случая, когда все три числа - a, j3, у - положительны. Пусть а, а', Ь, Ь', с, с' - про- извольные рациональные числа, удовлетворяющие неравенствам 0<a<a<a', О-=с<у<с'. Тогда, по самому определению произведения двух вещественных чи- сел, имеем и bc<(3y<b'c'. Пользуясь еще раз тем же определением, получим (aZ>)c<(aj3)y<(a'Z>')c' и a(Z>c)<a(j3y)<a'(Z>'c'). Так как для рациональных чисел доказываемое свойство уже из- вестно, то вещественные числа (рф)у и <х(/3у) оказываются заключен- ными между одними и теми же границами: (ab)c = а(Ьс) и (а'Ь')с' = а'(Ь'с').
151 § 3. АРИФМЕТИЧЕСКИЕ ДЕЙСТВИЯ 33 Но легко показать, что за счет сближения множителей а и а', b я Ь', с яс’ между собой и разность произведений a'b'c' - abc может быть сделана сколь угодно малой (при этом можно использовать подобное же утверждение в 14 относительно произведений двух мно- жителей). Отсюда, по лемме 2, и получится заключение о равенстве чисел (ajS)y и a(/fy). Переход к случаю чисел произвольных знаков производится не- посредственно, если учесть лишь «правило знаков». Если же хоть одно из чисел а, j3, у равно 0, то оба произведения обращаются в 0. Обратимся к свойству: III 4° для каждого вещественного числа я, отличного от нуля, существует (обратное ему) число , удовлетворяющее условию: Достаточно ограничиться случаем иррационального числа а. Пусть сначала а >0. Если а определяется сечением А |Л', то мы следующим образом 1 TZ Г построим сечение для числа -. К нижнему классу его А мы отне- сем все отрицательные рациональные числа и нуль, а также все числа вида , где а - любое число класса А ; в верхний же класс А по- а 1 с местам все числа вида - , где а - любое положительное а число класса А. Легко убедиться, что мы, таким образом, действи- тельно получаем сечение, которое определит положительное веще- ственное (в данном случае - иррациональное) число; это число - 1 обозначим -. а Покажем, что оно удовлетворяет требуемому условию. Если учесть построение обратного числа, то, по самому определению произведения, число а• - есть единственное вещественное a a' t число, заключенное между числами вида и —, где а я а - по- ложительные рациональные числа, удовлетворяющие неравенствам Но и число 1 заключено между упомянутыми числами: следовательно, оно и является искомым произведением. Если а<0, то полагаем 1= 1 а” |а| ’ тогда по «правилу знаков» 3 Г. М. Фихтенгольц, т. I
34 ВВЕДЕНИЕ. ВЕЩЕСТВЕННЫЕ ЧИСЛА П6 После того как мы убедились, что и по отношению к умноже- нию область вещественных чисел обладает всеми основными свой- ствами III 1° - 4°, ясно, что для этой области сохраняет силу все ска- занное в 4 о существовании и единственности част- ного^ чисел аи$ (при условии, что j3 #0) и т. д. Распределительное свойство: III 5° (a+j3)-y = a«y + j3.y также имеет место для любых вещественных чисел, что легко до- казывается для случая положительных чисел (как и свойство III 2°). К этому случаю приводятся все остальные - путем изменения знаков обеих частей равенства или путем переноса членов из одной части в другую. Исключение, впрочем, представляет случай, когда одно из чисел а, /?, у, а+/3 равно нулю; но для этого случая равенство не- посредственно очевидно. Наконец, свойство: III 6° из и у>0 следует a.-y>fi-y проверяется без труда. Неравенство равносильно а-Д>0; тогда по «правилу знаков» и (a-j3)-y>0. Но умножение имеет распреде- лительное свойство и относительно разности, так что a-y-/J-y=-O, а отсюда а -у -у. 16. Заключение. Остается упомянуть еще об «аксиоме Архи- меда». IV 1° каково бы ни было вещественное число у, существует нату- ральное число п, большее у. Проверка ее легка: ведь в верхнем классе сечения С|С", опре- деляющего число у, найдется большее его рациональное число с', а для рациональных чисел этот принцип имеет место. Теперь можно, наконец, считать установленным, что в области всех вещественных чисел полностью с о хр ан я ю т с я пра- вила элементарной алгебры, относящиеся к четырем арифметическим действиям и к сочетанию равенств и неравенств. 17. Абсолютные величины. В интересах дальнейшего, присово- купим еще несколько замечаний об абсолютных величинах. Прежде всего, установим, что неравенство: |ос] (где, конечно, /3>0) равносильно двойному неравенству: Действительно, из |ос| следует, что одновременно и т. е. a - /1 Обратно, если дано, что a < и a > - /J, то имеем одновре- менно: a<j3 и -a-=j3; но одно из этих чисел а, -а и есть |aj, так что наверное Аналогично, оказываются равносильными и неравенства:
18] § 4. ПРИЛОЖЕНИЯ ВЕЩЕСТВЕННЫХ ЧИСЕЛ 35 Докажем, далее, полезное неравенство: «s ]ос| + |0|. Складывая почленно очевидные неравенства — |а| asa=s|a| и — )/?|, получим — (|a| + |0|)=sa + 0«s|a| + |0|, откуда, в силу сделанного выше замечания, и вытекает требуемое неравенство. С помощью математической индукции оно распространяется на случай любого числа слагаемых: |a + j3+ ... +у| =s|a| + |0| + ...+ |у|. Если заменить в доказанном неравенстве 0 на -0, то получим |a-/3|=s|a| + |0|. Так как a = (а + 0) - 0, то |а | |а + 01 + [01, или |a+j3|>|a| - |0|. Аналогично |a| - |0| =s Так как одновременно и |0| - |a|=s[a—0|, то, очевидно, ||a|-|0||«s[a-0|. Все эти неравенства будут полезны в теории пределов. § 4. Дальнейшие свойства и приложения вещественных чисел 18. Существование корня. Степень с рациональным показа- телем. Определение умножения (и деления) вещественных чисел не- посредственно приводит, как и обычно, к определению степени с целым положительным (и отрицательным) показателем. Переходя к степени с вообще рациональным показателем, остановимся прежде всего на вопросе о существовании корня. Как мы помним, отсутствие в области рациональных чисел про- стейших корней послужило одним из поводов к расширению этой области; проверим же, в какой мере произведенное расширение за- полнило старые пробелы (не создав при этом новых). Пусть a - любое вещественное число, п - натуральное число. Как известно, корнем и-й степени из числа а называют такое ве- щественное число 5, что = а. з»
36 ВВЕДЕНИЕ. ВЕЩЕСТВЕННЫЕ ЧИСЛА [18 Мы ограничимся случаем, когда а положительно, и будем искать положительное же 5, удовлетворяющее этому соотношению, т. е. так называемое арифметическое значение корня. Мы дока- жем, что такое число £ всегда существует, и притом только одно. Последнее утверждение относительно единственности числа ё, впро- чем, сразу следует из того, что разным положительным числам соот- ветствуют и разные степени их: если 0 то £п<£'п. Если существует такое рациональное число г, п-я. степень которого равна а, то оно и будет искомым числом 5. Поэтому впредь достаточно ограничиться предположением, что такого рациональ- ного числа нет. Построим теперь сечение Х\Х' в области всех рациональных чисел следующим образом. К классу X отнесем все отрицательные рациональные числа и нуль, а также те из положительных рациональ- ных чисел х, для которых хп-=а. К классу X' отнесем положительные рациональные числа х’, для которых х'п>а. Легко видеть, что классы эти не пустые и что X содержит и поло- жительные числа. Если взять, например, натуральное число тп так, чтобы было — <а<ти, то и подавно так что число — т тп т входит в X, а число т - в X’. Прочие требования, предъявляемые к сечению, проверяются не- посредственно. Пусть теперь £ будет число, определяемое сечением дока- п жем, что = а, т. е. что £ = Уа. Рассматривая как произведение п сомножителей, равных £, на основании определения произведения положительных вещественных чисел [14] заключаем, что хп<£,п^х'п, если х и х' суть положительные рациональные числа, для которых 0<х-=£-=х'. Так как, очевидно, х принадлежит классу X, а х' - классу X', то, по определению этих классов, одновременно и хп<а<х'п. Но разность х'-х может быть сделана меньшей любого числа е>0 (9, замечание), причем ничто не мешает считать х' меньшим некоторого наперед фиксированного числа Xq. В таком случае разн ость х'п - хп=(х' - х)(х'п-1 + х • х'"-2 + ... + х"-1) < е • ихд"-1, т. е. также может быть сделана сколь угодно малой*). Отсюда, пс лемме 2, и следует равенство чисел £" и а. *) Заметим, что число е-пх'оп~г становится меньшим любого числа е'=-0, есш
§ 4. ПРИЛОЖЕНИЯ ВЕЩЕСТВЕННЫХ ЧИСЕЛ 37 1»1 После того как доказано существование корня, обычным путем устанавливается понятие степени с любым рациональным по- казателем г и проверяется, что для таких степеней справедливы обыч- ные правила, выводимые в курсе элементарной алгебры: v.r • аг' = v.r+r', аг: аг' = (<х.г)г' = ал ’г>, (а/5)г = аг»/?г, Йг аг и ДР. Подчеркнем еще, что при а> 1 степень аг возрастает с воз- растанием рационального показателя г. 19. Степень с любым вещественным показателем. Обратимся к определению степени любого вещественного (поло- жительного) числа а с любым вещественным по- казателем р. Введем в рассмотрение степени числа а <хь и а6' с рациональными показателями b и V, удовлетворяющими неравен- ствам Ь^Ь'. Степенью числа а=-1*) с показателем называют (и обозначают символом аР) вещественное число у, содержащееся между сте- пенями v.b и v.b': ocb^y-=txb'. (1) Легко убедиться в том, что такое число всегда существует. Дей- ствительно, множество степеней {аь} ограничено сверху, например, любой степенью о6'. Возьмем тогда [11] у =sup {а6}. b-tfl Для этого числа будем иметь a.b=sy-=sixb'. На деле же знак равенства здесь не нужен, ввиду возможности уве- личить b а уменьшить Ь’, так что построенное число у удов- летворяет условиям (1). Обратимся теперь к доказательству единственности числа, опре- деляемого этими условиями. Для этого, прежде всего, заметим, что лемма 2 [8] сохраняет свою силу и в том случае, если опустить требование, чтобы числа s, s' и е *) Этим случаем можно ограничиться: при а-= 1 полагаем, например, \а)
38 ВВЕДЕНИЕ. ВЕЩЕСТВЕННЫЕ ЧИСЛА 119 были непременно рациональными; доказательство остается то же. Затем, установим одно весьма простое, но часто полезное нера- венство, которое иногда связывают с именем Як. Бернулли (Jac. Bernoulli): если п - натуральное число, большее единицы, и у>1, то уп»1 + л(у-1). (2) Действительно, положив у = 1 + Я, где Я > 0, по формуле бинома Нью- тона будем иметь (1+Я)П = 1+ пЯ+...; так как ненаписанные члены положительны, то (1 + Я)" > 1 + пЯ, что равносильно неравенству (2). £ Положив здесь у = а" (а =-1), получим неравенство 1 П , Ot — 1 /ОХ а —, (3) которым мы сейчас и воспользуемся. Мы знаем, что числа b и Ь' можно выбрать так, чтобы разность Ь' -Ь была меньше - при любом наперед заданном натуральном п; тогда, по неравенству (3), £ а6' — а? = аДа6'-* - 1) < аь(ап — 1) < <хь ~~ • Так как b меньше любого (но фиксированного) Ь'о, то достаточно взять a6«(a-1) где е - произвольно малое положительное число, чтобы было а6' -аь-<е. В таком случае, по обобщенной выше лемме 2, между границами аь и аь' не может содержаться двух различных чисел у. Если /? рационально, то данное выше определение возвращает нас к обычному пониманию символа оЛ Легко проверить, что для степени с любым вещественным пока- зателем выполняются все обычные для степени правила. Остановимся для примера на доказательстве правила сложения показателей при умножении: vf • хг = х^+г.
20] § 4. ПРИЛОЖЕНИЯ ВЕЩЕСТВЕННЫХ ЧИСЕЛ 39 Пусть Ь, Ь', с, с' - любые рациональные числа, для которых с^у^с'; по определению суммы [12] b + c^ft + y^b' + с', а по определению степени а6 < а₽ < , ас<а?<ас' и ab+c-sa/+y<af/+c'. Перемножив почленно первые два двойные неравенства (с учетом того, что для рациональных показателей доказываемое правило уже известно), получим a!>+c«xfl • ay-=ay+c'. Таким образом, два числа а/3+у и а/ • а? оказываются заключенными между границами а4+с, <х6'+с/, которые, как легко показать, могут быть сделаны сколь угодно близкими. Отсюда (по обобщенной лем- ме 2) и вытекает равенство этих чисел. Проверим еще, что при а> 1 степень а/ возрастает с воз- растанием вещественного показателя ft. Если $ < Д, то, вставив рацио- нальное число г между ними: ft < г < Д, по самому определению степени с вещественным показателем будем иметь о^-=аг и аг<а^, откуда а^о-Л 20, Логарифмы. Пользуясь данным определением степени с лю- бым вещественным показателем, теперь легко установить суще- ствование логарифма для любого положительного веще- ственного числа у при положительном основании а, отличном от 1 (мы будем, например, считать а =-1). Если существует такое рациональное число г, что аг = у, то г и есть искомый логарифм. Предположим же, что такого рацио- нального числа г нет. Тогда можно произвести сечение В\В' в области всех рациональ- ных чисел по следующему правилу. К классу В отнесем рациональные числа Ь, для которых а к классу В' - рациональные числа Ь', для которых а6' >у. Покажем, что классы В и В' - не пустые. В силу неравенства (2) а" > 1 + и(а - 1) =-л(а - 1), и достаточно взять
40 ВВЕДЕНИЕ. ВЕЩЕСТВЕННЫЕ ЧИСЛА 121 чтобы было ап>у; такое натуральное число и относится к классу В'. В то же время имеем: -п 1 1 а" и(а-1)’ и достаточно взять 1 у(а-1)’ чтобы было а-п<у и число - и попало в класс В. Остальные требования, предъявляемые к сечению, здесь также выполнены. Построенное сечение В\В' определяет вещественное число р, кото- рое является «пограничным» между числами обоих классов. По опре- делению степени, имеем аь-=а^-=ад' (Ь-^Р^Ь'), причем а/ есть единственное число, удовлетворяющее всем подобным неравенствам. Но для числа у имеем (по самому построению сечения) а? -= у -= а6'. Следовательно, оЛ = 7 и j3 = logay; существование логарифма доказано. 21. Измерение отрезков. Невозможность снабдить, оставаясь в области рациональных чисел, все отрезки длинами также была важнейшим поводом к введению иррациональных чисел. Покажем теперь, что произведенного расширения числовой области достаточно для решения задачи измерения отрезков. Прежде всего сформулируем самую задачу ♦): Требуется с каждым прямолинейным отрезком А связать некото- рое положительное вещественное число 1(A), которое будем называть «длиной отрезка А», так, чтобы 1) некоторый наперед выбранный отрезок Е («эталон длины») имел длину 1 : /(Е) = 1; 2) равные отрезки имели одну и ту же длину, 3) при сложении отрезков длина суммы всегда была равна сумме длин складываемых отрезков: 1(А + В) = 1(А) + 1(В) («свойство аддитивности»). Поставленные условия приводят к однозначному решению задачи. *) Мы пользуемся здесь школьными сведениями по геометрии и не форму- лируем относящихся сюда аксиом.
211 § 4. ПРИЛОЖЕНИЯ ВЕЩЕСТВЕННЫХ ЧИСЕЛ 41 Из 2) и 3) следует, что q-я часть эталона должна иметь длину если же эта часть повторена слагаемым р раз, то полученный отрезок, в силу 3), должен иметь длину . Таким образом, если отре- зок А соизмерим с эталоном длины, и общая мера отрезков А и Е укладывается в них, соответственно, р и q раз, то необходимо Легко видеть, что это число не зависит от взятой общей меры и что если отрезкам, соизмеримым с эталоном, приписать рациональные длины по этому правилу, то - для этих отрезков - задача измерения будет полностью решена. Если отрезок А больше отрезка В, так что А = В+С, где С есть также некоторый отрезок, то, в силу 3), должно быть: /(Л)=/(2?) + /(С) и, так как I (С) > 0, то I (Л) -1 (В). Итак, неравные отрезки должны иметь неравные длины, а именно, больший отрезок - большую длину. Так как каждое положительное рациональное число - является ч длиной некоторого отрезка, соизмеримого с эталоном длины Е, то из сказанного, между прочим, ясно, что ни один отрезок, несоизмери- мый с эталоном, не может иметь рациональную длину. Пусть же 27 будет такой отрезок, несоизмеримый с Е. Найдется бесчисленное множество отрезков S и S', соизмеримых с Е и, соответственно, меньших или больших 27* **)). Если обозначить их длины через s и s': I (5) = s, I (S') = s', то искомая длина I (27) должна удовлетворять неравенствам у</(27)<у' ♦*). Если разбить все рациональные числа на два класса S и S', от- неся к нижнему классу S числа s (и кроме них - все отрицательные числа и 0), а к верхнему классу S' - числа s', то получится сечение в области рациональных чисел. Так как в нижнем классе, очевидно, нет наибольшего числа, а в верхнем - наименьшего, то этим сечением определяется иррациональное число а, которое и будет единственным вещественным числом, удовлетворяющим неравенствам s^a^s'. Именно этому числу необходимо положить равной длину /(27). Предположим теперь, что всем отрезкам, как соизмеримым с Е, так и несоизмеримым, приписаны длины в согласии с указанными *) Это легко доказать, исходя из геометрической «аксиомы Архимеда», о которой уже была речь в 5. **) Разумеется, и для длины отрезка 27, соизмеримого с Е, также вы- полняются эти неравенства.
42 ВВЕДЕНИЕ. ВЕЩЕСТВЕННЫЕ ЧИСЛА [21 правилами. Выполнение условий 1), 2) очевидно. Рассмотрим два отрезка Р, S с длинами о = I (Р), а = I (2) и их сумму, отрезок Т = Р + S, длину которого обозначим через т = I (Т). Взяв любые положительные рациональные числа г, г', s, s' такие, что S<<T-=S построим отрезки R, R', S, S', для которых именно эти числа, соот- ветственно, служат длинами. Отрезок R + S (длины г + s) будет мень- ше Т, а отрезок R' + S' (длины г' + s') - больше Т. Поэтому г + .?<т-=г' + у Но [12] единственным вещественным числом, содержащимся между числами вида г + s *) и числами г' + s', является сумма g + а. Следова- тельно, t = g + а, ч. и тр. д. Распространение «свойства аддитивности» на случай любого ко- нечного числа слагаемых производится по методу математической индукции. Если на оси (направленной прямой) (рис. 1) выбрать на- чальную точку О и эталон длины ОЕ, то каждой точке X этой прямой -2,5 Рис. 1. отвечает некоторое вещественное число - ее абсцисса х, равная длине отрезка ОХ, если X лежит в положительном направлении от О, или этой длине со знаком минус - в противном случае. Естественно встает вопрос, будет ли верно и обратное: каждое ли вещественное число х отвечает при этом некоторой точке прямой ? Вопрос этот в геометрии решается в утвердительном смысле - имен- но с помощью аксиомы о непрерывности прямой, устанавли- вающей для прямой, как множества точек, свойство, аналогичное свойству непрерывности области вещественных чисел [10]. Таким образом, между всеми вещественными числами и точками направленной прямой (оси) можно установить взаимно однозначное соответствие. Вещественные числа можно изображать точками на оси, которую в связи с этим называют числовой осью. Подобным изображением мы впредь постоянно будем пользоваться. *) Ограничение положительными числами г и s, конечно, несуще- ственно.
ГЛАВА ПЕРВАЯ ТЕОРИЯ ПРЕДЕЛОВ § 1. Варианта и ее предел 22. Переменная величина, варианта. В физике и в других нау- ках о природе читателю встречалось множество различных вели- чин: время, длина, объем, вес и т. п. Любая из них, смотря по об- стоятельствам, то принимала различные значения, то лишь одно. В первом случае мы имели дело с переменной величиной, а во втором - с постоянной. В математике, однако, мы отвлекаемся от физического смысла рассматриваемой величины, интересуясь лишь числом, которым она выражается; физический смысл величины снова приобретает важ- ность, лишь когда занимаются приложениями математики. Таким образом, для нас переменная величина (или короче - переменная) яв- ляется отвлеченной или числовой переменной. Ее обозна- чают каким-либо символом (буквой, например, х), которому приписы- ваются числовые значения. Переменная считается заданной, если указано множество X = {х} значений, которые она может принять. Постоянную величину (короче - постоянную) удобно рассматривать как частный случай переменной; он отвечает предположению, что мно- жество X={х} состоит из одного элемента. При установлении понятия предела переменной х недоста- точно знать лишь, из какого числового множества X получает значе- ния эта переменная; необходимо еще знать, какие именно значения (среди которых могут быть и повторяющиеся) и в каком порядке она принимает. Откладывая изложение вопроса о направленной переменной и ее пределе, в общей постановке, до конца следующего тома *) (когда у читателя накопится достаточный опыт в этой области), мы посвятим настоящую главу изучению одного, самого простого и вместе с тем важного, частного типа такой переменной величины. Начнем с установления понятия числовой последователь- ности. Представим себе натуральный ряд: 1, 2, 3, ..., и, ..., и', ..., (1) ♦) См. там Дополнение: «Общая точка зрения на предел».
44 ГЛ. 1. ТЕОРИЯ ПРЕДЕЛОВ [22 в котором числа расположены в порядке возрастания, так что боль- шее число п' следует за меньшим числом п (или меньшее число п предшествует большему числу «')• Если теперь заменить в ряде (1), по какому-нибудь закону, каждое натуральное число п некоторым вещественным числом хп, то получится числовая последова- тельность: ^1» ^2> *3. • • •» • • •> (2) члены или элементы которой хп занумерованы всеми нату- ральными числами и расположены в порядке возраста- ния номеров. При п' >п член хп, следует за членом хп (хп предшествует хп,), независимо от того, будет ли само число хп, больше, меньше или даже равно числу хп *). Переменную х, принимающую некоторую последователь- ность (2) значений, мы - следуя М е р э (Ch. Мёгау) - будем на- зывать вариантой. Это и есть тот тип переменной, рассмотре- нием которого мы здесь ограничиваемся. В школьном курсе математики читателю встречались переменные именно типа варианты. Ему знакома, например, последователь- ность вида a, a + d, а + 2d, ..., а + («-1Н ... 12 3 п (арифметическая прогрессия) или вида a, aq, aq2, ..., од"-1, ... 12 3 л (геометрическая прогрессия); переменный член той и другой про- грессии есть варианта. В связи с определением длины окружности обычно рассматри- вается переменный периметр правильного вписанного в окружность многоугольника, получаемого из шестиугольника последовательным удвоением числа сторон; таким образом, эта варианта принимает последовательность значений: />6 = 6Я, Л,= 12я]/2-/3, 1 2 ^ = 24^2-/2+/3, р48, ... 3 А Упомянем еще о десятичном приближении (скажем, по недостатку) к /2, со все возрастающей точностью; оно принимает последо- вательность значений: 1,4; 1,41; 1,414; 1,4142; ... 12 3 А и также представляет собой варианту. *) Аналогично определяется понятие последовательности точек на прямой или объектов какой-либо другой природы.
22] § 1. ВАРИАНТА И ЕЕ ПРЕДЕЛ 45 Переменную х, пробегающую последовательность (2), часто обо- значают через хп, отождествляя ее с переменным («общим») членом этой последовательности. Иногда варианта х задается тем, что указывается непосред- ственно выражение для хп; так, в случае арифметической или геометрической прогрессии имеем, соответственно, хп - а + (n - 1)с7 или xn = aqn~\ Пользуясь этим выражением, можно сразу вычислять любое значение варианты по заданному его номеру, не вычисляя предыдущих значений. Для периметра правильного вписанного многоугольника такое общее выражение возможно лишь, если ввести число л; вообще пери- метр рт правильного вписанного m-угольника дается формулой рт = 2т R sin —. В других случаях нам может быть неизвестно выражение для общего члена хп последовательности (2). Тем не менее, последова- тельность (2), а с нею и отвечающая ей варианта, считается заданной, если мы все же владеем правилом, по которому может быть вычислено любое значение варианты, лишь только известен его номер. Поэтому-то, зная правило для приближенного вычисления корней, мы можем считать заданной всю последовательность деся- тичных приближений к ^2, хотя выражения для его общего члена мы не знаем. Если варианта - в указанном смысле - задана, то этим не только охарактеризовано все множество принимаемых ею значений в целом, но и определен порядок, в котором эти значения принимаются; каждому номеру отвечает свое значение варианты, и из двух значений то считается следующим, номер которого больше. Ещё раз подчеркнем, что значения варианты не должны быть обязательно различными. Например, если задать варианту одной из формул: хп=1; xn = (-l)"+1; xn = 1+-(~1)n, то соответствующие последовательности будут: 1, 1, 1, 1, 1, I,--- 1 2 3 4 5 6 1, -1, 1, -1, 1, -1, ... 1 2 3 4 5 6 О, I, о, i, о, |, ... 1 2 3 4 5 6 В первом случае мы имеем просто постоянную величину, все «мно- жество» принимаемых ею значений сводится к одному. Во втором -
46 ТЕОРИЯ ПРЕДЕЛОВ [23 это множество состоит из двух значений, 1 и -1, принимаемых по- очередно. Наконец, в третьем случае множество значений перемен- ной бесконечно, но это не мешает значениям переменной через одно равняться 0; и мы считаем, что значение 0 на пятом месте следует не только за значением 1 на втором месте, но и за значением 0 на первом месте. 23. Предел варианты. Читатель из школьного курса также зна- ком уже с этим понятием. Вот точное его определение: Постоянное число а называется пределом варианты х = хп если для каждого положительного числа е, сколь бы мало оно ни было, существует такой номер N, что все значения хп, у которых номер n^N, удовлетворяют неравенству |хп-д|<е. (3) Тот факт, что а является пределом варианты, записывают так: limxn = a или Итх=а (lim есть сокращение латинского слова limes, означающего «предел»). Говорят также, что переменная стремится к а, и пишут хп-а или х-*«. Иной раз число а называется пределом последовательно- сти (2), и говорят, что эта последовательность сходится к а. То же определение коротко может быть сформулировано так: Число а есть предел варианты х = хп, если ее значения отличаются от а сколь угодно мало, начиная с некоторого места. Неравенство (3), где е произвольно, и есть точная запись утвер- ждения, что хп от а «отличается сколь угодно мало», а номер N как раз и указывает то «место, начиная с которого» это обстоятельство осуществляется. Важно дать себе отчет в том, что номер N, вообще говоря, .. может быть указан раз навсегда: он зависит от выбора числа г. Для того чтобы подчеркнуть это, мы иной раз вместо N будем писать Nt. При уменьшении числа е соответствующий номер N=Ne, вообще говоря, увеличивается: чем большей близости значений варианты хп к а мы требуем, тем более далекие значения ее - в ряду (2) - приходится рассматривать. Исключение представляет тот случай, когда все значения ва- рианты хп равны постоянному числу а. Очевидно, что тогда a = lim хп, но на этот раз неравенство (3) будет выполняться для любого е >0 одновременно при всех значениях хп *). *) Аналогичное обстоятельство имеет место для варианты хп, значения которой становятся равными а, начиная с некоторого места.
24] § 1. ВАРИАНТА И ЕЕ ПРЕДЕЛ 47 Неравенство (3), как мы знаем [17], равносильно следующим: —е<хп-а<е или (4) а-е<хп<а+Е; этим мы часто будем пользоваться впоследствии. Если изобразить числа а, а±е и значения хп нашей варианты точ- ками на числовой оси [21] (рис. 2), то получится наглядное геометри- ческое истолкование предела варианты. Какой бы малый отрезок а-е a+s ! g \____________ ____________ Рис. 2. (длины 2е) с центром в точке а ни взять, все точки хп, начиная с не- которой из них, должны попасть внутрь этого отрезка (так что вне его может остаться разве лишь конечное число этих точек). Точка, изображающая предел а, является как бы средоточием сгустка точек, изображающих значения варианты. s/ 24. Бесконечно малые величины. Случай, когда варианта стре- мится к нулю: хп-*0, представляет особый интерес. Варианта хп, имеющая своим пределом нуль, называется беско- нечно малой величиной, или просто бесконечно ма- лой. Если в определении предела варианты [23] положить а=0, то не- равенство (3) примет вид |х„-0| = |хп| (для и=-Л\). Таким образом, данное выше определение бесконечно малой можно подробнее сформулировать без упоминания термина «предел»: Варианта хп называется бесконечно малой, если она по абсолютной величине становится и остается меньшей сколь угодно малого наперед заданного числа е>0, начиная с некоторого места. Не вполне удачный (исторически сложившийся) термин «беско- нечно малая» величина ^е должен вводить читателя в заблуждение: ни одно в отдельности взятое значение этой величины, если оно не нуль, не может квалифицироваться, как «малое». Суть дела в том, что это - переменная величина *), которая лишь в процессе своего изменения способна сделаться меньшей произвольно взятого числа е. Если вернуться к общему случаю варианты хп, имеющей предел а, то разность осп—хп — а *) Исключая неинтересный случай, когда она тождественно равна нулю.
48 ГЛ. I. ТЕОРИЯ ПРЕДЕЛОВ (25 между переменной и ее пределом, очевидно, будет бесконечно малой: ведь, в силу (3), |ап| = |хп-а| <s (для Обратно, если ап есть бесконечно малая, то хп->~а. Это приводит нас к следующему утверждению: Для того чтобы варианта хп имела своим пределом постоянное число а, необходимо и достаточно, чтобы разность между ними о.п—хп-а была бесконечно малой. В связи с этим можно было бы дать и для понятия «предел» другое определение (равносильное старому): Постоянное число а называется пределом варианты хп, если разность между ними есть бесконечно малая величина. Разумеется, если исходить из этого определения предела, то для бесконечно малой нужно использовать второе из приведенных выше определений. Иначе получился бы порочный круг: предел определялся бы через бесконечно малую, а бесконечно малая - через предел! Итак, если варианта хп—а, то она может быть представлена в виде где ап есть бесконечно малая, и обратно, если варианта хп допускает такое представление, то она имеет пределом а. Этим часто пользуют- ся на практике для установления предела переменной. 25. Примеры. 1) Рассмотрим варианты 1 1 (-l)n+1 —» Хп-----, хп----------; п п п им отвечают такие последовательности значений: 1 1 М | ь- Ь> I — ь> I ►- 1 Ы I ь- w | >-* - 1 1 4^| 4^1 ►- Все три переменные представляют собой бесконечно малые, т. е. имеют пре- делом 0. Действительно, для них Uni-----=«, п лишь только л»- —. Таким образом, з качестве N,можно, например, взять наиболь- £ 1 (1)*) шее целое число, содержащееся в —, т. е. Е — . е (е) *) Вообще, через Е(р) обозначается наибольшее целое число, не превосходящее р, или, короче, целая часть числа р; Е есть начальная буква французского слова Entier, означающего «целый».
25] § 1. ВАРИАНТА И ЕЕ ПРЕДЕЛ 49 Отметим, что первая переменная все время больше своего предела 0, вто- рая - все время меньше его, третья же - попеременно становится то больше, то меньше его. 2) Если положить 2-f-(-l)n %п =--------, п то переменная пробегает такую последовательность значений: 3 13 13 1, 2 3 4 5 6 И в этом случае хп -0, так как 3 I хп | = е п 3 ( 3 | для п> — , так что за Ne можно принятья —I. е \е J Мы сталкиваемся здесь с любопытной особенностью: переменная поочередно то приближается к своему пределу 0, то удаляется от него. 3) Пусть теперь l+(-Dn хп =--------> п с этой вариантой мы уже имели дело в конце 22. Здесь также хп - О, ибо 2 l*nl=S-=«> П (2\ лишь только п >Ne = Е — . Iе ) Отметим, что для всех нечетных значений п переменная оказывается равной своему пределу. Эти простые примеры интересны тем, что они характеризуют многообразие тех возможностей, которые охватываются данным выше определением предела варианты. Несущественно, лежат ли значения переменной с одной стороны от предела или нет; несущественно, приближается ли переменная с каждым шагом к своему пределу; несущественно, наконец, достигает ли переменная своего предела, т. е. принимает ли значения, равные пределу. Существенно лишь то, о чем говорится в определении: переменная должна отличаться от предела сколь угодно мало в конце концов, т. е. для достаточно далеких своих значений. 4) Возьмем более сложный пример варианты: н2-н+2 хп =--------; Зп2 + 2л-4 1 докажем, что ее пределом будет число у . С этой целью рассмотрим разность 1 -5п+10 Х"-з"’з(Зя2+2л-4) и оценим ее абсолютную величину; для п 2 имеем: 1 5п -10 5п 5п 1 хп---=--------------=--------=-----, 3 3(3n2+2n-4) 3(3п2 —4) 3-2и2 п /П 1 так что это выражение меньшее, еслип =-^ = Я| — I. Этим доказано, что — . 4 I. М. Фихтенгольц, т. I
50 ГЛ. I. ТЕОРИЯ ПРЕДЕЛОВ [25 5) Определим варианту формулой 1 п_ хг1 = ап = ]!а (а=-1), и докажем, что хп -1. Если воспользоваться неравенством (3) в 19, то можно написать: а-1 fa-1' \хп - 11 = ya- 1 •'--=е лишь только n^NB = E\------- п Vе, Можно, однако, рассуждать и иначе. Неравенство равносильно такому: —*loga(l+e) или п>-------—-, п loga (1 +е) так что оно выполняется при п^Лг,, = е(---1 . Uoga (1 +£)) В соответствии с выбранным способом рассуждения мы пришли к р а з л и ч- 9 н ы м выражениям для NB. Например, при a = 10, е = 0,01 получаем No 01 =-= / 1 а ’ 0,01 = 900 по первому способу и Ao,oi =—I = 231 - по второму. По второму способу мы получили наименьшее из возможных значений для NB 01, ибо г ’ уже 10231= 1,010017 ... отличается от 1 больше, чем на е = 0,01. То же будет и в общем случае, ибо, как легко видеть, при 1 1 и=е--------- необходимо ап-1э»г. logo (1 +е) Заметим по этому проводу, что мы вовсе не заинтересованы именно в наи- меньшем возможном значении Ne, если речь идет только об установлении факта стремления к пределу. Должно быть гарантировано выполнение нера- венства (3), начиная хоть с какого-нибудь места, далекого или близкого - без- различно. 6) Важный пример бесконечно малой дает варианта an = <jn, где |зН1. Для доказательства того, что an — 0, рассмотрим неравенство W = i<7ln^; оно равносильно таким: 11,1 logs «•Iog|#| -=loge или н =-----. log| ?| Таким образом, если положить (считая е < 1) (logs 1 kTld)’ то при n>Ne упомянутое неравенство наверное выполнится. Аналогично, легко убедиться в том, что и варианта Pn = A-qn, *) Под log х здесь (и впредь) разумеется log10 х. Следует иметь в виду, что |<?| -=1 и log |?| <0; поэтому при делении обеих частей неравенства на это число знак неравенства должен быть изменен на обратный.
25] § 1. ВАРИАНТА И ЕЕ ПРЕДЕЛ 51 где по-прежнему |?|-=1, а А - постоянное число, также есть бесконечно малая. 7) Рассмотрим, далее, бесконечную убывающую геометрическую прогрессию ^а, ад, ад2, ..., адп~\ ... (|?| -= 1) и поставим вопрос об определении ее суммы. Под суммой бесконечной прогрессии, как известно, разумеется предел, к которому стремится сумма sn ее п членов при безграничном возрастании п. Но а - аап а а *. = ----------------дП 1-q 1-д 1-д а а так что варианта sn разнится от постоянного числа-на величину ап =---. qnf l-q 1-д которая, как мы только что видели, является бесконечно малой. Следовательно, по второму определению предела, искомая сумма прогрессии v а s - lim sn =-. 1 ~Q Таким образом, это число является суммой бесчисленного множества членов прогрессии, что записывают так: а a+aq+aq2+ • • *+aqn . 1-^ 8) Пусть даны два числа а и Ь. Положим х0 = a, = Ь, а последующие значения варианты хп определим равенством Х<? ъ + Хп— 1 2 Этим варианта хп, действительно,задана,так как, полагая здесь и = 2, 3, ..., можно последовательно найти все ее значения, до любого вклю- чительно. Если из обеих частей написанного равенства вычесть по xn~i, то получим 1 хп-хп_1=- — (Хп-I-Хп-2) (н = 2, 3, 4, ...). Таким образом, в ряду разностей —Xg == b — a, x2~Xi, •. •, Х/2—1 —Хп~2> Xn — xn — i, 1 каяадая (начиная со второй) получается из предыдущей умножением на - —, т. е. 1 мы имеем здесь геометрическую прогрессию со знаменателем Так как сумма п ее членов есть хп - а, то, пользуясь известной нам [см. (7)] формулой для суммы прогрессии, сразу получаем: Ь-а 2 lim (хп - а)=. - - = — (Ь-а), 1-|----1 I 2) откуда уже легко заключить, что 2 а+2Ь lim хп = а+j (Ь- а) = —— 4*
52 ГЛ. I. ТЕОРИЯ ПРЕДЕЛОВ [26 9) Наподобие геометрической прогрессии можно рассмотреть произволь- ную последовательность чисел ’ <?3 > • • • J , • • • и, по порядку складывая их, образовать «частичные суммы»: А1 = а1, Л2^й1+в2, Л3 = <г1 + я2 + о!, Ап = Й1 П2 + ... Увп, ... Если, при безграничном возрастании и, Ап стремится к (конечному или беско- нечному) пределу А, то это число называют суммой всех взятых чисел ап и пишут О1Н-п2+ ... -Ь<И4- ... ~ А. Символ в левой части этого равенства называют бесконечным рядом, а число А - его суммой. Про ряд, имеющий конечную сумму, говорят, что он сходится. Пусть, например, дан ряд 111 1 ------------------------]----1 1- • •« Ч |- ... Ь2 2-3 3-4------------------------------л(н+1) Здесь 1 1 111 ЙГ. 1 , П, — , • • •, 1-2 2 2-3 2 3 1 I 1 tfq-----—---------f , д(л+1) п n+1 так что в данном случае Очевидно, так что предложенный ряд сходится и имеет суммой единицу. Если ряд не имеет конечной суммы, про него говорят, что он расходится: таков, например, ряд 1 + 14-...+!+... 26. Некоторые теоремы о варианте, имеющей предел. Пусть варианта хп имеет предел а. При любом р^а (или q>a) легко подо- брать число е >0 так, чтобы было а-е>р (или для этого достаточно взять е меньшим разности а—р (или q — а). Но, по определению предела [23], найдется такой номер N, что для n>N будет выполняться неравенство [см. (4)] xn>a-s (хп<а + е), а следовательно - и подавно неравенство Хп--р (или xn^q). 1° Если варианта хп стремится к пределу а, и а^р (a<q), то и все значения переменной, начиная с некоторого, тоже будут >р (^q)-
26] § 1. ВАРИАНТА И ЕЕ ПРЕДЕЛ 53 Это простое предложение имеет ряд полезных следствий. 2° Если варианта хп стремится к пределу а>0 (<0), то и сама переменная х„>0 (<0), начиная с некоторого места. Для доказательства достаточно применить предыдущее утвержде- ние, взяв р = 0 (q = 0). Можно установить и более точный результат: 3° Если варианта хп стремится к пределу а, отличному от нуля, то, по крайней мере, достаточно далекие значения хп по абсолютной величине превзойдут некоторое положительное число г: |х„| >-г:-0 (для Действительно, при а >0 (< 0) можно взять ()<р-=:а (п<#-еО) и положить г=р (г= |<?|). z/40 q другой стороны, если варианта хп имеет предел а, то она является ограниченной, в том смысле, что все ее значения по абсолютной величине не превосходят некоторой конечной границы: |x„|=sAf (М=const; п = 1, 2, 3, ...). Возьмем число М' - [а|, так что - М'<а<М', и положимр = -М', a q = M'. Найдется такой номер N, что для n^N будет -М'-^хп^М' или |x„|-=Af'. Это неравенство наверное выполняется при n=N+\, N+2, ..., так что ему могут н е удовлетворять лишь первые N значений нашей варианты (или некоторые из них). Поэтому, если положить М равным наибольшему из чисел |Xi|, |х2|, ..., Ixjvl, М', то уже для всех значений хп будем иметь: |xn|'=sAf, ч. и тр. д. Замечания. I. Можно дать определение ограниченности пере- менной хп в равносильной форме, потребовав выполнения неравенств k^xn^g (и=1, 2, 3, ...), где к и g - два конечных числа. Действительно, из этих неравенств, если положить М равным наибольшему из чисел |/с[, |g|, следует jx„|=sM; обратно, если имеет место последнее неравенство, то оно может быть написано в форме - М*=хп^М, так что - Миграет роль к, а М - роль g. II. Утверждение 4° не может быть обращено: не всякая ограни- ченная варианта имеет предел. Если положить, например, хп=(- 1)п+1, то эта варианта, конечно, ограничена: |х„|=^1, но предела она не имеет, все время колеблясь от +1 к - 1,
54 ГЛ. I. ТЕОРИЯ ПРЕДЕЛОВ 127 В заключение, опираясь на предложение 1°, докажем един- ственность предела: 5° Варианта хп не может одновременно стремиться к двум различ- ным пределам. Действительно, допустим противное: пусть одновременно хп-*а и хп->-Ь, причем а <6. Возьмем любое число г между aub а^г^Ъ. Поскольку хп--а и а<г, найдется такой номер N', что для n^N' будет выполняться неравенство: С другой стороны, раз хп-+Ъ и Ь>г, найдется и такой номер N", что для n^N" окажется: хп^-г. Если взять номер п большим и АГ, и N", то соответствующее значение переменной хп будет одновременно и < г и > г, что невозможно. Это противоречие доказывает наше утверждение. 27. Бесконечно большие величины. Бесконечно малым величинам, в некотором смысле, противопоставляются бесконечно боль- шие величины (или просто бесконечно большие). Варианта хп называется бесконечно большой, если она по абсолютной величине становится и остается большей сколь угодно большого наперед заданного числа Е>0, начиная с некоторого места: |хп | > Е (для п >jVe). Как и в случае бесконечно малых, здесь также следует подчер- кнуть, что ни одно в отдельности взятое значение бесконечно большой величины не может быть квалифицировано, как «большое»; мы имеем здесь дело с переменной величиной, которая лишь в про- цессе своего изменения способна сделаться большей про- извольно взятого числа Е. Примерами бесконечно больших могут служить варианты Хп = п; Хп=-п; хп = (~1)п+1п, которые пробегают натуральный ряд чисел, но первая со знаком плюс, вторая со знаком минус, третья же - с чередующимися знаками. Вот еще один пример бесконечно большой величины: xn = Qn при |2|>1. Действительно, каково бы ни было Е=-0, неравенство i*ni = iein*E выполняется, лишь только , log Е *) n.log|e|>logE или п>-—— , logiei так что за Afe можно взять число Ep°gg_y uogiei j *) Так как |£>| =»1, то log |g| =-0.
27] § 1. ВАРИАНТА И ЕЕ ПРЕДЕЛ 55 Если варианта хп является бесконечно большой и (по крайней мере, для достаточно больших п) сохраняет определенный знак (+ или -), то, в соответствии со знаком, говорят, что варианта хп имеет пре- дел + °° или - оо, и пишут: lim хп = + оо, хп -* + оо или lim хп = - оо, хп -* - °°. Можно было бы дать для этих случаев и независимое определе- ние, заменив неравенство |х„|=-Е, смотря по случаю, неравенством хп =- Е или хп < - Е, откуда уже вытекает, соответственно, что хп>0 или х„<0. Очевидно, что бесконечно большая величина хп в общем слу- чае характеризуется соотношением: |х„|-<- + ~. Из приведенных выше примеров бесконечно больших величин, очевидно, варианта хп = и стремится к + ~, варианта хп = - п стремится к - Что же касает- ся третьей варианты: хп = (- 1)п+1п, то про нее нельзя сказать ни что она стремится к +~, ни что она стремится к — <=<>. Наконец, относительно варианты хп = QP при Q - 1 можно сказать, что она стремится к + ~, а при С-= - 1 у нее предела нет. С несобственными числами ± == мы уже сталкивались в 10; следует помнить, что их применение имеет совершенно условный смысл, и остерегаться производить над этими «числами» арифметические опе- рации. Вместо + оо часто пишут просто °о. Введение бесконечных пределов не нарушает теоремы о един- ственности предела, установленной в предыдущем п° (см. 5°); действительно, как указано было там же (4°), варианта, имеющая конечный предел а, является ограниченной и, следовательно, никак не может одновременно стремиться к бесконечному пределу. В заключение упомянем о простой связи, которая существует между бесконечно большими и бесконечно малыми величинами: Если варианта хп является бесконечно большой, то ее обратная 1 , , , величина а.п = — будет бесконечно малой. Хп Возьмем любое число е=-0. Так как |х„| -><=<>, то для числа Е = -| найдется такой номер N, что |хп|>-^-, лишь только n>N. Тогда для тех же значений п, очевидно, будет |ал|-=е, что и доказывает наше утверждение.
56 ГЛ. I. ТЕОРИЯ ПРЕДЕЛОВ 128 Аналогично можно доказать и обратное утверждение: Если варианта v.n (не обращающаяся в 0) является бесконечно малой, то обратная для нее величина хп = ^ будет бесконечно большой. § 2. Теоремы о пределах, облегчающие нахождение пределов 28. Предельный переход в равенстве и неравенстве. Соединяя две варианты хп и уп знаками равенства или неравенства, мы всегда подразумеваем, что речь идёт о соответствующих значениях их, т. е. о значениях с одним и тем же номером. 1° Если две варианты хп и уп при всех их изменениях равны: хп=уп, причем каждая из них имеет конечный предел: lim хп=a, lim уп = Ь, то равны и эти пределы: а=Ь. Непосредственно следует из единственности предела [26, 5°]. Этой теоремой пользуются обычно в форме предельного перехода в равенстве: из хп=уп заключают, что lim хп = = limy„. 2° Если для двух вариант хп, уп всегда выполняется неравенство хп^Уп> причем каждая из них имеет конечный предел: lim хп = a, lim уп = Ь, то и а^Ь. Допустим противное: пусть а<Ъ. Рассуждая так же, как и в 26, 5°, возьмем число г между а и Ь, так что а-= г<Ь. Тогда, с одной сто- роны, найдется такой номер N', что для n>N’ будет хп<г, с другой же - найдется и такой номер N", что для п >N" окажется уп > г. Если N больше обоих чисел N', N", то для номеров п >N будут одновременно выполняться оба неравенства хп^г, Уп>г, откуда хп^уп, что противоречит предположению. Теорема доказана. Эта теорема устанавливает допустимость предельного пе- рехода в неравенстве (соединенном с равенст- вом): из xns*yn можно заключить, что lim xns=limy„. Конечно, знак > всюду может быть заменен знаком -=. Мы обращаем внимание читателя на то, что из строгого не- равенства хп>уп, вообще говоря, не вытекает строгое же не- равенство lim x„>limy„, а только, по-прежнему: lim xns=limyn. Так, 1 1 например, - > - - при всех п, и тем не менее .. 1 ( 1) А lim-=lim —1 = 0, п I п)
29] § 2. ТЕОРЕМЫ О ПРЕДЕЛАХ 57 При установлении существования и величины предела варианты иногда бывает полезна теорема: 3° Если для вариант хп, уп, zn всегда выполняются неравенства Хп^Уп^п, причем варианты хп и zn стремятся к общему пределу а: lim хп = lim zn = а, то и варианта уп имеет тот же предел: lim уп = а. Зададимся произвольным е>0. По этому е, прежде всего, най- дётся такой номер N', что при n>N' а-е<хп<а+е. Затем, найдется такой номер N", что при n>N" a-e<zn~=a + e. Пусть N будет больше обоих чисел N' и N"; тогда, при a >N, вы- полняются оба предшествующих двойных неравенства, и потому a-e<xn=syn^zn^a + e. Окончательно, при n=~N а-е<уп<а + е или |уп-д|<е. Таким образом, действительно, limyn = a. Из этой теоремы, в частности, следует: если при всех п a^yn^zn и известно, что zn-+a, то и уп-*а. Впрочем, это очень легко доказать и непосредственно. Теоремы 1°, 2° и 3° легко распространяются и на случай бесконеч- ных пределов. 29. Леммы о бесконечно малых. В дальнейших теоремах нам придётся рассматривать одновременно две варианты (или больше), сочетая их между собой знаками арифметических действий. При этом, как и выше, мы относим эти знаки к соответствующим зна- чениям вариант. Например, говоря о сумме двух вариант хп и уп, про- бегающих порознь последовательности значений х1;х2,х3, ...,хп,... и Л.Уг.Уз, •••> мы имеем в виду варианту хпууп, принимающую последовательность значений Xj + Л, х2 + у2, Х3уу3, ..., Х„+Уп, ...
58 ГЛ. 1. ТЕОРИЯ ПРЕДЕЛОВ [30 При доказательстве теорем, относящихся к результатам арифме- тических операций над переменными, важную роль будут играть сле- дующие две леммы о бесконечно малых. Лемма 1. Сумма любого конечного числа бесконечно малых есть также величина бесконечно малая. Проведем доказательство для случая двух бесконечно малых а„ и (общий случай исчерпывается аналогично). Зададимся произвольным числом е>0. Согласно определению бес- конечно малой, по числу е для бесконечно малой а„ найдется такой номер N', что при n ^N' будет Ы-2- Точно так же и для бесконечно малой [>п найдется такой номер N", что при n>N" будет ВН- ЕСЛИ взять натуральное число N большим обоих чисел N' и N", то при n^-N одновременно выполняются оба эти неравенства, так что |=е ы + \fin\-=|+ |=е- Итак, величина действительно, является бесконечно малой. Лемма 2. Произведение ограниченной переменной хп на бесконечно малую хп есть величина бесконечно малая. Пусть, для всех значений и, |xn|=sM. Если задано произвольное число е>0, то по числу для бесконечно малой ап найдется такой номер N, что для п будет Тогда для тех же значений п, очевидно, [ хп • хп | —-1 хп | • | осп | ~е. Отсюда и следует, что хп • есть бесконечно малая. 30. Арифметические операции над переменными. Следующие теоремы важны в том отношении, что с их помощью во многих слу- чаях делается ненужным восхождение всякий раз к определению понятия «предел», с разысканием по заданному е соответствующего N, и т. д. Этим вычисление пределов значительно облегчается. 1° Если варианты хп и уп имеют конечные пределы'. Jim хп = a, Jim уп = Ь,
30] § 2. ТЕОРЕМЫ О ПРЕДЕЛАХ 59 то и сумма {разность) их также имеет конечный предел, причем lim(xn±yn) = a±Z>. Из условия теоремы следует, что ^П = а + «П, Уп~д + fin, (1) где <хп и рп - бесконечно малые. Тогда x„±j„ = (a±6) + (a„±^). Здесь есть бесконечно малая по лемме 1; следовательно, пользуясь вторым определением предела, можно утверждать, что варианта хп±уп имеет предел, равный а±Ь, что и требовалось до- казать. Эта теорема и ее доказательство переносятся на случай любого конечного числа слагаемых. 2° Если варианты хп и уп имеют конечные пределы: lim хп = a, lim уп = Ь, то и произведение их также имеет конечный предел, и lim хпуп - ab. Исходя из тех же равенств (1), имеем на этот раз = ab + {арп + Выражение в скобках, в силу лемм 1 и 2, есть величина бесконечно малая. Отсюда и следует, что варианта хпуп, действительно, имеет пределом ab. Эта теорема может быть распространена на случай любого ко- нечного числа сомножителей (например, методом математической ин- дукции). 3° Если варианты хп и уп имеют конечные пределы: lim хп = a, lim уп = Ь, причём b отлично от 0, то и отношение их также имеет конечный предел, а именно, lim—=£. Уп О Поскольку Ь^О, согласно утверждению 3° в 26, начиная с некото- рого места, не только но даже где г - постоянное число. Ограничимся теми значениями номера п, Хп для которых это выполняется; тогда отношение — заведомо имеет смысл. Уп Исходя, по-прежнему, из равенств (1), имеем Хп a n-j-ccn & 1 /, п \
60 ГЛ. I. ТЕОРИЯ ПРЕДЕЛОВ [31 Выражение в скобках, в силу лемм 1 и 2, есть величина бесконечно малая. Множитель же при нем, на основании сказанного вначале, будет ограниченной переменной: 1 1 1 ЬУп |6| |№|"Срк’ Следовательно, по лемме 2, все произведение справа будет бес- конечно малым, а оно представляет разность между вариантой у- и числом Итак, предел ~ есть что и требовалось доказать. 31. Неопределенные выражения. В предыдущем п° мы рассмат- ривали выражения хп±Уп, хпуп, (2) и, в предположении, что варианты хп и уп стремятся к конечным пре- делам (из которых, в случае частного, предел уп не должен был рав- няться нулю), устанавливали пределы каждого из этих выражений. Оставлены были без рассмотрения случаи, когда пределы перемен- ных хп и уп (один или оба) бесконечны или - если речь идет о частном - когда предел знаменателя нуль. Из этих случаев мы здесь остановимся лишь на четырех, представляющих некоторую важ- ную и интересную особенность. 1°. Рассмотрим сначала частное — и предположим, что обе пе- ременные хппуп одновременно стремятся к нулю. Здесь мы впервые сталкиваемся с совсем особым обстоятельством: хотя нам известны пределы хп и уп, но о пределе их отношения - не зная самих этих вариант - никакого общего утвер- ждения мы сделать не можем. Этот предел, в зависимости от част- ного закона изменения обеих переменных, может иметь различные зна- чения или даже вовсе не существовать. Следующие простые примеры поясняют это. Пусть, скажем, хп = —2 и Уп = ^’> обе варианты стремятся к нулю. Их отношение —=- также стремится к нулю. Если же, на- оборот, положить хп = -, уп = ~, то хотя они по-прежнему стремятся к нулю, на этот раз их отношение — = л стремится к «>! Взяв Уп же любое отличное от нуля число а и построив две бесконечно малые а 1 хп = - и уп = -, видим, что отношение их имеет пределом а (так как тождественно равно а).
311 § 2. ТЕОРЕМЫ О ПРЕДЕЛАХ 61 Наконец, если хп = —-—, Уп=- (обе имеют пределом нуль), то отношение — = ( - 1)п+1 оказывается вовсе не имеющим Уп предела. Таким образом, одно знание пределов вариант хп и в данном случае не позволяет еще судить о поведении их отношения: не- обходимо знать сами варианты, т. е. закон их изменения, и непо- средственно исследовать отношение —. Для того, чтобы харак- Уп теризовать эту особенность, говорят, что когда О и у„-*0, вы- ражение представляет неопределенность вида ~. 2°. В случае, когда одновременно хп — и -* + °о, имеет место подобное же обстоятельство. Не зная самих ва- риант, общего утверждения о поведении их отношения сделать нельзя. Этот факт иллюстрируется примерами, вполне аналогичными приведённым в 1°: о %П 1 f\ хп = п-*^>, Уп=п~-*°°, —=--0; Уп и о Хп Хп = П“ -► оо, Уп — ^^^ч — — Уп хп = ап-* ±оо (а#0), уп = п-*«>, - = Уп ^ = [2 + (-1)л+1]и->оо, Уп=П-*°°, Д1 = 2 + (-1)п+1 Уп вовсе не имеет предела. И в этом случае говорят, что выражение — представляет н е- е» УП определенность - вида — . со Обратимся к рассмотрению произведения хпуп. 3° Если хп стремится к нулю, в то время как уп стремится к + с», то, исследуя поведение произведения хпуп, мы сталкиваемся с такой же особенностью, как и в пунктах 1° и 2°. Об этом свидетельствуют примеры: in in = xnyn=-**0; Хп = ~-*0, уп=П2-*^, Хпуп = П-*^; х„ = ^-*0 (а^О), уп = п-*<х>, хпуп = а-*а; xn^~^--*Q, Уп=п-*^, хлул = (-1)п+1 вовсе не имеет предела. В связи с этим при х„-*0 и ул-*°° говорят, что выражение хпуп представляет неопределенность вида 0• «>.
62 ГЛ. I. ТЕОРИЯ ПРЕДЕЛОВ [32 Рассмотрим, наконец, сумму хп+уп. 4° Здесь оказывается особым случай, когда хп и уп стремятся к бесконечности разных знаков: именно в этом случае о сумме хп+уп ничего определенного сказать нельзя, не зная самих ва- риант хп и уп. Различные возможности, представляющиеся здесь, иллюстрируются примерами: х„ = 2и->- +°о, х„ = и-> +°о, хп = и + а -* + оо, Хп = и + (- 1)п+1- +°°, -и-* Уп — -2п+-~>, Уп = -п-* Уп — -п-+ хп+уп = п-+ +с°; хп+уп= -п- -< хп+уп = а-~а\ *п+УпЧ-1)п+1 вовсе не имеет предела. Ввиду этого, при хп -* + и уп — - °°, говорят, что выражение Хп+Уп представляет неопределенность вида °°-оо. Таким образом, поставив себе задачей - определить пределы арифметических выражений (2) по пределам вариант хп и уп, из ко- торых они составлены, мы нашли четыре случая, когда этого сделать О • °=, нельзя: неопределенности вида 0 “ л *) — - . и • ОО. СО — оо 7 О’ В этих случаях приходится, учитывая закон изменения вариант хп и уп, непосредственно исследовать интересующее нас вы- ражение. Подобное исследование получило название раскрытие неопределенности. Далеко не всегда оно так просто, как в приведенных выше схематических примерах. Ниже мы укажем не- сколько более интересных примеров этого рода. 32. Примеры на нахождение пределов. 1) Пусть р(п) будет многочлен, целый относительно п, с постоянными коэффициентами: р(п) = ОоПк++ ... + а*_1Л+ак. Поставим вопрос о пределе его. Если бы все коэффициенты этого многочлена были положительны (отрицательны), то сразу ясно, что пределом р(п) будет 4-оо (- ©о). Но в случае коэффициентов разных знаков одни члены стремятся к 4-другие к -и налицо неопределенность вида »-оо. Для раскрытия этой неопределенности представим р(п) в виде: &к—1 ^к Оо+—+ ---+-^+-т • п пК 1 К1) Так как все слагаемые в скобках, начиная со второго, при возрастании п будут бесконечно малыми, то выражение в скобках имеет пределом а0; первый же мно- житель стремится к 4-~. В таком случае все выражение стремится к — ~ или к — в зависимости от знака а,,. Уничтожение «неопределенности» путем преобразования выражения (чем мы здесь воспользовались) часто применяется для неопределенности. данного раскрытия *) Конечно, символы эти лишены всякого числового Каждый из них является лишь краткой условной характеристикой для одного из четырех типов неопределенности. смысла, выражений
32] § 2. ТЕОРЕМЫ О ПРЕДЕЛАХ 63 2) Если q(n) есть такой же многочлен q(ri) = bonl + b1nl~1+... +bi_1n+bi, р(п) то частное —- при возрастании п представит неопределенность вида —. q(n) Преобразуя и здесь каждый из многочленов так, как это было сделано в 1), получим: р(п) ----= пк 1 Q(n) «1 ----Ь — + п п bi b0-i---1- -.. + П № Второй множитель здесь имеет конечный предел «о —. Если степени обоих Оо р(п) *) „ отношения ------ . При Ч(п) многочленов равны: к = 1, таков же будет и предел к>1 первый множитель стремится к + °=, так что рассматриваемое отношение стремится к ± ~ (аД знак - в зависимости от знака — . Наконец, Ьо) при к^1, первый множитель, а с ним и все выраже- ние, стремится к нулю. 3) Найти объем V треугольной пирамиды SABC (рис. 3). Разделив высоту Н пирамиды на п равных частей, проведем через точки деления плоскости, параллельные плоскости основания. В сечении по- лучатся треугольники, подобные основанию. По- строим на них систему входящих и выходящих призм; из первых составится тело с объемом Vn, а из вторых - тело с объемом Vh, причем, оче- видно, Vn^V^Vh. Но разность V'n - Vn есть не что иное, как объем нижней выходящей призмы с основанием Q = Н = пл. lsABC и высотой — ; итак разность п QH V/,-Vn = -—о п при возрастании п, а тогда тем более стремятся к нулю и разности V- и Vh~ V, т. е. V= lim Fn = lim Vn. Найдем теперь выражение для Vh • Мы имеем здесь тело, составленное из ряда выходящих призм; по свойству сечений пирамиды, их основания, соответственно, будут равны: 1 22 Р п* -Q, —s, •••, -q.....^е=е, П2 П2 П2 IF и2 *) Так можно было бы получить предел — в примере 4) 25.
64 ГЛ. I. ТЕОРИЯ ПРЕДЕЛОВ [32 в то время как высота у всех одна и та же: — . Поэтому h v,n Л (12+22+... +„2) Д==6^. (»+1)(2л+1) *> л2 л л3 6 6 л2 так что , QH И=11гп Vn =--. 3 4) Найти площадь Q фигуры ОРМ, образованной частью ОМ параболы у = ах2 (а > 0), отрезком QP оси х и отрезком РМ (рис. 4). Разобьем отрезок ОР на и равных частей и построим на них ряд входящих и выходящих прямоугольников. Площади Qn и Q'n составленных из них ступенчатых х фигур разнятся площадью — • у наибольшего л прямоугольника. Отсюда, как и в 3), разность £?л-бл—0 и, так как Qn -^Q^ Qn, очевидно, Q = lim Qn •= lim Qh Так как высоты отдельных прямоуголь- ников суть ординаты точек параболы, с абс- циссами 12 i п — X, — х, ..., — X, . . ., — X = X, п п л п и - в согласии с уравнением кривой - величина их равна, соответственно, 1 22 г2 а• — х2, а- — х2, ..., а- — х2, ..., а~х2, п2 п2 п2 то для Qn получаем выражение ах2 х ах3 Qn = — (12+22+ ... + л2) • - = — л2 и 6 (л+1)(2л + 1) л2 Отсюда е=пт£й=— х•ах2 ху “1 "з ‘ Опираясь на это, легко получить, что площадь параболического сегмента 4 М'ОМ равна — ху, т. е. - двум третям площади описанного прямоугольника (этот результат был известен еще Архимеду)**). *) Здесь мы используем известную формулу для суммы квадратов первых л натуральных чисел. **) Общее определение площади криволинейной фигуры будет дано лишь в главе X (второй том); там же примененный здесь метод вычисления площади будет обобщен на другие криволинейные фигуры.
32] § 2. ТЕОРЕМЫ О ПРЕДЕЛАХ 65 5) Доказать, что при 0 /с -= I, lim [(п + l)ft - = 0. Мы имеем здесь неопределенность вида Преобразуем, вынося пк за скобку: г/ 1\к 1 Г/ 1 1 1 1 0 (n+l)fc- пк = пк I 1 +—I -11 ' пл 111 -I— I - 1 р =-. LV п) J Ц п) J n1”* Так как----^’0, то и подавно (л+1)А-иА-0, ч. и тр. д. Л1-К 6) Найти предел варианты хп = У« ( Уп+1 - уй), представляющей (согласно предыдущему примеру) неопределенность вида == 0. Умножая и деля на сумму корней уй+Т+уй, преобразуем данное выражение к неопределенности вида —: д- (У«+1 - }'«)(Уи+И- уй) у« Хд = уП*------- -----—-------- -------z > Уи+1 + Уп У?г +1 У?г наконец, делим числитель и знаменатель на п: Очевидно, так как выражение справа стремится к 1, то корня. Окончательно, это же справедливо и относительно 7) Найти пределы вариант: п п Хп = , Уп = --- У«2-гЛ У»2+1 и, наконец, 11 1 1 Zn ~ ___:+ • • • + —- ! . . . , Уп2+1 Ул2 + 2 Уи2 + 1 Уп2 + п Варианты хп и уп представляют неопределенность вида — (так как оба корня то они стремятся к ~). Преобразуем, деля числитель и знаменатель на п: Так как оба корня в знаменателе имеют пределом 1 (ср. предыдущий пример), то хл-1 и уп-1. 5 Г* М. Фихтенгольц, т. I
66 ГЛ. I. ТЕОРИЯ ПРЕДЕЛОВ [32 Выражение для zn имеет своеобразную форму: каждое слагаемое этой суммы зависит от л, но и число их растет вместе с п*). Так как каждое сла- гаемое меньше первого и больше последнего, то п п ——zzzz.zn^ , т. е. ха~zn<уп. рг2 + п pi2+1 Но (согласно уже найденному) варианты хп и уп стремятся к общему пределу 1; следовательно, - по теореме 3°, 28, - к тому же пределу стремится и варианта zn . 8) Пусть дано т положительных чисел ai, в2, ..., ат Обозначая через А наибольшее из них, доказать, что п lim У+<?2 "Г * • Т ат — А. Заключение это следует из очевидных неравенств п____________________________ ____ п А^Уа"+аг + ... +От^А-1/~т [см. 25, 5)]. 9) Мы видели в 27, что при а > 1 степень ап -* + ~ (с возрастанием п). Иссле- дуем теперь поведение отношения пк (при к =- 0), представляющего неопределенность вида — . Установим одно вспомогательное неравенство [ср. неравенство Бернулли в 19]. Положив e = 1+ Я, так что Я=-0, имеем по формуле бинома Ньютона: . л(и — 1) . п(п - 1) ап = (1+Я)п = 1 + пЛ+---- Я2+...^---- л2. 2 2 п Так как для п =-2, очевидно, п- 1 , то окончательно, При к = 1, получаем сразу cf1 (а-1)2 — =--------п, п 4 так что lim — = +~. п Так как этот результат верен при любом «=-1, то, взяв к>1, можем на- писать (по крайней мере, для достаточно больших и) £ £ o'1 Г(«А)'1]* (о*)« пк I п 1 п ' откуда в» lim —г = + “ \а > 1). /г *) Эту же особенность, впрочем, имели и выражения для Vn и Qn в 3), 4).
33] § 2. ТЕОРЕМЫ О ПРЕДЕЛАХ 67 Доказанный, таким образом, для fca=l, этот результат тем более будет верен и для &«= 1. 10) Тем же неравенством (3) можно воспользоваться, чтобы установить, что 11m У»= 1. п Именно, полагая в нем а = Уп, получим „2 л откуда п что и приводит к требуемому результату. 11) Теперь мы можем установить и другой интересный предел logo п lim—-— = 0 п Здесь мы снова имеем неопределенность вида —, ибо, как легко показать, loga«*+~. “ Действительно, если взять произвольное число с=»0, то, поскольку as>\, для достаточно больших п будет [26, 1°] Л Логарифмируя по основанию а, получим logan ------ п откуда и следует высказанное утверждение. 33. Теорема Штольца и ее применения. Для определения пределов неопределен- „ хп ~ ных выражений — типа — часто бывает полезна следующая теорема, принадле- Уп. “ жащая Штольцу (О. Stolz) ♦). Пусть варианта уп -* -г°», причем - хотя бы начиная с некоторого места - с возрастанием п и уп возрастает: Уп + х ^Уп- Тогда .. хп .. хп~хП—1 lim — = lim------, Уп Уп~Уп—\ если только существует предел справа (конечный или даже бесконечный). Допустим сначала, что этот предел равен конечному числу /: ХП~ ХП —1 , lim--------= I. Уп-Уп-1 Тогда по любому заданному е =-0 найдется такой номер N, что для n>N будет /_ е , i . / [ £ 2 Уп~Уп—1 2 *) При частном предположении уп = п мы находим эту теорему еще у К о ш и (A. L. Cauchy).
68 ГЛ. I. ТЕОРИЯ ПРЕДЕЛОВ [33 Значит, какое бы п ни взять, все дроби XN+1~XN xN + z~xN+t xn—i~xn—z хп~хп—1 yN+i~yN УЫ+2~ )’N+1 Уп-1~Уп—2 Уп — Уп—i лежат между этими границами. Так как знаменатели их, ввиду возрастания уп вместе с номером п, положительны, то между теми же границами содержится и дробь Xn~XN Уп-yN ’ числитель которой есть сумма всех числителей, написанных выше дробей, а знаме- натель - сумма всех знаменателей. Итак, при n^N хп - XN Уп ~ УЫ 2 Напишем теперь тождество (которое легко непосредственно проверить): откуда хп [ XN-fyN / .Ж'Ш'п - ГД' Уп Уп I Уп)\Уп~У№ %п Уп XN-b'N Уп хп х.\’ Уп-yN Второе слагаемое справа, как мы видели, при n~~N становится первое 2 же слагаемое, ввиду того, что уп — +<*>, также будет -= --, скажем, для n Если при этом взять N' >N, то для п >N', очевидно, хп Уп что и доказывает наше утверждение. Случай бесконечного предела приводится к рассмотренному. Пусть, например, хп~хп—г lim-------= 4- ~. Уп-Уп-i Отсюда, прежде всего, вытекает, что (для достаточно больших я) хп~хп—г Уп ~ Уп-1 > следовательно, вместе с уп ил'п->--°», причем вариантахп возрастаете возраста- нием номера п. В таком случае, доказанную теорему можно применить к обрат- Уп ному отношению —: Хп .. Уп Уп~ Уп-i „ Inn — = lim------= О хп хп ~~ хп—1 (ибо здесь предел уже конечен), откуда и следует, что lim—=+~, ч. и тр. д. Уп Обратимся снова к примерам.
33] § 2. ТЕОРЕМЫ О ПРЕДЕЛАХ 69 12) Мы видели уже в 9), что при а=-1 ап lim — = +~. п Этот результат с помощью теоремы Штольца получается сразу: о" ( 1 1 lim — = lim (ап -ап ') = lim ап 11-=+»>. п ( a J То же относится и к примеру 11). 13) Применим теорему Штольца к доказательству следующего интересного предложения (Коши): Если варианта ап имеет предел (конечный или бесконечный), то тот же предел имеет и варианта а1 + а2+ • +ап Ъп =-------------- п («среднее арифметическое» первых п значений варианты ап). Действительно, полагая в теореме Штольца хп = а1+в2+ +ап, Уп~ п, имеем: ДГи Хп_1 lim bn = lim — = lim-------= lim ап. Уп Уп~Уп-1 п Например, если мы знаем [10)], что ]/и-1, то и з _ п 1 + ]/2н-Уз + ... hYn ( п 14) Рассмотрим теперь варианту (считая к - натуральным) 1*+2А+ .. .+пк которая представляет неопределенность вида — . Полагая в теореме Штольца хп = 1к+2к+...±пк, Уп = пк + \ будем иметь lim z„ = lim —---------— . reA + 1_(„-l)fc + i Но (n- 1)к + 1 = пк+г-(к+1)пк+ ..., так что г H/t+1-(H-l)fc+I = (fc+l)^+... И [см. 2)] пк 1 lim z„ = lim----------=------. (£+1) лА+... £+1 15) В заключение определим предел варианты / j ч 1а + 2а+ ...+пк п I. к+\) пк к+\ представляющей в первой форме неопределенность вида ~ • 0, а во второй - вида Произведя вычитание дробей, получим на этот раз неопределенное выражение вида —: (к +1) (1А+2А+ ... + пк) - пк+1 Un ~ (к+1)пк
70 ГЛ. I. ТЕОРИЯ ПРЕДЕЛОВ 134 Полагая хп равным числителю этой дроби, а уп - знаменателю, применим еще раз ту же теорему. Получим (к+1) пк - [nft+1 - (л -1)»+1] lim ип = lim . (fc+l) [nk-(n-l)k] Но (k-L. к (Hl) [nk+ *-(п- l)ft+1] = 2 — л*-’+ ..., 2 а nk _ (л _ ])A = knk-i i ..., так что [см. 2)], окончательно, (*+»* -------пн *-•-... 2 1 lim ип = lim--------------= — § 3. Монотонная варианта 34. Предел монотонной варианты. Теоремы о существовании пределов переменных, которые приводились до сих пор, имели такой характер: в предположении, что для одних вариант пределы суще- ствуют, устанавливалось существование пределов для других вариант, так или иначе связанных с первыми. Вопрос о признаках существо- вания конечного предела для заданной варианты, безотноситель- но к другим переменным, не ставился. Оставляя решение этого во- проса в общем виде до § 4, 39 - 42, мы рассмотрим здесь один простой и важный частный класс переменных, для которых он решается легко. Варианта хп называется возрастающей, если Х1<Х2< . . . < Хп< , т. е. если из п’ > п следует х'п >хп. Её называют неубывающей, если • • • j т. е. если из и' =-и следует лишь хп'»хп. Можно и в последнем случае называть переменную возрастающей, если придать этому термину более широкий смысл. Аналогично устанавливается понятие об убывающей - в узком или широком смысле слова - варианте: так называется вари- анта, для которой, соответственно, *^2 • • ' *л+1 ’ • • ИЛИ ХуЗ^Х^З^ . . • 3‘Xn3^Xnjr-l3‘. . . так что из п’ >п следует (смотря по случаю) хП'^хп или лишь х^^хп. Переменные всех этих типов, изменяющиеся в одном направле- нии, объединяются под общим названием монотонных. Обычно
34J § 3. МОНОТОННАЯ ВАРИАНТА 71 о варианте говорят, что она «монотонно возрастает» или «монотонно убывает». По отношению к монотонным вариантам имеет место следую- щая - фундаментальной важности - Теорема. Пусть дана монотонно возрастающая варианта хп. Если она ограничена сверху. хп^М (Af=const; п = 1, 2, 3, ...), то необходимо имеет конечный предел, в противном же случае - она стремится к + °°. Точно так же, всегда имеет предел и монотонно убывающая вари- анта хп. Ее предел конечен, если она ограничена снизу: хп^т (m = const; п= 1, 2, 3, ...), в противном же случае ее пределом служит -ео. Доказательство. Ограничимся случаем возрастаю- щей, хотя бы в широком смысле, варианты хп (случай убывающей варианты исчерпывается аналогично). Допустим сначала, что эта переменная ограничена сверху. Тогда, по теореме п° 11, для множества {%„} ее значений должна существо- вать и (конечная) точная верхняя граница: a=sup {хп}; как мы покажем, именно это число а и будет пределом варианты хп. Вспомним, действительно, характерные свойства точной верхней границы [П]. Во-первых, для всех значений п будет хп^а. Во-вторых, какое бы ни взять число е=-0, найдется такой номер N, что Cl —£. Так как, ввиду монотонности нашей варианты (здесь мы впервые на это опираемся), прии># будет xnz*xN, т. е. и подавно хп>а-с, то для этих значений номера п выполняются неравенства 0=ssa-x„<e или |х„-а|<е, откуда и следует, что lim хп = а. Пусть теперь варианта хп не ограничена сверху. Тогда, сколь ве- лико ни было бы число Е>0, найдется хоть одно значение нашей переменной, которое больше Е; пусть это будет xN: xN>E. Ввиду монотонности варианты хп, для п и подавно х„>Е, а это и означает, что lim хп = + °°.
72 ГЛ. I. ТЕОРИЯ ПРЕДЕЛОВ [35 Легко понять, что все заключения остаются в силе и для пере- менной, которая, лишь начиная с некоторого места, становится моно- тонной (ибо - без влияния на предел переменной - любое число первых её значений можно отбросить). Обратимся к примерам применения теоремы. 35. Примеры. 1) Рассмотрим варианту (считая с>0) с71 где n! = 1 • 2 • 3... п. Она при с =-1 представляет неопределенность вида —. Так как то, лишь только л=-с- 1, переменная становится убывающей; в то же время снизу она ограничена, например, нулем. Следовательно, варианта хп - по теореме - имеет конечный предел, который мы обозначим через а. Для того чтобы найти его, перейдем к пределу в написанном выше равенстве; так как хл+1 пробегает ту же последовательность значений, что и хп (с точностью до первого члена) и имеет тот же предел а, то мы получим а = а-0, отсюда а = 0 и, окончательно, с71 lim — = 0. п! 2) Считая снова с =- 0, определим теперь варианту хп так: Х1=Ус, х2 = Ус+ ]/с, х3= ]/с+Ус+}'с, . • и вообще пкорней Таким образом, хп+1 получается из хп по формуле *n+t= Ус+Х„. Ясно, что варианта хп монотонно возрастает. В то же время она ограничена сверху, например, числом Ус+1. Действительно, xt= ]/с меньше этого числа; если допустить теперь, что какое-либо значение хп< ]/'с+1. то и для следующего значе- ния получаем +1 *= Ус+ Ус+1 -< Ус+2Ус+1 = Ус +1. Таким образом, наше утверждение оправдывается по методу математической индукции. По основной теореме, варианта хп имеет некий конечный предел а. Для определения его перейдем к пределу в равенстве Хп+1~С + Хп', мы получим, таким образом, что а удовлетворяет квадратному уравнению а! = с+а.
35] § 3. МОНОТОННАЯ ВАРИАНТА 73 Уравнение это имеет корни разных знаков; но интересующий нас предел а не может быть отрицательным, следовательно, равен именно положительному корню: ]/4с+1 +1 3) Взяв любое ха, 0-=ao-=1, определим варианту хп рекуррентным соотно- шением xn+i — хп(2 — Хц). Допустив, что 0 -= хп « 1 (это условие для п = 0 выполнено), установим, что 0-< хц хп :: 1. Действительно, так как 2-х,г>1, то хП71 =-х„; но хп(2-хп) = 1 - (1 -х;1)2, откуда xn+1-= 1. Таким образом, индуктивно доказано, что варианта хп, монотонно воз- растая, остается меньше единицы; следовательно, она имеет конечный предел а#0. Переходя к пределу в рекуррентном соотношении, найдем, что в=1. Итак, limxn = l. Предоставляем читателю самому разобраться в том, что произойдет, если взять х0 вне промежутка (0, 1). Замечание. Пусть с - любое положительное число, и положим хп = суп Написанное выше рекуррентное соотношение заменится таким: Уп+1=Уп(2-сУп)- 1 Взяв начальное значение уа под условием: 0-=.то-= —, получим, что уп, монотонно _ 1 с возрастая, будет стремиться к —. По этой схеме на счетных машинах и вычисля- с ется число, обратное с. 4) Пусть даны два положительных числа а и b (а^Ь). Составим их среднее арифметическое и среднее геометрическое: ai- b^yab. Известно, что первое среднее больше второго *); в то же время оба они содержатся между исходными числами: а^а^Ь^Ь. Для чисел в] и bL снова составим их оба средних: «i + ii , -т- @2---~ причем #2 ^2 > и т. д. Если числа дпи&,г уже определены, то яп+1 и bn+i определяются по фор- мулам ап+Ьп —т- ап+\-----—> bn+i- \ япЬп и, как и выше, яп ^Яп+i^bn+j >Ьп. ♦) Это сразу следует из неравенства a+Z> ..— 1 , , (Va-VS)2 —-----] — (а-2УаЬ+Ь) =------------>0 (при а^Ь).
74 ГЛ. I. ТЕОРИЯ ПРЕДЕЛОВ [35 Таким образом составляются две варианты ап и Ьп, из которых первая оказы- вается убывающей, а вторая - возрастающей (навстречу одна другой). В то же время так что обе варианты ограничены и, следовательно, обе стремятся к конечным пределам: а = lim ап и /3 = lim bn Если в равенстве Оп + Ьп ап + 1------- перейти к пределу, то получим “+£ , о а = , откуда а - р. Таким образом, обе последовательности - и средних арифметических ап, и средних геометрических Ьп - стремятся к общему пределу р =р(а, by, следуя Гауссу (С. F. Gauss), его называют средним арифметико-геомет- рическим исходных чисел а и Ь. Выражение числа р (а, Ь) через эти последние покуда нам недоступно - для него требуется так называемый эллиптиче- ский интеграл (см. второй том). 5) Отправляясь снова от двух положительных чисел а и & (а=~Ь), на этот раз станем последовательно составлять средние арифметические и средние гармо- нические *). a+b 2аЬ = = —т, 2 а+Ь avA-bl 2«151 (In " ' • Ьп = ~~~ « 2 Oj+Z»! Ort + bn an + l - • ~ 2апЬп ’п +1 = г Чп + Ьп Из известного уже нам неравенства (при а^Ь) получаем: fa+b}2 a+b 2ab ----- >ab и, наконец, = , [ 2 ) 2-a+b так что среднее арифметическое больше среднего гармонического; к тому же оба средних содержатся между исходными числами. Применяя это к ап и Ьп, найдем: ап 4-1 =» Ьп 4-! =- Ьп . Совершенно аналогично тому, как это было сделано в предыдущем примере, убедимся в том, что обе варианты ап и Ьп стремятся к общему пределу с, кото- рый можно было бы назвать средним арифметико-гармониче- ским чисел а и Ь. *) Число с называется средним гармоническим двух положи- тельных чисел а и Ь, если обратное ему число — является средним ариф- 1 1 с метическим для обратных чисел — и — : а b 11) 2аЬ —I— , откуда с =------. а Ь) а+Ь 1 _ ! / 7~ 2 I
351 § 3. МОНОТОННАЯ ВАРИАНТА 75 Однако, здесь предел с имеет простое выражение через а и Ь. Именно, видим, что а161 = «/>; так как, аналогично, и ап+1Ьп+1 = апЬп, то заключаем, что при всех значениях п anbn = ab. Переходя здесь к пределу, получаем с= }rab, т. е. среднее арифметико-гармоническое двух чисел попросту есть их среднее геометрическое. 6) Наконец, приведем более сложный пример. с Исходя из некоторого вещественного числа с, положим хх = ~, а последую- щие значения варианты хп определим индуктивно формулой С Хп Хп+1=2+2' (1) Исследуем вопрос о пределе этой варианты при двух различных предположениях относительно с. Заметим, что, если бы мы наперед знали, что существует конечный предел а = lim хп, (2) то найти его не составило бы труда. Стоит лишь перейти к пределу в равенстве (1), определяющем нашу варианту, чтобы получить с а2 а = —।— иди а2-2а + с=0. 2 2 Из этого квадратного уравнения находим а=1-1/Т^с. (3) (+) Отсюда сразу видно, что варианта хп заведомо не может иметь конечного предела при с»-1. (а ) Предположим сначала, что 0-=са=1. Тогда ясно, что хп=-0. Вычитая из (1) почленно аналогичное равенство найдем, что V2 ,-2 Хп~Хп—1 хпи~хп =---------- . с Очевидно, х2>хх = —\ а из предыдущего равенства следует, что, лишь только Xrr^Xn-i, тотчас же и хп+1э-хп-Таким образом, по методу математической индук- ции устанавливается факт монотонного возрастания варианты хп. Аналогично доказывается ограниченность (сверху) нашей варианты: хп<1. Это неравенство очевидно для и = 1; если же оно соблюдается при каком-нибудь значении п, то будет верно и для п+1 — в силу (1). Значит, предел (2) действитель- но существует, а тогда он выражается формулой (3), и именно со знаком минус при корне, так как предел этот не может быть больше единицы. б) Пусть теперь - 3«=с-=0. Очевидно, для всех п: с хп^—
76 ГЛ. I. ТЕОРИЯ ПРЕДЕЛОВ [35 Покажем, что в этом случае хп -= 0. Это верно при п = 1; если же допустить справед- ливость этого утверждения для какого-либо значения п, то так как------- 1 4 и хп+1 будет иметь знак — , т. е. будет отрицательным, ч. и тр. д. На этот раз варианта хп не будет монотонной. Однако, если поло- жить в (1) п = 2к и 2к-2, а затем п = 2£+1 и 2&-1, и в обоих случаях почленно вычесть, то получим: 2 2 х2к~ х2к— 2 x2fc+l ~ х2к-1 = ~ 2 2 х2к+1 “ Хгк—1 x2/t+ х2к~----------~------ (4) Отсюда можно индуктивно заключить, что всегда Х2/с + 1 x2Zf-l И Х2к+Ъ^ Х2к • С 2 2 Действительно, x3=-Xi = — тогда ]х3|-< (xj, x3^xj, и по второй из формул (4) (при к = 1) будет х4 -= х». Следовательно, | х4 ] =- | х21, х4 =- х|, и по первой из формул (4) (при к = 2) получится х5=-х3, и т. д. Таким образом, в рассматриваемом случае, монотонными будут порознь взятые варианты х2к-\ и х2к (fc=l, 2, 3, ...); так как они содержатся между с конечными границами — и 0, то обе имеют конечные пределы а' = lim x2k-i, а" = lim х2/с. Остается показать, что а' = а". С этой целью устремим значок л в (1) к беско- нечности, сначала через четные значения, а затем - через нечетные. Мы получим в пределе два соотношения: Вычитая, исключим с: с а"2 с а'2 । =—।—_ ц" = —।-- 2 2 2 2 (а' - «")(«' + а"+2) = 0. (5) Как мы установим сейчас, если с =- - 3, вторые скобки обратиться в 0 не могут, так что необходимо а' = а". Действительно, в противном случае, подставляя «" = = - а' - 2 во второе из соотношений (5), мы получили бы для а' квадратное урав- нение в'2 + 2а' + (4 + с) = 0, которое, именно при с - 3, вещественных корней иметь не может. Наконец, если с = - 3, вторые скобки обращаются в 0 одновременно с первыми, ибо в этом случае и а’ — -1 и а" = -1. Итак, во всех случаях а' -а": Обозначив общее значение этих пределов через а, имеем для а выражение (3), очевидно, снова со знаком минус при корне, ибо предел отрицательной варианты хп не может быть положительным. Изложенные примеры дают повод к следующему замечанию. Дока- занная теорема является типичной «теоремой существования»: в ней устанав- ливается факт существования предела, но не дается никакого приема для его
36J § 3. МОНОТОННАЯ ВАРИАНТА 77 вычисления. Тем не менее она имеет очень важное значение. С одной стороны, в теоретических вопросах часто только существование предела представляется нужным. С другой же стороны, во многих случаях возможность предварительно удостовериться в существовании предела важна тем, что открывает пути для его фактического вычисления. Так, в примерах 1), 2), 3), 5), 6) именно знание факта существования предела позволило, с помощью перехода к пределу в некоторых ра- венствах, установить точное значение предела. В этом отношении особенно поучителен пример 6) (б). Ведь при с -- - 3 выра- жение (3) сохраняет смысл, но это вовсе не означает, что оно продолжает давать предел варианты хп; напротив, он здесь не существует: например, как нетрудно проверить, при с = - 4 наша варианта пробегает последовательность значений: -2,0, -2,0, -2,0,... и никакого предела не имеет. В примере 4) мы выражения для предела не имеем, но, зная что он существует, легко можем вычислить его с любой степенью точности, ибо он содержится между вариантами ап и Ьп , которые к нему стремятся с обеих сторон. В следующем п° мы познакомимся с еще одним важным примером приложения теоремы о монотонной варианте. 36. Число е. Мы используем здесь предельный переход для опреде- ления нового, до сих пор не встречавшегося нам числа. Рассмотрим варианту п« и попытаемся применить к ней теорему п° 34. Так как с возрастанием показателя п основание степени здесь убывает, то «монотонный» характер варианты непосред- ственно не усматривается. Для того чтобы убедиться в нем, прибег- нем к разложению по формуле бинома: Если от хп перейти теперь к хп+1, т. е. увеличить п на единицу, то, прежде всего, добавится новый, (и + 2)-й (положительный) член, каждый же из написанных п +1 членов увеличится, ибо
78 ГЛ. I. ТЕОРИЯ ПРЕДЕЛОВ [36 любой множитель в скобках вида 1 - - заменится большим мно- п жителем 1 - . Отсюда и следует, что Хп+1>Хп, т. е. варианта хп оказывается возрастающей. Теперь покажем, что она к тому же ограничена сверху. Опустив в выражении (6) все множители в скобках, мы этим увели- чим его, так что „11 1 Х',<2 + Й + 31 + ' ’ ‘ + п\~Уп' Заменив, далее, каждый множитель в знаменателях дробей (начи- ная с 3) числом 2, мы еще увеличим полученное выражение, так что, в свою очередь, „11 1 •У«<2 + 2 + 22+ ’ ’ ’ + 2^1 ’ Но прогрессия начинающаяся членом Л имеет сумму <1, поэтому jn<3, а значит и подавно х„<3. Отсюда уже следует, по теореме п° 34, что варианта хп имеет ко- нечный предел. По примеру Эйлера (L. Euler), его обозначают всегда буквой е. Это число е = lim 1 + - I п имеет исключительную важность как для самого анализа, так и для его приложений. Вот первые 15 знаков его разложения в десятичную дробь: е = 2,71828 18284 59045 ... В следующем п° мы покажем удобный прием для приближенного вычисления числа е, а также попутно установим, что е есть число и р р а циональное. Некоторые свойства числа е, которые мы установим впоследст- вии [54, (13)], делают особенно выгодным выбор именно этого числа в качестве основания для системы логарифмов. Логарифмы по осно- ванию е называются натуральными и обозначаются знаком In без указания основания; в теоретических исследованиях пользуются исключительно натуральными логарифмами *). *) Эти логарифмы иногда ошибочно называют Неперовыми по имени шотландского математика Непера (J. Napier, XVI - XVII в.) - изобрета- теля логарифмов. Сам Непер не имел понятия об основании системы лога- рифмов (ибо строил их своеобразно, на другом принципе), но его логарифмы 1 соответствуют логарифмам по основанию, близкому к — . Близкое к е основание е имеют логарифмы его современника Б ю р г и (J. Burgi).
37] § 3. МОНОТОННАЯ ВАРИАНТА 79 Упомянем, что обычные, десятичные, логарифмы связаны с натуральными известной формулой: log х = In х • М, где М есть модуль перехода и равен М=log е = --Гп = 0,434294 ...; ° In 10 это легко получить, если прологарифмировать по основанию 10 тож- дество х = е1пх. 37. Приближенное вычисление числа е. Вернемся к равенству (6). Если фиксировать к и, считая n=-fc, отбросить все члены по- следней части, следующие за (к + 1)-м, то получим неравенство Увеличивая здесь п до бесконечности, перейдем к пределу; так как все скобки имеют пределом 1, то найдем: ега2 + ^+^ + ' ’ ’ +^Ук' Это неравенство имеет место при любом натуральном к. Таким об- разом, имеем Хп^Уп^е, откуда ясно [в силу теоремы 3°, 28], что и limy„ = <?. Заметим попутно, что уп есть (п+ 1)-я частичная сумма для бесконеч- ного ряда [25, 9)] и написанное только что предельное соотношение показывает, что е является его суммой; говорят также, что число е разлагается в этот ряд, и пишут 1 1 1 e=1+n+a+-+ri+-" Варианта уп для приближенного вычисления числа е гораздо удоб- нее, чем хп. Оценим степень близости уп к е. С этой целью рассмотрим
80 ГЛ. I. ТЕОРИЯ ПРЕДЕЛОВ [37 сначала разность между любым значением уп+т (т = 1, 2, 3, ...), сле- дующим за , и самим уп. Имеем 1 1 1 Уп+т Уп-(п + 1)1 +(л+2)! + • ’ • + (п+т)Г 1 (. 1 1 li (п + 1)! ( п + 2 (п+2)(п + 3) ' (п+2)(п+3) ... (п + т)) Если в скобках { } заменить все множители в знаменателях дробей через п + 2, то получим неравенство 1 г. 1 1 11 Уп+т 3,п'с(п+1)!|И п + 2 + (п + 2)2+ "• +'(п+2)й-1р которое лишь усилится, если заменить скобки суммой бесконеч- ной прогрессии: 1 и + 2 Уп+т Сохраняя здесь п неизменным, станем увеличивать т до беско- нечности; вариантауп+т (занумерованная значком т) принимает после- довательность значений Ул+1, Уп+2> Улц-З, • • • > Уп+т> • • • , очевидно, сходящуюся к е. Поэтому получаем, в пределе, или, наконец, 1 п + 2 е Уп^(п+Г)'. "л+1 0^е-уп-=:~- \ п!и Если через 0 обозначить отношение разности е-уп к числу ~ (оно, очевидно, содержится между 0 и 1), то можно написать также а е~Уп~1йп' Заменяя здесь уп его развернутым выражением, мы и придем к важ- ной формуле: ,111 10 е=1 + П + Я + 3!+--- п!+п!п’ ♦) Так как (это легко проверить) п + 2 1 (п+1)2 и
37] § 3. МОНОТОННАЯ ВАРИАНТА 81 которая послужит отправной точкой для вычисления е. Отбрасывая последний, «дополнительный», член и заменяя каждый из оставлен- ных членов его десятичным приближением, мы и получим прибли- женное значение для е. Поставим себе задачей с помощью формулы (7) вычислить е, 1 гт скажем, с точностью до . Прежде всего, нужно установить, каким взять число п (которое находится в нашем распоряжении), чтобы осу- ществить эту точность. Вычисляя последовательно числа, обратные факториалам (см. при- лагаемую табличку), мы видим, что при п = 10 «дополнительный» член формулы (7) будет уже ^-ЮЛо-0’000 000 03’ так что, отбрасывая его, мы делаем погрешность, значительно мень- шую поставленной границы. Остановимся же на этом значении и. Каждый из остальных членов обратим в десятичную дробь, округляя (в запас точности) на восьмом знаке так, чтобы погрешность по абсолютной величине была меньше половины единицы на восьмом 1 „ месте, т. е. меньше jiq»- ™ы свели результаты вычислении в таб- личку. Рядом с приближённым чис- лом поставлен знак (+ или -), ука- зывающий на знак и о п р а в к и, ко- торую необходимо было бы приба- вить для восстановления точного числа. Итак, как мы видим, поправка на отбрасывание дополнительного 3 W члена меньше . Учитывая теперь lv° ещё и поправки на округление (с их знаками), легко сообразить, что сум- марная поправка к полученному при- ближенному значению числа е лежит между 3 5 ----ТТ -I------ 10» 10» Отсюда само число е содержится между дробями 2,718 281 78 и 2,718 281 86, так что можно положить 2,000 000 00 i=0,500 000 00 ^i = 0,166 666 67- ^=0,041 666 67- 0,008 333 33 + 0,001 388 89- о! ^=0,000 198 41 + i=0,000 024 80 + О; ^=0,000 002 76- i=0,000 000 28- 2,718 281 81 е = 2,718 281 8±o,ooooooi. Отметим попутно, что та же формула (7) может служить и для доказательства иррациональности числа е. 6 Г. М. Фихтенгольц» т. I
82 ГЛ. I. ТЕОРИЯ ПРЕДЕЛОВ 138 Рассуждая от противного, попробуем допустить, что е равно ра- циональной дроби — ; тогда, если именно для этого п написать фор- мулу (7), будем иметь т , 11 1 0 /г. г, , \ -=1 + -п+^+ ... +-7+-7-(О-=0<1). п 1! 2 n! пIn v Умножив обе части этого равенства на и!, по сокращении знамена- телей всех дробей, кроме последней, мы получим слева це- к 6 лое число, а справа - целое число с дробью—, что невозможно. Полученное противоречие и доказывает то, что требо- валось. 38. Лемма о вложенных промежутках. В заключение этого параграфа, посвященного монотонной варианте, остановимся на со- поставлении двух таких вариант, изменяющихся «навстречу» одна другой: Пусть даны монотонно возрастающая варианта хп и монотонно убывающая варианта уп, причем всегда Хп^Уп- (8) Если их разность уп - хп стремится к 0, то обе варианты имеют об- щий конечный предел: с = lim хп = lim уп. Действительно, при всех значениях п имеем: уп^уг, а значит, ввиду (8), и хп-^у1 (n = 1, 2, 3, ...). Возрастающая переменная хп ока- зывается ограниченной сверху, следовательно, она имеет конечный предел с = lim хп. Аналогично, для убывающей переменной уп будем иметь Уп э"3:п^х1, так что и она стремится к конечному пределу c' = Iimjn. Но, по теореме 1°, 30, разность обоих пределов с' -с= lim(y„-xn), т. е. по условию равна 0, так что с' = с; это и требовалось доказать. Доказанному утверждению можно придать другую форму, в ко- торой оно чаще применяется. Назовем промежутком [а, Ь} (где а «= Ь) множество всех чисел (или, как говорят, «точек») х, удовлетворяющих неравенствам a^xsb. Числа («точки») а и Ъ называются, соответственно, левым и пра- вым концами промежутка, а их разность b-а - длиной
391 § 4, ПРИНЦИП СХОДИМОСТИ. ЧАСТИЧНЫЕ ПРЕДЕЛЫ 83 промежутка. Нетрудно видеть, что на числовой оси промежутку отвечает отрезок (той же длины). Условимся говорить, что промежуток [а', й'] содержится в про- межутке [а, й] или вложен в него, если все точки первого про- межутка принадлежат второму или, что то же самое, если а^а' <b'*sb. Геометрический смысл этого ясен. Пусть имеется бесконечная последовательность вложенных один в другой промежутков [»1, [«2, ЬД, ..., [ап, Ьп], ..., так что каждый последующий содержится в предыдущем, причем длины этих промежутков стремятся к 0 с возрастанием п: lim (й„ - а„) = 0. Тогда концы ап и Ьп промежутков (с разных сторон) стремятся к об- щему пределу с = lim ап = lim bn, который представляет единственную точку, общую всем проме- жуткам. Это есть лишь перефразировка доказанной выше теоремы: согласно условию, @п bп+1^Ьп , так что левый конец ап и правый конец Ьп п-ro промежутка играют здесь роль монотонных вариант хц и у„. Так как ап стремится к с возрастая, а Ьп - убывая, то ап^с^.Ьп (и=1, 2, 3, ...), т. е. точка с, действительно, принадлежит всем нашим промежуткам. В то же время другой, отличной от с, точки с' с тем же свойством быть не может, ибо иначе мы имели бы йп-апв=|с'-с| -О и длина л-го промежутка не могла бы стремиться к 0. Впоследствии нам не раз придется опираться на это предложение, которое мы будем называть «леммой о вложенных промежутках». § 4. Принцип сходимости. Частичные пределы 39. Принцип сходимости. Пусть задана варианта хп, пробегаю- щая последовательность значений *1, х2, ..., хп, ..., хП', ... (1) Займемся, наконец, вопросом об общем признаке существо- вания конечного предела для этой варианты. Само опре- в
84 ГЛ. I. ТЕОРИЯ ПРЕДЕЛОВ [39 деление предела для этой цели служить не может, ибо в нем фигури- рует уже тот предел, о существовании которого идет речь. Мы нуж- даемся в признаке, который использовал бы лишь то, что нам дано, а именно - последовательность (1) значений варианты. Поставленную задачу решает следующая замечательная теорема, принадлежащая чешскому математику Больцано (В. Bolzano) и французскому математику Коши (A. L. Cauchy); ее называют прин- ципом сходимости. Теорема. Для того чтобы варианта хп вообще имела конеч- ный предел, необходимо и достаточно, чтобы для каждого числа е>0 существовал такой номер N, чтобы неравенство хп-хп-\^е (2) выполнялось, лишь только п >N и п >N. Как видит читатель, суть дела здесь в том, чтобы значения пере- менной между собой безгранично сближались по мере воз- растания их номеров. Обратимся к доказательству. Необходимость. Пусть варианта хп имеет определенный конечный предел, скажем, а. По самому определению предела [23], каково бы ни было число е>0, по числу у найдется такой номер N, что для n>N всегда имеет место неравенство I I е Ип-«|-=2 • Возьмем теперь любые два номера n>N ип' для них одно- временно будет и |a-xn,|«=j, 1 I ъ откуда | хп - хП' | = | (хп - а) + (а - хп<) | | хп - а | + | а - хп> | -< ~1 =е. Этим необходимость условия доказана. Значительно труднее дока- зать его Достаточность. Пусть условие теоремы выполнено; тре- буется установить, что тогда для варианты хп существует определен- ный конечный предел. С этой целью произведем в области всех вещественных чисел сечение по следующему правилу. В нижний класс А отнесем каждое такое вещественное число а, для которого, начиная с некоторого номера, выполняется неравенство х„>а. В верхний же класс А' отнесем все остальные (т. е. не попавшие в А) вещественные числа а'.
40] § 4. ПРИНЦИП СХОДИМОСТИ. ЧАСТИЧНЫЕ ПРЕДЕЛЫ 85 Прежде всего, убедимся в непустоте этих классов, используя для этого условие теоремы. Задавшись произвольным числом е>0, возь- мём соответствующий ему (в указанном там смысле) номер N. Если п и п' >N, то выполняется (2), откуда хП'-£-=хп<хП’+е. (3) Теперь мы видим, что каждое число х^-в (где п' >7V) в отдельно- сти относится к классу А, ибо для достаточно больших п (именно, для n^N ) хп его превосходит. С другой стороны, так как (для тех же п) хп оказывается меньшим, чем любое из чисел вида хп-+е (при п'>N), то ни одно такое число заведомо не может принадлежать А и, следовательно, относится к классу А'. Правило, определяющее классы А и А', так сформулировано, что из него непосредственно ясно, что каждое вещественное число попадает в один и только один из этих классов. Вместе с тем, каждое число а (из А) меньше каждого числа а' (из А'); ведь, при а>а', ва- рианта хп, начиная с некоторого места, превзошла бы и а', вопреки определению чисел а'. Таким образом, произведенное разбиение об- ласти вещественных чисел на классы есть, действительно, сечение. По основной теореме Дедекинда [10], существует такое ве- щественное число а *), которое является пограничным между числами обоих классов: а Но, как мы отметили, при любом n' ^N число хп’-в есть одно из а, а число хп-+е - одно из а'. Поэтому, в частности, xn--e=sa=sxn'+e или |a-xn<] = =se для любого По определению же предела [23], это и значит, что а = lim хп. Теорема доказана. Применение этого признака мы будем не раз встречать в даль- нейшем изложении. 40. Частичные последовательности и частичные пределы. Рассмотрим теперь, наряду с последовательностью (1), какую-либо извлеченную из нее частичную последовательность (или под- последовательность) Хп,, Хп,, Хп,, ..., xni, ..., (4) где {лл} есть некоторая последовательность возрастающих на- туральных чисел: n1-=«2-=«3<...-=nfc-=^+1-=... (5) *) В указанной теореме оно было обозначено через /?.
86 ГЛ. I. ТЕОРИЯ ПРЕДЕЛОВ [40 Здесь роль номера, принимающего последовательно все нату- ральные значения, играет уже не п, а к\ пк же представляет собой варианту, принимающую натуральные значения и, очевидно, стремя- щуюся к оо при возрастании к. Если последовательность (1) имеет определенный предел а (конеч- ный или нет), то тот же предел имеет и частичная последователь- ность (4). Остановимся для примера на случае конечного а. Пусть для за- данного е>0 нашлось такое N, что при n>N уже выполняется не- равенство: -а\ <е. Ввиду того, что пк—°°, существует и такое К, что при к>К будет nk^N. Тогда, при тех же значениях к, будет выполняться неравен- ство что и доказывает наше утверждение. [Заметим попутно, что в этом рассуждении мы не опирались на неравенства (5), т. е. не пользовались монотонностью варианты пк. Значит, наше утверждение сохраняет силу, по какому бы закону не стремилась к +°° целочисленная варианта пк.] Если для варианты хп или, что то же, для последовательности (1) нет определенного предела, то это не исключает возможности суще- ствования предела для какой-либо частичной последователь- ности (4) или для соответствующей ей варианты хк=х^. Такой пре- дел называют частичным пределом для вариантыхп или после- довательности (1). Пусть, например, хп = (- l)n+1; предела эта варианта не имеет. Если же за- ставить п пробегать лишь одни нечётные или одни четные значения, то частич- ные последовательности х± — 1, х$ = 1, • • •, х*к_j — 1, ... и х2=-1, х4=-1, ..., хгк = - 1, ... будут иметь пределом, соответственно, 1 или - 1. Эти числа и являются частич- ными пределами варианты хп. Аналогично, варианта = (- 1)п+1л имеет ч а- стичные пределы +~ и а варианта = Ж-1)'*4'1 - частичные пре- делы + == и 0. Легко построить примеры варианты, для которой существует бесконечное множество различных частичных пределов; вот один из них. Зададим варианту Хп следующим правилом: если номер п написан по десятичной системе: aft... v (где а, Д ..., v - цифры), то полагаем х.п = 0, «0 ... v. Например, xi3 = 0,13, х1п35 = 0,4035 и т, д. При этом каждая конечная деся- тичная дробь, между 0,1 и 1, встречается в ряду значений нашей варианты бесконечное множество раз: например, 0,217 - на 217-м месте, а также на 2170-м, 21700-м и т. д.
41] § 4. ПРИНЦИП СХОДИМОСТИ. ЧАСТИЧНЫЕ ПРЕДЕЛЫ 87 Отсюда сразу следует, что каждая конечная десятичная дробь между 0,1 и 1 будет служить частичным пределом для нашей варианты. Но если взять и любое другое вещественное число а в этих границах, то стоит лишь представить его в виде бесконечной десятичной дроби [9]: а=0, qcj ... Cfc ... (c^l), чтобы стало ясно, что частичная последовательность Хсх = 0, Ci, Acxct — 0, CiC% * • * , XcxCj ... Cfc = 0, CiC% ... Ск, ... имеет именно это число а своим пределом. Таким образом, в рассматриваемом случае частичными пределами последовательности заполняется весь промежуток [0,1; 1]. Всегда ли для варианты хп существуют частичные пределы? На этот вопрос легко ответить утвердительно в случае, когда мно- жество {хп} не ограничено. Пусть например, оно не ограничено с в е р- х у; тогда для каждого натурального к найдется в ряду (1) член x„t, больший, чем к: хПк>к (к = 1, 2, 3, ...) (причем легко устроить так, чтобы номера пк возрастали вместе с к). Частичная последовательность . Хп, > 5 - ’ • ? Хщ э • • • ? очевидно, будет иметь пределом + это и есть частичный предел для нашей варианты. Утвердительный ответ можно дать и в случае ограниченной ва- рианты; но это требует более тонких соображений, которые мы при- ведём в следующем п°. 41. Лемма Больцано — Вейерштрасса (В. Bolzano — С. Weier- strass). Из любой ограниченной последовательности (1) всегда можно извлечь такую частичную последовательность (4), которая сходилась бы к конечному пределу. (Эта формулировка не исключает возможности и равных чисел в составе данной последовательности, что удобно в приложениях.) Доказательство. Пусть все числа хп заключены между гра- ницами а и Ъ. Разделим этот промежуток [а, й] пополам, тогда хоть в одной половине будет содержаться бесконечное множе- ство элементов данной последовательности, ибо, в противном слу- чае, и во всем промежутке [а, Ь] этих элементов содержалось бы ко- нечное число, что невозможно. Итак, пусть [<ях, будет та из поло- вин, которая содержит бесконечное множество чисел хп (или, если обе половины таковы, то - любая из них). Аналогично, из промежутка [<з15 А-Д выделим его половину [а2>^г1 - при условии, чтобы в ней содержалось бесконечное мно- жество чисел хп, и т. д. Продолжая этот процесс до бесконеч- ности, на k-й стадии его выделим промежуток [ак, Ьк], также содер- жащий бесконечное множество чисел хп.
88 ГЛ. I. ТЕОРИЯ ПРЕДЕЛОВ [41 Каждый из построенных промежутков (начиная со второго) со- держится в предыдущем, составляя его половину. Кроме того, длина к-го промежутка, равная , Ь-а t>k~ak--2JT > стремится к нулю с возрастанием к. Применяя сюда лемму о вло- женных промежутках [38], заключаем, что ак и Ък стремятся к общему пределу с. Теперь построение частичной последовательности {хП1} произведем индуктивно - следующим образом. В качестве х^ возьмем любой (например, первый) из элементов хп нашей последовательности, со- держащихся в [«j, В качестве х^ возьмем любой (например, пер- вый) из элементов хп, следующих за хп> и содержащихся в [^2, и т. д. Вообще, в качестве х„к возьмем любой (например, первый) из элементов хп, следующих за ранее выделенными Хл,, х„г, ...,хп^ и содержащихся в [ак, Возможность такого вы- бора, производимого последовательно, обусловливается именно тем, что каждый из промежутков [ак, содержит бесконечное множество чисел хп, т. е. содержит элементы хп со сколь угодно большими номерами. Далее, так как и limak=limbk=c, то, по теореме 3°, 28, и lim хПк = с, ч. и тр. д. Метод, примененный при доказательстве этой леммы и состоящий в последовательном делении пополам рассматриваемых промежутков, известен под именем метода Больцано; он часто будет нам по- лезен и в других случаях. Лемма Больцано-Вейерштрасса значительно облег- чает доказательство многих трудных теорем, как бы вбирая в себя основную трудность рассуждения. Для примера докажем снова с ее помощью принцип сходимости; мы имеем в виду достаточность содержащегося в нем условия, которая потребовала от нас в 39 зна- чительных усилий. Итак, пусть условие выполнено, и по заданному е>0 найден такой номер N, что для п и л' >N имеют место неравенства (2) или (3) Если л' при этом фиксировать, то из (3) ясно, что варианта хп, в< всяком случае, будет ограниченной: ее значения для л > А содержите между числами хл--е и хл-+е, и нетрудно эти границы раздвинут так, чтобы охватить и первые N значений: х1,х2, ..., xN. Тогда, по только что доказанной теореме, можно выделить части ную последовательность {хЛ1}, сходящуюся к конечному пределу lim х„к = с.
42] § 4. ПРИНЦИП СХОДИМОСТИ. ЧАСТИЧНЫЕ ПРЕДЕЛЫ 89 Покажем, что к этому пределу стремится вообще и варианта хп. Можно выбрать к настолько большим, чтобы было |хл*~ с| и, одновременно, nk=~N. Следовательно, в (2) можно взять = | Хп — [ < £, и, сопоставляя оба эти неравенства, окончательно находим |х„-с|-=2е (дляи>.У), что и доказывает наше утверждение *). 42. Наибольший и наименьший пределы. Итак, для любой варианты хп, будь она ограничена или нет, существуют частичные пределы. Мы покажем сейчас, что среди этих частичных пределов необходимо найдутся наибольший и наименьший; они называются наибольшим и наименьшим пре- делами самой варианты хп и обозначаются, соответственно, через lim хп и lim хп Теорема. Наибольший и наименьший пределы для варианты хп всегда су- ществуют. Их равенство есть условие, необходимое и достаточное для существова- ния предела варианты (в обычном смысле) **). Доказательство. Начнем с рассмотрения вопроса о наибольшем пределе. Мы уже видели выше [40], что если варианта хп не ограничена сверху, то из последовательности (1) ее значений можно выделить такую частичную после- довательность {хП1}, что lim хл»= +~. Таким образом, в этом случае + ~ является одним из частичных пределов варианты, и, очевидно, наибольшим из всех возможных, так что lim хп = + ~. Предположим же теперь, что варианта хп ограничена сверху: Хп^М (п=1, 2, 3 ...). Рассмотрим точную верхнюю границу значений хп для п^к: Mfc=sup{xn} = sup{x*+1, хк+2, п>-к При возрастании к значение Мк может разве лишь уменьшаться, следо- вательно, по теореме о монотонной варианте [34], во всяком случае существует предел (при возрастании к до бесконечности) lim Мк, конечный или равный -«=. *) Число 2е в такой же мере «произвольно малое» число, как и е. Если угодно, е можно было сначала взять не е, а — , тогда мы здесь получили бы е. Впредь подоб- ных указаний мы уже делать не будем. **) Эта теорема, доказательство которой не использует леммы Больцано - Вейерштрасса, перекрывает последнюю.
90 ГЛ. I. ТЕОРИЯ ПРЕДЕЛОВ [42 Случай, когда этот предел есть — ~, также исчерпывается просто. Для любого Е =- 0 найдется такой номер k = N, что MN^ -Е; но для n>N, очевидно, хп*аМм, так что при указанных значениях и и подавно Хп = - Е. А это означает, что существует предел (в обычном смысле) limxn= который одновременно будет и наибольшим и наименьшим*). Остается рассмотреть самый важный случай, когда существует конечный предел: lim М^=М*; мы покажем, что это число М* и будет искомым наибольшим пределом для ва- рианты хп. С этой целью установим два характерных свойства числа М*. Если произвольно взять число е^О, то найдется такое к - N', что Af;v'-=M*+e; так как, при п >N' хп^Мк', то и подавно хп ~=М*+е. Итак, имеем I свойство числа М*: каково бы ни было е =-0, существует такой номер N', что для всех n>N' будет хп<М*+е. С другой стороны, при произвольном £ » 0 и любом к будет Но тогда, по свойству точной верхней границы [11], среди значений Хп с но- мерами п = к+1, к+2, к+3, ... найдется такое значение хП', что и хп'^М*~е. Заменяя произвольно взятое к на N, сформулируем II свойство числа М *: каковы бы ни были 1>0и номер N, найдется зна- чение хп' с номером п’ такое, что Хп'^М*-е. Подчеркнем разницу в формулировках обоих свойств. В первом случае не- равенство выполняется для всех значений хп сплошь, начиная с некоторого. Во втором же случае неравенству удовлетворяют лишь отдельные значения хп, среди которых, однако, имеются значения со сколь угодно боль- шими номерами. Прежде всего, опираясь на эти свойства, докажем, что число М* служит частичным пределом для варианты хп. Для этого нужно выделить частичную последовательность сходящуюся к М*. Возьмем последовательность положительных чисел г,- -»0. Положив nt = 1, допустим, что номера ~ 1 "" ^2 "* Ид ' " • • • И/_j уже выбраны, и покажем, как выбрать щ. По I свойству для е = е, найдем соответ- ствующий номер N'=Ni, такой, что для всех n>Ni будет Теперь обратимся ко II свойству, полагая по-прежнему е=е(-, а за N взяв наибольший из номеров «(•_! и Nt; этому выбору чисел г и А и отвечает номер «' = «,. Для него, с одной стороны, Xni^-M*-е,, *) При наличии обычного предела варианты все частичные пределы с ним совпадают [40].
421 § 4. ПРИНЦИП СХОДИМОСТИ. ЧАСТИЧНЫЕ ПРЕДЕЛЫ 91 с другой же, так как n^Ni, одновременно будет и *+е,. Отметим, кроме того, что щ =- . Для элементов хщ построенной таким путем — индуктивно - последова- тельности будем иметь |хп,-М*Нг,- (/ = 2,3,4,...), так что, действительно, хП(~М*. Наконец, установим, что ни один частичный предел не может превзойти М*. В самом деле, пусть для некоторой частичной последователь- ности {хл(} имеем xnt~a, так что а есть один из частичных пределов. По I свойству для достаточно далеких номеров (уже больших, чем N') будет хП(^М* + е. Переходя здесь к пределу, получим a*sM*+e и, ввиду произвольности е, окон- чательно, а^М*. Таким образом, М* действительно будет наибольшим из всех частичных пределов, т. е. M* = limxn. Аналогично устанавливается существование наименьшего предела. Не повторяя всех рассуждений, отметим следующие два обстоятельства. Если этот наименьший предел есть + ~, то существует предел в обычном смысле lim хп = +«°. Если же наименьший предел есть конечное число М *, = lim хп, то оно обладает свойствами, аналогичными указанным выше для М *: I свойство числа М*: каково бы ни было е =-0, существует такой номер N", что для n>N" будет Хп^М*-е. II свойство числа Мф: каковы бы ни были s=»0 и номер N, найдется значение хп" с номером n" >N, такое, что хп"^М ф + е. Обратимся к доказательству заключительного утверждения теоремы. Если существует предел в обычном смысле слова limxn (конечный или бесконечный), то все мыслимые частичные пределы с ним сливают- ся [40], так что необходимость высказанного условия очевидна. Предположим теперь, что lim хп = lim хп • Если их общее значение есть + ~ или - =», то, как мы видели, существует предел варианты в обычном смысле и имеет то же значение. Пусть, наконец, оба предела конечны: Л/* = МФ = «.
92 ГЛ. I. ТЕОРИЯ ПРЕДЕЛОВ [42 Тогда, сопоставляя I свойства чисел М* и М,, найдем по наперед заданному е=»0 такой номер N, что для n>N будет а-е^хп^а+е, т. е. |хп-а|«=е. А это и значит, что а есть предел варианты хп в обычном смысле. Теорема до- казана. Заметим, что с помощью этой теоремы совсем уж просто доказывается д о- статочность условия Больцано - Коши [39]. Именно (если сохра- нить прежние обозначения), из неравенств Хп'-е^Хп^Хп'+е (для п и n'>N) непосредственно усматриваем, что наибольший и наименьший пределы вари- анты хп конечны и разнятся не более, чем на 2г, следовательно, ввиду произ- вольности е, совпадают. Отсюда и вытекает существование конечного' предела в обычном смысле.
ГЛАВА ВТОРАЯ ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ § 1. Понятие функции 43. Переменная и область ее изменения. В 22 уже было дано общее понятие о переменной. Переменная х задаётся множе- ством X = {х} тех значений, которые она способна принять (в рас- сматриваемом вопросе). Это множество X, в котором каждое значе- ние х встречается по разу, называется областью изменения перемен- ной х. Вообще, областью изменения переменной может служить любое числовое множество. Мы уже упоминали о том, что числа геометрически истолко- вываются как точки на (числовой) оси. Область X изменения пере- менной х на этой оси изображается в виде некоторого множества точек. В связи с этим обычно сами числовые значения пере- менной называют точками. Часто приходится иметь дело с переменной п, для которой об- ластью изменения является множество Ж всех натуральных чисел. Для варианты хп = — областью изменения будет множество дробей вида 1/ш (при т = 1, 2, 3, ...) с присоединением числа 0; для постоянной величины вся область изменения сведется к одному числу. Однако в анализе обычно изучаются переменные, изменяющиеся, как говорят, непрерывным или сплошным образом: их прообразом являются физические величины - время, путь, проходи- мый движущейся точкой, и т. п. Областью изменения подобной пере- менной служит числовой промежуток. Чаще всего это будет конечный промежуток, ограниченный двумя вещественными чи- слами а и Ъ (a-sb) - его концами, которые сами могут быть вклю- чены в его состав или нет. В зависимости от этого мы будем различать замкнутый промежуток [a,b]: a=sx=sb (оба конца включены); {(a, bl: a-sx=sb [a, b): a=sx^b (лишь один конец включен); открытый промежуток (а, Ь): a-sx-sb (ни один конец не включен). Длиной промежутка во всех случаях называется число Ь-а.
94 ГЛ. it. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ [44 Геометрическим аналогом числового промежутка является, как легко понять, отрезок числовой оси, причем - в зависимости от типа промежутка - и к отрезку концы его приключаются или нет. Приходится рассматривать и бесконечные промежутки, у которых одним из концов или обоими служат «несобственные числа» -оо, + оо. Обозначения их аналогичны приведенным выше. Напри- мер, (-оо, +°°) есть множество всех вещественных чисел; (а, +°°) означает множество чисел х, удовлетворяющих неравенству промежуток (-оо, 6] определяется неравенством x=s,b. Геометрически бесконечные промежутки изображаются в виде бесконечной в обе стороны прямой или луча. 44. Функциональная зависимость между переменными. При- меры. Главным предметом изучения в математическом анализе являет- ся, однако, не изменение одной переменной самой по себе, а зависи- мость между двумя или несколькими переменными при их совме- стном изменении. Здесь мы ограничимся простейшим случаем двух переменных. В различных областях науки и жизни - в самой математике, в фи- зике, в технике - читатель не раз встречал такие совместно изменяющиеся переменные. Они не могут одновременно при- нимать любую пару значений (из своих областей изменения): если од- ной из них (независимой переменной) придано конкретное значение, то этим уже определяется и значение другой (зависи- мой переменной или функции). Приведем несколько при- меров. 1) Площадь Q круга есть функция от его радиуса Л; ее значение может быть вычислено по заданному значению радиуса с помощью известной формулы: 2) В случае свободного падения тяжелой материальной точки - при отсутствии сопротивления - время t (сек.), отсчитываемое от начала движения, и пройденный за это время путь s (.и) связаны урав- нением: s=s— s 2 ' где g=9,81 есть ускорение силы тяжести. Отсюда и определяется значение в, соответствующее взятому моменту t: путь в является функ- цией от протекшего времени t. 3) Рассмотрим некоторую массу (идеального) газа, содержащуюся под поршнем цилиндра. В предположении, что температура сохра- няется неизменной, объем V (л) и давление р (атм) этой массы газа подчиняются закону Бойля-Мариотта: pP=c = const.
45J § 1. ПОНЯТИЕ ФУНКЦИИ 95 Если произвольно изменять V, то р как функция от V будет всякий раз однозначно определяться по формуле с Р-у- 4) Наконец, остановимся ещё на зависимости давления воздуха р (атм) от высоты места h (м) над уровнем моря. В физике выво- дится барометрическая формула: p=poe~/ft, где р0 - давление на уровне моря, а к - некоторая постоянная. По этой формуле значение р, как функции от h, и определяется, лишь только задано значение h. Заметим тут же, что самый выбор независимой переменной из числа двух рассматриваемых иногда бывает безразличен или связан с соображениями простого удобства. В большинстве же случаев он диктуется целенаправленностью производимого исследо- вания. Например, если - в последнем примере - связь между давле- нием р и высотой h используется для того, чтобы дать возможность лётчику по наблюдаемому давлению судить о достигнутой высоте, то естественно обменять роли переменных и барометрическую фор- мулу представить в виде к р 45. Определение понятия функции. Отвлечемся теперь, как обычно, от физического смысла рассматриваемых величин и дадим точное общее определение понятия функции - одного из основ- ных понятий математического анализа. Пусть даны две переменные х и у с областями изменения X и . Предположим, что по условиям вопроса переменной х может быть приписано произвольное значение из области без каких-либо огра- ничений. Тогда переменная у называется функцией от переменной х в области ее изменения X, если по некоторому правилу или закону каж- дому значению х из УС ставится в соответствие одно определенное зна- чение у (из ^). Независимая переменная х называется также аргументом функ- ции. В этом определении существенны два момента: во-первых, ука- зание области X изменения аргумента х (её называют областью опре- деления функции) и, во-вторых, установление правила или закона соот- ветствия между значениями х и у. (Область изменения функции у обычно не указывается, поскольку самый закон соответствия уже определяет множество принимаемых функцией значений.) Можно в определении понятия функции стать на более общую точку зрения, допуская, чтобы каждому значению х из X отвечало
96 ГЛ. II. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ 145 не одно, а несколько значений у (и даже бесконечное множество их). В подобных случаях функцию называют многозначной, в от- личие от однозначной функции, определенной выше. Впрочем, в курсе анализа, стоящем на точке зрения вещественной переменной, избегают многозначных функций, и впредь говоря о функции, если не оговорено противное, мы будем разуметь однозначную функцию. Для указания того факта, что у есть функция от х, пишут: У =<?(*)> y = F(x) и т. п.*). Буквы f,(p, F, ... характеризуют именно то правило, по которому получается значение у, отвечающее заданному х. Поэтому, если одно- временно рассматриваются различные функции от одного и того же аргумента х, связанные с различными законами соответ- ствия, их не следует обозначать одной и той же буквой. Хотя именно буква «эф» (в различных алфавитах) связана со сло- вом «функция», но для обозначения функциональной зависимости, ра- зумеется, может применяться и любая другая буква; иногда даже повторяют ту же букву у: у=у(х). В некоторых случаях пишут аргумент и в виде значка при функ- ции, например, ух. Под этот тип подходит привычное нам обозначе- ние варианты хп, которая является (как мы теперь можем ска- зать) функцией от «независимой переменной» и, пробегающей ряд на- туральных чисел Аналогично и обозначение Ne для номера N (в определении предела варианты, 23), которое подчеркивает его зависимость от е, и т. д. Если, рассматривая функцию, скажем, у=f(x), мы хотим отме- тить ее частное значение, которое отвечает выбранному частному значению х, равному х0, то для обозначения его употребляют сим- вол: f(x0). Например, если = = /1(и)=-У1-и2, то /(1) означает численное значение функции f(x) при х=1, т. е. по- 1 (У\ просту число х, аналогично, g(5) означает число 2, h к - “ 1^7 4 ЧИСЛО J , и т. п. Обратимся теперь к самому правилу или закону соответ- ствия между значениями переменных, которое составляет сущность понятия функциональной зависимости. Правило это может быть весьма разнообразной природы, поскольку оно ничем не было ограничено. Наиболее простым и естественным представляется осуществление этого правила в виде аналитического выражения или *) Произносится эта запись следующим образом: «игрек равно эф от икс», «игрек равно фи от икс», и т. д.
451 § 1. ПОНЯТИЕ ФУНКЦИИ 97 формулы, содержащих указание на те операции или действия над постоянными числами и над значением х, которые надо произвести, чтобы получить соответствующее значение у. Этот аналитиче- ский способ задания функции является наиболее важным для математического анализа (мы еще вернемся к нему в следующем п°). С ним читатель всего лучше знаком из школьного курса математики; наконец, именно аналитическим способом мы пользовались в приве- денных в 44 примерах. Однако было бы ошибочным думать, что это - единственный способ, которым может быть задана функция. В самой математике нередки случаи, когда функция определяется без помощи формулы. Такова, например, функция Е(х) - «целая часть числа х» *). Легко сообразить, что Д1) = 1, Д2,5) = 2, £(У13) = 3, Д-л)=-4 и т. д„ хотя никакой формулы, выражающей Е(х), у нас нет. Таковы также и многочисленные «арифметические функции», т. е., функции от натурального аргумента, принимающие лишь натураль- ные же значения. В виде примера упомянем «о факториале числа т: п\ = 1 -2-3 ... п, а также о функции т(л), представляющей число делителей числа п, или о функции ф(п), указывающей, сколько в ряду 1,2, 3,...,и имеется чисел, взаимно простых с л. Не- смотря на своеобразный характер правил, которыми задаются эти функции, они позволяют вычислять значения функций с такой же определенностью, как и формулы. Например, имеем: т(10) = 4, т(12) = 6, т(16) = 5, ... ДЮ)=4, Д12)=4, Д16) = 8, ... В естественных науках и в технике зависимость между величинами часто устанавливается экспериментально или путем наблюдений. На- пример, если подвергнуть воду произвольно выбранному давлению р (атм), то на опыте можно определить соответствующую ему тем- пературу 9 (°C) кипения воды: О есть функция от р. Однако эта функ- циональная зависимость задается не какой-либо формулой, а лишь таблицей, где просто сопоставлены полученные из опыта данные. Примеры табличного способа задания функции легко найти в любом техническом справочнике. Наконец, упомянем еще, что в некоторых случаях - при помощи самопишущих приборов - функциональная зависимость между фи- зическими величинами задается непосредственно графиком. На- пример, «индикаторная диаграмма», снимаемая при помощи индика- *) См. сноску на стр. 48. 7 Г. М. Фихтенгольц, т. I
98 ГЛ. П. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ [46 тора, дает зависимость между объемом V и давлением р пара в цилин- дре работающей паровой машины; «барограмма», доставляемая баро- графом, представляет суточный ход атмосферного давления, и т. п. Мы не входим в подробности относительно табличного и графи- ческого способов задания функциональной зависимости, так как ими в математическом анализе не приходится пользоваться. 46. Аналитический способ задания функции. Сделаем ряд разъяснительных замечаний по поводу задания функции аналити- ческим выражением или формулой, которые играют в математическом анализе исключительно важную роль. 1° Прежде всего, какие аналитические операции или действия могут входить в эти формулы? На первом месте здесь разумеются все изученные в элементарной алгебре и тригонометрии операции: арифметические действия, возвышение в степень (и извле- чение корня), логарифмирование, переход от углов к их тригонометри- ческим величинам и обратно [см. ниже 48 - 51]. Однако, и это важно подчеркнуть, к их числу по мере развития наших сведений по анализу будут присоединяться и другие операции, в первую голову - пре- дельный переход, с которым читатель уже знаком из главы I. Таким образом, полное содержание термина «аналитическое вы- ражение» или «формула» будет раскрываться лишь постепенно. 2° Второе замечание относится к области определения функции аналитическим выражением или формулой. Каждое аналитическое выражение, содержащее аргумент х, имеет, так сказать, естественную область применения: это множество всех тех значений х, дня которых оно сохраняет смысл, т. е. имеет вполне определенное, конечное, вещественное значение. Разъясним это на простейших примерах. 1 Так, для выражения -— такой областью будет все множество веществен- ных чисел. Для выражения ]/1 - х2 эта область сведется к замкнутому про- межутку [-1, 1], за пределами которого значение его перестает быть веществен- 1 ным. Напротив, выражению —------ придется в качестве естественной области ]/1 - х- применения отнести открытый промежуток (-1,1), ибо на концах его знаме- натель обращается в 0. Иногда область значений, для которых выражение сохра- няет смысл, состоит из разрозненных промежутков: для ]/л2-1 это будут про- 1 межутки (-<», -1] и [1, +~), для --- - промежутки (-<*=, -1), (-1, 1) и (1, +=»); и т. д.*). х--1 В качестве последнего примера рассмотрим сумму бесконечной геометри- ческой прогрессии 1 + х+х2+ ... +хп-1+ ... = lim (1+х+х2+ ... + хп-1). Л-*ео *) Для нас, разумеется, не представляют интереса такие выражения, которые ни при одном значении х вообще не имеют смысла.
46] § 1. ПОНЯТИЕ ФУНКЦИИ 99 Если |х|-=1, то, как мы знаем [25, 7)], этот предел существует и имеет значение ----. При |х| =-1 предел либо равен + ~, либо вовсе не существует. Таким об- 1-х разом, для приведенного аналитического выражения естественной областью при- менения будет открытый промежуток (-1, 1). В последующем изложении нам придется рассматривать как более сложные, так и более общие аналитические выражения, и мы не раз будем заниматься исследованием свойств функций, задаваемых по- добным выражением во всей области, где оно сохраняет смысл, т. е. изучением самого аналитического аппарата. Однако возможно и другое положение вещей, на что мы считаем нужным заранее обратить внимание читателя. Представим себе, что какой-либо конкретный вопрос, в котором переменная х по сущ е- ству дела ограничена областью изменения X, привел к рассмотре- нию функции f(x), допускающей аналитическое выражение. Хотя мо- жет случиться, что это выражение имеет смысл и вне области Й7, выходить за ее пределы, разумеется, все же нельзя. Здесь аналитиче- ское выражение играет подчиненную, вспомогательную роль. Например, если, исследуя свободное падение тяжелой точки с высоты It над поверхностью земли, мы прибегнем к формуле gt2 s = — 2 [44, 2)], то нелепо было бы рассматривать отрицательные значения t или зна- 1/2Л / чения /, большие, чем Т= I/ — , ибо, как легко видеть, при 7 = Г точка уже упадет ' s gt2 на землю. И это несмотря на то, что само выражение — сохраняет смысл для всех вещественных t. 2 •3° Может случиться, что функция определяется не одной и той же формулой для всех значений аргумента, но для одних - одной формулой, а для других - другой. Примером такой функции в промежутке (-<«, +~) может служить функ- ция, определяемая следующими тремя формулами: /(х)=1, если |х|=>1 (т. е. если или х-=-1), /(х)=-1, если |х|-=1 (т. е. если -1«х-=1), и, наконец, /(х) = 0, если х = ± 1. Упомянем еще о функции Дирихле (Р. G. Lejeune-Dirichlet), которая опре- деляется так: Х(х)=1, если х рационально, Z(x)-0, если х иррационально. Наконец, вместе с Кронекером (L. Kronecker) рассмотрим функцию, которую он назвал «сигнум хп *) и обозначил через sgn х; sgnx=l, если х-»0; sgnx=-l, если х<0; sgn 0 = 0. *) По-латыни signum = знак. 7»
100 ГЛ, И. ФУНКЦИЯ ОДНОЙ ПЕРЕМЕННОЙ [47 Впрочем, не следует думать, что есть принципиальная разница между функцией, задаваемой одной формулой для всех значений х, и функ- цией, определение которой использует несколько формул. Обычно функция, задаваемая несколькими формулами (правда, ценой некоторого усложнения вы- ражения), может быть задана и одной. Например, если привлечь операцию предельного перехода, то первая из приведённых выше функций, f (х), может быть задана одной формулой (для в с е х х сразу): __ 1 Действительно, при | х | > 1 степень х2П — + оо, а обратное ей выраже- ние стремится к 0 [27], так что' 1___L __ 1 vWl 1 +х>п При | х | < 1 степень х2Л —> 0 [25, 6)], и в этом случае хзп— 1 . 1П1х2Л + 1 — *' Наконец, при х— ± 1 будет, очевидно, х2Л = 1, откуда ^ = 0 х2Л + 1 ’ и в пределе получается 0. Всё это полностью согласуется с прежним опреде- лением. 47. График функции. Хотя в математическом анализе функции графически не задают, но к графической иллюстрации функции прибегают всегда. Лёг- кая обозримость и наглядность графика делают его незамени- мым вспомогательным сред- ством исследования свойств функции. Пусть в некотором проме- жутке задана функция y=f(x). Представим себе на плоскости две взаимно перпен- дикулярные оси координат — ось х и ось у. Рассмотрим пару соответствующих значе- ний х и у, где х взято из про- межутка SP, а _у=/(х); обра- тен к а At (х, у), с абсциссой х зом этой пары на плоскости служит и ординатой у. Когда переменная х изменяется в пределах своего промежутка, эта точка описывает некоторую кривую АВ (черт. 5), которая и является геометрическим образом нашей функции и назы- вается её графиком. В этих условиях само уравнение _у=/(х) называют уравнением кривой АВ,
47] § 1. ПОНЯТИЕ ФУНКЦИИ 101
102 ГЛ. И. ФУНКЦИЯ ОДНОЙ ПЕРЕМЕННОЙ [48 Например, на черт. 6 и 7 изображены графики функций у — Чу^/1 — х3 и у = ± )/ ха — 1; (j ж I =£ 1) (|.v|=il) читатель узнает в них окружность и равнобочную гипер- болу. Много других примеров графического изображения функций читатель найдет в ближайших номерах. Строится график обычно по точкам. Берут в промежутке 35 ряд близких между собой значений х, вычисляют по формуле y=f(x) соответствующие значения у: х = | Xi | х, | х3,| ... | х„ У = I Л I У* IJs I.... I Уп и наносят на чертёж точки (*1, J'l), (*2, Л), точки от руки или с (*з. J's).....(-*». УпУ помощью лекала проводят кривую, Через эти которая (конечно, лишь с некоторым приближением) и дает искомый д. график. Чем плавнее ход графика и чем гуще взяты точки на нём, тем точнее начерченная кривая воспро- изводит этот график. Следует заметить, что хотя геометрический образ функции всегда можно себе «представить», но не всегда этот образ будет кривой в обычном, интуитивном смысле. Построим, например, график функции у = £(х). Так как в промежутках ..., [— 2, — 1), [- 1,0), [0,1), [1, 2), [2, 3), ... функция сохраняет постоянные значения ..., — 2, — 1,0, 1, 2, ..., то график будет состоять из ряда отдельных горизонтальных отрезков, лишенных своих правых концов (черт. 8) *. Для функции х (я) Дирихле график состоит из множества точек с ирра- циональными абсциссами на оси х и множества точек с рациональ- ными абсциссами на прямой у = 1; его и изобразить невозможно. У”Е(Х) -2 Черт. 8. О 2 3 48. Важнейшие классы функций. Перечислим здесь некоторые классы функций, получивших название элементарных. 1° Целая и дробная рациональные функции. Функция, представляемая целым относительно буквы х многочленом: ______________У — аахП 4~ + •••-{- an-i х~\гап * Это обстоятельство символизируется стрелками, которые своими остриями указывают на точки, не принадлежащие графику.
48] § 1. понятие функции 103 (а0, аь.аг, ...— постоянные), называется целой рациональной функцией. Отношение двух таких многочленов: „ _ аохп + aix"-1 + ... + gn_iX + on У — boxm + b1X”” +... + bm_1X + bm называется дробной рациональной функцией. Она опре- делена для всех значений х, кроме тех, которые обращают знаме- натель в нуль. Для примера на черт. 9 даны графики функции у — ах* (пара- болы) при различных значениях коэффициента а, а на черт. 10 — графики функции У = ~~ (равнобочные гиперболы), также при различных значениях а. 2° Степенная функция. Так называется функция вида у = х11, где р — любое постоянное вещественное число. При целом [л полу- чается рациональная функция. При р. дробном мы имеем здесь pa- fl и к а л. Например, пусть т — натуральное число и 1 у — х^ = эта функция определена для всех значений х, если т—нечётное, и лишь для неотрицательных значений — при т чётном (в этом случае мы имеем в виду арифметическое значение радикала). Нако- нец, если р,— иррациональное число, мы будем предполагать х^>0 (х = 0 допускается лишь при р.^>0). На черт. 11 и 12 даны графики степенной функции при различ- ных значениях р.. 3° Показательная функция, т. е. функция вида у ~ах, где а — положительное число (отличное от единицы); х принимает любое вещественное значение. Графики показательной функции при различных значениях а даны на черт. 13. 4° Логарифмическая функция, т. е. функция вида _y = logax, где а, как и выше,—положительное число (отличное от единицы); х принимает лишь положительные значения. На черт. 14 даны графики этой функции при различных значениях а. 5° Тригонометрические функции: у = sin х, у — cos х, у = tg х, у — ctg х, у — sec х, у== esc х.
104 ГЛ. II. ФУНКЦИЯ ОДНОЙ ПЕРЕМЕННОЙ [48
48] § 1. ПОНЯТИЕ ФУНКЦИИ 105 Черт. 11. Черт. 12.
106 Г Л. И. ФУНКЦИЯ ОДНОЙ ПЕРЕМЕННОЙ [48 Черт. 16.
48] § 1. ПОНЯТИЕ ФУНКЦИИ 107 Очень важно раз навсегда усвоить, что аргументы тригоно- метрических функций, если их рассматривать как меры углов, всегда выражают эти углы в радианах (поскольку не огово- рено противное). Для tgx и sec# исключаются значения-вида (2^+1)у, а для ctg х и esc х — значения вида kit (k — целое). Графики функций у — sinx(cosх) и у = tgх(ctgх) даны на черт. 15 и 16. График синуса обычно называют синусоидой. Иной раз, особенно в технических вопросах, представляют интерес: ' 6° Гиперболические функции. Так называются функции: . ех — е' shx =-------- sh х ех — е~х 2 —, ch X — — ., au л с - с ,, Ch X th х — -г— — -Т-Т-=5 , cth х = -г— ch х е* 4- е х’ sh х (гиперболические синус, косинус, тангенс, котангенс, ...);они определены для всех значений х, исключая cthx, который теряет смысл при х = 0. Эти функции проявляют'замечательную анало- гию с тригонометрическими функ- циями. Так, имеют место формулы (обратить внимание на знаки!) ch (х ±у) = ch х • chy ± sh х • sh.у, sh (х ±у) = sh х • ch у ± ch х • sh.y, из которых при _у = х, в частности, следует: ch2 х — sh2 х = 1, ch 2х = ch2x -ф- sh2 х, sh 2х = 2 sh х • ch x.
108 Гл. II. ФУНКЦИЯ ОДНОЙ ПЕРЕМЕННОЙ [49 Например, первая из этих формул сводится к легко проверяемому тождеству: ех+У е-х-у___ех е-х еу _|_ е* — ё~х е? — е~У ~~2 2 2 Н 2 2 • Так же проверяются и остальные. Графики гиперболических функций изображены на черт. 17 и 18. 49. Понятие обратной функции. Прежде чем перейти к обрат- ным тригонометрическим функциям, сделаем пояснение относительно обратных функций вообще. Предположим, что функция_у —/(х) задана в некоторой области 37, и пусть 3/ будет множество всех значений, которые эта функция принимает, когда х изменяется в пределах области 37. (В нашей практике как 37, так и У обычно будут представлять собою про- межутки.) Выберем какое-нибудь значение у=уй из области У\ тогда, в области необходимо найдётся такое значение х = хй, при кото- ром наша функция принимает именно значение уй, так что /(х0)=_у0; подобных значений хй может оказаться и несколько. Таким образом, каждому значению у из У ставится в соответствие одно или не- сколько значений х; этим определяется в области У однозначная или многозначная функция x = g(y), которая и называется обратной для функции y—f (х). Рассмотрим примеры: • 1) Пусть у = ах (а^>1), где х изменяется в промежутке 37 = (— оо, оо). Значения у заполняют промежуток У = (0, оо), причём каждому у из этого промежутка отвечает, как мы знаем [20], в 37 одно определённое x=logay. В этом случае обратная функ- ция оказывается однозначной. 2) Наоборот, для функции _у = х8, если х изменять в промежутке 37 = (—оо, -|- оо), обратная функция будет двузначной: каж- дому значению у из промежутка У = [0, оо), отвечают два зна- чения х = ±11 У из 37. Вместо’ этой двузначной функции обычно рассматривают раздельно две однозначные функции х = -|- ^~у и х = — -fy («ветви» двузначной функции). Их можно порознь также считать обратными для функции у =х8, в предположении лишь, что область изменения х ограничена, соответственно, промежутком [0, -[- оо) или промежутком (— оо, 0]. 3) Аналогично, если взять _y = chx, где областью изменения х снова является промежуток 37 = {—оо, -|-оо), то> решая уравнение 2 или eix — 2у ех -j- 1=0
49] § 1. понятие функции 109 относительно ех, найдём (при_у^1) два значения ех=у± /У — 1, откуда х = 1 п (у ± у/у1— 1). Снова — двузначная функция, которая распадается на две одно- значные ветви, отвечающие порознь изменению х от 0 до Ц- оо и от — оо до 0. 4) Если же у = sh х, то — при любом у — из уравнения еХ-^еЛ =у или eix — 2у • ех — 1 =0 найдём лишь одно значение для ех: ех=у+^~рГ, так как второе значение — с минусом при корне, как отрицательное, невозможно и должно быть отброшено. Отсюда x = lnCj>4- уУ4-1), так что здесь обратная функция однозначна. Заметим, что по графику функции y=f(x) легко сообразить, будет ли обратная для неё функция x — g(y) однозначной или нет. Первый случай представится, если любая прямая, параллельная оси х, пересекает этот график разве лишь в одной точке. Наоборот, если некоторые из таких прямых пересекают график в нескольких точках, обратная функция будет многозначной. В этом случае по графику же легко разбить промежуток изменения х на части так, чтобы каждой части уже отвечала однозначная «ветвь» этой функции. Например, по одному взгляду на параболу черт. 4, которая служит графиком функции _у = ха, ясно, что обратная ей функция двузначна и что для получения однозначных «ветвей» достаточно раздельно рассматривать правую и левую части этой параболы, т. е. положи- тельные и отрицательные значения х *. Если функция х = g(y) является обратной для функции у =.f(x), то, очевидно, графики обеих функций совпадают. Можно, однако, потребовать, чтобы и аргумент обратной функции обозначался бук- вой х, т. е. вместо функции x=.g(y) рассматривать у = g(x). Тогда лишь придется горизонтальную ось назвать осью у, а вертикальную — осью х; график всё ещё останется прежним. Если же пожелать, * Ниже [83] мы вернёмся ещё к вопросу о существовании и однознач- ности обратной функции.
1 10 ГЛ. II. ФУНКЦИЯ ОДНОЙ ПЕРЕМЕННОЙ [50 чтобы (новая) ось х была бы, как привычно, горизонтальной, а (новая) ось у — вертикальной, то эти оси нужно будет переставить одну на место другой, что уже изменит и график. Для осуществления этого проще всего повернуть плоскость чертежа хОу на 180° вокруг бис- сектрисы первого координатного угла (черт. 19). Таким образом, график y = g{x) по- лучается как зеркальное отраже- ние графика у =f(x) относительно этой биссектрисы. По черт. 13 и 14, например, сразу видно, что они именно так полу- чены один из другого. Точно так же, исходя из высказанных соображений, легко объяснить симметричность (относительно биссектрисы) каждого из черт. И и 12. 50. Обратные тригонометрические функции. В дополнение к.тем классам элементарных функций, которые были упомянуты в 48, рас- смотрим теперь 7° Обратные тригонометрические функции: y = arcsinx, у = arccos х, y = arctgx, у == arcctg х, {у = arcsec х, у = arccsc х). Остановимся сначала на первой из них. Функция y = sinx опре- делена в промежутке 3? = (—оо, -j-оо), причём её значения запол- няют сплошь промежуток У = [—1, 1]. Параллель оси х пересекает синусоиду, т. е. график функции у — sinх (черт. 15) в бесконеч- ном множестве точек; иначе говоря, каждому значению у из про- межутка [— 1,1]отвечает бесконечное множество значенийх. Поэтому обратная функция, которую обозначают так: х = Arcsinу, * будет (бесконечно-)многозначной. Обычно рассматривают лишь одну «ветвь» этой функции, отве- чающую изменению х между---------% И g'"» каждому у из [— 1, 1] в этих пределах отвечает одно значение х; его обозначают через х = arcsin у и называют главным значением арксинуса. * Мы уже подчёркивали в своё время [48,5°], что аргумент х тригономе- трической функции выражает угол в радианах; разумеется и здесь значе- ния обратных тригонометрических функций, если их рассматривать как меру угла (или дуги) все выражены в радианах (в радиусах).
50] § 1. ПОНЯТИЕ ФУНКЦИИ 111 Поворачивая синусоиду около биссектрисы первого координат- ного угла (черт. 20), получаем график многозначной функции у = Arcsin jtr; сплошной линией выделен гра- фик главной ветви её у = arcsinx, ко- торая однозначно определена в про- межутке [— 1, 1], значений х и притом удовлетворяет неравенству тс . . .тс — у arcsin х у, которое характеризует её среди других ветвей. Вспоминая из элементарной тригономе- трии, как выражаются все' значения угла, имеющего данный синус, через одно из этих значений, легко написать формулы, дающие все значения арксинуса: Arcsin х — arcsin х -ф- 2&гс (А = 0, ± 1, ±2, ...). или (2k-1- 1)-гс — arcsin х. Исходя из теоремы сложения для си- нуса sin (а -ф- Р) — sin а • cos р cos а • sin Р> можно получить теорему сложения для арк- синуса. Именно, положим здесь а = arcsin х, Р = arcsinу (где х и у лежат между — 1 и —|- 1); тогда sina = x, sinp=_y; cos а— у/1—х3, cos р — 1 —у3, причём корни берутся со знаком плюс, так как углы а и р, по характерному свойству главного значения арксинуса, лежат между — у и у, так что косинусы их положи- тельны. Итак, Черт. 20. откуда sin (a -ф- Р) = х j/1 —у3 -ф-у у/1 — х3, а -ф- ? — arcsin х -ф- arcsinj/ = = Arcsin (х j/1 —у3 -ф-_у j/1 — х3). Формула может быть написана проще: arcsin х -ф- arcsinу = arcsin (х/1 —у3 -ф-_у j/l — лсв)
112 ГЛ. П. ФУНКЦИЯ ОДНОЙ ПЕРЕМЕННОЙ [50 лишь в том случае, если и а р не выходит из промежутка [л тс 1 ~ — Т ’ Т г ^то Условие автоматически выполняется, если аргументы х и у (а с ними аир) имеют разные знаки. В случае же одина- ковых знаков высказанное условие, как легко видеть, равносильно такому: 1 - Подобные же рассуждения применимы к функции у = cos х ' (— оо < х < -f- оо). И здесь обратная функция у = Arccos х (— 1 х 1) оказывается (бесконечно-)многозначной (см. черт. 15). Для выделений однозначной ветви, её подчиняют условию: О «С arccos х те; это есть главная ветвь арккосинуса. । Функция arccos х связана с arcsinx очевидным соотношением л arccos х = -£- — arcsin х; действительно, не только косинус угла ------------arcsin х равен sin (arcsin х) == х, но и сам угол содержится именно между 0 и те. Остальные значения Arccos х выражаются через главное его значение по формуле Arccosх = 2Ате±arccosх (А = 0, ±1, ±2, ...). функция y = tgx определена для всех значений х, кроме значе- ний х = (2А-[-1)у (А = 0, ±1, ±2, ...). Значения у заполняют здесь промежуток (— оо, -|- оо), причём каждому у снова соответ- ствует бесконечное множество значений х (см. черт. 16). Поэтому обратная функция x = Arctg_y, заданная в промежутке/—оо, -[-оо), будет (бесконечно-)многозначной. На черт. 21 изображён график функции у = Arctg х, полученный поворотом на 180° вокруг биссек- трисы первого координатного угла графика функции _y = tgx. За главное значение арктангенса, arctgх, принимают то из зна- чений этой многозначной функции, которое удовлетворяет неравен- ствам * 2 arctg х ~2 • Таким путём определяется однозначная функция — главная ветвь арктангенса, заданная для всех значений х. Остальные зна- чения арктангенса, как легко показать, получаются так: Arctg х = arctg х Ате (k == 0, ± 1, ±2, ...),
50] § 1. ПОНЯТИЕ ФУНКЦИИ 113 Теорема сложения для тангенса: tg(a + B) = —+ V* Т Pl ! _ tg a . tg р ’ если положить a = arctg х, p = arctgj/, даёт (при ху ?£ 1) ‘8<« + Ю = Й£, так что а4-]- р = arctg х 4- arctgj/ = Arctg . И в данном случае равенство приводится к простому виду arctg х + arctgу = arctg , лишь если—«? <С v > т- е- если АУ/<С1|
114 ГЛ. И. ФУНКЦИЯ ОДНОЙ ПЕРЕМЕННОЙ [51 Нетрудно установить прямую связь между функциями arctg х и arcsin х: arctgх = arcsin ——*--- или arcsinх = arctg —. Л.,.,..- , у 1 + у 1 —х* (— оо< х<4-оо) (— 1 < х <4-1) Например, если положить а = arctg х, так что tga = x, то sin a = у.-. - а. , причём корень берётся со знаком У 1+tg‘a Kl+x’ плюс, потому что —отсюда и вытекает, что a = arcsin —х . Упомянем ещё о функции Arctg х (—00 х<^'-^ °°)> eS глав- ное значение определяется неравенствами О arcctg х тс и связано с arctg х соотношением arcctg х = у — arctg х. Остальные значения арккотангенса имеют вид Arcctgх = arcctgx-]~kiz (k = 0, ±1, ±2, ...). На функциях arcscx (—оо<^х«С — 1 и 1 оо) и arccoscx (те же промежутки изменения) останавливаться не будем, предоставляя читателю самому в них разобраться. 51. Суперпозиция функций. Заключительные замечания. По- знакомимся с понятием суперпозиции (или наложения) функций, которая состоит в том, что вместо аргумента данной функции подставляется некоторая функция от другого аргумента. Например, суперпозиция функций у = sin х иг — logy даёт функ- цию г — log sin х\ аналогично получаются и функции У" 1—х2, arctg у и т. п. В общем виде, предположим, что функция г = <р (у) определена в некоторой области 3< = {уа функция у=/(х) определена в области = {х}, причем значения ее все содержатся в области Тогда переменная г, как говорят, через посред- ство у, и сама является функцией от х: Z = ?(/(x)). По заданному х из X сначала находят соответствующее ему (по правилу, характеризуемому знаком /) значение у из У, а затем устанавливают соответствующее этому значению у (по правилу,
52] § 2. ПРЕДЕЛ ФУНКЦИИ 115 характеризуемому знаком <р) значение г; его и считают соответ- ствующим выбранному х. Полученная функция от функции или сложная функция и есть результат суперпозиции функций fix) и Предположение, что значения функции /(х) не выходят за пре- делы той области 3/, в которой определена функция <р (_у), весьма существенно: если его опустить, то может получиться и не- лепость. Например, полагая ar = logj/, a _y = sinx, мы можем рас- сматривать лишь такие значения х, для которых sin х 0, ибо иначе выражение log sin х не имело бы смысла. Мы считаем полезным здесь же подчеркнуть, что характеристика функции, как сложной, связана не с природой функциональной зависимости z от х, а лишь со способом задания этой за- висимости. Например, пусть г==]/1—у* для у в [—1, 1], а [Л "1m — Т’ Т Г Тогда £= ]/1 — sin2 х = cos х. Здесь функция cos х оказалась 'заданной в виде сложной функ- ции. Теперь, когда полностью выяснено понятие суперпозиции функ- ций, мы можем точно охарактеризовать простейший из тех классов функций, которые изучаются в -анализе: это, прежде всего, перечисленные выше элементарные функции 1°—7°, а затем — все те, которые из них получаются с помощью четырёх арифмети- ческих действий и суперпозиций, последовательно применённых конечное число раз. Про них говорят, что они выражаются через элементарные в конечном виде; иногда их все также называют элементарными. Впоследствии, овладев более сложным аналитическим аппаратом (бесконечные ряды, интегралы), мы познакомимся и с другими функ- циями, также играющими важную роль в анализе, но уже выходя- щими за пределы класса элементарных функций. § 2. Предел функции 52. Определение предела функции. Рассмотрим числовое мно- жество = Точка а называется точкой сгущения этого множества, если в любой близости от а содержатся зна- чения х из SC, отличные от а. Чтобы выразить это определение в более точных терминах, введём пегнятие окрестности точки а: так называется любой открытый промежуток (а — В, а -|—8) с центром в точке а. Теперь можно сказать, что точка а будет точкой с г у ще ни я мно- жества ЗГ, если в каждой её окрестности содержатся отличные от а значения х из SC.
116 ГЛ. И. ФУНКЦИЯ ОДНОЙ ПЕРЕМЕННОЙ [52 Сама точка сгущения при этом может принадлежать 37 или нет. Пусть в области 37, для которой а является точкой сгущения, задана некоторая функция /(х). Представляет интерес поведение этой функции при приближении х к а. Говорят, что функция /(х) имеет пределом число А при стремлении х к а (или в точке а), если для каждого числа е^>0 найдётся такое число 8^>0, что |/(х)— А | е, лишь только |х — а | 8 (1) (где х взято из и отлично от а)*. Обозначают этот факт так: lim/(x) = A. (2) х~+а Если область 37 такова, что в любой близости от а, но с пр а в а от а, найдутся отличные от а значения х из 37 (в этом случае точку а называют правой точкой сгущения для 37), то можно специализировать только-что данное определение предела функции, ограничившись лишь значениями х^>а. В этом случае предел функ- ции, если он существует, называется пределом функции f(x) при стремлении х к а справа или, короче, пределом (в точке а) справа и обозначается.символом lim f(x) или /(а-[-0)**. Аналогично устанавливается понятие о левой точке сгуще- ния и о пределе функции при стремлении х к а слева или о пределе (в точке а) слева: lim f(x) или f(a— 0)**. х-*а—0 Если точка а является одновременно точкой сгущения для 37, и правой, и левой, то, как легко установить, для существования предела (2) необходимо и достаточно существование порознь и равенство пределов справа и слева: lim f(x) = lim f(x) = A. x-*a-\-0 x-*a—0 При стремлении x к конечному пределу а функция может иметь и бесконечный предел. Именно, функция f(x) имеет пределом —оо (—оо) при стремлении х к а, если для каждого чи- сла Е^>0 найдётся такое число 80, что /(х)[>£ (/(х)<— Е), лишь только |х— а[<[8 (3) (где, как и всегда, х взято из 37 и отлично от а). * Именно из того, что а есть точка сгущения для 37, явствует, что такие значения х в окрестности (а — 8, а 4- й) точки а наверное существуют. ** Если само а = 0, то вместо 0 О (0 — 0) пишут просто + 0 (— 0).
53] § 2. ПРЕДЕЛ ФУНКЦИИ 117 Запись этих фактов аналогична (2): lim /(х) = -|~00 (—оо) х—>а Для рассматриваемого случая могут быть повторены сделанные выше замечания относительно односторонних пределов справа и слева. Если множество Я? = {х} содержит сколь угодно большие (по абсолютной величине) положительные (отрицательные) зна- чения х, то говорят, что -ф- оо (— оо) является точкой сгуще- ния для Ж. В этом предположении: функция f(x) при стремлении х к 00 (— сю) имеет предел А, если, каково бы ни было число е^>0, для него существует такое число Д^>0, что | f (х) — А | <4 е, лишь только х 4> Д (х — Д) (4) (где х берется из ST). При этом пишут: lim f(x) — A. (5) (х-> — оо) Наконец, легко перефразировать всё сказанное на случай .А = -|-оо или —оо. Сущность всех этих определений одна и та же: функция f(x) должна быть сколь угодно «близка» к своему пределу А, лишь только независимая переменная х достаточно «близка» к своему пре- делу а. Но переменная «близка» к своему конечному пределу, если разность между ними (по абсолютной величине) мала, а к бес- конечному, если она сама (по абсолютной величине) велика и притом сохраняет знак предела. Ясно, что числа 8(Д) во всех случаях зависят от е(Е). Заметим в заключение, что при стремлении функции f(x) к О её называют бесконечно малой; её называют бесконечно большой, если \f(x) | стремится к оо. Если последнее обстоя- тельство имеет место при х— а, то говорят также, что в точке а функция обращается в бесконечность. 53. Сведение к случаю варианты. Если рассматривать варианту, как функцию от независимой переменной п, изменяющейся в преде- лах натурального ряда, то предел этой функции при л—оо, как он определён в 52, очевидно, совпадает с пределом варианты, опре- делённым в 23 и 27 (роль Д там играет N). Таким образом, пре- дел варианты есть частный случай предела функции. Однако и, обратно, в некотором смысле предел функции может быть сведён к пределу варианты. Пусть множество ^ = (х) имеет точку сгущения а (здесь а может быть как конечным числом, так и бесконечностью того или
118 ГЛ. И. ФУНКЦИЯ ОДНОЙ ПЕРЕМЕННОЙ [53 иного знака). Тогда из 37 (бесчисленным множеством способов) можно извлечь такую последовательность Xi, Xi, Xi..., хп, (6) значений х (отличных от а), которая имела бы своим пределом а- Действительно, если а конечно, то, задавшись положительной вари- антой Ъп, стремящейся к нулю, в каждой окрестности (а — 8Л, а -|- 8Л) (л=1, 2, 3,...) точки а найдём по точке х-=хп из 37, отличной от а: так как | хп — а | 8Л, то хп -> а. При а — -ф- оо (— оо) за- дадимся положительной вариантой Дл оо и для каждого Дл найдём значение х — хп из 37, для которого хл^>Дл (хп<^ — Дл); очевидно, хл->-|-00 (—°°)> и т- Д- Последовательности (6) значений аргумента отвечает последо- вательность значений функции /Oi), f{Xi), /(х3), .../(хл), ... (7) Легко усмотреть, что при наличии равенства (2) эта последо- вательность всегда имеет предел А. Остановимся для при- мера на случае конечных а и А. Если задано произвольное число е^>0, то сначала возьмём то число 8^>0, которое ему соответствует в силу определения пре- дела (2). По числу 8, ввиду сходимости последовательности (6) к а, найдётся [23] такой номер N, что для будет выпол- няться неравенство |хл— а | 8, а следовательно [см. (1)], и |/(хл)— А | е. Этим и доказана сходимость последователь- ности (7) к А. Оказывается, что справедливо и обратное утверждение: Допустим теперь, что какую бы последователь- ность (6) (из 37) с пределом а ни пробегала независимая пере- менная х, соответствующая последовательность (7) значений функции всегда имеет предел А. Тогда это число А будет пре- делом функции f(x)— в согласии с определением в 52. Ограничимся и здесь случаем конечных а и А. Рассуждая от противного, предположим, что А не будет пределом функции в упомянутом смысле. Тогда для некоторого числа е^>0 уже не существовало бы соответствующего 8; т. е., какое бы малое 8 ни взять, всегда найдётся хоть одно значение переменной х = х' (от- личное от а), для которого | х' — а | 8, но тем не менее | f(x') — А | е. Возьмём последовательность положительных чисел {8Л}, стре- мящихся к нулю. На основании только что сказанного, для к а ж- дого числа 8 = 8Л найдётся такое значение х7 — х'п, что \х'а — а | 8Л, но тем не менее |/(хл)— А | а.
53] § 2. ПРЕДЕЛ ФУНКЦИИ 119 Из этих значений, таким образом, составляется некоторая по- следовательность -^*2’ •^'8* * * ’’ Хщ ’ ' •> для которой |х; — а|<8л («=1,2,3,...); так как 8Л -> 0, то хп -> а. По допущению теоремы, соответствующая последовательность значений функции /(•<), /(.<), /(.<), ..., /(х^), ... должна стремиться к Л, а это невозможно ввиду того, что при всех я=1, 2, 3,... имеем |/(хл)— Д|^е. Полученное противо- речие и доказывает наше утверждение. Таким образом, мы в сущности приходим ко второму опре- делению понятия предела функции, которое в 52 было выражено, так сказать, «на языке е-3». Теперь же мы можем выра- зить его «на языке последовательностей», понимая равенство (2) в том смысле, что для любой последовательности (6), имеющей предел а, соответствующая последовательность (7) имеет пре- дел А. В заключение отметим, что достаточно предположить одно лишь существование предела для каждой, последователь- ности (7), отвечающей любой сходящейся к а последователь- ности (6), чтобы отсюда уже вытекало совпадение всех этих пределов. Действительно, допустим, что для двух последо- вательностей: х'„ х’3...х'п, ... и х", х"......Хп...... стремящихся к а, имели бы f(x’„)-+A' и f (х'п)-+ А", где А' Ф А*. Тогда, перемежая члены обеих последовательностей, составим новую последовательность: V* V* V*** V*' 4*^ • -Vj, -Vj , л2, -Vg , . . . , Лд, . . «, она, очевидно, стремится к а, поскольку для достаточно больших п и х'п, и х'п отличаются от а произвольно мало. В то же время со- ответствующая последовательность значений функции: Ж). /«)> f(x's), /«), ... , f(x’n), f(x”)....... вопреки предположению, не имеет вовсе предела, так как частич- ные последовательности из её членов, стоящих на чётных или не- чётных местах, стремятся к различным пределам [40]. Получен- ное противоречие и доказывает, что последовательности вида (7) на деле стремятся все к одному и тому же пределу.
120 ГЛ. И. ФУНКЦИЯ ОДНОЙ ПЕРЕМЕННОЙ [54 54. Примеры. 1) Докажем, что lim ах = 4- оо (при а > 1). Л —4-00 При любом Е > 0, достаточно взять Д = log0 Е, чтобы х > Д влекло за собой ах > Е, что. и доказывает наше утверждение *. Аналогично доказывается, что lim ах — 0 (приа>1). X-* — ОО Именно, каково бы ни было е>0 (е <. 1), если взять A = loga —= = — logae, то при х < — Д необходимо ах <z г. Если же 0<a< 1, то с помощью преобразования х /1 V* а х= — \aj легко установить результаты lim ах = 0, lim a* = +oo (при0<а<1). л—00 х~*— °° 2) Установим, что при a> 1 lim logax = 4-oo, lim logax = —оо, x-»+<» *-*4-0 При любом заданном Е>0рлишь только х> будем иметь: logax>E, и аналогично, лишь только 0 < х < а—Е, выполняется неравенство: logax<—Е. Этим и доказаны оба соотношения. 3) Имеем, далее, lim arctgx = -y, lim arctgx — —у. Остановимся для примера на первом пределе. При любом г > 0, доста- . / Ъ \ . л точно взять x>tgl-2—el, чтобы было: arctg—е, так что п л О < -£--arctg X < е. 4) Более тонким является соотношение: ах lim — = -|- оо (при а > 1). X —♦ Вспомним, что частный случай его мы уже имели: ап lim — == оо п-.4-00 п [32, 9)]; очевидно, одновременно будет и * С более частным результатом lim ап = + оо (а > 1) |иы уже имели цело в 27,
54] § 2. ПРЕДЕЛ ФУНКЦИИ 121 Следовательно, по заданному Е > О найдётся такое натуральное число N, что при п> N выполняется неравенство Пусть теперь х > N +1; если положить п-Е(х'), то и га^х<п-|-1, так что ах . р, х «4-1 ’ что и доказывает наше утверждение. Отсюда, как и в 32, 9), легко получить ах lim —т = -|- оо (а > 1, k > 0). ДГ -* 4~ 00 5) Аналогично, опираясь на прежний результат [32, 11)] lim = 0 (а > 1), п ~*4~00 можно установить, что вообще lim !2?а£==о (а> 1), х -»4-°о х где х принимает любые положительные вещественные значения. Заменяя здесь х на xk (k > 0), легко показать, что и lim 1^ = 0 (а>1,'й>0). Действительно, если, задавшись произвольным е > 0, взять Д так, чтобы при х > Д выполнялось неравенство X то при х>Д1 = Д/! будет и • logo х ~ xfe... < е- Если заменить здесь х на -i-, то полученный результат перепишется в виде lim xftlogax = 0 (а>1, й>0). *->4-0 6) Из доказанного в 25, 5) предельного соотношения । lim ап = 1 П->4- оо можно получить более общее lim ах = 1. *->о Заметим, что, очевидно, и _ 2 lim а п — lim -L= 1. n-»4-oo п -> оо 2. a”
122 ГЛ. И. ФУНКЦИЯ ОДНОЙ ПЕРЕМЕННОЙ [54 Поэтому, каково бы ни было е > О, можно найти такое натуральное число ив, что (если, скажем, а > 1) __L 1 1 — Ка л» < ал“ < 1 + е. Если теперь то а л° <ах < an°, откуда 1 — е < ах < 1 s или \ах — 1 | < е, что и доказывает высказанное утверждение. 7) Теперь мы установим следующий (в а ж- ный и для дальнейшего) результат: .. sin х , ,о. lim —— = 1. (8) ж —О х - Предварительно, однако, нам придётся до- казать некоторые полезные неравенства: sin х <[ х < tg х (o<*<i). ОТ С этой целью в круге радиуса R рассмотрим острый угол АОВ, хорду АВ и касатель- ную АС к окружности в точке А (черт. 22). Тогда имеем: площадь Д АОВ площади сектора АОВ площади д АОС *. Если через х обозначить радианную меру угла -^АОВ, так что длина дуги АВ выразится произведением Rx, то эти нера- венства перепишутся так: sin х<[у• tgx. Отсюда — по сокращении на у/?2— и приходим к неравенствам (9). В предположении, что 0<^х<^у, разделим sin х на каждый из членов неравенств (9). Мы получим: , sin х 1 ~ ~..cos х, ♦ При этом мы пользуемся теми сведениями о площадях элементарных фигур, которые излагаются в школьном курсе.
54] 5 2. ПРЕДЕЛ ФУНКЦИИ 123 откуда Но л 1 Sin X . О -= 1---< 1 - cos х. X 1 - cos х = 2 sin22 sin * -= х [в силу (9)], так что sm х Отсюда вытекает неравенство sin х х -= |xl, которое, очевидно, сохранится и при изменении знака х, т. е. будет справедливо для всех х^ 0, лишь только |х| Полученное неравенство и решает вопрос. Действительно, если по произволу задано число е>0, то за 6 достаточно выбрать наи- меньшее из чисел е и : при | х | < д, прежде всего, приме- нимо <5=se) это неравенство /ведь <5==Н, а именно в силу него (так как sin х х е. По определению предела функции [52], это и означает, что функция sin х п „ ---- при стремлении х к 0 имеет предел 1, так что соотношение (8) оправдано. 7а) Предельное соотношение (8) может быть, в согласии с 53, понимаемо и так, что, лишь только х пробегает сходящуюся к нулю последовательность sin хп {хп}, варианта---- будет всякий раз стремиться к 1. Хп Приложим это замечание к разысканию предела варианты <Р <Р <Р lim cos — • cos — ... cos — , 2 22 2n где <p - любое отличное от 0 число. Очевидно, Ф Ф Ф Ф Ф ф ф ф . Ф sin <р = 2 cos • sin — = 22 cos — • cos — • sin — = ... = 2n cos — • cos — ... cos —- • sm — , 2 2 2 22 22 2 22 2" 2" так что интересующее нас выражение представится в виде <Р sin <р <Р 2"-sin — 2П sin 95 ?> 2" . <Р sin — 2”
124 ГЛ. II. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ [54 <р Так как х,г = —-0, то по сказанному выше lim---= 1, У 2п sin <р и предел нашей варианты оказывается равным числу -. У 8) Сейчас мы изучим также очень важный предел. Именно, в 36 было определено число е как предел варианты e = lim (1 +-1 • (10) \ ft) Теперь же мы установим более общий результат: lim ^1 +~jX=e, (11) а также и lim f 1 + Л = е. (11а) Х—-~ | Х) Воспользуемся на этот раз вторым определением предела «на языке последовательностей» [53]. Прежде всего, напомним, что наряду с (10) имеет место и ра- венство ( 1 Iя* lim 1+— = е, (12) I Пк) 4 если {и*} есть произвольная последовательность натуральных чисел, растущих вместе с номером к до бесконечности [40]. Пусть теперь х пробегает какую-нибудь последовательность {х*} значений, стремящихся к +°о; можно считать даже, что все хк>1. Положим пк = Е(хк), так что nk=sxk~^nk+l и пк-*+°°. Так как при этом 1 Х^Х «/с + 1 Хк~~пк ’ ТО (л 1 (1 I Iх* (1 1 1+—< 1+— -= 1+— ( «л+1; ( хк) [ пк) Два крайних выражения могут быть преобразованы так: ( 1 [1+ » , (1 +Х]-+1=[ 1+1W1 + п 5 I л^+1) 1+—?— \ пч ( М ( пч пк+1
54] § 2. ПРЕДЕЛ ФУНКЦИИ 125 причем, в силу (12), (1 \пк ( 1 1 +—| -*е, а также 1;----------+е, пк) ( nk+lj в то время как, очевидно, «/с я*+1 таким образом, оба упомянутых выражения стремятся к общему пре- делу е, а тогда и заключенное между ними выражение также стре- мится к е [по теореме 3°, 28]: 1- 11 1 Iх* lim 1 + — = е. ( Хк J Этим и завершается доказательство соотношения (11) «на языке последовательностей». Для доказательства же (Па) предположим теперь, что последо- вательность {хА} имеет пределом -<» (причем можно считать все - 1). Если положить хк = -ук, тогда i оо (и все 1). Оче- видно, ±Г*=(1 /' ук у* А , 1 У*-1 А , 1 1 Хк) | Ук] (л-1/ ( Ук-1] | Ук-1]' Так как, по доказанному, первый множитель последнего выражения стремится к е, второй же, очевидно, имеет пределом 1, то и выра- жение слева также стремится к е. Формула (Па) оправдана. Заменим теперь в выражении 1 + - переменную х на -; если придать а последовательность положительных или отрицательных значений, стремящихся к 0 (но не равных 0), то х= - будет стре- миться к ±оо. Поэтому формулы (11) и (11а) можно переписать в виде 1 e = lim(l+af. (13) а—-0 Этот замечательный результат лежит в основе всех приложений числа е. 9) Интересен, наконец, и пример, когда предел функции не существует: функция sin х при стремлении х к + ~ (- ~) вовсе не имеет предела. В отсутствии предела всего проще убедиться, стоя на «точке зрения последова- тельностей». Достаточно заметить, что двум последовательностям (и=1, 2, 3, ...) 1
126 ГЛ. II. ФУНКЦИИ ОДНОЙ ПЁРЁМЕННОЙ 154 значений х, имеющим пределом + ~, отвечают последовательности значений функции, стремящиеся к различным пределам: . ( 1] С П sm 2л-----л=-1--1, sin 2лН— л=1~1. V 2/ ( 2) [То же можно выразить и иначе: если взять последовательность (I Л 1 ||и+— I (л= 1, 2, 3, ...) значений х, имеющую пределом + ~, то ей отвечает последовательность значений функции: sm (n + yj л = (-1)п (л=1, 2, 3, ...), вовсе не имеющая предела.] Если вспомнить «колебательный» характер синусоиды, то отсутствие предела в рассматриваемом случае станет наглядным. Аналогично, и функция sin — при стремлении а к 0 (справа или слева) пре- а дела не имеет. Это, в сущности, лишь другая форма приведенного выше при- 1 мера: стоит лишь в функции sin х заменить х на —. Очевидно, если а пробегает по- o' 1 следовательность значений, приближающихся к 0 справа (слева), то х=— стремится к +=» (-«.), и обратно. а Напишем снова в выражении sin — вместо буквы а букву х (чтобы вернуться а к привычному обозначению абсциссы) и рассмотрим поучительный график функции 1 у = sin — (х s О), X 2 ( 2 ) ограничиваясь значениями х от 0 до — и от--до 0 . л I я ) Отметим последовательно убывающие до 0 значения х: 2 12 12 12 2 1 2 я я Зя 2л ’ 5л Зл’ 7л’ ’ (2и-1)л’ ил’ (2л+1)л’ 1 им отвечают растущие до + <» значения — : х л Зл 5л 7л (2л-1)л (2и + 1)л — , л, — , 2л, — , Зл, — , ..., -------, ил, ---------, ... 2 2 2 2 2 2 В промежутках между указанными значениями (при убывании х) наша функ- ция попеременно убывает от 1 до 0 и от 0 до -1, затем возрастает от -1 до О и от 0 до 1, и т. д. 1 Таким образом, функция sin — производит бесконечное множество коле- х баний, подобно функции sin х, но, в то время как для последней эти колебания распределяются на бесконечный промежуток, здесь они все умещаются в конечном промежутке, сгущаясь к 0.
54] S 2. ПРЕДЕЛ ФУНКЦИИ 127 График изображен на рис. 23 (разумеется, не полностью — бесконечное мно- жество колебаний воспроизвести невозможно!). Так как при изменении знака 1 х и sin — меняет знак, то левая половина графика симметрична с правой относи- х тельно начала. 10) Если (для х?^0) рассмотреть функцию x-sin —, которая отличается мно- х жителем х от только что изученной функции sin —, то на этот раз предел при х—>0 х существует: lim x-sin —= 0, х—о х что сразу ясно из неравенства При приближении х к 0 наша функция по-прежнему производит бесконечное множество колебаний, но их амплитуда (благодаря множеству х) убывает, стремясь к 0, чем и обеспечивается существование предела. График функции 1 y=x-sin — х изображен на рис. 24; он умещается между двумя биссектрисами у—х и у — —х координатных углов *). Замечание. Мы имели ряд пределов sin х - . 1 п lim----= 1, lim (1+х)х=е, hmxsm-=0, х-*0 X х—0 х-*0 X объединенных одной особенностью: ни одна из рассматриваемых здесь функций не определена при х = 0. Но это нисколько не мешает говорить об их пре- *) На рис. 23 и 24 для ясности пришлось по оси х взять больший масштаб, что создает искажение.
128 ГЛ. II. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ [55 делах при х—>0, ибо, согласно точному смыслу данного в 52 определения, как раз значение х~0 при этом не рассматривается. Аналогично, то обстоятельство, что функция sin— не имеет смысла при х=0, х не мешает ставить вопрос об ее пределе при х—>0; но на этот раз предел оказывается несуществующим. 55. Распространение теории пределов. Естественно встает вопрос о распространении теории пределов, развитой в главе I (§§ 1 и 2) применительно к случаю варианты, на рассматриваемый здесь общий случай произвольной функции. Для этого существуют два пути: I. Прежде всего, можно перефразировать здесь изло- женные там рассуждения. Мы для примера фактически выполним это по отношению к предложению 1° в 26. Рассмотрим функцию f(x), заданную в некоторой области ЗС, с точкой сгущения а *). 1° Если при стремлении х к а функция f(x) имеет конечный предел А, и А>р (A<q), то для достаточно близких к а значений х {отличных от а) и сама функция удовлетворяет неравенству (f(x)^q). (14) Выбрав положительное число е-^А-р (q-A), будем иметь А-е>р (A+e^q). Но, по определению предела, для этого е найдется такое б, что, лишь только (где х взято из X и отлично от а), тотчас же А - е -= f(x) <А + е. Для тех же значений х и подавно будет выполняться (14). Читатель видит, что никаких новых идей для доказательства привлекать не пришлось. *) Число а может быть и бесконечным, но мы для определенности ограничимся случаем конечного а.
55] § 2. ПРЕДЕЛ ФУНКЦИИ 129 Отсюда непосредственно могут быть оправданы и утверждения 2°, 3° и 5° из 26. Например, полагая в 1° р = 0 (#=0), получим: 2° Если при х-*а функция f(x) имеет конечный положительный (отрицательный) предел, то и сама функция положительна (отрица- тельна), по крайней мере, для значений х, достаточно близких к а, но отличных от а. Справедливо и утверждение, аналогичное 4°, но в более узкой форме: 4° Если при стремлении х к а функция f(x) имеет конечный предел А, то для значений х, достаточно близких к а, функ- ция будет ограниченной: |/(х)| М' (М1 = const, |х-а|-=й). Напомним, что первоначально и для варианты хп, имеющей конеч- ный предел, неравенство |x„| =sM' было получено только для n>N, но, так как лишь конечное число значений варианты может не удовлетворять этому неравенству, то нетрудно было, увеличив в случае надобности М', добиться выполнения неравенства для всех хп. Здесь же этого, вообще говоря, сделать нельзя, ибо значений х, для которых | f(x) | =- М', может оказаться и бесконечное множество. Например, функция f(x) = ~ (для х=-0) при х->1 стремится к единице; очевидно,/(%)-= 2, если однако для всех рассматри- ваемых значений х функция f(x) вовсе не будет ограниченной. II. Переходя к другим теоремам, в которых переменные связы- ваются знаками равенства, неравенства или арифметических действий, мы, прежде всего, должны оговорить, что, соединяя две или несколько функций f(x), g(x), ... (определенных в одной и той же области Д7) такими знаками, мы всегда подразумеваем, что их значения отвечают одному и тому же значению х. Все эти теоремы можно было бы доказать аналогичным образом наново, но - и это важно подчеркнуть - на деле нет необходимости их передоказывать. Если, говоря о пределе функции, стоять на «точке зрения последовательностей», то, поскольку для последовательностей теоремы доказаны, они верны и для функций. Для примера остановимся на теоремах 1°, 2°, 3° из 30: Пусть в области SC (с точкой сгущения а) заданы две функции f(x) и g(x), и при стремлении х к а обе имеют конечные пределы lim f(x) =А, lim g(x) = В. Тогда и функции f(x)±g(x), f(x).g(x), (15) 9 Г. М. Фихтенгольц, т. I
130 ГЛ. II. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ (56 также имеют конечные пределы (в случае частного — в предпо- ложении, что В ф 0), именно А±В, А-В, 4- На «языке последовательностей» данные соотношения расшифро- вываются так: если {хл} есть любая последовательность значений х из Ж, имеющая пределом а, то /(*„) —Д, g(xn) — B. Если к этим двум вариантам применить уже доказанные теоремы, то получаем сразу: lim [/(*„)±§•(*„)] = А±В, \mf(xn)g(xn) = А-В, а это (на «языке последовательностей») и выражает именно то, что нужно было доказать *). Таким же образом на общий случай, рассматриваемый нами теперь, автоматически переносится и все сказанное в 31 относительно «неопределенных выражений», условно характеризуемых символами: 0 оо „ -тг,—, 0 • оо, оо — оо. О ’ оо ’ Как и в простейшем случае, когда мы имеем дело с функциями нату- рального аргумента, здесь для «раскрытия неопределенности» уже недостаточно знать лишь пределы функций f(x) и g(x), а нужно учесть и самый закон их изменения. Читатель легко проверит, что в примерах 4), 5) предыдущего п° мы имели дело с неопределенностью вида 4- и 0 • оо, а в примере 7) — с неопределенностью вида . В следующем п° мы приведем даль- нейшие примеры, уже с применением простейших теорем теории пре- делов. Мы еще вернемся к этому вопросу и в § 4 главы IV, где будут даны общие методы раскрытия неопределенностей уже с примене- нием дифференциального исчисления. 56. Примеры. 1) Обобщая примеры 1) и 2), 32, исследуем поведение многочлена р (х) = aQxk + аре1*-1 + ... + а^х + ak, *) В случае частного можно было бы заметить (аналогично тому, как мы это сделали для варианты), что для х, достаточно близких к а, знаменатель f(x} g(x)y^0, так что дробь J v ; имеет смысл, по крайней мере, для этих зна- чений х.
56] § 2. ПРЕДЕЛ ФУНКЦИИ 131 а затем - и частного двух таких многочленов р(х) aaxh+a1x!l-1 * * * * *+ +aic-1x+aic q(x) boxl + b1xl~1+ .. •+Z>(_1x+Z>; прих-» + Путем преобразования , I °i ak) p(x) = x,c aa-i--F • • .4- V x xk) легко установить, что lim p(x) = + “ (~ - ~), +oo причем знак предела при к четном определяется лишь знаком а„, а при к нечетном - зависит еще и от знака х. 2) Аналогично находим, что г Р&> , lim -----= ± ~, —, О q(x) ь0 в зависимости от того, будет ли k-~l, к = I или к^1. Знак предела (в первом случае) устанавливается по знакам аа и Ьо, а также (при к -1 нечетном) - по знаку х. 3) Докажем для любого положительного рационального показателя г фор- мулу Начнем с простейшего случая, когда показатель есть натуральное число: г - п. По биному Ньютона п(п -1) Г7? и(л-1) = ин-------х+ ... +хп-1; 1-2 так как при х-0 все члены в последней сумме, кроме первого, стремятся к 0, то, действительно, имеем (1 + х)«-1 (1+х)п-1 lim---------- п. 1 Пусть теперь г = — (где т — натуральное), и рассмотрим выражение т т fl+x-l Положим т У1+Х- 1 — у, Так как (считая | х | =-1) откуда х-(Пу)т-1. т то limyi+x=l, У так что, вместе с х, и у-0. А тогда, по предыдущему случаю, т У1+Х-1 у 1 lim-------= ]1т---------- _ . х-*о х у^о(1+у)т-1 т *) Ниже [77, 5) (в)] она будет обобщена на случай любого вещественного по- казателя. 9*
132 ГЛ. II. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ [56 Наконец, общий случай г~ — исчерпывается введением той же вспомогатель- т ной переменной у. п d+x)m-l (1+УР-1 _(1+уГ-1 У х (l+.y)"’-! у '(1+>’)т-Г откуда п , (1+х),п-1 п lim---------= — . х-о л' т 4) Найти предел х т lim-----------. х-*-о х2 т С помощью той же подстановки ^l+x-l«j преобразуем рассматриваемое выражение к виду 1 т -1 т - 1 у~ - [(1 +?)т -1] - - гЧ... - +... т 2 2 [(1 +y)m ~ И3 т2у2+ ... т3-|- ... т- 1 откуда сразу ясно, что искомый предел равен - 2т2 5) Предел [54, 7)] sin % lim-----1 х-*о х часто используется для нахождения других пределов. (а) 1 - cos х hm---------- Очевидно, 1 (° 2 (о 2 sin=— 1 - cos x 2 fsin^V 2 1 2 2 так как выражение в скобках стремится к 1, то общий предел и будет — . (б) tg x - sin x 1 (0 A lim----------= — — . x-o x3 2 1.0 J И здесь преобразование легко приводит к уже изученным пределам: tg х - sin х 1 sin х 1 - cos x X3 COS XX X2 Заметим, что cos x -1 при x - 0, как это вытекает, например, из предыдущего результата (а). (в) lim (secx-tgx) = 0
57| § 2. ПРЕДЕЛ ФУНКЦИИ 133 Здесь удобнее перейти к переменной очевидно а-О при Имеем 1 - cos а 1 - cos а а sec х- tg х = esc а- ctg а = —;-------а -0. sin а а2 sin а 57. Предел монотонной функции. Вопрос о самом существо- вании предела функции lim /(х) х-*а особенно просто решается для функций частного типа, представляю- щих обобщение понятия монотонной варианты [34]. Пусть функция /(х) определена в некоторой области X = {х}. Функция называется возрастающей (убывающей) в этой области, если для любой пары принадлежащих ей значений из х'>х следует /(х')>/(х) [/(х-')-=/(х)]. Если же из x's-x следует лишь /(х')==/(х) [/(х')=е/(х)], то функцию называют неубывающей (н е в о з р а с т а ю щ е й). Иногда удобнее и в этом случае называть функцию возрастающей (убывающей) - но в широком смысле. Функции всех этих типов носят общее название монотонных. Для монотонной функции имеет место теорема, вполне аналогичная той теореме о монотонной варианте, которая была установлена в 34. Теорема. Пусть функция /(х) монотонно возрастает, хотя бы в широком смысле, в области X, имеющей точкой сгущения число а, большее всех значений х {оно может быть конечным или равным + ~). Если при этом функция ограничена сверху: f{x)^M {для всех х из X), то при х^а функция имеет конечный предел; в противном случае - она стремится к +~. Доказательство. Допустим сначала, что функция /(х) огра- ничена сверху, т. е. ограничено сверху множество {/(х)} значений функции, отвечающих изменению х в области X. Тогда для этого множества существует [11] конечная точная верхняя граница А. Докажем, что это число А и будет искомым пределом. Задавшись произвольным числом е>0, по свойству точной вер- хней границы, найдем такое значение х'<н, что f{x')>A-e. Ввиду монотонности функции, для х>х' и подавно будет: f{x)>A-e. Так как, с другой стороны, всегда /(х)=ёЛ+s, то для упомянутых зна- чений х выполнится неравенство |/(х)-Л|<е. Это и доказывает наше утверждение, стоит лишь при а конечном положить х' = п-<5 (т. е. Ь = а-х'), а при а= +«> взять /1=х'.
134 гл. II. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ [51 Если функция /(х) сверху не ограничена, то, каково бы ни было число Е, найдется такое х', что /(х') =-Е; тогда для х>х' и подавно /(х)=-Е, и т. д. Предоставляем читателю преобразовать эту теорему для случая, когда предельное значение а меньше всех значений х, равно как и для случая монотонно убывающей функции. Легко усмотреть, что теорема о монотонной варианте в 34 есть просто частный случай этой теоремы. Независимой переменной там был значок п, областью изменения которого служил натуральный ряд «У = {«}, с точкой сгущения + В последующем нам чаще придется в качестве области Д7, в кото- рой рассматривается функция /(х), встречать сплошной про- межуток [а’, а), где а' < а и а - конечное число или + либо же - промежуток {а, а'], где а'>а и а - конечное число или 58. Общий признак Больцано—Коши. Перейдем теперь к рас- смотрению общего случая - функции /(х), заданной в области X = {х}, для которой а служит точкой сгущения. Для существования к о- н е ч н о г о предела этой функции при стремлении х к а может быть установлен такой же признак, как и в случае варианты [39]. Форму- лировку его мы дадим параллельно для случая конечного а и для случая а= + ~. Теорема. Для того чтобы функция f(x) при стремлении х к а имела конечный предел, необходимо и достаточно, чтобы для каждого числа s>0 существовало такое число 5>0 (4 >0), чтобы неравенство |/(х) -f(x') | <е выполнялось, лишь только \х-а |<5 и | х'-а |<<3 (х=-Д и x'=-Zl). Доказательство проведем в предположении, что а - ко- нечное число. Необходимость. Пусть существует конечный предел lim /(х)=Л. х—а Тогда по заданному е >0 найдется такое б =>0, что 1Ж)-4НЧ, если только | х - а | < 3. Пусть и | х' - а | < д, так что и \A-f(x')\^-
59] § 2. ПРЕДЕЛ ФУНКЦИИ 135 Отсюда получаем |/(*)-Ж)| = |[/М-^] + М-/(х')]Н|Ях)-Л| + |Л-/(ОНе, в предположении, что одновременно |х-«|-=<5 и |х'-«|-=6. Достаточность может быть установлена с помощью рас- суждений, вполне аналогичных тем, которые были применены в слу- чае варианты [39]. Проще, однако, не повторяя этих рассуждений, попросту свести вопрос к уже рассмотренному случаю. Путь для этого нам открывает второе определение понятия предела функции «на языке последовательностей [53].» Итак, пусть условие, сформулированное в теореме, выполнено, и по произвольно взятому е>0 установлено соответствующее <5=-0. Если {х„} есть любая последовательность значений х из X, сходящаяся к а, то, по определению предела последовательности, найдется такой номер N, что для n>N будет: |хп-я|-= <5. Возьмем, наряду с и, и другой номер и' =- N, так что одновременно |х„-«1^=3 и |хП'-а|<6. Тогда, в силу самого выбора числа 5, Это неравенство, таким образом, выполняется при единственном требовании, чтобы оба номера мил' были >N. Это означает, что для варианты /(х„) (л = 1, 2, 3, ...) выполняется условие 39 и, следо- вательно, последовательность f(xj),f(x2), ... имеет конечный предел. Мы видели в 53 (см. замечание в конце), что этого уже достаточно, чтобы последний предел был одним и тем же, как бы ни выбирать последовательность {х„}, сходящуюся к а; этот предел и будет пре- делом функции, существование которого надлежало доказать. [Легко вывести достаточность высказанного условия и из теоремы Больцано-Вейерштрасса - наподобие того, как это сде- лано для варианты в конце 41.] 59. Наибольший и наименьший пределы функции. Даже при отсутствии опреде- ленного предела функции f(x) при стремлении х к а, для отдельных последова- тельностей значений хп-*а предел lim /(хп) все же может существовать; его называют частичным пределом функции.
136 ГЛ. II. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ [60 и lim /(х). 1 Например, для функции sin х при х-> ±°» (или для sin— при х->0) эти частич- X ные пределы заполняют весь промежуток от —1 до +1. Среди частичных пределов функции всегда найдется как наибольший, так и наименьший; их обозначают так: lim /(х) х->а Равенство наибольшего и наименьшего пределов есть условие, необходимое и доста- точное для существования определенного предела функции, в обычном смысле слова. Мы ограничимся формулировкой этой теоремы, не приводя доказательства. Оно может быть выполнено в том же порядке идей, что и в 42. § 3. Классификация бесконечно малых и бесконечно больших величин 60. Сравнение бесконечно малых. Предположим, что в каком- либо исследовании одновременно рассматривается ряд бесконечно малых величин: а,/?, У, , которые, вообще говоря, будут функциями от одной и той же пере- менной, скажем, х, стремящейся к конечному или бесконечному пре- делу а. Во многих случаях представляет интерес сравнение назван- ных бесконечно малых между собой по характеру их приближения к нулю. В основу сравнения двух бесконечно малых а и /3 кладется поведение их отношения *). На этот счет установим два соглашения: т г Р ( а) I. Если отношение — lac ним и имеет конечный и от- I Р) личный от нуля предел, то бесконечно малые а и fl считают- ся величинами одного порядка. II. Если же отношение — само оказывается бесконечно малым ОС (а обратное отношение - бесконечно большим), то бесконечно малая fl считается величиной высшего порядка, чем бесконечно ма- лая <х, и одновременно бесконечно малая а будет низшего по- рядка, чем бесконечно малая fl. Например, если а = х->0, то по сравнению с этой бесконечно малой одного порядка с нею будут бесконечно малые т sinx, tgx, УТ+X-I, ибо, как мы знаем [54, 7); 56, 3)], .. sin х lim------= 1, х—о х т ]/Т+х-1 1 lim---------=— х-*о х т *) Мы будем считать, что переменная, на которую мы делим, не обращается в 0, по крайней мере, для значений х, достаточно близких к а.
61] § 3. КЛАССИФИКАЦИЯ БЕСКОНЕЧНО МАЛЫХ 137 Наоборот, бесконечно малые т ,---- х yi + x—1-»—, 1-cosx, tgx—sin х (1) т будут, очевидно, высшего порядка, чем х [56, 4); 5), (а) и (б)]. Конечно, может случиться, что отношение двух бесконечно малых не стре- мится ни к какому пределу; например, если взять [см. 54, 9) и 10)] 1 а = х и /? = х sin —, х 1 то их отношение, равное sin —, при х->0 предела не имеет. В таком случае говорят, х что две бесконечно малые не сравнимы между собой. Заметим, что если бесконечно малая /? оказывается высшего порядка, чем бесконечно малая а, то этот факт записвыают так: £ = о(а). Например, можно писать: 1 - cos х = о(х), tg х - sin х = о(х) и т. п. Таким образом, символ <?(а) служит общим обозначением для бесконечно малой высшего порядка, чем а. Этим удобным обозна- чением мы впредь будем пользоваться. 61. Шкала бесконечно малых. Иной раз встречается надобность в более точной сравнительной характеристике поведения бесконечно малых, в выражении их порядков числами. В этом случае, прежде всего, в качестве своего рода «эталона» выбирают одну из фигурирую- щих в данном исследовании бесконечно малых (скажем, а); ее назы- вают основной. Конечно, выбор основной бесконечно малой в известной мере произволен, но обычно берут простейшую из всех. Если рассматриваемые величины, как мы предположили, являются функциями от х и становятся бесконечно малыми при стремлении х к а, то в зависимости от того, будет ли а нулем, конечным и отлич- ным от нуля числом или бесконечностью, естественно за основную бесконечно малую взять, соответственно 1 х, х—а, — . X Далее, из степеней основной бесконечно малой а (мы будем счи- тать а > 0) с различными положительными показателями, а\ составляют как бы шкалу для оценки бесконечно малых более слож- ной природы *). III. Уславливаются считать бесконечно малую fl величиной к-го порядка {относительно основной бесконечно малой а), если fl и я.к {к > О) будут величинами одного порядка, т. е. если отноше- р ние имеет конечный и отличный от нуля предел. *) Легко видеть, что при величина а,( будет бесконечно малой одновре- менно с а.
138 ГЛ. П. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ 161 Теперь, например, можно, не довольствуясь утверждением, что бесконечно малые (1) (при х-»0) будут величинами высшего порядка, чем а. = х, сказать точно, что первые две из них суть бесконечно малые второго порядка, а последняя — третьего порядка относительно а = х, ибо [56, 4); 5), (а) и (б)] т____ 1 У1+х — 1---X т lim------------- х-о х2 т— 1 2т2 ’ lim х-0 1 - COS X 1 х* ~2 ’ tg х - sin х hm------------ х^О X3 1 2‘ Чтобы взять более сложный пример, рассмотрим выражение /? = Ух+1 + Ух-1 - 2 Ух; при х-»+°° оно будет бесконечно малым, что становится ясным, если предста- вить его в виде Р=(У%+1 - Ух)- (Ух- Ух-1)=—_ Ух+1 + Ух 1 Ух+угл‘ Продолжая это преобразование, найдем: Ух — 1 — Ух +1 2 (Ух+1 +Ух)(Ух+Ух^Т) (ух + 1 + Ух)(Ух + Ух-1)(Ух-1 + Ух+1) 1 Полагая а = —, теперь уже нетрудно сообразить, что х .. Р -2(1^)’ lim пт —------------------------—----- х-+- a3/s х-+~ (ух+1 -|- Ух)(]/х+ Ух— 1)(Ух — 1 + Ух+1) Таким образом, здесь порядок выражается числом —. Не следует думать, конечно, что для всякой бесконечно малой р (даже срав- нимой со всеми степенями ак) может быть установлен определенный порядок.’ *) Повсюду здесь мы пользуемся тем, что lim yi+z=l; это было доказано 2—0 в 56, 3) (для корня любой степени tn).
62] § 3. КЛАССИФИКАЦИЯ БЕСКОНЕЧНО МАЛЫХ 139 Любопытные примеры, относящиеся сюда, можно получить из формул, установ- ленных: в 54, 4) и 5) (при а=-1 и Л=-0): ах logo х lim — =+“>, lim —-— = 0. (2) х—+«> х"- x-+~ x* Прежде всего, отсюда хк . xk lim — -0, lim ----------— оо. х-+«, ах ,\-+~ logax 1 1 Заменив теперь здесь х на — и положив еще в первом из этих соотношений а - -- , х с 0-«с-=1, мы получим: 1 1 1 Таким образом, бесконечно малая сх (0-=с<1) будет высшего поряд- ка, чем все степени хк (&=»0), в то время как бесконечно малая---------------- logax (а =-1) оказывается низшего порядка, чем все эти степени. 62. Эквивалентные бесконечно малые. Остановимся теперь на од- ном особенно важном частном случае бесконечно малых одного порядка. IV. Будем называть бесконечно малые оси р эквивалентными (в знаках: если их разность у=р~а. оказывается величиной выс- шего порядка, чем каждая из бесконечно малых а и ft: y = o(a) и у = о(Р). Впрочем, достаточно потребовать, чтобы у была высшего порядка, чем одна из этих бесконечно малых, потому что, если, например, у высшего порядка, чем а, то она будет также высшего порядка, чем р. Действительно, из того, что lim ~ = 0, следует, что и у lim = lim —— = lim = 0. a+v 1+Z a Рассмотрим две эквивалентные бесконечно малые а и р, так что Р = a + у, где у — о(а). Если приближенно положить *), то - по мере уменьшения обеих величин - стремится к нулю не только абсолютная погрешность от этой замены, представляемая вели- ‘) Знак ’ означает приближенное равенство.
140 ГЛ. II. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ [62 чиной |у|, но и относительная погрешность, равная Иными словами, при достаточно малых значениях хи ft можно со сколь угодно большой относительной точностью положить $ = х. На этом основана, при приближенных выкладках, замена сложных бесконечно малых эквивалентными им простыми. Установим полезный критерий эквивалентности двух бесконечно малых, который в сущности дает второе определение этого понятия, равносильное ранее данному: Для того чтобы две бесконечно малые х и были эквивалентны, необходимо и достаточно, чтобы было а Пусть сперва выполняется это соотношение, так что 5 = ^-1-»0. <х Тогда будет величиной высшего порядка, чем а, ибо lim - = lim 5 = 0. а Обратно, пусть теперь а и Д эквивалентны, т. е. у=)3-а есть беско- нечно малая высшего порядка, чем а. Вследствие этого имеем --1 = --*0, откуда - —1, а а ’ J а ’ Ч. И Тр. Д. С помощью этого критерия, например, сразу видно, что при х-0 бесконечно т__________________________________ 1 малые sin л и tgx эквивалентны х, a yi+x-1 эквивалентно —х. Отсюда - при- ближенные формулы: sin х~х, tg Х-'-х, т____ 1 _______________________ 1 У1 + х-1==—х, в частности, yi+x -l-^j.r. Доказанное свойство эквивалентных бесконечно малых приводит к исполь- 0 зованию их при раскрытии неопределенности вида —, т. е. при разыскании пре- /1 о дела отношения двух бесконечно малых —. Каждая из них при этом может быть х заменена, без влияния на существование и величину предела, любой эквивалентной ей бесконечно малой. Действительно, если а~а и т. е. а 8 lim —= 1 и lim —= 1, а ?
63] § 3. КЛАССИФИКАЦИЯ БЕСКОНЕЧНО МАЛЫХ 141 то отношение a J а а’ Р отличающееся от отношения — множителями, стремящимися к единице, имеет а предел одновременно с ним (и притом тот же). Если удастся выбрать а и р достаточно простыми, то это может сразу значи- тельно упростить задачу; например, 1 ,------ — (Л'+Л'2) У1+Л-+Л-2-1 2 1 lim------------= lim-------= - . х-.о sin 2х х-о 2х 4 Из доказанного вытекает также, что две бесконечно малые, экви- валентные третьей, эквивалентны между собой. 63. Выделение главной части. Если выбрана основная бесконечно . малая а, то простейшими бесконечно малыми естественно счи- тать величины вида с-а\ где с - постоянный коэффициент и /<>0. Пусть бесконечно малая р будет А--го порядка относительно а, т. е. г /3 11Ш — = с, «К где с - конечное и отличное от нуля число. Тогда lim 1, са^ и бесконечно малые Р и сай оказываются эквивалентными: р~сх!‘. Эта простейшая бесконечно малая сэ.\ эквивалентная данной бесконечно малой Р, называется ее главно й час т ыо (или г л а в- ным членем). Пользуясь установленными выше результатами, кроме уже указанных простых примеров, легко выделить главные части выражений: Здесь х-0, и именно а = х является основной бесконечно малой. 1 Наконец, если л - i «> и за основную принята бесконечно малая а , то имеем также s ]/х+1"+ ]/х-1 ~2'\[х ~---I — | . Все эти результаты снова приводят к приближенным формулам. Пусть т. е. fl = ctx!{ + y, где y = o(a/f). Можно представить себе, что из бесконечно малой у снова выделен главный член: у^-с'об'rd, где k!--k, a d = o(a/r), и т. д.
142 ГЛ. II. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ [63 Например, если положить (считая х-0): т__ 1 V1+X- 1= — х+у, т то, как мы уже имели [56, 4)], у т-1 lim — ------, х-»о х2 2т2 т-1 так что главная часть у есть-х2. Отсюда 2т2 m.--- 1 т-1 У1 + х-1= — х- — х2 + о(х2). т 2т2 В частности, ,,_______________________1 1 У1 +х-1 - — х- —х2+о(х2). Этот процесс последовательного выделения из бесконечно малой простей- ших бесконечно малых все возрастающих порядков можно продолжать и дальше. Мы ограничиваемся в настоящем параграфе установлением общих понятий, иллюстрируя их лишь немногими примерами. В последующем мы укажем систематический прием как для построения главной части данной бесконечно малой величины, так и для дальней- шего выделения из нее простейших бесконечно малых, о котором только что шла речь [см. 104, 124]. В заключение, остановимся еще на таком вопросе: если для двух бесконечно малых /3 и у известны их главные члены схк и с'а.к', что можно сказать о главном члене их суммы ft + у 1 При к^к' главным членом ее, очевидно, будет тот из членов са.к и с'а'£', в котором показатель меньше. Пусть теперь к = к'', тогда главной частью для /3 + у явится сумма (с + c')vk - в предполо- жении, однако, что с + с'^0. В случае же, когда оба главных члена взаимно уничтожаются, сумма /3 + у оказывается бесконечно малой высшего порядка, чем каждое из слагаемых. Так будет, например, при х-0 для бесконечно малых ,.__________________ 1 -------------- 1 /? = у 1-4-х — 1 х и у=у1-х-1 ~ -—х. Если выделить в них еще следующие члены: 11 11 ,3 = — X-х2 + о(х2), у= - —- Х-— х2+о (х2), 2 8 2 8 то ясно, что fi+y= ут+х+ У1-х-2= - — х2+о (х2), так что 0+у будет бесконечно малой второго порядка, а ее главный член 1 равен----х2.
64] § 3. КЛАССИФИКАЦИЯ БЕСКОНЕЧНО МАЛЫХ 143 64. Задачи. Для иллюстрации изложенных соображений приведем несколько задач, в которых они используются. 1) Пусть прямолинейное расстояние на местности измеряется с помощью мерной рейки длины I м. Так как фактически рейка прикладывается не точно вдоль измеряемой прямой, то результат измерения оказывается несколько больше истинной длины. Сделаем самое невыгодное предположение, именно, что рейка прикладывается зигзагом, так что ее концы отстоят от прямой п о- очередно то в одну, то в другую сторону на расстояние Я м (рис. 25). Требуется оценить погрешность. Рис. 25. При однократном прикладывании рейки абсолютная погрешность равна разности между длиной / рейки и ее проекцией на измеряемую прямую; проекция же эта будет: Воспользовавшись приближенной формулой V1 + х — 1Ч— х 2 4Я2 при х= —— (что оправдано, ввиду малости величины л относительно Г), заменим выражение для проекции следующим: ( 2Я2\ 2Я2 '('--Я-'-т- 2Я2 В таком случае, упомянутая погрешность есть — ,а относительная по- 2Я2 1 грешность, очевидно, будет . Та же относительная погрешность сохранится и при многократном прикладывании рейки. 2Я2 Если для этой погрешности установлена граница б, т. е. должно быть то отсюда Например, при измерении двухметровой рейкой (/=2), для достижения отно- сительной точности в 0,001 достаточно, чтобы уклонение Я не превосходило 2 ^0,0005^0,045 м=4,5 см. 2) Найти формулу для длины I открытого ремня, надетого на данную пару шкивов радиусов Я и г, с расстоянием d между центрами (рис. 26). Из чертежа имеем I _ ——АС+Сс = са. 2 Но АС=Л1 —ha , ca = r I-а U ) U < бос; а из Д ODo где через а обозначены равные углы <$ВОС и Cc=Z>o= ](d2 —(/? —г)2.
144 ГЛ. П. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ [64 Таким образом, I = n(R + г) + 2а(Л - г) : 2]'d2-(R-r)-- Для упрощения этой формулы вспомним, что OD R-r — в предположении, что R — r мало относительно d. В том же предположении После подстановки этих значений и преобразований, получим окончательную формулу: (R-r)‘ I—л(А 4_ г) 4 2d 4--— d 3) При разбивке дуг окружностей на местности имеет значение следующая задача: найти отношение стрелы f -DB дуги АВС окружности к стреле f l=D1B1 половины АВрВ этой дуги (рис. 27). Если положить радиус окружности равным г, <ЛОВ=у, то ^АОВ1 Ч>_ 2 f — cos <р), . (, <Р /1 = г I 1 -COS-J Таким образом, искомое отношение равно f 1—cosy fi , <Р 1 — COS — 2
65] § 3. КЛАССИФИКАЦИЯ БЕСКОНЕЧНО МАЛЫХ 145 Выражение это слишком сложно, чтобы им удобно было пользоваться на прак- тике. Найдем его предел при <р -0 (ибо для достаточно малых <р это выражение можно приближенно заменить его пределом). С этой целью заменяем числитель и зна- менатель их главными частями и сразу на- ходим: Итак, для дуг, соответствующих не- большому центральному углу, приближенно можно считать, что стрела полудуги вчет- веро меньше стрелы дуги. Это позволяет последовательно строить промежуточные точки дуги, для которой даны концы и середина. 65. Классификация бесконечно больших. Заметим, что для беско- нечно больших величин может быть развита подобная же классифи- кация. Как и в 60, будем считать рассматриваемые бесконечно боль- шие величины функциями от одной и той же переменной х, которые стремятся к + °°, когда х стремится к а. I. Две бесконечно большие у и z считаются величинами одного порядка, если их отношение --[а с ним и у) имеет конечный и отличный от нуля предел. II. Если же отношение - само становится бесконечно большим у (а обратное отношение - бесконечно малым^, то z считается бесконечно большой величиной высшего порядка, чем у, и, одновременно, у будет бесконечно большой низшего порядка, чем z. В случае, когда отношение - ни к какому пределу не стремится, бесконечно большие у и z будут несравнимы. При одновременном рассматривании ряда бесконечно больших величин, одну из них (скажем, у) выбирают в качестве основной и с ее степенями сравнивают остальные бесконечно большие. Напри- мер, если (как мы предположили выше) все они суть функции от х и стремятся к + оо при х — а, то в качестве основной бесконечно боль- шой обыкновенно берут |xj, если а = при а конечном. III. Бесконечно большая z называется величиной к-го порядка (относительно основной бесконечно большой у), если z и yh будут одного порядка, т. е. если отношение имеет конеч- ный и отличный от нуля предел. } 10 Г. М. Фихтенгольц, т. I
146 ГЛ. II. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ [66 Мы не станем приводить здесь примеров, ибо их легко получить, заменив рассмотренные выше бесконечно малые величины обратными им. Упомянем только о том, что бесконечно большая а* (а =-1) при х - + ~ будет высшего поряд- ка, a бесконечно большая logoх (а =-1) - низшего порядка, чем любая степень хк (с положительным показателем Л); это следует из формул (2) 61. § 4. Непрерывность (и разрывы) функций 66. Определение непрерывности функции в точке. С понятием пре- дела функции тесно связано другое важное понятие математического анализа - понятие непрерывности функции. Рассмотрим функцию f(x), определенную в некоторой области X = {%}, для которой х0 является точкой сгущения; при этом пусть сама точка х0 принадлежит области определения функции, так что в этой точке функция имеет определенное зна- чение /(х0). Когда устанавливалось понятие о пределе функции при стремле- нии х к х0 [52, 53] lim/(x), x-*.ve неоднократно подчеркивалось, что значения х0 переменная х и е п р и- н и м а е т; это значение могло даже не принадлежать области опре- деления функции, а если и принадлежало, то значение f(x л "пи обра- зовании упомянутого предела не учитывалось. Однако особую важность имеет именно случай, когда lim/(x)=/(x0). (1) Х-»Х0 Говорят, что функция f(x) непрерывна при значении х = х0 (или в точке х=х0), если выполняется это соотношение', если же оно нару- шено, то говорят, что при этом значении (или в этой точке) функция имеет разрыв*). В случае непрерывности функции f(x) в точке х0 (и, очевидно, только в этом случае), при вычислении предела функции f(x) при х-*х0 становится безразличным, будет ли х в своем стремле- нии к х0 принимать, в частности, и значение х0, или нет. Определение непрерывности функции можно сформулировать в других терминах. Переход от значения х;, к другому значению х можно себе представить так, что значению х0 придано приращение ♦) Эта терминология связана с интуитивным представлением о не- прерывности и разрывах кривой: функция непрерывна, если непрерывен ее график, точки разрыва функции отвечают точкам разрыва графика. На деле, однако, понятие непрерывности для кривой само требует обоснования, и про- стейший путь к нему лежит как раз через непрерывность функций!
66] § 4. НЕПРЕРЫВНОСТЬ (И РАЗРЫВЫ) ФУНКЦИЙ 147 dx0=-x-x0*). Новое значение функции >’=-/(х)-“= ф(хп-\-Лхф разнится от старого у0=/(х0) на приращение Ду0=/(х) - /Uo)=/Uo+zlxo) - /(л'о)- Для того чтобы функция f(x) была непрерывна в точке хи, необходимо и достаточно, чтобы ее приращение Ду0 в этой точке стремилось к О вместе с приращением /1х0 независимой переменной. Иными словами: непрерывная функция характеризуется тем, что бесконечно малому приращению аргумента отвечает бесконечно малое же приращение функции. Возвращаясь к основному определению (1), раскроем его содер- жание «на языке е-5» [52]. Смысл непрерывности функции /(х) в точке хп сводится к следующему: каково бы ни было число s > 0, для него найдется такое число д -- 0, что неравенство |х-х0|<й влечет за собой |/(х)-/(х0)| <е. Последнее неравенство, таким образом, должно выполняться в д о- статочно малой окрестности (х0-д, х045) точки х0. Наконец, «на языке последовательностей» непрерывность выра- зится так: какую бы последовательность значений х из X: хг, х2, ...,хп, ..., сходящуюся к х0, ни взять, соответствующая последовательность значений функции /(хДДхД ...,/(хД ... сходится к /(х0). Замечание. Пусть точка х=х0, служащая точкой сгущения для области X, в которой определена функция /(х), сама области X не принадлежит, так что в этой точке функция не определена. Если, однако, существует конечный предел lim/(x), х-*х0 то стоит лишь дополнить определение функции, положив /(х0) равным этому пределу, чтобы функция оказалась непрерывной ив точке х=х0. Это в подобных случаях мы обычно и будем впредь подразумевать. Наоборот, если упомянутый предел не существует, то — несмотря на то, что в самой точке х=х0 функция не определена — все же говорят, что функция в этой точке терпит разрыв: она будет иметь здесь разрыв, какое бы значение дополнительно ни приписать функции при х—х0. *) В анализе принято приращения величин х, у, t, ... обозначать через Ах, Ay, At, ... Эти обозначения надлежит рассматривать как цельные символы, не отделяя А от х, и т. п. 10»
148 ГЛ. II. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ [« Обычно мы будем в дальнейшем рассматривать функции, опреде- ленные в промежутке Й7; все его точки являются его точками сгущения, так что по отношению к любой из них можно ставить вопрос о непрерывности. Для упрощения речи, уславливаются го- ворить, что функция непрерывна в промежутке#, если она непрерывна в каждой точке промежутка в отдельности. 67. Арифметические операции над непрерывными функциями. Прежде чем перейти к примерам непрерывных функций, устано- вим следующее простое предложение, которое позволит легко рас- ширить их число. Теорема. Если две функции f(x) и g(x) определены в одном и том же промежутке X и обе непрерывны в точке х0, то в той же точке будут непрерывны и функции f(x)±g(x), /(x)-g(x),^ , о w последняя при условии, что g(xo)^O. Это непосредственно вытекает из теорем о пределе суммы, разно- сти, произведения и частного двух функций, имеющих порознь пре- делы [55]. Остановимся для примера на частном двух функций. Предполо- жение о непрерывности функций f(x) и g(x) в точке х0 равносильно наличию равенств lim/(x)=/(х0), lim g(x)=g(x0)- х-у, х~у. Но отсюда, по теореме о пределе частного (так как предел знаме- нателя не нуль), имеем: limZW=/W X f(x) а это равенство и означает, что функция непрерывна в точке л0. 68. Примеры непрерывных функций. 1° Целая и дробная рациональные функции. Функция f(x)=x, очевидно, не- прерывна во всем промежутке (-~, +»): если хп->-х0, то f(xn) = =^xn—x0=f(x^. Точно так же непрерывна и функция, сводящаяся тождественно к постоянной. Отсюда, на основании теоремы предыдущего п°, вытекает уже непрерывность любого одночленного выражения т раз ахт = а’Х’Х.. .х
68] § 4. НЕПРЕРЫВНОСТЬ (И РАЗРЫВЫ) ФУНКЦИЙ 149 как произведения непрерывных функций, а затем - - и много- члена (целой рациональной функции) аох" + + ... + ап_±х 4 ап как суммы непрерывных функций. Во всех упомянутых случаях непрерывность имеет место во всем промежутке ( - °°, ч- «>). Очевидно, наконец, что и частное двух многочленов (дробная рациональная функция): аохп + а1хп~1 + ... -гйп-1Х+вл bl>xm + blxm~1 + ... +bm-ix+bm также будет непрерывно при каждом значении х, кроме тех, которые обращают знаменатель в нуль. 2°. Показательная функция. Докажем непрерывность показательной функции ах при любом значении х = ха,гиными сло- вами, установим, что lim ах = ах‘. (При этом достаточно ограничиться предположением: о > 1.) Мы видели в 54, 6), что lim ах = 1. х-0 Так как 1 есть как раз значение а0 нашей функции, то это равенство и выражает непрерывность показательной функции в точке х=0. Отсюда уже легко перейти к любой точке; действительно, «х _ = йх»(йх-х« - 1), но при х-*х0, очевидно, х-х0—О, так что - по доказанному - flX“X»-*l и йх-><7х«, ч. и тр. д. 3° Гиперболические функции. Их непрерывность, по уже упоминавшейся теореме, непосредственно вытекает из доказан- ной непрерывности показательной функции, ибо все они рационально выражаются через функцию 6х. 4° Тригонометрические функции. Остановимся сна- чала на функции sinx. Она также непрерывна при любом значении х = х0, т. е. имеет место равенство lim sin х = sin х0. х--х, Для доказательства заметим, что из неравенства sin х < х, установленного 54, (9) для 0 х -= , легко вывести, что неравенство |sinx|=s[x|
150 ГЛ. II. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ (69 справедливо уже для всех значений х (для | х |s=y=»l это следует из того, что | sin х | «=!). Далее, имеем: - • х-ха sin X - Sin A'o = 2 sin ——- • cos — 2. t так что I • • l-л • X-Xa |sinx-sinx0| =2- sin— и, окончательно, cos x+x0 2 - I . X - x„ 2-|Sin-2^ <2 l*-*ol |sin x - sin x0| =s |x-x0|, (2) каковы бы ни были значения х и х0. Если задано любое е=-0, то положим <5=е; при |х-х0| <<5 будет |sinx-sinx0| что и доказывает непрерывность sin х. Аналогично устанавливается и непрерывность функции cos х также при любом значении х. Отсюда, по теореме предыдущего п°, вытекает уже непрерывность функций . sin х 1 cosx 1 tg х =----, sec х =------, ctg х = -—, esc x = -—. cosx cosx sin x sm x Исключение представляют для первых двух - значения вида (2к 1)~ , обращающие cos х в 0, для последних двух - значения вида кп, обра- щающие sin х в 0. 69. Односторонняя непрерывность. Классификация разрывов. Выше с помощью равенства (1) мы определили понятие непрерыв- ности функций /(х) в точке х0. При этом, вычисляя предел (1), мы могли приближать х к х0 и справа, и слева. Установим теперь понятие об односторонней непрерывности или одностороннем разрыве функции в данной точке. Говорят, что функция fix') непрерывна в точке х0 справа (с л е- в а), если выполняется предельное соотношение: /(xo + O) = lim /(х)=/(х0) х—хо+О [/(хо-О)= lim/(х) =/(х0)]. х-*хв—0 (3) Если же то или другое из этих соотношений не осуществляется, то функция f(x) имеет в точке х0 разрыв, соответственно, справа или слева.
70] § 4. НЕПРЕРЫВНОСТЬ (И РАЗРЫВЫ) ФУНКЦИЙ 151 По отношению к левому (правому) концу промежутка Й7*), в ко- тором функция определена, может идти речь, очевидно, только о непрерывности или разрыве справа (слева). Если же х0 есть внутренняя точка промежутка Ж, т. е. не совпадает ни с одним из его концов, то для того, чтобы выполнялось равенство (1), вы- ражающее непрерывность функции в точке х0 в обычном смысле, необходимо и достаточно, чтобы имели место сразу оба равен- ства (3) [52]. Иными словами, непрерывность функции в точке х0 равносильна ее непрерывности в этой точке одновременно справа и слева. Остановимся подробнее на вопросе о непрерывности и разрыве функции /(х) в точке х(), скажем, справа. Предполагая, что функция /(х) в некотором промежутке [х0, х0 + /г] (/г>0) справа от этой точки определена, видим, что для непрерывности необходимо и достаточно: во-первых, чтобы существовал конечный предел /(хо + О) функции f(x) при стремлении х к хи справа, и, во-вторых, чтобы этот предел был равен значению /(х0) функции в точке х0. Поэтому легко дать себе отчет в том, при каких обстоятельствах для функции /(х) в точке х0 справа появляется разрыв. Может случиться, что хотя конечный предел /(хо + О) и существует, но он не равен значению /(х0); такой разрыв называют обыкновенным или разрывом первого рода **). Но может быть и так, что предел /(хо + О) бесконечен, или его вовсе нет; тогда говорят о разрыве второго рода. В следующем п° мы приведем примеры этих разрывов. Замечание. Если в точке х=х0 функция /(х) не определена (см. замечание в 66), то восстановить непрерывность функции в этой точке можно лишь, если существуют оба конечных предела /(хо + О), /(х0 - 0) и равны между собой. Если какой-либо из этих пределов бесконечен или вовсе не су- ществует, то говорят о наличии разрыва второго рода с соот- ветствующей стороны. 70. Примеры разрывных функций. 1) Рассмотрим функцию у-Е(х) (график ее представлен на рис. 8). Если х0 - не целое число и Е(х0)-т, т. е. х()*; т+1, то и для всех значений х в промежутке (т, т+1) будет Е(х) = т, так что непрерыв- ность функции в точке х0 непосредственно ясна. Иначе обстоит дело, если х0 равно целому числу т. Справа в этой точке будет иметь место непрерывность, ибо правее х = т, именно для значений х в (т, т + 1) будет Е(х) = т, так что и Е(т+0) = т<= Е(т). Наоборот, левее х = т, для значений х в (ы-1, /и), очевидно, Е(х) = т — I; отсюда, и Е(пг-0) = т-1, что не равно значению Е(т), и слева в точке х = т функция имеет обыкновенный раз- рыв или скачок! *) Предполагая, что этот конец есть число конечное. **) В этом случае говорят также, что функция /(х) в точке х0 справа имеет скачок, по величине равный /(хо+О) -/(х0).
152 ГЛ 11. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ 170 2) Возьмем функцию, рассмотренную в 46: х2п- 1 у =/(*) = lim —-—- п-~ х2"+1 (ее график дан на рис. 28.) Она имеет обыкновенные разрывы в точках х = ± 1 и справа, и слева, ибо: Л±1)=0, /(-1-0)=/(1+0) = 1, /(-1 + 0)=/(1-0)=-1. 3) Для функции 1 /(*)= — (при х^О) х3 точка х = 0 есть точка разрыва второго рода - с обеих сторон; именно, в ней функция и справа и слева обращается в 1 1 /(+0)= lim — = + ~, /(-0)= lim —=-». Х-+О.Г3 S^O.v’ 4) Функция 1 f(x) = sin— (при х^О), х рассмотренная в 54, 9), в точке х = 0 имеет разрыв второго рода с обеих сторон, У,. ----------------ч------------------------------------------ -/ О +1 Рис. 28. так как не существует вовсе предела этой функции при стремлении х к 0 ни справа, ни слева. 5) Наоборот, если взять функцию [54, 10)] f(x) = х • sin i (при x#0), X для которой, как мы видели, существует предел lim /(х) = 0, х~о то, положив - согласно замечанию п° 66 - Д0) = 0, мы восстановим непрерыв- ность и при х=0. 6) Определим две функции равенствами: £ 1 Л(х) = ах , (а =» 1), /2(х) = arctg — х для х#0 и сверх того положим /х (0) = /3 (0) = 0.
70] § 4. НЕПРЕРЫВНОСТЬ (И РАЗРЫВЫ) ФУНКЦИЙ 153 Для первой из них имеем: 1 /i(4-0) = lim а* = lim а2 = +~, 1 /i( - 0) = lim ах = lim а2 = 0, х-»-о z-*-~ так что в точке х = 0 справа - разрыв второго рода, а слева - непрерывность. Для второй же - 1 л /2(+0) = lim arctg—= lim arctgz = —, x- + o x 2 л Л(-0>-р и в точке x-0 - с обеих сторон скачки. Графики этих функций даны на рис. 29 и 30. 7) Вспомним еще о функции Дирихле [46]: %(х) = 1, если х рационально. /(х) = 0, если х иррационально.
154 ГЛ. II. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ |71 Так как в любой близости от рациональной точки найдутся точки иррациональ- ные, и наоборот, то каково бы ни было х0 в промежутке (- °°, + =»), предела %(_х) при х - ха не существует, так что в каждой точке налицо разрыв второго рода (с обеих сторон). 8) Определим, наконец, в промежутке [0, 1] функцию f(x) так: если х рацио- Р 1 н а л ь н о и выражается несократимой дробью — , то f(x) = -; для х и р р а- д д ционального положим f(x) = 0 *). Мы утверждаем, что в каждой рациональ- ной точке функция имеет обыкновенные разрывы, в то время как в каждой ирра- циональной точке она непрерывна. Действительно, пусть х0 будет любая точка в рассматриваемом промежутке. Если задаться произвольным числом е=-0, то существует лишь конечное 1 число натуральных чисел q, не превосходящих —, а значит в промежутке найдется е р [ Р\ 1 лишь конечное число рациональных точек—, для которых / — = —=гг. Точку х0 д \д) д можно окружить такой окрестностью (х0- 6, х0+<5), чтобы в нее не попала ни одна из этих точек (кроме, быть может, самой точки х0). Тогда, лишь только | х - х0 | -= S (х х0), будет ли х рационально или нет, во всяком случае | /(х) | -= г. Значит, для любой точки х0 существуют /(хо-1 0) =/(х0 - 0) - 0. Если х0 есть иррациональная точка, то и /(х0) = 0, т. е. в этой точке функция непрерывна; если же х0 рационально, то /(х0) отлично от 0, и налицо разрыв (обык- новенный), с обеих сторон. 71. Непрерывность и разрывы монотонной функции. Рассмотрим функцию /(х), которая - при изменении х в промежутке Й7**) - монотонно возрастает (убывает), хотя бы в широком смысле [57]. По отношению к таким функциям имеет место следующая теорема: 1° Монотонно возрастающая (убывающая) функция f(x) может иметь в X разве лишь разрывы первого рода, т. е. скачки. Возьмем любую точку х0 промежутка X, и пусть она не является левым концом этого промежутка. Рассматривая ту часть промежутка, которая лежит влево от х0, применим к ней теорему из 57 о пределе монотонной функции; поскольку для х<х0, очевидно,/(x)=s/(x0), то существует конечный предел /(хо-О) = lim f(x)^f(x0). x~*xft~O Если он совпадает со значением f(x0), то слева в точке х0 функция непрерывна; в противном случае - налицо скачок. Аналогично убеждаемся в том, что в каждой точке х0 промежутка X (не служащей правым его концом) справа тоже либо имеет место непрерывность, либо скачок. *) Эту функцию рассматривал Риман (В. Riemann). *♦) Этот промежуток может быть как конечным, так и бесконечным замкну- тым или открытым (с одного или с обеих концов).
72] § 4. НЕПРЕРЫВНОСТЬ (И РАЗРЫВЫ) ФУНКЦИЙ 155 С помощью доказанной теоремы легко установить критерий не- прерывности монотонной функции, удобный на практике: 2° Если значения монотонно возрастающей (убывающей) в проме- жутке X функции f(x) содержатся в промежутке 6i] и сплошь заполняют его {так что каждое значение у из принимается функцией хоть раз), то эта функция непрерывна в X *). Попробуем допустить, что в какой-нибудь точке хи из X функция f{x) имеет разрыв, например, слева; как мы видели, этот разрыв может быть только скачком. В этом случае существует предел f{x0 - 0), но он меньше значения f{x0). Так как для х^х0 будет /(%)«= ^s/(xo-O), а для х=-х0, очевидно, /(х)&/(х0), то функция не может принимать значений у, лежащих между числами f{x0-O) и f{x0), принадлежащими промежутку ^|. Это противоречит условию теоре- мы; значит, на деле функция f{x) разрывов не имеет. В следующем п° читатель найдет ряд примеров приложения этой полезной теоремы. 72. Непрерывность элементарных функций. Для ряда элементар- ных функций непрерывность была доказана под видом примеров в 68. Пользуясь теоремой 2° предыдущего номера, легко, прежде всего, наново установить непрерывность функции ах или sin х. Функция у = ах («=-!) монотонно возрастает при изменении х в промежутке X={-», + ~). Ее значения положительны и заполняют весь промежуток = (0, + ~), что видно из существования логарифма x = loga у для любого у >0 [20]. Следовательно, показательная функция непрерывна при любом значении х. Аналогично, непрерывность функции у = sin х, скажем, при изме- нении х в промежутке X = ~, вытекает из ее монотонности в этом промежутке, да еще из того факта (устанавливаемого геометри- чески), что при этом она принимает каждое значение между - 1 и + 1. То же относится и к любому промежутку вида [кл-^, кл t ~] (к = 0, +1, ±2,...). Однако более интересны для нас новые результаты, кото- рые так же легко могут быть получены применением названной тео- ремы. Продолжим перечисление основных элементарных функций, начатое в 68. 5° Логарифмическая функция: у = loga х {а >0, а^ 1). Ограничиваясь случаем д=-1, видим, что эта функция возрастает при изменении х в промежутке X = (0, + «). К тому же она, очевидно, *) Условие, чтобы значения /(х) заполняли сплошной промежуток Д, выска- зано здесь, как достаточное для непрерывности монотонной функции; впоследствии [82] мы убедимся, что оно является и необходимым.
156 ГЛ. II. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ (73 принимает любое значение у из промежутка «у = (— <==>, + оо), именно, для х = аУ. Отсюда - ее непрерывность. 6° Степенная функция: у=х*‘ (д<0), при возрастании х от 0 до +°о возрастает, если ц>0, и убывает, если д<0. При этом 1 она принимает любое положительное значение у (для х=у'х), следовательно, и она непрерывна *). Наконец, упомянем 7° Обратные тригонометрические функции: у = arcsin х, у = arccos х, у = arctg х, у = arcctg х. Первые две непрерывны в промежутке [-1, +1], а последние - в промежутке ( — °°). Доказательство предоставляем читателю. Резюмируя, можно сказать, таким образом, что основные элемен- тарные функции оказываются непрерывными во всех точках, где они имеют смысл (т. е. в соответствующих естественных областях их определения). 73. Суперпозиция непрерывных функций. Обширные классы непре- рывных функций могут быть построены с помощью суперпозиции [51] функций, непрерывность которых уже известна. В основе этого лежит следующая Теорема. Пусть функция <р(у) определена в промежутке а функ- ция f(x) - в промежутке X, причем значения последней функции не выходят за пределы когда х изменяется в ЗС. Если f(x) непрерывна в точке х0 из ЗС, а <р(у) непрерывна в соответствующей точке у0=/(х0) из ‘’У, то и сложная функция <р(/(х)) будет непрерывна в точке х0. Доказательство. Зададимся произвольным числом е>0. Так как ср(у) непрерывна при у=у0, то по е найдется такое <т=-0, что Ь-ТоЬ0, следует | <р(у)-<р(л) | С другой стороны, ввиду непрерывности f(x) при х = х0, по а най- дется такое й =-0, что из | х - х01 < д следует | /(х) - /(х0) | = | /(х) - у01 < O'- По самому выбору числа а отсюда следует, далее, |<Р(/(*)) -7>(То) I = I <ХЖ)) -<p(/W) I<е- *) Если ft =-0, то значение 0 включается как в промежуток изменения х, так и в промежуток изменения у; при ft-= 0 значение Оне включается. Далее, если fi - целое число ±п или пробное + — с нечетным знаменателем, то Ч степень х можно рассматривать и для х-=0; непрерывность ее для этих значений устанавливается аналогично.
741 § 4, НЕПРЕРЫВНОСТЬ {И РАЗРЫВЫ) ФУНКЦИЙ 157 Этим «на языке е-8» и доказана непрерывность функции в точке х0. Например, если степенную функцию х? (х=-0) представить в виде сложной функции: которая получается от суперпозиции логарифмической и показатель- ной функций, то из непрерывности последних двух функций уже будет вытекать непрерывность степенной функции. 74. Решение одного функционального уравнения. Для облегчения изложения в ближайшем п°, займемся сейчас следующей задачей (которая представляет и самостоятельный интерес): Найти все непрерывные в промежутке ( — =», Г ~) функции f(x), удовлет- воряющие условию f(xyy) = f(.x)-yf(y), (А) каковы бы ни были значения х и у. Уравнение (А) является простейшим примером так называемых функцио- нальных уравнений, формулирующих некое свойство искомой функции, по которому она и должна быть найдена. Наша задача состоит в разыскании всех непрерывных решений уравнения (А). Легко видеть, что линейные однородные функции, вида f(x)-cx (c^const.), (а) удовлетворяют этому уравнению: с(х +у)^схсу. Но весь вопрос именно в том, будут ли они единственными непрерыв- ными функциями, имеющими свойства (А). Для того чтобы установить, что это действительно так, предположим, что некоторая непрерывная функция /(х) уравнению (А) удовлетворяет, и по- кажем, что тогда она необходимо имеет вид (а). Прежде всего, с помощью метода математической индукции легко обобщить соотношение (А) на случай любого числа (=н) слагаемых: п f(x+y+'. + z)'= f(x) + f(y) н-4- /(z). (4) Действительно, если допустить верность его для какого-либо числа ns^2 слагаемых, то оно окажется верным и для и+1 слагаемых: Л л f(x+y+ .. . + zJru)=f(x + y+-hz) + /(«)=[/(x)+ .. .+/(z)H-/(h). Полагая в (4) х=у=.. .=z, найдем: f(nx)=n-f(x). (5) „ 1 Заменив здесь х на — л-, мы получим н (1 ) 1 / -хЬ=— Ж), \п ) п а затем, если подставить тх (tn — натуральное) вместо х и использовать преды- дущее равенство, придем к соотношению (т \ т f -X —• f(x) (6) \п ) п
158 ГЛ. И. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ [75 Положим теперь в основном уравнении (А) х=у=0; получим /(0)=2/(0), так что /(0)—0. (7) Если же взять у=-х, то, с учетом (7), найдем: /(~х)=-/(*), так что функция /(х) меняет знак при изменении знака х. А тогда из (5) и (6) легко вывести: /( - их) = - /(их) = - и • /(х) (8) и, аналогично, вообще (т ) т ---х=------/(*)• (9) и ) п Полученные соотношения (5) —(9) могут быть объединены в равенстве /(гх)=г./(х), справедливом для любого вещественного значения х, каково бы ни было р а- циональное число г. Если взять здесь х=1 и обозначить /(1) через с, то получим /(г)=сг. Таким образом, мы, собственно говоря, установили уже вид функции /, но пока лишь для рациональных значений аргумента. При этом мы использовали только тот факт, что функция удовлетворяет условию (А), и не опирались на ее непрерывность. Пусть теперь о будет любое иррациональное значение аргумента. Легко построить стремящуюся к нему последовательность рациональных чисел П,г2, ...,гл>... (можно, например, взять отрезки соответствующей бесконечной десятичной дроби). Мы только что видели, что f(f)=crn (л=1,2, 3, ...). Перейдем здесь к пределу при п-> + ~; справа мы получим сд, слева же, именно ввиду предположенной непрерывности функции /, получится lim/(rn)=/(p), так что, окончательно, Таким образом, действительно, наша функция при всех вещественных значе- ниях аргумента выражается формулой (а). Эта формула дает самое общее решение уравнения (А) в непрерывных функциях. 75. Функциональная характеристика показательной, логарифмической и степен- ной функций. 1° Если /(х)--=<А (а=-0), (б) то, каковы бы ни были два вещественных числа х и у, всегда имеет место равенство /(х ^)=/(х)-/О), (Б) выражающее общеизвестное правило умножения степеней: Оказывается, что функциональным свойством (Б), вместе со свойством н е- прерывности, показательная функция определяется вполне. Точнее говоря: единственной функцией, определенной и непрерывной во всем промежутке ( —о», + оо) и удовлетворяющей в нем условию (Б), является показательная функция (если не считать функции, тождественно равной 0).
75] § 4. НЕПРЕРЫВНОСТЬ (И РАЗРЫВЫ) ФУНКЦИЙ 159 Иными словами, формула (б) - за указанным исключением - дает самое общее решение функционального уравнения (Б) в непрерывных функциях. Для доказательства этого рассмотрим произвольную функцию /(х), опре- деленную и непрерывную при всех х и удовлетворяющую условию (Б). Исклю- чается тривиальный случай, когда /(х)=0. Итак, при некотором значении х = х0 эта функция отлична от 0. Полагая в (Б) j> = x0-x, получим /(х) • /(х0 - х) = /(х0) # 0; отсюда ясно, что /(х) отлична от 0 при всяком х. Больше того, заменяя х в (Б) х и у через —, найдем: Г (х)]2 так что/(х) всегда строго положительна. Пользуясь этим, прологарифмируем равенство (Б), например, по натураль- ному основанию е: In /(х+у) = In /(х)+1п /(у). Если положить у(х) = 1п/(х), то в лице ф(х) мы будем иметь функцию, непрерывную (как результат суперпози- ции непрерывных функций, 73) и удовлетворяющую условию: 9’(х+^)=?(х)+?>(у), аналогичному (А). В таком случае, как мы установили, необходимо Дх) = In / (х) + ex (с= const.), откуда, наконец, /(х) = есх = ах (если положить а = ес), ч. и тр. д. 2° Если /(х) = loga х (а>0, а#1), (в) то при любых положительных значениях х и у будет /(ху)=/(х)+/(у)- (В) Это есть запись правила логарифмирования произведения: logo ху = logo x+loga у. И здесь - это равенство, совместно с непрерывностью, вполне характеризует именно логарифмическую функцию: единственной функцией, определенной и непрерывной в промежутке (0, +~) и удовлетворяющей в нем условию (В), является логарифмическая функция (за тем же исключением), так что формула (в) дает самое общее решение функцио- нального уравнения (В), в непрерывных функциях. Для доказательства возьмем произвольную функцию /(х), непрерывную для х>0 и удовлетворяющую этому уравнению. Введем новую переменную f„ изме- няющуюся в промежутке (-~, +~), и положим х = е$, <f(Ji)=j\e?), откуда ; In х, /(х) =<р (In х).
160 ГЛ. II. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ [76 Непрерывная (в силу 73) функция <р(£) удовлетворяет условию [см. (В)] <P(.S+V) = f№+r>) = f(ei • e’f) = f(ei) + f(e’i) =<р($)+<р(т1) типа (А). Значит, <p(£) = d и f(x) = c • In X. Если исключить случай c=0 (тогда f(x) = 0), то полученный результат может быть написан и в виде /(•*) = logaX, где а = ес. Этим все доказано. 3° Наконец, обратимся к функции /(х)-ха, (г) которая, очевидно, удовлетворяет функциональному уравнению f(xy)=f(x)-f(y) (Г) (при любых положительных х и у), ибо (ху)/‘ = ХА -ур. Уравнение это, в соединении с непрерывностью, в данном случае также характеризует степенную функцию в том смысле, что единственной функцией, определенной и непрерывной в промежутке (0, + ~) и удовлетворяющей в нем условию (Г), является степенная функция (за обычным исключением). В самом деле, если дана непрерывная для х =- 0 функция /(х), удовлетворяю- щая условию (Г), то прибегнем к той же подстановке, что и в 2°. Тогда функция <р({) будет удовлетворять условию [см. (Г)] <p(.S + V) = /(cf+,i) = /(ef e’i) = f(en) = y(f). <p( rf) типа (Б). Мы уже знаем, что тогда (если исключить тривиальный случай) <р(!:) = а£ (в=-0). Отсюда /(х) = «1п х = Х1‘ (если положить /i = 1п а), что и требовалось доказать. 76. Функциональная характеристика тригонометрического и гиперболического косинусов. 4° Если f(x) = cosax или chax(o=»0), (д) то, при любых вещественных значениях х и у, удовлетворяется соотношение f(y+х)+f(y - х) = 2 /(х) • f (у). (Д) Это с легкостью вытекает из теоремы сложения для обоих косинусов: cos (y±x) = cos х • cos у ± sin х • sin у, ch (у + х) = ch х • ch у ± sh х • sh у [48, 6°]. Функциональное уравнение (Д), вместе с требованием не- прерывнести функции, и на этот раз полностью характеризует оба коси- нуса: единственными функциями, определенными и непрерывными в промежутке (-», +~) и удовлетворяющими в нем условию (Д), являются тригонометрический и гиперболический косинусы (д) (если, как и выше, не считать функции, тождественно равной нулю).
76] § 4. НЕПРЕРЫВНОСТЬ (И РАЗРЫВЫ) ФУНКЦИЙ 161 Итак, пусть f(x) будет непрерывная для всех х функция, удовлетворяющая условию (Д). Полагая х = 0 и принимая за у какое-либо из значений, для которых /(у)# О, заключаем, что 7(0)=1. (Ю) При у = 0 в таком случае получается /(-х)=/(х), (И) так что функция /(х) оказывается четной. Поскольку непрерывная функция /(х) при х = 0 будет положительна, то най- дется такое, скажем, положительное число с, что f(x) будет положительна во всем промежутке [0, с]. В дальнейшем исследование пойдет по разным путям в зависимости от того, будет ли (a)/(c)=sl или (/'>’) /(с)=-1. Займемся сначала слу- чаем (а). ( л 1 Так как 0-/(с)«г1, то найдется такое 6 10«=6-= — I , что /(c) = cos0. (12) Приведя затем основное соотношение (Д) к виду: fly + х) = 2/(х) •/(')’) - /(у - х), станем в нем последовательно полагать х = с, у~с, х = с, у~2.с, х = с, у = Зс и т. д. Мы получим [с учетом (10) и (12)] f (2с) = 2 cos2 6 - 1 = cos 26, f (Зс) = 2 cos б • cos 20 - cos 6 = cos 30, /(4c) = 2 cos 0 cos 30 - cos 20 = cos 40 и т. д. Пользуясь методом математической индукции, легко докажем для любого натурального ш формулу f(mc) = cosmO. (13) 1 Если же в (Д) положить х = у= — с, то получим [снова с учетом (10) и (12)]: Г, (1 112 /(0)+/(с) 1 + COS0 Г I f Г U Л 2 2 I. 2 J так как f (x) остается положительной между 0 и с, а функция cos х - между 0 и О, то, извлекая положительные корни в обеих частях, придем к равенству. I 1 1 f — с =cos— 0. (.2 J 2 1 Совершенно так же, полагая в (Д) х=у=— с, найдем, что 22 I1 3 1 f — с = cos — 0, (22 ) 22 и т. д. Так, последовательно (математическая индукция!), получим и общее со- отношение I 1 । 1 f — с I = cos — 0 (и=1, 2, 3, ...). (14) П Г. М. Фихтенгольц, т. I
162 ГЛ. II. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ [77 Наконец, повторяя тот процесс, с помощью которого мы, отправляясь от (12), пришли к (13), мы из (14) придем к равенству (т ) т Итак, для положительных значений х вида — имеем: 2П /(cx) = cos6x. (15) Но так как любое положительное число х можно представить как предел значений этого вида, то, с помощью предельного перехода (и опираясь на не- прерывность функций f(x) и cos х), установим справедливость формулы (15) для всех х=-0. Для х-=0 она будет верна в силу (11), а для х=0 - в силу (10). х в Если заменить в (15) х на — и положить — = а, то и получим окончательно: с с f(x) = cos ах. В случае ((8) имеем: /(с)=-1; тогда найдется такое в, что /(c) = ch в. Повторяя дословно все проведенные только что рассуждения и опираясь на со- отношения для гиперболического косинуса, совпадающие по форме с соответ- ствующими соотношениями для тригонометрического косинуса, мы для рассматри- ваемого случая найдем, что /(x) = chax (а=-0). При а = 0 по обеим формулам получили бы: f(x)s 1. Функциональные уравнения (А), (Б), (В), (Г) и (Д) впервые были рассмотрены Коши, который и дал их решения в непрерывных функциях. 77. Использование непрерывности функций для вычисления пределов. Непрерыв- ность функций многообразно может быть использована при вычислении пределов*). Примерам этого рода мы посвящаем настоящий номер. 1) Имеем, при любом вещественном х, ( х]л lim 11Ч— = ех. ( П J Действительно, рассматриваемое выражение (считая х/0) можно представить в виде [(<г X Так как —►О, то варианта в квадратных скобках стремится к е [54 (13)], а тогда - п ввиду непрерывности степенной функции (здесь х = const.) - все выражение имеет пределом ех. 2) Найти предел lim (У(х :-<21)(х+а2) • • -(х+а^-х} (~-<»), х->+•« где ai, а2, • • •, aj{ суть данные постоянные числа. *) Фактически мы иной раз это делали и раньше; так, в примере 3) 56 мы по- т путно установили непрерывность ]/х при х = 1 и использовали ее, а в примере 5) (б) так же поступили по отношению к cos х при х = 0.
77] § 4. НЕПРЕРЫВНОСТЬ (И РАЗРЫВЫ) ФУНКЦИЙ 163 Воспользуемся тождеством yk-zk у- z =------------------, ук 2z+...+zk 1 куда подставим к____________________________________ У = Уи+аО ... (х + Л*) и z = x. Тогда рассматриваемое выражение представится последовательно в виде При подкоренное выражение стремится к 1, следовательно, сам корень I: имеет пределом "/1=1 - ввиду непрерывности корня, как частного случая сте- пенной функции. Так как многочлен (£-1)-й степени (от корня), стоящий в знаменателе, также есть непрерывная функция, то знаменатель стремится к к, а предел всей дроби будет аг + а^ + +ah к 3) Вернемся к предложению в 33, 13). Пусть ап~~0 и -я; ограничимся пока допущением, что 0-= ««=+*>. Применим упомянутое предложение к последова- тельности {In ап} Так как In ап~ In а (в силу непрерывности логарифмической функ- ции), то п,---- In at+ ... +ln йч lim In kaj... an = lim---------= In a. n В таком случае - по непрерывности показательной функции - ^...ап = е,п...еша = а С помощью пределов 1) и 2), 54, этот результат распространяется и на случай а = 0 и а= + °°. Таким образом, мы получаем следующее преобразование упомянутого пред- ложения: Если положительная варианта ап имеет предел (конечный или нет), то тот же предел имеет и варианта П Ьп = l/at-Ог ап. 4) Применив это предложение к последовательности Д2 й3 аП 4-1 ^1,-, •••,--------, ---- , •••, придем к интересному следствию: lim "fan = lim " 1-1, dn в предположении лишь, что существует второй из этих пределов. и*
164 ГЛ. II. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ [77 Найдем для примера предел °) О) ' и! Полагая ап = — , будем иметь пп an+i _ (л + 1)! л! _ 1 1 a~L -(л + 1)л+1’ Тп~~( П" *7 ’ 1+- V п) 1 Значит, и искомый предел есть —. е 5) Установим ряд важных пределов, которые понадобятся нам в следующей главе: г„ l°ga(l+a) 1 /О'! (a) hm---------= loga е - , a-»-О a \0/ (б) lim —- = In а a-0 “ (в) lim-——=/i a-0 * Имеем так как выражение, стоящее справа под знаком логарифма, при <х->0 стремится к е [54, (13)], то (по непрерывности логарифмиче- ской функции) его логарифм стремится к loga е, ч. и тр. д. Отметим частный случай доказанной формулы, когда речь идет о натуральном логарифме {а = е): нт?лО±?)=1. a В простоте этого результата и коренятся, по существу, те преиму- щества, которые представляет натуральная система логарифмов. Обращаясь к формуле (б), положим ал-\=^-, тогда при а-*0 (по непрерывности показательной функции) и /3 —0. Имеем, далее, a = logQ(l 1Д), так что, если воспользоваться уже доказанным результатом: г о“-1 г/? 1т lim---= 11т=---Ь-гж=1-----=ша, я. и тр. д. Если, в частности, взять <х = ^ (л = 1, 2, 3, ...), то получится инте- ресная формула: lim п (/a - 1) = In а (<=° • 0).
78J § 4. НЕПРЕРЫВНОСТЬ (И РАЗРЫВЫ) ФУНКЦИЙ 165 Наконец, для доказательства формулы (в), положим (1 I я)" — 1 при к —0 (по непрерывности степенной функции) будет и р -0. Логарифмируя равенство (1 -• <z)''= 1-;/>, получим, что р-In (1 +00 = In (1 + /?). С помощью этого соотношения преобразуем данное нам выражение так: (!+«>-! 0 = 0__________ In (1+а) а а In (1 +/?) * а По доказанному, оба отношения /? In (1+а) in(T+0) И а стремятся к 1, так что все произведение имеет пределом р, ч. и тр. д. Предел, рассмотренный в 56, 3), получается отсюда, как частный случай, при р = г. 78. Степенно-показательные выражения. Рассмотрим теперь с re- ii с н н о - п о к а з а т е л ь н о е выражение и1', где и и v являются функциями от одной и той же переменной х, с областью изменения Й7, имеющей точку сгущения х0; в частности, это могут быть две варианты ип и vn. Пусть существуют конечные пределы: lim и = а и lim v = b, причем <7-0. Требуется найти предел выражения и1'. Представим его в виде Функции v и In и имеют пределы lim v = b, lim In и = In а х-х, х-х, (здесь использована непрерывность логарифмической функ- ции), так что lim v In и — b In а. х—х0 Отсюда - по непрерывности показательной функции - окон- чательно: lim uv = е^’Хпа^аь. Предел выражения п® можно установить и в других случаях, ког- да известен предел с произведения г In п - конеч- ный или бесконечный. При конечном с искомый предел будет, оче- видно, ес; если же с= -«> или +°о, то этот предел, соответственно, будет 0 или + о» [54, 1)].
166 ГЛ. II. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ [79 Самое же определение предела с = lim {v In и} - лишь по заданным пределам а и b - возможно всегда, кроме случаев, когда это произ- ведение (при х—х0) представляет неопределенность вида °о-0. Легко сообразить, что исключительные случаи отвечают таким комбинациям значений а и Ь: а— 1, b = ± °° j а = 0, 2> = 0; а= +оо, А = 0. В этих случаях говорят, что выражение и” представляет неопре- деленность вида 1~, 0°, со0*) (смотря по случаю). Для решения вопроса о пределе выражения и® здесь мало знать лишь пределы функций и и v, а нужно непосредственно учесть закон, по которому они стремятся к своим пределам. 1 ( 1)л Варианта 14— , при п -<», или более общее выражение (1+а)“, при а -0, ( п 1 имеющие пределом е, дают пример неопределенности вида 1"°. Выше, в 77, 4), Л 1 1 Ал! ( л!)п мы рассматривали варианту / — = — , представляющую неопределенность у пп \пп) . п вида 0°. Наконец, в 32, 10), выражение тоже было неопределенным - вида Приведем еще несколько примеров на раскрытие неопределенностей новых видов. 1 79. Примеры. 1) Найти lim (In х)х (“°). X—4-“ Обозначая данное выражение через у, имеем [см. 54, 2) и 5)] In (In х) In (In х) In х (~) 1пт=-------=—:-----------”0 - , X In X X (“) так что у — е°= 1. 2) Найти lim xsin * (0°). v~0 Здесь [54, 7) и 5)] sin х In у = sin х - In х =-• х In х~0, х следовательно, опять у-1. 3) Пример 1), 76, легко теперь следующим образом обобщить: если варианта хп - х (где х - конечное число), то ( Хп\П lim 14-----=ех (1~). л-ч-~( nJ *) Относительно самих этих символов можно было бы повторить сказанное в сноске на стр. 62.
79] § 4. НЕПРЕРЫВНОСТЬ (И РАЗРЫВЫ) ФУНКЦИЙ 167 Для доказательства достаточно представить предложенное выражение в виде основание степени стремится здесь к е, показатель же - к х. 4) К этому можно привести и пример: (X X cos —F л sin — = п п) Полагая выражение в скобках равным 14— э имеем п X X sin — 1 - cos — [X X] п п cos---1 I- Л Sin — I = ЛХ-X--------► лх п П1 X X п 71 и т. д. 5) Аналогично исчерпывается пример (а, b >0) Здесь так что, на основании одного частного следствия из формулы 5) (б), 77, Хп — (In a+ln b) = In }fab, и искомый предел, действительно, оказывается равным eln = ~\ГаЬ. 6) Наконец, рассмотрим предел 1 lim (cosx)sln2x= lim х->-0 х-*0 (1~). Читатель видит, что в случае неопределенности вида 1“ удобно приводить дело непосредственно к е. Как уже указывалось, общие методы раскрытия неопределенностей всех видов будут даны в главе IV (§ 4).
168 ГЛ. И. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ [80 § 5. Свойства непрерывных функций 80. Теорема об обращении функции в нуль. Займемся теперь изуче- нием основных свойств функции, непрерывной в некотором проме- жутке. Интересные и сами по себе, эти свойства в дальнейшем изложе- нии часто будут служить основой для различных умозаключений. Начнем со следующей простой теоремы, принадлежащей Боль- цано (В. Bolzano) и Коши (A. L. Cauchy). Первая теорема Больцано—Коши. Пусть функция f(x) опреде- лена и непрерывна в замкнутом промежутке [а, Ь] и на концах этого промежутка принимает значения разных знаков. Тогда меж- ду а и b необходимо найдется точка с, в которой функция обращает- ся в нуль: f{c)--=Q (а^с^Б). Теорема имеет очень простой геометрический смысл: если непре- рывная кривая переходит с одной стороны оси х на другую, то она пересекает эту ось (рис. 31). I-е доказательство мы проведем по методу Больцано [41] - последовательным делением промежутка. Для определенности положим, что /(я)-=0, a /(Z>)>0. Разделим промежуток [а, Б] пополам точкой . Может случиться, что функция /(х) обратится в нуль „ д+5 в этой точке, тогда теорема доказана: можно положить с = —у. Пусть же тогда на концах одного из промежутков j функция будет принимать значения разных знаков (и притом отрицательное значение на левом конце и по-
80] § 5. СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИЙ 169 ложительное - на. правом). Обозначив этот промежуток через [пх, Ь}], имеем Я^-о, Д^)>о. Разделим пополам промежуток [пх, /?.] и снова отбросим тот слу- чай, когда f(x) обращается в нуль в середине а'^Ь' этого проме- жутка, ибо тогда теорема доказана. Обозначим через [а2, />2] ту из половин промежутка, для которой Я«2)<о, /(&.)> о. Продолжим этот процесс построения промежутков. При этом либо мы после конечного числа шагов наткнемся в качестве точки деления на точку, где функция обращается в нуль, - и доказательство теоремы завершится,/ - либо получим бесконечную последователь- ность вложенных один в другой промежутков. Остановимся на этом последнем случае. Тогда для п-го промежутка [а„, Д] (п = 1, 2, 3, ...) будем иметь Лап)<0, ДДДО, (1) причем длина его, очевидно, равна Д-^ = ^. (2) Построенная последовательность промежутков удовлетворяет усло- виям леммы о вложенных промежутках [38], ибо, вви- ду (2), lim (bn - ап) = 0; поэтому существует точка с из промежутка [а, Ь], для которой lim ап = lim Ъп = с. Покажем, что именно эта точка удовлетворяет требованию теоремы. Переходя к пределу в неравенствах (1) и используя при этом и е- прерывность функции (в частности, в точке х = с), получим, что одновременно Дс) = НтДпп)^0 и Дс) = Пт ДД)>0, так что, действительно, Де) = 0. Теорема доказана. Мы дадим ниже второе доказательство теоремы Коши, по- строенное на другой идее. Предпошлем ему следующее очевидное предположение: Лемма. Если функция f(x) непрерывна в точке х = х0 и значение f (х0) отлично от Q,mo для всех достаточно близких к х0 значений х функция f(x) сохраняет тот же знак, какой она имеет в точке х0. Это вытекает из утверждения 2° в 55, I, причем в данном случае роль предела А функции (именно ввиду непрерывности) игра- ет /(х0).
170 ГЛ. II. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ 181 П-е доказательство. Рассмотрим все те точки х = х про- межутка [a, Z>], для которых /(х)-=0. К их числу, например, отно- сятся точка а и (в силу леммы) близлежащие к ней точки. Множе- ство {х} ограничено сверху числом Ъ. Положим теперь c=sup {х} [11]; мы утверждаем, что /(с) = 0. Действительно, допустим противное; тогда либо /(с)<0, либо /(с)>0. Если бы было /(с)<0 (тогда заведомо с^Ъ, ибо нам дано, что /(h)>0), то - по лемме - и правее с нашлись бы значения х, для которых /(х)-=0, а это противоречило бы определению с, как верхней границы для {х}. Если же было бы /(с) >0, то - снова на основании леммы - имели бы /(х) =»0 и вблизи с слева, имен- но - в некотором достаточно малом промежутке (с -Ъ, с], а тогда там вовсе не было бы значений х, что также невозможно, ибо с, по определению, есть точная верхняя граница для {х}. Теорема доказана. Заметим, что требование непрерывности функции /(х) в замкнутом промежутке [а, Ь\ существенно: функция, имеющая раз- рыв хоть в одной точке, может перейти от отрицательного значения к положительному и не обращаясь в 0. Так будет, например, с функцией /(x) = E(x)-i, которая нигде не принимает значения 0, хотя /(0) = = -i, а/(1) = (скачок при х = 1). 81. Применение к решению уравнений. Доказанная теорема имеет применение при решении уравнений. Прежде всего, с ее помощью устанавливается существова- ние корней. Например, для всех очевиден корень х= 4 уравнения 2х = 4х, но труднее заметить существование еще одного корня. А между тем, функция /(х) = 2х-4х при х = 0 принимает значение /(0)=1>0, а при х =--значение (1) 2 f —1= 12-2-гО, следовательно (так как она непрерывна), обращается в 0 в (2/ 1 некоторой точке между 0 и -. Другой пример: рассмотрим, вообще, алгебраическое уравнение нечетной степени (с вещественными коэффициентами) f(x)=а^п+1+asx2n + ... + а„,,х+а2П+1 = 0. При достаточно больших по абсолютной величине значениях х многочлен имеет знак старшего члена, т. е. при положительном х - знак а0, а при отрицательном х — обратный знак. Так как многочлен есть непрерывная функция, то, меняя знак, он в промежуточной точке необходимо обращается в 0. Отсюда: всякое алгебраи- ческое уравнение нечетной степени (с вещественными коэффициентами) имеет по крайней мере один вещественный корень. Теоремой Коши можно пользоваться не только для установления суще- ствования корня, но и для приближенного его вычисления. Поясним это при- мером. Пусть f(x) = xl-x-X. Так как /(1)= - 1,/(2) = 13, то многочлен имеет
82] § 5. СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИЙ 171 корень между 1 и 2. Разделим этот промежуток [1, 2] на 10 равных частей точка- ми 1,1; 1,2; 1,3; ... и станем последовательно вычислять: /(1,1)= -0,63 ...; /(1,2)= -0,12 ...; /(1,3)=+0,55 Видим, что корень содержится между 1,2 и 1,3. Разделив и этот промежуток на 10 частей, найдем: /(1,21)= -0,06 ...; /(1,22)= -0,004 ...; /(1,23)= +0,058 Теперь ясно, что корень лежит между 1,22 и 1,23; таким образом, мы уже знаем значение корня с точностью до 0,01 и т. д. * **)). В свете этих замечаний интересно сопоставить изложенные выше два доказа- тельства одной и той же теоремы. Второе из них является только «доказатель- ством существования)» корня уравнения /(х) = 0, ничего не говоря о том, как ко- рень найти. Первое же намечает определенный путь к реальному вычислению корня: путем последовательного деления промежутка пополам (чем мы для про- стоты ограничились) можно в действительности заключить искомый корень в промежуток произвольно малой длины, т. с. вычислить этот корень с произволь- ной степенью точности. 82. Теорема о промежуточном значении. Доказанная в 80 теорема непосредственно обобщается следующим образом: Вторая теорема Больцано — Коши. Пусть функция /(х) определена и непрерывна в некотором промежутке X (замкнутом или нет, конечном или же бесконечном). Если в двух точках х — а их = Ь (а-'Ь) этого промежутка функция принимает неравные значения f(a)=A и f(b) = B, то, каково бы ни было число С, лежащее между А и В, найдется такая точка х = с между а и Ъ, что Доказательство. Будем считать, например, А <В, так что Л--С--В. Рассмотрим в промежутке [а, Ь] вспомогательную функцию ср(х)- =/(х)- С. Эта функция непрерывна в промежутке [а, Л] и на концах его имеет разные знаки: <р(а) =f(a) -С=А-С^0, <р(Ъ) =f(b) С = В С-0. Тогда, по первой теореме Больцано - Коши, между а и Ъ найдется точка х = с, для которой <р(с) = 0, т. е. /(с)-С=0 или /(<?) = С, ч. и тр. д. *) Впрочем, практически этот путь невыгоден. В главе IV (§ 5) будут указаны гораздо более эффективные приемы. **) Очевидно, что первая теорема Больцано - Коши есть частный случай этой: если А и В - разных знаков, то в качестве С можно взять и 0.
172 ГЛ. II. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ [83 Мы установили, таким образом, важное свойство функции f(x), непрерывной в промежутке: переходя от одного своего значения к дру- гому, функция хоть раз принимает, в качестве значения, каждое про- межуточное число. Иными словами это свойство можно выразить и так: значения, принимаемые непрерывной функцией f(x), когда х изменяется в каком- либо промежутке X, сами также заполняют сплошь некоторый промежуток Действительно, пусть т = inf {/(%)}, М=sup {f (х)} * **)) и у0 есть произвольное число между т и М: т<уй-~М. Необходимо найдутся значения функции уг = /(х^ и у2 = f(x2) (хх и х2 взяты из промежутка X), такие, что т^у^у^у^М; это вытекает из самого определения точных границ числового множества. Но тогда, по доказанной теореме, существует между xt и х2 такое значение х = х0 (очевидно, также принадлежащее X), что ,/'(х0) в точности равно у0; следовательно, это число входит в мно- жество Таким образом, представляет собой промежуток с кон- цами т и М (которые сами могут ему принадлежать или нет - смотря по случаю; ср. 84). Мы видели в 71, 2°, что в случае монотонной функции упомяну- тое свойство, обратно, влечет за собой непрерывность. Однако не следует думать, что так будет всегда; легко построить заведомо раз- рывные функции, которые все же этим свойством обладают. Напри- мер, значения функции [70, 4)]: /(x)=sini (х#0), /(0) = 0, когда х изменяется в каком-либо промежутке, содержащем точку разрыва х = 0, заполняют сплошь промежуток [-1, +1]. 83. Существование обратной функции. Применим изученные в пре- дыдущем п° свойства непрерывной функции к установлению, при не- которых предположениях, существования однозначной обрат- ной функции и ее непрерывности [ср. 49]. Теорема. Пусть функция y=f(x) определена, монотонно воз- растает (убывает) **) и непрерывна в некотором промежутке X. *) Напоминаем читателю, что если множество {/(%)} не ограничено сверху (снизу), то мы условились в 11 полагать М= +~ (т- -~). **)В строгом смысле слова (это здесь существенно).
83 J § 5. СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИЙ 173 Тогда а соответствующем промежутке значений этой функции существует однозначная обратная функция х = g(y), также монотонно возрастающая (убывающая) и непрерывная. Доказательство. Ограничимся случаем возрастающей функ- ции. Мы видели выше, что значения непрерывной функции f(x) за- полняют сплошь некоторый промежуток % так что для каждого значения у0 из этого промежутка найдется хоть одно такое зна- чение х0 (из X), что f(.x0)=y0. Но ввиду монотонности этой функции такое значение может найтись только одно: если х1>или<х0, то, соответственно, и /(х^^- или Сопоставляя именно это значение произвольно взятому из , мы получим однозначную функцию обратную для функции у=/(х). Легко видеть, что эта функция g(y), подобно/(х), также монотонно возрастает. Пусть У'^У" и X' = g(y'), x"=g(y"); тогда, по самому определению функции g(y), одновременно У' =f(x') и у" =f(x"). Если бы было х' >х", то, в силу возрастания функции/(х), было бы и у’ >у", что противоречит условию. Не может быть и х' = х", ибо тогда было бы и у' —у”, что также противоречит усло- вию. Итак, возможно только неравенство <х", так что g(y), дей- ствительно, возрастает. Наконец, чтобы дока- зать непрерывность функ- ции x=g(y), достаточно сослаться на теорему в 71, 2°, условия которой выполнены: названная функция монотонна, и ее значения, очевидно, за- полняют сплошь проме- жуток X*). Все утверждения теоремы геометрически очевидны, их легко «про- читать» по рис. 32. *) Какое бы х из X ни взять, стоит лишь положить y=f (х), чтобы для э т о г о у функция g(y) имела своим значением именно взятое х.
174 ГЛ. И. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ 184 С помощью доказанной теоремы можно наново установить ряд уже известных нам результатов. Если применить ее к функции хп (п - натуральное число) в про- межутке X = [0, + °°), то придем к существованию и непрерывности п (арифметического) корня х = rfy для у в = [0, + °°). Исходя из функ- ции у = ах в промежутке Я7 = (-°°, + °о), докажем существование и непрерывность логарифма x = logaj’ в промежутке “<У = (0, +оо). На- конец, рассматривая функции у = sin х и у = tg х, первую - в про- межутке Xr = I ~2 > 2 , а вторую в открытом промежутке Х2 = = [-2 ’ 2] ’ Убедимся в существовании и непрерывности обратных им функций х = arcsin у и х = arctg у, соответственно, в промежутках *$!=[- 1; +1] И % = +°°)- [При этом предполагается, что предварительно уже доказана не- прерывность функций х'\ ах, sin х, tg х - без ссылки на сущест- вование обратных им функций (иначе получился бы порочный круг). Такие доказательства и были даны в 68; соображения же п° 72, очевидно, здесь непригодны.] Рассмотрим еще такой пример. Пусть для х в X = ( - +~) 7 = x-C'Sin.r, где 0- 6-1. (3) Легко показать, что эта функция будет монотонно возрастающей (в узком смысле). Именно, если х" > х' и у', у" - соответствующие значения у, то у” - у' = (х” - л-') - f (sin х" - sin х'). Но [см. (2), 68] | sin х" - sin х' | ==х" - х', откуда и следует, что У'-У=-0, т. е. у"^у'. Применив к этому случаю теорему, убеждаемся в том, что и х является одно- значной функцией от у, и т. д. Приведенный пример представляет интерес тем, что соприкасается с одной задачей теоретической астрономии. Уравнение Е --Л/1-6-sin Е (За) есть знаменитое уравнение Кеплера, которое связывает среднюю ано- малию М планеты с ее эксцентрической аномалией Е (е есть эксцентриситет планетной орбиты). Мы доказали, таким образом, что, каково бы ни было значе- ние средней аномалии, уравнение Кеплера, действительно, однозначно опре- деляет значение эксцентрической аномалии. 84. Теорема об ограниченности функции. Если функция f(x) определена (следовательно, принимает конечные значения) для всех значений х в некотором конечном промежутке, то это не вле- чёт за собой с необходимостью ограниченности функции,
85] § 5. СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИЙ 175 т. е. ограниченности множества {/(х)} принимаемых ею значений. Например, пусть функция f(x) определена так: /(x) = i, если O-=pc=s=1, и Д0) = 0. Функция эта принимает только конечные значения, но она не огра- ничена, ибо при приближении х к 0 может принимать сколь угодно большие значения. Заметим попутно, что в полуоткрытом промежутке (О, 1] она непрерывна, но в точке х = 0 имеет разрыв. Иначе обстоит дело с функциями, непрерывными в зам- кнутом промежутке. Первая теорема Вейерштрасса. Если функция /(х) определена и непрерывна в замкнутом промежутке [а, Ь], то она ограни- чена, т. е. существуют такие постоянные и конечные числа т и М, что m=sf(x)^M при а^х^гЬ. Доказательство поведем от противного: допустим, что функция /(л) при изменении х в промежутке [а, Л] оказывается н е- ограниченной. В таком случае для каждого натурального числа п найдется в про- межутке [а, Л] такое значение х = хп, что (4) По лемме Больцано-Вейерштрасса [41], из последо- вательности {хл} можно извлечь частичную последовательность {xnJ, сходящуюся к конечному пределу: xnf — x0 (при /с — 4- °°)} причем, очевидно, a=s=x0*sb. Вследствие непрерывности функции в точке х0, тогда должно быть и /(Л'л*) -*Л*о)> а это невозможно, так как из (4) следует, что |ЖД| ~>то- Полученное противоречие и доказывает теорему. 85. Наибольшее и наименьшее значения функции. Мы знаем, что бесконечное числовое множество, даже ограниченное, может не иметь в своем составе наибольшего (наименьшего) элемента. Если функция f(x) определена и даже ограничена в некото- ром промежутке изменения х, то в составе множества ее значений {/(х)} может не оказаться наибольшего (наименьшего). В этом случае точная верхняя (нижняя) граница значений функции f (х)
176 ГЛ. II. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ [85 не достигается в названном промежутке. Так будет обстоять дело, например, с функцией f(x) = x-E{x) (график ее представлен на рис. 33). При изменении х в любом про- межутке [0, />] (йв= 1), точной верх- ней границей значений функции бу- дет 1, но она не достигается, так что наибольшего значения функция не имеет. Читателю, вероятно, ясна связь этого обстоятельства с наличием Рис. 33. У рассматриваемой функции раз- рывов при натуральных значе- ниях х. Действительно, для непре- рывных в замкнутом промежутке функций имеет место: Вторая теорема Вейерштрасса. Если функция f(x) определена и непрерывна в замкнутом промежутке [а, Ь\, то она дости- гает в этом промежутке своих точных верхней и нижней границ. Иными словами, в промежутке [а, />] найдутся такие точки х = х0 и х = х3, что значения f(x.^ и /(х3) будут, соответственно, наи- большим и наименьшим из всех значений функции f(х). I-е доказательство. Положим М-sup {/(х)}; по предыдущей теореме, это число - конечное. Предположим (во- преки тому, что нужно доказать), что всегда f(x)-<M, т. е. что гра- ница М не достигается. В таком случае, можно рассмотреть вспо- могательную функцию <р(х) = .. 1.. , . Так как, по предположению, знаменатель здесь в нуль не обращается, то эта функция будет непрерывна, а следовательно (по предыдущей теореме) ограничена: </>(х)=ец (ц>0). Но отсюда легко получить, что тогда т. е. число Af-i, меньшее, чем М, оказывается верхней грани- цей для множества значений функции /(х), чего быть не может, ибо М есть точная верхняя граница этого множества. Получен- ное противоречие доказывает теорему: в промежутке [a, 6] найдётся такое значение х0, что f(xn) = M будет наибольшим из всех значений /(х).
85| § 5. СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИЙ 177 Аналогично может быть доказано утверждение и относительно наименьшего значения. П-е доказательство. Можно и здесь исходить из леммы Больцано-Вейерштрасса [41]. Ограничимся утверждением о наибольшем значении. Если, как и только что, M=sup {/(%)}, то по свойству точной верхней границы [11], для любого п най- дется такое х = хп в [а, Ь], что (5) Тогда из последовательности {%„} может быть извлечена частич- ная последовательность {xnt}, сходящаяся к некоторому значению х0 из [а, Л]: xnt->-x0, так что, ввиду непрерывности функции, и В то же время из (5) имеем в пределе, /(х0>М. пк Но /(х0) не может быть больше верхней границы М множества значений функции и, следовательно, /(х0) = М, что и требовалось доказать. Отметим, что оба приведенные доказательства суть чистые «до- казательства существования». Средств для вычисления, например, зна- чения х = х0 никаких не дано. Впоследствии [в главе IV, § 1], правда, при более тяжелых предположениях относительно функции, мы на- учимся фактически находить значения независимой переменной, до- ставляющие функции наибольшее или наименьшее значения. Если функция /(х), при изменении х в каком-либо промежутке X, ограничена, то ее колебанием в этом промежутке называется разность а> = М-т. Иначе можно определить колебание со как точную верхнюю гра- ницу множества всевозможных разностей /(х")-/(х')> где х’ и х" принимают независимо одно от другого произвольные значения в про- межутке Х-. а>= sup {/(х") -/(%')} • х', х" из X Когда речь идет о непрерывной функции f(x) в замкну- том конечном промежутке X = [а, /?], то, как следует из дока- шнной теоремы, колебанием будет попросту разность между 2 Г. М. Фихтенгольц, т. I
178 гл. ii. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ [86 наибольшим и наименьшим значениями функции в этом промежутке. В этом случае промежуток значений функции есть замкну- тый промежуток [т, М], и колебание дает его длину. 86. Понятие равномерной непрерывности. Если функция f(x) определена в некотором промежутке X (замкнутом или нет, конеч- ном или бесконечном) и непрерывна в точке х0 этого промежутка, то lim/(x)=/(x0) или [«на языке е-д», 66]: для каждого числа е>0 найдется такое число Й=>0, что |х-х0|<й влечет за собой \f(x)~/(х0)|<е. Предположим теперь, что функция /(х) непрерывна во всем про- межутке X, т. е. непрерывна в каждой точке х0 этого промежут- ка. Тогда для каждой точки х0 из X в отдельности по заданному s найдется й, соответствующее ему в упо- мянутом выше смысле. При изменении х0 в пределах X, даже еслие неизменно, число д, вообще говоря, будет ме- няться. Одного взгляда на рис. 34 достаточно, чтобы убедиться в том, что число й, пригодное на участке, где функция изменяется медлен- но (график представляет п о- .2- л о г у ю кривую), может оказаться слишком боль- шим для участка быстрого изменения функции (где гра- х0 ха+8 Рис. 34. фик круто поднимается или опускается). Иными словами, число й вообще зависит не только от е, но и от х0. Если бы речь шла о конечном числе значений х0 (при неиз- менном е), то из конечного числа соответствующих им чисел й можно было бы выбрать наименьшее, и это последнее годилось бы, очевидно, и для всех рассматриваемых точек х0 одновременно. Но по отношению к бесконечному множеству значений х0, содержащихся в промежутке X, так уже рассуждать нельзя: им (при постоянном s) соответствует бесконечное множество чисел й, среди которых могут найтись и сколь угодно малые. Таким образом, по отношению к функции /(х), непрерывной в промежутке X, встает во-
871 § 5. СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИЙ 179 прос: существует ли, при заданном е, такое д, которое годилось бы для всех точек х0 из этого промежутка ? Если для каждого числа £=>0 найдется такое число <5^0, что |х-х0|<(5 влечет за собой |/(х)~/(^0)Не> где бы в пределах рассматриваемого промежутка X ни лежали точки х0 и х, то функцию f(х) называют равномерно непрерывной в промежутке X. В этом случае число S оказывается зависящим только от е и может быть указано до выбора точки х0: 3 годится для всех х0 одновре- менно. Равномерная непрерывность означает, что во всех частях проме- жутка достаточна одна и та же степень близости двух значений аргу- мента, чтобы добиться заданной степени близости соответствующих значений функции. Можно показать на примере, что непрерывность функции во всех точках промежутка не влечет необходимо за собой ее равномер- ной непрерывности в этом промежутке. Пусть, например, f(x) = 1 2 =sin - для х, содержащихся между 0 и -, исключая 0. В этом случае область изменения х есть незамкнутый промежуток f0, -1 , I 1 и в каждой его точке функция непрерывна. Положим теперь х0 = В , х =— (где п - любое натуральное число); тогда /(x0)=sin = ± 1, f(x) =sin ил = 0, так что |Л*)-Ж)Ы> несмотря на то, что |х-х0| с В03Растанием п может быть сделано сколь угодно малым. Здесь при s = 1 нельзя найти д, которое (21 0, - , хотя для каж- дого отдельного значения х0, ввиду непрерывности функции, такое й существует! Весьма замечательно, что в замкнутом промежутке [а, й] ана- логичного положения вещей быть уже не может, как явствует из сле- дующей теоремы, принадлежащей Кантору (G. Cantor). 87. Теорема Кантора. Если функция f(x) определена и непрерывна в замкнутом промежутке [а, Ь], то она и равномерно не- прерывна в этом промежутке. Доказательство поведем от противного. Пусть для неко- торого определенного числа е >0 не существует такого числа 12*
180 ГЛ. И. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ [88 <5>0, о котором идет речь в определении равномерной непрерывно- сти. В таком случае, какое бы число <5>0 ни взять, найдутся в про- межутке [a, А] такие два значения х'о и х', что |x'-Xq|<(5, и тем не менее |/(х') -/(xq)| Возьмем теперь последовательность {<5Л} положительных чисел так, что йл-»0. В силу сказанного, для каждого 8п найдутся в [а, Ь] значения х(оп) и х(л) (они играют роль х'о и х'), такие, что (при п = 1, 2, 3, ...) |х(л)-х(ол)| < 8п, и тем не менее |/(х(л))-/(х(ол))| s=s. По лемме Больцано-Вейерштрасса [41] из ограничен- ной последовательности {х(л)} можно извлечь частичную последова- тельность, сходящуюся к некоторой точке х0 промежутка [а, />]. Для того чтобы не осложнять обозначений, будем считать, что уже сама последовательность {х(л)} сходится к х0. Так как х(л)-х^л)-*0 (ибо |х(л)-х£л)| < 8п, а Й„—0), то одновременно и последовательность {х^л)} сходится к х0. Тогда, ввиду непрерывности функции в точке х0, должно быть /(х<л>)->/(х0) и /(х<л>)->/(х0), так что /(х<л))-/(4л))-о, а это противоречит тому, что при всех значениях п |/(xW)-/(x^>)|s=e. Теорема доказана. Из доказанной теоремы непосредственно вытекает такое следст- вие, которое ниже будет нам полезно: Следствие. Пусть функция f (х) определена и непрерывна в зам- кнутом промежутке [а, />]. Тогда по заданному е =- 0 найдется такое 8 >0, что если промежуток произвольно разбить на частичные про- межутки с длинами, меньшими 8, то в каждом из них колебание функ- ции /(х) будет меньше s. Действительно, если, по заданному е, в качестве 5 взять число, о котором говорится в определении равномерной непрерывности, то в частичном промежутке с длиной, меньшей 8, разность между лю- быми двумя значениями функции будет по абсолютной величине мень- ше е. В частности, это справедливо и относительно наибольшего и наименьшего из этих значений, разность которых и дает колебание функции в упомянутом частичном промежутке [85]. 88. Лемма Бореля. Мы докажем сейчас одно интересное вспо- могательное утверждение, которое - подобно лемме Больцано —
88] § 5. СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИЙ 181 — Вейерштрасса - может быть полезно при проведении многих гонких рассуждений; оно принадлежит Б о р е л ю (Е. Borel). Рассмотрим, наряду с промежутком [а, Ь], еще некоторую систему 2 открытых промежутков о, которая может быть как конечной, так и бесконечной. Условимся говорить, что система^1 покры- вает промежуток [a 6] (или что этот промежуток покрывается си- стемой и т- п.), если для каждой точки х промежутка [а, й] найдется в промежуток а, содержащий ее. Этот способ речи облегчит нам формулировку и доказательство упомянутого утверждения. Лемма Бореля. Если замкнутый промежуток [а, Ь] покры- вается бесконечной системой £ = {ст} открытых промежут- ков, то из неё всегда можно выделить конечную подсистему которая также покрывает весь промежуток [а, Ь]. I-е доказательство поведем от противного, применив ме- тод Больцано [41]. Допустим же, что промежуток [а, Ь] не может быть покрыт конечным числом промежутков п из Разделим про- межуток [a, й] пополам. Тогда хоть одна из половин его тоже не мо- жет быть покрыта конечным числом о; действительно, если бы одна из них могла быть покрыта промежутками о\, п2, ..., ат (из ^), а другая - промежутками пт+1, от+2, ..., (из ^), то из всех этих промежутков составилась бы конечная система покрывающая уже весь промежуток [а, />], вопреки допущению. Обозначим через [а1, ту половину промежутка, которая не покрывается конечным числом <т (если же обе таковы, то - любую из них). Этот промежуток снова разделим пополам и обозначим через [а2, ту из его половин, ко- торую нельзя покрыть конечным числом а, и т. д. Продолжая этот процесс неограниченно, мы получим бесконечную последовательность вложенных промежутков [а„, Ьп] (и = 1, 2, 3, ...), каждый из которых составляет половину предшествующего. Про- межутки эти все выбираются так, что ни один из них не покрывается конечным числом проме- жутков а. По лемме о вложенных промежутках [38], существует общая им всем точка с, к которой стремятся концы ап, Ьп. Эта точка с, как и всякая точка промежутка [а, Ь], лежит в одном из промежутков ст, скажем в п0 = (а, /?), так что а-=с</5. Но варианты ап и Ьп, стремящиеся к с, начиная с некоторого номера будут сами содержаться между а и /3 [26, 1°], так что определяемый ими проме- жуток [ап, Ъп] окажется покрытым всего лишь одним промежутком <т0, вопреки самому выбору этих промежутков [ап, й;1]. Полученное про- тиворечие и доказывает лемму. Приведем еще одно доказательство, построенное на новой идее; она принадлежит Лебегу (Н. Lebesgue). П-е доказательство. Рассмотрим точки х* промежутка [а, />], обладающие тем свойством, что промежуток [а, х*] покрывается
182 ГЛ. II. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ [89 конечным числом промежутков а. Такие точки х*, вообще, найдутся: так как, например, точка а лежит в одном из <т, то и все близлежа- щие к ней точки содержатся в этом а и, следовательно, оказываются точками х*. Нашей задачей является установить, что и точка b принадлежит к числу точек х*. Так как все x*=sb, то существует [11] и sup {х*} = c=sb. Как и всякая точка промежутка [a, А], с принадлежит некоторому <т0 = (а,/3), а-<с-<(6. Но, по свойству точной верхней границы, най- дется Xq, такое, что x^Xqsc. Промежуток [a, xj] покрывается ко- нечным числом промежутков а (по самому определению точек х*); если к этим промежуткам присоединить еще лишь один промежуток <т0, то покроется и весь промежуток [а, с], так что с есть одна из то- чек х*. Вместе с тем, ясно, что с не может быть -~Ь, ибо иначе между сир нашлись бы еще точки х*, вопреки определению числа с как верхней границы всех х*. Таким образом, необходимо Ь = с; зна- чит b есть одно из х*, т. е. промежуток [а, й] покрывается конечным числом промежутков ст, ч. и тр. д. Заметим, что для справедливости заключения леммы в равной мере существенно как предположение о замкнутости основного промежутка [а, />], так и предположение о том, что промежутки а, составляющие систему - открытые. Например, система открытых промежутков р 3] р 31 р 31 р 31 II’ 2)’ (4 ’ 4j ’ U ’ 8J ’ ' ’ ’ ’ 1.2"’ 2"] ’ покрывает промежуток (0, 1], но из них нельзя выделить конеч- ной подсистемы с тем же свойством. Аналогично, система замкну- тых промежутков [о,1], 2-^21,... И [1,2] L 2 J L 2 4 J L 4 8 J L 2" 2"+1 J покрывает промежуток [0,2], но и здесь выделение конечной подсистемы невозможно. 89. Новые доказательства основных теорем. Покажем теперь, как лемма Б о р е л я может быть использована для доказательства основных теорем о непрерывных функциях Больцано-Коши, Вейерштрасса и Кантора. 1° 1-я теорема Больцано-Коши [80]. На этот раз доказывать ее будем от противного. Допустим, что - при соблюдении предполо-
891 § 5. СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИЙ 183 жения теоремы - все же ни в одной точке функция f(x) не обращается в нуль. Тогда, по лемме п° 80, каждую точку х' промежутка [а, Ь\ можно окружить такой окрестностью о' = (х' - 6', х' + <У), что в ее пре- делах*) f(x) сохраняет определённый знак. Бесконечная система 2 = {ст} этих окрестностей покрывает, таким образом, весь данный промежуток [а, />]. Тогда, по лемме Бореля, для этого оказывается достаточно уже конечного числа упомя- нутых окрестностей, образующих систему ^*. Левый конец а нашего промежутка принадлежит одной из окрест- ностей этой системы 2*, скажем, окрестности Oi = (Xi~ х1 + 51). Рис. 35. Ее правый конец Xj + Й15 в свою очередь, принадлежит окрестности *2+^2) из точка х2+<52 содержится в окрестно- сти <г3 = (х3-33, х3 + <53) из 2*’ и т- Д- (рис. 35). После конечного числа шагов, передвигаясь направо, мы придем к окрестности оп = (-Тп ~Ьп, хп + 5„) из 2*’ заключающей в себе уже правый конец b данного промежутка. Если бы 2* содержала еще какие-либо другие промежутки, кроме <т1,<г2,<тз> (6) то их, очевидно, можно было бы просто опустить. В окрестности о, функция f(x) сохраняет определенный знак, именно, знак f(a). Но и в о2 функция имеет определенный знак, ко- торый должен тоже совпадать со знаком /(а), поскольку и о2 взаимно налегают. Так же убеждаемся в том, что тот же знак функция сохраняет и в следующей по порядку окрестности <т3, на- легающей на ст2, и т. д. В конце концов, придем к заключению, что и в последней окрестности ап функция имеет знак f(a), так что и f(b) совпадает по знаку с /(я), а это уж противоречит предполо- жению. Теорема доказана. 2° 1-я теорема Вейерштрасса [84]. Ввиду непрерывности функции f (х), какую бы точку х промежутка [a, Z>] ни взять, задав- шись числом £>0, можно окружить эту точку столь малой окрест- ностью а' = (х'~д', х' + <5'), чтобы для всех принадлежащих ей значе- ний х выполнялись неравенства |/(х)-/(х')| или Ж) - е < f(.x) -= f{x') + е. *) То есть в общей части этой окрестности и промежутка [a, в котором х только и может изменяться.
184 ГЛ. II. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ [89 Таким образом,, в пределах каждой такой окрестности функция /(л) заведомо ограничена: снизу - числом/(%')-е, а сверху - числом /(x')+s. Читателю ясно, что и здесь к бесконечной системе £ окрестно- стей, обладающих указанным свойством, надлежит применить лемму Бореля. Из нее следует, что найдется в £ конечное число окрест- ностей (6), также в совокупности покрывающих весь промежуток [а, 2>]. Если в а±, m2*&f(x)^M2 в <т2, mn=&f(x)^Mn в ап, то, взяв в качестве т наименьшее из чисел т2, ..., тп, а в каче- стве М - наибольшее из чисел Мг, М2, ..., Мп, очевидно, будем иметь во всем промежутке [а, Ь\, ч. и тр. д. 3°. Теорема Кантора [87]. Зададимся произвольным числомs>0. На этот раз каждую точку х' промежутка [а, Ь] окружим такой окрест- ностью а' = (х' - <5', х' + 3'), чтобы в ее пределах выполнялось нера- венство Если х0 также есть точка этой окрестности, то одновременно и |Ж)-/(х0)Н|- Таким образом, для любых точек х и х0 из в' будем иметь |/(х)-/(х0)|<е. Стянем каждую окрестность а' вдвое, сохраняя ее центр, т. е. вместо ff' рассмотрим окрестность — ( , , <5'1 С = * - у , X + у • Из этих окрестностей также составится система покрывающая промежуток [а, Ь], и именно к ней мы применим лемму Бореля. Промежуток [а, Ь] покроется конечным числом промежутков из 2’- = + (i=l,2, ..., и). Пусть теперь д будет наименьшим из всех чисел |, и х0, х - любые две точки нашего промежутка, удовлетворяющие условию: |х-х0|-=<5. (7)
89] § 5. СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИЙ 185 Точка л0 должна принадлежать одной из выделенных окрестно- стей, например, окрестности ai<i ~ ХЬ> 2 ’ ' 2 1’ так что . Так как <5==у, то, ввиду (7), |х-х0|-=^, откуда |x-xj <<$,„, т. е. точка х (а подавно - и точка х0) принадлежит той перво- начально взятой окрестности стягиванием которой получена окрестность aic. В таком случае, по свойству всех первоначально взятых окрестностей, Поскольку 5 было выбрано вне зависимости от положения точки х0, равномерная непрерывность функции f(x) доказана. Как видно из приведенных рассуждений, лемма Б о р е л я с успе- хом прилагается в тех случаях, когда «локальное» свойство, связан- ное с окрестностью отдельной точки, подлежит распространению на весь рассматриваемый промежуток.
ГЛАВА ТРЕТЬЯ ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ § 1. Производная и ее вычисление 90. Задача о вычислении скорости движущейся точки. Начнем с частного примера, именно, рассмотрим свободное падение (в пу- стоте - чтобы не учитывать сопротивления воздуха) тя- ?/7 желой материальной точки. Если время t (сек.) отсчитывается от начала падения, то пройденный за это время путь s (м), по известной фор- муле, выразится так: где g = 9,81 Исходя из этого, требуется опреде- лить скорость v движения точки в данный момент t, когда точка находится в положении М (рис. 36). Придадим переменной t некоторое приращение At и рассмотрим момент /!Z1Z, когда точка будет в поло- Рис. 36. жении Мг. Приращение ММГ пути за промежуток вре- мени At обозначим через As. Подставляя в (1) t + At вместо t, получим для нового значения пути выражение s I As=|(Z -.L At)2, откуда As = ~(2t-At + At2). Разделив As на At, мы получим среднюю скорость падения точки на участке ММу. rcp. = ^ = g/ + l-J/. Как видим, эта скорость меняется вместе с изменением At, тем лучше характеризуя состояние падающей точки в момент t, чем мень- ше промежуток At, протекший после этого момента.
911 § I. ПРОИЗВОДНАЯ И ЕЕ ВЫЧИСЛЕНИЕ 187 Скоростью v точки в момент времени t называют предел, к которому стремится средняя скорость vcp за промежуток At, когда At стремится к 0. В нашем случае, очевидно, « = lim (gt + ^-Atj = gt. Аналогично вычисляется скорость «ив общем случае прямоли- нейного движения точки. Положение точки определяется ее расстоя- нием в, отсчитываемым от некоторой начальной точки О', это рас- стояние и называется пройденным путем. Время t отсчиты- вается от некоторого начального момента, причем не обязательно, чтобы в этот момент точка находилась в О. Движение считается вполне заданным, когда известно уравнение движения: л =/(7), из которого положение точки определяется для любого момента вре- мени; в рассмотренном примере такую роль играло уравнение (1). Для определения скорости v в данный момент t пришлось бы, как и выше, придать t приращение Ак, этому отвечает увеличение пути s на As. Отношение At выразит среднюю скорость «ср за промежуток At. Истинная же скорость v в момент t получится отсюда предельным переходом: v = lim v.„ = lim -r . Мы рассмотрим ниже другую важную задачу, приводящую к по- добной же предельной операции. 91. Задача о проведении касательной к кривой. Пусть дана кривая (К) (рис. 37) и на ней точка М; обратимся к установлению самого понятия касательной к кривой в ее точке М. (д// В школьном курсе к а с а- / тельную к окружности /I/ определяют как «прямую, имею- щую с кривой лишь одну общую точку». Но это определение имеет — частный характер, не вскрывая существа дела. Если попытаться Рис- 37- применить его, например, к пара- боле у = «х2 (рис. 38а), то в начале координат О обе координатные оси подошли бы под это определение; между тем, - как, вероятно, непосредственно ясно и читателю, - на деле лишь ось х служит касательной к параболе в точке О! Мы дадим сейчас общее определение касательной. Возьмем на кривой (К) (рис. 37), кроме точки М, еще точку Му и проведем
188 ГЛ. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [91 секущую ММ,. Когда точка Му будет перемещаться вдоль по кривой, эта секущая будет вращаться вокруг точки М. Касательной к кривой {К) в точке М называется предель- ное положение МТ секущей ММу, когда точка Му вдоль по кривой стремится к совпадению с М. (Смысл этого определения со- стоит в том, что угол <4 МуМТ становится сколь угодно малым, лишь только достаточно мала хорда ММу). Применим для примера это определение к параболе у = ах2, в любой ее точке М(х, у). Так как касательная проходит через эту точку, то для уточнения ее положения достаточно знать еще ее угловой ко- эффициент. Мы и поставим себе задачей найти угловой коэффициент tga касательной к точке М. Придав абсциссе х приращение Zlx, от точки М кривой перейдем к точке Му с абсциссой х + Дх и ординатой у + Zly = а(х + Zlx)2 (рис. 38, а). Угловой коэффициент tgгр секущей ММу определится из прямоугольного д MNMy. В нем катет MN равен приращению абсциссы Zlx, а катет NMy, очевидно, есть соответствующее прира- щение ординаты Лу = а(2х • Zlx + Zlx2), так что tg = 2ах + а • Zlx. Для получения углового коэффициента касательной, как легко по- нять, нужно перейти здесь к пределу при Дх-*0. Мы приходим таким образом к результату: tg a = lim (2ах + а • Zlx) = 2ах. Их-0
92] § 1. ПРОИЗВОДНАЯ И ЕЕ ВЫЧИСЛЕНИЕ 189 [Заметим попутно, что отсюда вытекает удобный прием для фак- тического построения касательной к параболе. Именно, из аМРТ (рис. 38, б), отрезок тр у =ахг =* tga 2ах 2 ’ так что Т есть середина отрезка ОР. Итак, для того чтобы получить касательную к параболе в ее точке М, достаточно разде- лить пополам отрезок ОР и середину его соединить с точкой М.] В случае любой кривой, с уравнением У = Л.х), угловой коэффициент касательной устанавливается подобным же об- разом. Приращению Ах абсциссы отвечает приращение Лу ординаты, и отношение Лу zlx выражает угловой коэффициент секущей, tg гр. Угловой же коэф- фициент касательной получается отсюда путём перехода к пределу при Zbc-*O: tga= limtgq9= lim . zlx-0 Jx-0ax 92. Определение производной. Сопоставляя операции, которые мы осуществляли при решении рассмотренных выше фундаменталь- ных задач, легко усмотреть, что в обоих случаях - если отвлечься от различия в истолковании переменных - по существу делалось одно и то же: приращение функции делилось на приращение незави- симой переменной и затем вычислялся предел их отношения. Таким путем мы и приходим к основному понятию дифференциального исчи- сления - к понятию производной. Пусть функция у=/(х) определена в промежутке X. Исходя из некоторого значения х = х0 независимой переменной, придадим ему приращение не выводящее его из промежутка %, так что и новое значение + принадлежит этому промежутку. Тогда зна- чение y=f (х0) функции заменится новым значением у + zly =/(*о + Ах), т. е. получит приращение = J/(x0) = f(x0 + Ax) - f(x0). Предел отношения приращения функции Лу к вызвавшему его при- ращению независимой переменной Ах, при стремлении Ах к 0, т. е. lim £ = Av-o Лх /1х_о /!х
170 ГЛ. II. ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ 181 II- е доказательство. Рассмотрим все те точки х = х про- межутка [а, Ь\, для которых /(х)<0. К их числу, например, отно- сятся точка а и (в силу леммы) близлежащие к ней точки. Множе- ство {х} ограничено сверху числом Ь. Положим теперь c=sup {х} [11]; мы утверждаем, что /(с) = 0. Действительно, допустим противное; тогда либо /(с)<0, либо /(с)>0. Если бы было /(с)<0 (тогда заведомо с^Ь, ибо нам дано, что /(/>)>0), то - по лемме - и правее с нашлись бы значения х, для которых f(x) -< 0, а это противоречило бы определению с, как верхней границы для {х}. Если же было бы /(с) >0, то - снова на основании леммы - имели бы /(х)>0 и вблизи с слева, имен- но - в некотором достаточно малом промежутке (с - 8, с], а тогда там вовсе не было бы значений х, что также невозможно, ибо с, по определению, есть точная верхняя граница для {х}. Теорема доказана. Заметим, что требование непрерывности функции /(х) в замкнутом промежутке [a, Z>] существенно: функция, имеющая раз- рыв хоть в одной точке, может перейти от отрицательного значения к положительному и не обращаясь в 0. Так будет, например, с функцией /(x) = £(x)-i, которая нигде не принимает значения 0, хотя /(0) = = а /(1)=^ (скачок при х = 1). 81. Применение к решению уравнений. Доказанная теорема имеет применение при решении уравнений. Прежде всего, с ее помощью устанавливается существова- ние корней. Например, для всех очевиден корень х = 4 уравнения 2х = 4х, но труднее заметить существование еще одного корня. А между тем, функция 1 f(x) = 2x-4x при х = 0 принимает значение /(0)=1>0, а при х =----значение (1 ] 2 / — = У2-2<О, следовательно (так как она непрерывна), обращается в 0 в (2/ 1 некоторой точке между 0 и - . Другой пример: рассмотрим, вообще, алгебраическое уравнение нечетной степени (с вещественными коэффициентами) /(х) = а0х2Л + 1+а1х2л + ...+а2пХ+а2л+1 = 0. При достаточно больших по абсолютной величине значениях х многочлен имеет знак старшего члена, т. е. при положительном х - знак а0, а при отрицательном х — обратный знак. Так как многочлен есть непрерывная функция, то, меняя знак, он в промежуточной точке необходимо обращается в 0. Отсюда: всякое алгебраи- ческое уравнение нечетной степени (с вещественными коэффициентами) имеет по крайней мере один вещественный корень. Теоремой Коши можно пользоваться не только для установления суще- ствования корня, но и для приближенного его вычисления. Поясним это при- мером. Пусть f(x) = х1-х-1. Так как /(1)= - 1,/(2)= 13, то многочлен имеет
92] § 1. ПРОИЗВОДНАЯ И ЕЕ ВЫЧИСЛЕНИЕ 191 Именно, если приращению времени Zk отвечает приращение ско- рости Av, то отношение _ Av °ср--17 выразит среднее ускорение за промежуток времени At, а пре- дел его даст ускорение движения в данный момент времени: lim аср = lim - . Таким образом, ускорение есть производная от скорости по времени. Обратимся к учению о теплоте - и с помощью производной уста- новим понятие теплоемкости тела при данной темпе- ратуре. Обозначим 'входящие в вопрос физические величины следующим образом: 0 - температура (в градусах С), W - количество тепла, которое нужно сообщить телу, при нагревании его от 0° до 6° (в кало- риях). Ясно, что Wесть функция от в: Придадим6 некоторое приращение А6, тогда W также получит приращение AW. Сред- няя теплоемкость при нагревании от 6° до (6 + А0)° будет AW с^- ~ Ав ' Но так как, вообще говоря, при изменении А6 эта средняя теплоем- кость меняется, мы не можем принять ее за теплоемкость при данной температуре 0. Для получения последней нужно перейти к пределу: г г AW с lim сср = lim . ив-о " ао-о Итак, можно сказать, что теплоемкость тела есть производная от количества тепла по температуре. Наконец, возьмем пример из учения об электричестве: установим понятие о силе переменного тока в данный момент. Обозначим через t время (в секундах), отсчитываемое от некото- рого начального момента, а через Q — количество электричества (в кулонах), протекавшего за это время через поперечное сечение цепи. Очевидно, что Q есть функция от t: Q=-f(t). Повторив преды- дущие рассуждения, получим, что средняя сила тока за промежуток времени At будет г 7ср- At ’
192 ГЛ. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [92 а сила тока в данный момент выразится пределом 1= lim Zcp.= lim^| , т. e. сила тока есть производная от количества протекшего электри- чества по времени. Все эти применения производной (число которых легко было бы увеличить) с достаточной яркостью обнаруживают тот факт, что понятие производной существенным образом связано с основными понятиями из различных областей знания. Вычисление производных, изучение и использование их свойств и составляет главный предмет дифференциального исчисления. Для обозначения производной употребляют различные символы: J или *) Лейбниц (G. W. Leibniz); у' или /'(хо) Лагранж (J. L. Lagrange); Dy или D/(х0) Коши (A. L. Cauchy). Мы будем пользоваться преимущественно простыми обозначения- ми Лагранжа. Если применяют функциональное обозначение (см. второй столбец), то буква х0 в скобках указывает то именно значение независимой переменной, при котором берется производная. Наконец, заметим, что в случаях, когда может возникнуть сомнение относи- тельно переменной, по которой взята производная (по сравнению с которой устанавливается «скорость изменения функции»), эта пере- менная указывается в виде значка внизу: Ух, Л(*о)> °хУ, ЛсЖ), причем значок х не связан с тем частным значением х0 независимой переменной, при котором берется производная. [В некотором смысле, можно сказать, что цельные символы или D? или Dx^ играют роль функциональных обозначений для произ- водной функции.] Запишем теперь, пользуясь введенными для обозначения произ- водных символами, некоторые из полученных выше результатов. Для скорости движения имеем: ds , v = -r- или v = s,, dt а для ускорения dv , а^--. или а = V.. /7/ ‘ *) Пока мы рассматриваем обозначения Лейбница как цельные символы; ниже [104] мы увидим, что их можно рассматривать и как дроби.
93] § 1. ПРОИЗВОДНАЯ И ЕЕ ВЫЧИСЛЕНИЕ 193 Аналогично, угловой коэффициент касательной к кривой ^=/(х) напишется так: dy , г ИЛИ tga=yx, и т. п. 93. Примеры вычисления производных. В качестве примеров вы- числим производные для ряда элементарных функций: 1° Отметим, прежде всего, очевидные результаты: если у = с = = const., то Ду = О, каково бы ни было Ах, так что/= 0; если же у=х, то Ау = Ах и у' = 1. 2° Пусть теперь у = хп, где п - натуральное число. Придадим х приращение Ах *); тогда новое значение у будет у + Ау = (х + Ах)п = хп г нхп~1 • Ах + х—2 • zlx2 + ..., гак что Ау = пл—1 • Ах + х—2 • Ах2 +..., И = ПХ"-1 I- Х"~2 • Ах-1- ... /lx 1-2 Так как при zlx-О все слагаемые, кроме первого, стремятся к нулю, то y = lim# = nx—1. 3° Если у = -, z х . 1 то у + Ау = т“, так что л z x+zlx . _ 1 1 _ — zlx у x+zlx х х(х + Лх) И /1у _ _1 /1.x х(х -| Их) ’ Отсюда , .. /1у 1 у = 111И = - — . 4x^0 х2 При этом предполагается, конечно, х#0. *) Если производная вычисляется при любом значении аргумента, то обыкновенно его обозначают той же буквой, что и аргумент, без каких-либо значков при нем. 13 Г. М. Фихтенгольц, т. I
194 ГЛ. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [93 4° Рассмотрим функцию у=Ух (при х>0). Имеем: у + Лу = Ух + Zlx, Zly=Ух + Zlx - Ух = ,—-Х—-, Лу _ 1 Лх ]/x+zlx+ Ух ’ наконец, пользуясь непрерывностью корня, получим , Лу 1 у =lim Дх-оЛх 2-fc Все эти результаты содержатся как частные случаи в следующем. 5° Степенная функция: у=хд (где р - любое вещественное число). Область изменения х зависит от р; она была указана в 48, 2°. Имеем (при х # 0) ( Лх'\1‘ 1+--- -1 Лу _(х + Лх)1‘ Х1' 1 х } Лх Лх Лх х Если воспользоваться пределом, вычисленным в 77 [5) (в)], то получим y = lim^-=jux'*-1*). ах В частности если у = ^ = х~г, то у’ = (- 1) -х-2 = , 1 1 ,/— 2 ,12 1 если и = Ух=х , то у =^х =— 2 гух 6° Показательная функция: у = ах (п>0, -оо<х< < + оо). Здесь Лу _ах+4с-а* _ а^х-1 Лх~ Лх ~ Лх ' Воспользовавшись пределом, вычисленным в 77 [5) (б)], найдем: y'=lim ~-ах-1п а. У Дх-о Лх В частности, если у=ех, то и у' = ех. Итак, скорость возрастания показательной функции (при а>1) пропорциональна значению самой функции: чем большего значения *) Если р^1, то при х = 0 легко непосредственно получить значение произ- водной: у' = 0.
93] § 1. ПРОИЗВОДНАЯ И ЕЕ ВЫЧИСЛЕНИЕ 195 функция уже достигла, тем быстрее в этот момент она растет. Это дает точную характеристику роста показательной функции, о кото- ром мы имели уже случай говорить [ср. 65]. 7° Логарифмическая функция: y-logax (0<а#1, 0<х< +оо). В этом случае ( ^х\ logo 1 и- Ду _ loga (х+Дх)~logo* _ 1 ( х ) Дх Дх х Дх Воспользуемся пределом, вычисленным в 77 [5) (а)]: / = Ит4г=10&£ 4х-*0 Лх X В частности, для натурального логарифма получается исключительно простой результат: при у = In х имеем у = -. Это дает (хотя, по существу, и не новое) основание для предпочтения, которое оказывается натуральным логарифмам при теоретических исследованиях. То обстоятельство, что скорость возрастания логарифмической функции (при а>1) обратно пропорциональна значению аргумента и, оставаясь положительной, стремится к нулю при безграничном возрастании аргумента, хорошо согласуется со сказанным по этому поводу раньше [65]. 8° Тригонометрические функции. Пусть у = sin х, тогда Дх sin — Ду sin (х+ z1x)-sin х 2 [ Дх\ —----Т-2---=—л----COS X + . Дх Дх Дх 12 1 Т Пользуясь непрерывностью функции cos х и известным [54, (8)] пре- .. sin а л делом lim---= 1, получим «-о а v' = lim 4^ = cosx*). *) Отметим, что эта формула обязана своей простотой тому, что угол измеря- ется в радианах. Если бы мы стали измерять х, например, в градусах, предел я отношения синуса к углу был бы равен не единице, а, как легко видеть,-, и тогда мы имели бы 180 (sin xY =----cos х. 180 13*
196 ГЛ. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ 194 Аналогично найдем: если у = cos х, то у' = - sin х. В случае y = tgx имеем sin (х+Ах) sinx zly _tg (x + zlx)-tgx_ cos (x+zlx) cosx_ zlx zlx Ax _sin (x + zlx) • cos x— cos (x+zlx) • sin x_ zlx • cos X • cos (x+zlx) _sinzlx 1 zlx cos X • cos (x+zlx) ’ Отсюда, как и выше, , , Ay 1 9 у =lim -7-=—= sec2.v. cos х Аналогично, , , 1 если у = ctg х, то у = - = - esc- х. S J 81П2 X 94. Производная обратной функции. Прежде чем заняться вычисле- нием производных от обратных тригонометрических функций, дока- жем следующую общую теорему. Теорема. Пусть 1) функция f(x) удовлетворяет условиям теоремы п° 83 о существовании обратной функции, 2) в точке х0 имеет конеч- ную и отличную от нуля производную /'(х0). Тогда для обратной функции g(y) в соответствующей точке y0=f(x^ также , 1 существует производная, равная Доказательство. Придадим значению у=у0 произвольное приращение Ду, тогда соответственное приращение zlx получит и функция x = g(y). Заметим, что при Дг + О, ввиду однозначности самой функции y=f(x), и /х + 0. Имеем Ах _ 1 Ау~ Ау' Ах Если теперь zlj’-О по любому закону, то - в силу непрерывности функции x = g(y) - и приращение Zlx —0. Но тогда знаменатель пра- вой части написанного равенства стремится к пределу /(х0) # 0, следо- вательно, существует предел для левой части, равный обратной вели- 1 - ,, л чине ; он и представляет собой производную g (у0). J \хъ) Итак, имеем простую формулу: , 1 xv = — У Ух
94] § 1. ПРОИЗВОДНАЯ И ЕЕ ВЫЧИСЛЕНИЕ 197 Легко выяснить ее геометрический смысл. Мы знаем, что производная у' есть тангенс угла а, образованного касательной к графику функции y=f(x) с осью х. Но обратная функция x=g(y) имеет тот же график, лишь независимая переменная для нее откла- дывается по оси у. Поэтому производная ху равна тангенсу угла Д составленного той же ка- сательной с осью у (рис. 39). Таким образом, выведенная формула сводится к известно- му соотношению tg р=—- , tga связывающему тангенсы двух углов а и /3, сумма которых равна . Положим для примера у = -^ах. Обратной для нее функ- цией будет x = logaj. Так как (см. 6°) ух = ах -In а, то, по нашей фор- муле, 1 _ 1 logaе ух ах In а у ’ в согласии с 7°. Переходя теперь к вычислению производных от обратных триго- нометрических функций, мы для удобства обменяем ролями перемен- ные х и у, переписав доказанную формулу в виде , 1 Ух^-ХГ Лу 9° Обратные тригонометрические функции. Рас- смотрим функцию у = arcsin х (- 1 -~х-; 1), причем Она является обратной для функции x = sinj>, имеющей для указанных значений у положительную производную х'у = cos у. В таком случае существует также производная у'х и равна, по нашей формуле, 1 _ 1 ___1________1 . Ух ~ *’у~ cos у ~ sin2 v ~ У1-Л2 ’ корень мы берем со знаком плюс, так как cos у > 0. Мы исключили значения х= +1, ибо для соответствующих значе- ний у = производная х'у = cos у = 0. Функция у = arctgх ( - °о < х -= + <=о) служйт обратной для функции V = tg у. По нашей формуле , 1 1 1 1 У* х'у sec2 у 1 + tg2 у 1 + х2 ’
198 ГЛ. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [95 Аналогично можно получить: , 1 для у = arccos х у = ~ ~у= У1-; для y = arcctgx y'=~Y^ (-1<х<1), + «=). 95. Сводка формул для производных. Сделаем сводку всех выве- денных нами формул: bJ h-i ч Ч Ч Ч II II II II «н ч * ° 1 . In О н 3. 1 Il il и II У 2 У® 4. у = а* У = е^ у' = ax • In a y' = ex 5. y==IogQx , __ logq e У X у = 1пх , 1 у =T 6. y = sinx 7. у — cos х 8. y = tgx у' = COS X у' — — sin х , 2 1 у =sec'X — —— ' cos2® 9. y = ctgx , 9 1 у = — CSC-X = r-т— J sin2 ® 10. y = arcsinx , 1 y yi—®2 11. у = arccos x , 1 У- 12. у = arctg x 1 У i+®2 13. y = arcctgx , _ i У ~ i+®2 96. Формула для приращения функции. Докажем здесь два простых утверждения, имеющих приложения в дальнейшем. Пусть функция у = fix') определена в промежутке X. Исходя из определенного значения х = х0 из этого промежутка, обозначим через Дх$0 произвольное приращение х, подчиненное лишь тому ограни- чению, чтобы точка x0+z1x не вышла за пределы X. Тогда соответ- ствующим приращением функции будет = Л/(х0) =/(х0+Лх) -/(х0).
97] § 1. ПРОИЗВОДНАЯ И ЕЕ ВЫЧИСЛЕНИЕ 199 1° Если функция y=f(x) в точке х0 имеет (конечную) производную y'x=f'(x0), то приращение функции может быть представлено в виде Zf/(x0) ~ /(хо) • zlx + а • Zlx (2) или, короче, Jy = у'х • Дх -I а • Дх, (2a) где а еспЛ> величина, зависящая от Дх и вместе с ним стремящаяся к нулю. Так как, по самому определению производной, при zlx—О то, полагая видим, что и ос-0. Определяя отсюда Ду, придем к формуле (2а). Так как величина х-Дх (при zlx—0) будет бесконечно малой выс- шего порядка, чем zlx, то, употребляя введенное в 60 обозначение, можно наши формулы переписать в виде 4f(x0) =/'(Хо) -Zlx + о(Дх) (3) или Ду=у'-Zlx + o(Zlx). (За) Замечание. До сих пор мы считали z1x$0; величина а и не определена была при z1x=0. Когда мы говорили, что а—0 при Zlx—0, то (как обычно) предполагали, что zlx стремится к 0 по любому за- кону, но не принимая нулевого значения. Положим теперь а=0 при Дх=0; тогда, разумеется, формула (2) сохранится и при zfx = O. Кроме того, соотношение а—0 при Zlx—0 можно пони- мать и в более широком смысле, чем раньше, не исключая для Zlx возможности стремится к 0, принимая в числе прочих и нулевые зна- чения. Из доказанных формул непосредственно вытекает: 2° Если функция y=f(x) в точке х0 имеет (конечную) производную, то в этой точке функция необходимо непрерывна. Действительно, из (2а) ясно, что соотношение Zlx—0 влечет за собой zly—0. 97. Простейшие правила вычисления производных. В предыдущих пп° мы вычислили производные для элементарных функций. Здесь и в следующем п° мы установим ряд простых правил, с помощью которых станет возможным вычисление производной для любой
200 ГЛ. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [97 функции, составленной из элементарных при посредстве конечного числа арифметических действий и суперпозиций [51]. I. Пусть функция и=<р(х) имеет (в определенной точке х) производ- ную и'. Докажем, что и функция у —си (с = const.) также имеет произ- водную (в той же точке), и вычислим ее. Если независимая переменная х получит приращение Лх, то функ- ция и получит приращение /1м, перейдя от исходного значения и к значению и+Ли. Новое значение функции у будет у + Лу=с (и + Ли). Отсюда Лу = С‘Ли и lim ~- = C’lim^ = c-u'. zlx-О Ах Jx-0 Ах Итак, производная существует и равна у' = (с • и)' = с • и'. Эта формула выражает такое правило: постоянный мно- житель может быть вынесен за знак производ- ной. II. Пусть функции и=<р(х), v=tp(x) имеют (в определенной точке) производные и', v'. Докажем, что функция y = u + v также имеет произ- водную (в той же точке), и вычислим ее. Придадим х приращение Лх; тогда и, v и у получат, соответственно, приращения Ли, Ло и Лу. Их новые значения и + Л и, v + Лп и у + Лу связаны тем же соотношением: у + Лу = (г/ +Ли)±(р + Ли). Отсюда 'л л , л Ду Ди t Av Лу = Ли + Ло, J ’ Дх Дх Дх И lim -^- = lim -j-±lim ^- = u'±w' Jx-0 Ax Их-O Ax Их-O Ax так что производная у' существует и равна у' = {u±v)' = и' ±v'. Этот результат легко может быть распространен на любое число слагаемых (и притом - тем же методом). III. При тех же предположениях относительно функций и, v, дока- жем, что функция y = U'V также имеет производную, и найдем ее. Приращению Лх отвечают, как и выше, приращения Ли, Ли и Лу; при этом у + Лу = (и + Ли) (р + Ло), так что Лу = Ли • v+и • Ло+Ли • Лп и Ду Ди Av Ди л 4- к •——|- —— • ZJ V, Ах Ах Ах Ах
97] § 1. ПРОИЗВОДНАЯ И ЕЕ ВЫЧИСЛЕНИЕ 201 Так как при Лх-»0, в силу 96, 2°, и Ли—О, то Лу Ли .. zlv , , lim -т- = lim -т- • v + и • lim -7— = и -v+u-v , Jx^o Ах Jx-o Ах щ-о Ах т. е. существует производная у' и равна у' = (и • V)' = и' • V 1 и • v'. Если у = uvw, причем и', v', w' существуют, то у' = [(иг;) •?/,>]' = (uv)' • w ч- (uv) • го' = u'vw + uv'w ч uvw'. Легко сообразить, что для случая п сомножителей будем иметь аналогично: п [uvw. . .s}' = U'VW. . .S+Uv'w. . .S + UVW'. + UVW. . .s’. (4) Для того чтобы доказать это, воспользуемся методом математиче- ской индукции. Предположим, что формула (4) верна для некоторого числа п сомножителей, и установим ее справедливость для п ч-1 со- множителей: п+1 п [uvw.. .st]' = [(uvw.. .s)-t}' = (uvw.. .s)' -t + (uvw.. .s)-t'; если производную (uvw . . . s)' развернуть по формуле (4), то придем к формуле [uvw.. .st}' = u'vw.. .st + uv'w.. .st-\ ... +uvw.. .s't + uvw.. .st', совершенно аналогичной (4). Так как в верности формулы (4) при и = 2 и 3 мы убедились непосредственно, то эта формула верна при любом п. IV. Наконец, если и, v удовлетворяют прежним предположениям _с U и, кроме того, v отлично от нуля, то мы докажем, что функция У = ~ также имеет производную, и найдем ее. При тех же обозначениях, что и выше, имеем , Л и+Ли у + Лу = ——-, так что л Ли-V-и-Лю ю(ю + Лю) И Ли Лю ----V—U----- Лу _ Лх Лх Лх ю-(ю + Лю)
202 ГЛ. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [98 Устремляя здесь Дх к нулю (причем одновременно и Zb—0), убе- ждаемся в существовании производной z _u'-V— U-v' V2 98. Производная сложной функции. Теперь мы можем установить весьма важное при практическом нахождении производных правило, позволяющее вычислить производную сложной функции, если из- вестны производные составляющих функций. V. Пусть 1) функция и=<р(х) имеет в некоторой точке х0 произ- водную их=<р'(х0), 2) функция y=f(u) имеет в соответствующей точке и0=<р(Х() производную y'u=f(ufy Тогда сложная функция у =f((p(x)) в упомянутой точке х0 также будет иметь производную, равную про- изведению производных функций f(u) и (р(х): L/faW)]' ^и(?>(*о))У(*о) *)> или, короче, Ух=Уи-их. Для доказательства придадим х0 произвольное приращение zlx; пусть Ди - соответствующее приращение функции п=ф(х) и, нако- нец, Ду - приращение функции y=f(u), вызванное приращением Ди. Воспользуемся соотношением (2а), которое, заменяя х на и, перепи- шем в виде zly = y'-zlM + a-z1w (а зависит от Ди и вместе с ним стремится к нулю). Разделив его по- членно на Zlx, получим Если Zlx устремить к нулю, то будет стремиться к нулю и Ди [96, 2°], а тогда, как мы знаем, будет также стремиться к нулю завися- щая от Ди величина а. Следовательно, существует предел lim -j-=y„-hm -j-=yu-«x, Лх-0 Jx-0 который и представляет собою искомую производную ух. Замечание. Здесь сказывается полезность замечания в 96 от- носительно величины а при Zlx=0: покуда Zlx есть приращение не- зависимой переменной, мы могли предполагать его отлич- ным от нуля, но когда Zlx заменено приращением функции и= =ф(х), то даже при Zlx#0 мы уже не вправе считать, что Ди^О. *) Подчеркнем, что символ /ц(?> (хо)) означает производную функции /(и) по ее аргументу и (а не по х), при значении ц,=у(х0) этого аргумента.
99] § 1. ПРОИЗВОДНАЯ И ЕЕ ВЫЧИСЛЕНИЕ 203 99. Примеры*). Сначала приведем несколько примеров приложения правил I-IV. 1) Рассмотрим многочлен: у = «oxn4-«ixn-14- •.. +аП-гхг+аП-1Х+ап. По правилу II, а затем I, будем иметь У = (аохпУ+(а1хп~1У + ... +(ап_2х2У + («ri-jx)' + (o/i)' = = a0(xri)'+a1(xri-1)'+ • • .+ап-г(х2У + an~t(xy + (апУ. Использовав же формулы 1, 2, 3 [95], окончательно получим у' = zuzoxri~1+(n- l)a1xri~24-+2an_2x+a,1_1. 2) у = (2х2 - 5x4-1) ех. По правилу III У = (2х2 - 5x4-1)' • ех+(2х2 - 5x4-1) • (ех)'. Опираясь на предыдущий пример и формулу 4 [95], найдем: у = (4х - 5) • ех+(2х2 - 5x4-1) • ех = (2х2 - х - 4) ех. ах+Ь 3) v ----. По правилу IV, х24-1 (ах4-6)'(х24-1)-(ах4-/>)(х24-1)' а(х24-1)-(ах4-й)-2х -ах2~2Ьх+а У = (х2+Ху2 (х24-1)2 (х24-1)2 4) Вычислим снова производную функции y=tgx, исходя из формулы у = sin х =-----. Пользуясь правилом IV (и формулами 6, 7, 95) получим cos х (sin х)' cos x-sin х • (cos х)' cos2x4-sin2x 1 у' --------------------------------------------- COS2 X COS2 X COS2 X (ср. 8, 95). X sin x 4“ COS X 5) у =-----------. Здесь приходится пользоваться сначала правилом IV, а х cos x-sin х затем правилами II и III (и формулами б, 7, 95): (х sin х 4- cos х)'(х cos х - sin х) - (х sin х 4- cos х)(х cos х - sin х)' У (xcosx-sinx)2 х cos х-(х cos x-sin x)- (xsin x-f-cosx)- (-xsin x) x2 (xcosx-sinx)2 (xcosx-sinx)2 Вычисление производных числителя и знаменателя мы произвели, не рас- членяя его на отдельные шаги. Путем упражнения необходимо добиться того, чтобы вообще писать производные сразу. Примеры на вычисление производных сложных функций: 6) Пусть у = In sin х, иначе говоря, у = in и, где и = sin х. По правилу V, у’х=Уи-и'х. Производная уц = (1пи)^=— (формула 5) должна и быть взята при «=sinx. Таким образом, 1 COS X ух——--(smx)' =---------= ctgx (формула 6). sin х sm х *) Буквами х, у, и, v ниже обозначены переменные, а другими буквами - постоянные величины.
204 ГЛ. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [99 7)у=У14-х2, т. с. у=^и, где и=1+х2; по правилу V, 1 X ух = —• (1 + х2)' = ------- (формула 3; пример 1). 2yi+x2 yi+x2 8) у = е*!, т. е. у = еи, где и = х2; у' = ех’. (х2)' = 2х-е*г (V; 4 и 3). Конечно, в отдельном выписывании составляющих функций на деле нет надобности. 9) у = sin ах; y'x = cos ах (ах)'= а cosax (V; 7, 1, 2). Ю) у = (х24-лЧ-1)"; у'х = п(х2+х+1)п~1-(х2+х+1)' = = n (2x+l)(x2 + x+l)n-1 (V; 3, пример 1). 11) y = 2sinx; yj = 2sin х In 2 • (sin x)' = In 2 • cos x • 2sin * (V; 4, 6) 1 12) у = arctg - -; x (x) Случай сложной функции, полученной в результате нескольких суперпози- ций, исчерпывается последовательным применением правила V: 13) у= 1/ tg—х; тогда Ух= J/ 1 ( 1 V tg-x = (V; 3) 1 1 2 )х 1 2 1 = • sec2 2|/Ц» 1 see2 — X 2 4^tg|x . 1 SI и2 - 14) y = e x; в этом случае sina - / iv y'x = e x • I sin2 — 22 I x)x sin® — Jr = <? x-2sin —• s x I sin2 i 1 = e x-2sin—-co X 1 2 sin’: sin—• e X2 X 1 (1 V -x. -x = (V; 8) Jx (V; 4) ini] = (V; 3) X)x si fi] = (V; 6) x \x)x ‘ (V; 3)
99] § 1. ПРОИЗВОДНАЯ И ЕЕ ВЫЧИСЛЕНИЕ 205 Дадим еще несколько примеров на применение всех правил: е*-е~* j ех+е~х 15) + = shx =— ----; +' = — [(e*)J-(e~x)£] = ----= chx. Наоборот, если + = ch х, то +' = shx. Наконец, как и в 4), легко получить: sh х + = thx=——, ch х если то 1 ch2x ’ если же у = cth х, то 1 sh2 х 16) + = 1п (х+]/х2+1); 1 Хх =------- •(х+Ух2+1)' = 1 1 Тот же результат можно получить и из других соображений. Мы видели в 49, 4), что функция у = In (х+ ]/х2+1) является обратной для функции х = sh у; поэтому [94; пример 15; 48, 6е] 1 17) У = - 111 1 +х = — =-= — =- ху chi' }'sh2++l Ух2 1 У'^ 18) y = iarctgj^f-l^x^l); (]/х2+а2)2 1 (х2 + а2)3/г 1 1 -•2- 2 1 •(!-х2)-х-(-2х) 1 (1-х2)2 1 Vax+b- Vb-ac 19) + = —In У —-1—:= yb-ac Уax+b+yb-ас (мь| предполагаем: />-ас=*0); а 2 Уах + Ь а 2 }[ах + Ь .У<?х + />- Уб - ас У«х+/>+ Ijb-ac ах+Ь ас-Ь 1 / = ----- ^b-ac 2 20) + = -—= а У! ас-Ь (здесь предположено: ас - Ь =- 0); 1 ах+Ь 1Н----— ас-Ь 2 У'= , У ас-Ь 1 а 1 (х+с) \+ix + b 1 ]'ас-Ь 2 ]'ax + b (х+с) Уах+Ь
206 ГЛ. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [99 1 a sm x+b ( л л) 21) у —-— arcsin---- |о| »-«; —<х<-|; e+(>sinx( 2 2) 1 1 «cosx-(e+6sinx)-(asinx+(>)-(>cosx 1 (a+6sin х)2 a+6sinx 1 t+asin x- V/>2-«2-cosx In-----------------------(|«| -= |6|); a+ism x 22) y=-= У*2^2 1 y'=——. ^b2-a2 [6+asinx a cos x+ Уй2-«2 sin x 6 COS X - ifi^a2 cos X «+* sin X 1 a+b sin x 23) В виде упражнения, исследуем еще вопрос о производной степенно- показательного выражения у=и» (ii»0), где и и «суть функции от х, имею- щие в данной точке производные и', Прологарифмировав равенство у = и®, получим In у = «-1п и. (5) Таким образом, выражение для у можно переписать в виде y = e»inu, откуда уже ясно, что производная у' существует. Самое же вычисление ее проще осуществить, приравнивая производные по х от обеих частей равенства (5). При этом мы исполь- зуем правила V и III (помня о том, что и, v и у суть функции от х). Мы получим 1 1 — y' = «'-ln u + v--и', У U откуда , (vu' ,i 1 у = у------н V in и , \ и ) или, подставляя вместо у его выражение, , (vu ,, 1 у - и»-------1-« In и . I и / (6) Эта формула впервые была установлена Лейбницем и И. Бернулли (Johann Bernoulli). Например, (sin х ) если y = xsinx, то yj = xsln*-------|-cosx-lnx . ( х J 24) Предполагая, что функция /(х) имеет производную /'(х), написать выраже- ния производных для функций (a) sin/(x), (б) еЖ>, (в) 1п/(х) по х, и для функций (г) /(sin I), (д) (e)/(lnr) по t. Ответ-, (a) cos/(x)-/'(x); (б) e/(*)-/'(x); (в) —— ; /W (r) /'(sin r)-cos t; (д) (e) /'(lnr)-y.
99] § 1. ПРОИЗВОДНАЯ И ЕЕ ВЫЧИСЛЕНИЕ 207 у = 1п |х| при По поводу последних трех примеров (г), (д), (е) обращаем внимание читателя на то, что символ /'(•) означает производную по аргументу х, от кото- рого зависит функция Дх), но при значении этого аргумента, соответственно, х = sin t, еl, In t, уже зависящем от t. Ср. сноску на стр. 202. 25) Функция Дх), определенная в симме- тричном относительно 0 промежутке, назы- вается четной, если Д-х)=Дх), и нечетной, если Д-х) = -Дх). [Примерами четных функций могут служить четные степени х2, х4, ..., а также cosx, chx; примеры нечетных функций: нечетные степени х, х3, ..., sinх, shх]. Доказать, что производная четной функ- ции (если существует) сама является нечет- ной функцией, а производная нечетной функции сама будет четной. 26) Вычислить производную для функции При х=»0, очевидно, у' = —; покажем, что та же формула сохраняется х х-=0. Действительно, вычисляя производную для функции у = 1п |х| == In( —х), как сложной функции, будем иметь и при и в этом случае. 27) Рассмотрим кривую у = ахт (ти>0). Угловой коэффициент касательной к ней в некоторой ее точке (х, у) будет [91 - 92]: tga = У = wax'”-1. По рис. 40 видно, что отрезок ТР (так называемая подкасательная) равен tga max'71-1 т ’ Это обстоятельство делает легким самое построение касательной. [Обобщение результата п° 91.] 28) Для кривой (цепная линия) y=«-ch— (a>0), а подобным же образом, х tga = y' = sh—. а На этот раз определим (считая х=-0) 1 cos a = —— yi + tg2a 1 1 а I х х У / 1+sh2— ch — I a a
208 ГЛ. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [99 так что у • cos а = а. Если из основания D ординаты y=DM (рис. 41) опустить перпендикуляр DS на касательную МТ, то отрезок DS окажется равным а. От- сюда снова вытекает простой способ построения касательной к рассматриваемой кривой: на ординате DM, как на диаметре, строят полуокружность и из точки D делают засечку S радиусом а: прямая MS и будет касательной. 29) Пусть материальная точка колеблется по оси около некоторого среднего положения по закону 5 = A-sin (oj?+a) (Л, <u=-0). Такое колебание носит название гармонического', А - его амплитуда, со - частота, a - начальная фаза. Взяв производную от пути s по времени Z, найдем скорость движения: v = Асо • cos (cot+a). Наибольшей величины ±Асо скорость дости- гает в моменты, когда 5 = 0, т. е. точка проходит через среднее положение. Наоборот, когда точка находится в наибольшем удалении от этого среднего по- ложения (5= ±А), скорость у =0. Производная от v по Г. а = -y4<u2-sin (<uZ+a) даст нам ускорение, с которым движется точка; очевидно, а = - со2 s. Отсюда, если ввести массу т движущейся точки, то, по закону Ньютона, сила F, под действием которой происходит гармоническое колебание, выразится так: F- -mafi-s. Как видим, она всегда направлена к среднему положению (ибо имеет знак, обрат- ный знаку s) и пропорциональна удалению точки от него. 30) Движение, происходящее по закону s = Ae~kt sin cot (A, k, со>0), называется затухающим колебанием, ибо наличие множителя е~w заставляет точку, хоть и колеблясь около среднего положения, все же стремиться к совпа- дению с ним: lim .г=0. t 4-00 В этом случае V- s't -Ae~kl(co-cos cot- Л-sin cot) и a- v't= -Ae~,cl(co2’Sin cot+2<ok-cos cot-k2-sin cot). Вводя в скобках еще члены ±£2-sin cot, после очевидных преобразований получим а= -Ae~kt((oF+k2)s\acotA-2k(co-coscot-k-satcot)} = -(aF+k2)-s-2k-v. Сила, под действием которой происходит подобное движение, равна F= -(co2+k2)m-s-2km-v. Мы видим, что она слагается из двух сил: 1) из силы, пропорциональной рас- стоянию точки от среднего положения и направленной к этому среднему поло-
1011 § 1. ПРОИЗВОДНАЯ И ЕЕ ВЫЧИСЛЕНИЕ 209 жению (как и в случае гармонического колебания), и 2) из тормозящей дви- жение силы, пропорциональной скорости и направленной обратно скорости. 100. Односторонние производные. Обратимся, в заключение, к обзору ряда особых случаев, которые могут представиться в отношении производных. Начнем с установления понятия об одно- сторонних производных. Если рассматриваемое значение х яв- ляется одним из концов того промежутка X, в котором определена функция у =/(х), то при вычислении предела отношения приходится ограничиться приближением zlx к нулю лишь справа (когда речь идет о левом конце промежутка) или слева (для правого конца). В этом случае говорят об о д- носторонней производной, справа или слева. В соответствую- щих точках график функции имеет одностороннюю касатель- ную. Может случиться, что и для внутренней точки х существуют лишь односторонние пределы отношения (при Ах — + 0 или Ах — - 0), не равные между собой; их также называют односторонними производными. Для гра- фика функции в соответствующей точке будут существовать лишь о д- носторонние касательные, составляющие угол; точка будет у г- л о в о й (рис. 42). В качестве примера рассмотрим функцию у=Дх) = |х|. Исходя из значения х = 0, будем иметь Ду =/(0+Дх) - ДО) =/(Дх) = | Дх |. Если /1x^0, то zly Ду = Дх, lim—=1. zlx-О Дх Если же Дх-=0, то Лу Ду=-Дх, Пт—-=-1. Дх-О Дх Начало координат является угловой точкой для графика этой функции, состоя- щей из биссектрис первого и второго координатных углов. 101. Бесконечные производные. Если отношение приращений — при /1х->0 стремится к +<*> (-°°), то это несобственное число также называют производной (и обозначают как обычно). Аналогично уста- навливается понятие об односторонней бесконечной произ- водной. Геометрическое истолкование производной как углового 14 Г. М. Фихтенгольц, т. I
210 гл. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [101 коэффициента касательной распространяется и на этот случай; но здесь - касательная оказывается параллельной оси у (рис. 43, а, б, в, г). В случаях (а) и (б) эта производная равна, соответственно, +°° и -оо (обе односторонние производные совпадают по знаку); в слу- чаях же (в) и (г) односторонние производные разнятся знаками. Пусть, например, /1(х) = х3; при х^О формула 3, 95 дает 1 -г 1 /{(х) = -х 3= — 3 ± Зх3 но она неприложима при х = 0. В этой точке вычислим производную, исходя не- посредственно из ее определения; составив отношение ACO+Jxj-ACO) = (zlx)3 = 1 zlx zlx ’ zlx3 видим, что его пределом при zlx-О будет +». Аналогично убеждаемся, что для 2 функции /2(х) = х3 при х--0 производная слева равна - а справа + Пользуясь расширением понятия производной, можно дополнить теорему п° 94 о производной обратной функции указанием, что и в тех случаях, когда /'(х0) равна 0 или ± <», производная обратной функ- ции g'(j'o) существует и равна, соответственно ±°° или 0. Например, так как функция sinx при х= имеет производную cos (±^j = 0, то для обратной функции arcsin у при у = ± 1 существует бесконечная производная (именно, +°°).
103] § 2. ДИФФЕРЕНЦИАЛ 211 102. Дальнейшие примеры особых случаев. 1° Примеры несуществования произ- водной. Уже функция |х| в точке х = 0 [см. 100] не имеет обычной, двусто- ронней, производной. Но интереснее пример функции /(х) =x-sin— (при х#0), /(0) = 0, х непрерывной и при х = 0 [70, 5)], но не имеющей в этой точке даже односторонних производных. Действительно, отношение /(0+z1x)-/(0) /(zlx) . 1 ------------------= sm---- Лх Лх Лх не стремится ни к какому пределу при Лх- ±0. По графику этой функции (рис. 24) легко усмотреть, что секущая ОМУ, исходя- щая из начальной точки О, не имеет предельного положения при стремлении Мх к О, так что касательной к кривой в начальной точке нет (даже односторонней). Впоследствии (во втором томе) мы познакомимся с замечательным примером функции, непрерывной при всех значениях аргумента, но ни при одном из них не имеющей производной. 2° Примеры разрывов производной. Если для данной функции у =f(x) существует конечная производная / = /'(х) в каждой точке некоторого промежутка %, то эта производная, в свою очередь, представляет собой в 2С функцию от х. В много- численных примерах, которые нам до сих пор встречались, эта функция сама оказывалась непрерывной. Однако, это может быть и не так. Рассмотрим, напри- мер, функцию /(x) = x2-sin—(при х^0), /(0) = 0. х Если х 0, то ее производная вычисляется обычными методами: 1 1 f'(x) = 2х - sin — cos —, х х но полученный результат неприложим при х=0. Обращаясь в этом случае непо- средственно к самому определению понятия производной, будем иметь г Я0-Мх)-/(0) .. л . 1 л /(0) = lim -----------= lim zlx-sin-—-=0. zlx^O Zlx Пх-0 Лх Вместе с тем ясно, что /(х) при х-0 не стремится ни к какому пределу, так что при х = 0 функция f'(x) имеет разрыв. То же справедливо и для любой функции 1 /(x) = xx-sin — (при х^0), /(0) = 0, х если только 2=-а=-1. В этих примерах разрывы производной оказываются второго рода. Это — не случайность: ниже [113] мы увидим, что разрывов первого рода, т. е. скачков, производная иметь не может. § 2. Дифференциал 103. Определение дифференциала. Пусть имеем функцию y=f(x), определенную в некотором промежутке X и непрерывную в рассмат- риваемой точке х0. Тогда приращению Лх аргумента отвечает при- ращение Jy = ДДхо) =/(х0 + Лх) -Ях0),
212 ГЛ. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [103 бесконечно малое вместе с zfx. Большую важность имеет вопрос: существует ли для Ау такая линейная относительно Ах бесконечно малая А-Ах (Л = const), что их разность оказывается, по сравнению с Ах, бесконечно малой высшего порядка: Ау=А-Ах+о(Ах). (1) При Л#0 наличие равенства (1) показывает, что бесконечно малая А-Ах эквивалентна бесконечно малой Ау и, значит, служит для по- следней ее главной частью, если за основную бесконечно ма- лую взята Ах [62, 63]. Если равенство (1) выполняется, то функция y=f(x) называется дифференцируемой (при данном значении х = х0), само же вы- ражение А - Ах называется дифференциалом функции и обо- значается символом dy или #(х0). [В последнем случае, в скобках указывается исходное значение х *)•] Еще раз повторяем, что дифференциал функции характеризуется двумя свойствами: (а) он представляет линейную (однородную) функ- цию от приращения Ах аргумента и (б) разнится от приращения функ- ции на величину, которая при dx->0 является бесконечно малой по- рядка высшего, чем Ах. Рассмотрим примеры. 1) Площадь Q круга радиуса г задается формулой б=лг2. Если радиус г увеличить на Аг, то соответствующее приращение AQ вели- чины Q будет площадью кругового кольца, содержащегося между концентрическими окружностями радиусов г и г + Аг. Из выражения d(7 = л(г + Аг)2-лг2 = 2лг • Аг +л(Аг)2 сразу усматриваем, что главной частью AQ при Аг—0 будет 2лг-Аг; это и есть дифференциал, dQ. Геометрически он выражает площадь прямоугольника (полученного как бы «выпрямлением» кольца) с осно- ванием, равным длине окружности 2лт, и высотой Аг. 4 2) Аналогично, для объема У=^лг3 шара радиуса г, при увели- чении радиуса на Аг, получается приращение А К= ~л(г + Аг)3 - ~ лг3 = 4лг2 • Аг + 4лг • (Аг)2 + ^л(Аг )3, главной частью которого при Аг—0, очевидно, будет dV=4лr2^Ar. Это - объем плоского слоя с основанием, равным поверхности шара 4л г2, и с высотой Аг; в подобный слой как бы «распластывается» слой, содержащийся между двумя концентрическими шаровыми поверхно- стями радиусов г и г + Аг. *) Здесь df как единый символ играет роль функционального обозначения.
104] § 2. ДИФФЕРЕНЦИАЛ 213 3) Наконец, рассмотрим свободное падение материальной точки, по закону 5 = у-. За промежуток времени zk, от t до t + At, движу- щаяся точка пройдет путь zb=g('+A)2 =gt. A t +1 (di)2. При zk->-0 его главной частью будет ds=gt-At. Вспомнив, что ско- рость в момент t будет v = gt [90], видим, что дифференциал пути (приближенно заменяющий приращение пути) вычисляется как путь, пройденный точкой, которая в течение всего промежутка времени At двигалась бы именно с этой скоростью. 104. Связь между дифференцируемостью и существованием произ- водной. Легко установить теперь справедливость следующего утвер- ждения: Для того чтобы функция y = f(x) в точке х0 была дифференци- руема, необходимо и достаточно, чтобы для нее в этой точке суще- ствовала конечная производная у' = f\x^. При выполнении этого усло- вия равенство (1) имеет место при значении постоянной А, равном именно этой производной: Ау=ухАх + o(zlx). (1а) Необходимость. Если выполняется (1), то отсюда Лу _ . о(Лх) Лх Лх ’ так что, устремляя Ах к 0, действительно, получаем А = 1ппф-=3\. Лх -гх Достаточность сразу вытекает из 96, 1° [см. там (За)]. Итак, дифференциал функции у — f(x) всегда равен*) dy-y’x'Ax. (2) Подчеркнем здесь же, что под Ах в этом выражении мы разумеем произвольное приращение независимой переменной, т. е. про- извольное число (которое часто удобно бывает считать не завися- щим от х). При этом вовсе не обязательно предполагать Ах бесконечно малой; но если zfx—0, то дифференциал dy также будет бесконечно малой, и именно (при у'х^0) - главной частью *) Легко проверить, что именно так и составлялся дифференциал во всех слу- чаях, рассмотренных в предыдущем п°. Например, в случае 1), имеем: б=№, Q'r = 27ir, dQ = 2nr-Ar, и т. д.
214 ГЛ. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [104 бесконечно малого приращения функции Ду. Это и дает основание приближенно полагать Ду = ф, (3) с тем большей точностью, чем меньше Jx. Мы вернемся к рассмот- рению приближенного равенства (3) в 107. Чтобы истолковать геометрически дифференциал dy и его связь с приращением Лу функции у = f(x), рассмотрим график этой функции (рис. 44). Значением х аргумента и у функции определится точка М на кривой. Проведем в этой точке кривой касательную МТ; как мы уже видели [92], ее угловой коэффициент, tg а, ра- вен производной у'. Если абс- циссе х придать приращение Лх, то ордината кривой у получит приращение Лу=ММх. В то же время ордината касательной по- лучит приращение УК. Вычисляя NK как катет прямоугольного треугольника MNK, найдем: NK=MN • tg а = у' • Лх = dy. Итак, в то время как Лу есть приращение ординаты кривой, dy является соответственным приращением ординаты касательной. В заключение остановимся на самой независимой пере- менной х: ее дифференциалом называют именно приращение Лх, т. е. условно полагают dx=^x. (4) Если отождествить дифференциал независимой перемен- но й х с дифференциалом функции у = х (в этом - тоже своего рода соглашение!), то формулу (4) можно и доказать, ссылаясь на (2): dx = x'x• Лх= I • Дх = Лх. Учитывая соглашение (4), можно теперь переписать формулу (2), дающую определение дифференциала, в виде Jy=j'-dx (5) - так ее обычно и пишут. Отсюда получается K-g. (6) так что выражение, которое мы раньше рассматривали как цель- ный символ, теперь можно трактовать как дробь. То обстоя- тельство, что слева здесь стоит вполне определенное число, в то время
1051 § 2. ДИФФЕРЕНЦИАЛ 215 как справа мы имеем отношение двух неопределенных чисел dy и dx (ведь dx-Лх произвольно), не должно смущать читателя: числа dx и dy изменяются пропорционально, причем производная у' как раз является коэффициентом пропорциональности. Понятие дифференциала и самый термин «дифференциал»*) при- надлежат Лейбницу, который не дал, однако, точного определе- ния этого понятия. Наряду с дифференциалами, Лейбниц рас- сматривал и «дифференциальные частные», т. е. частные двух диф- ференциалов, что равносильно нашим производным; однако именно дифференциал был для Лейбница первоначальным понятием. Со времени Коши, который своей теорией пределов создал фундамент для всего анализа и впервые отчетливо определил производную как предел, стало обычным отправляться именно от производной, а поня- тие дифференциала строить уже на основе производной. 105. Основные формулы и правила дифференцирования. Вычисление дифференциалов функций носит название дифференцирова- ния **). Так как дифференциал dy лишь множителем dx отличается от производной у'х, то по таблице производных для элементарных функций [95] легко составить таблицу дифференциалов для них: Р S"1 Ч Ч Ч II II II 8|*- и dy = 0 dy = (i3di~1’dx j dx dy=—-s SB2 y = Vx j dx 3. у = ах у = ёх dy=-ax'\na-dx dy = ex-dx 4. y=logax , logo e • dx x у =1пх dy=-£ 5. y = sinx 6. y = cosx dy = cos x-dx dy = — sin x • dx 7. y = tgx dy = sec2 x-dx = -^— J COS2 X *) От латинского слова differentia, означающего «разность». **) Впрочем, тем же термином обычно обозначают и вычисление произ- водных, для которого на русском языке нет особого термина. В большинстве иностранных языков для обозначения этих операций существуют два различ- ных термина; например, по-французски различают «derivation» и «differentiation».
216 ГЛ. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [106 8. у —ctgx J о 1 dX dy — — esc2 x-dx =—— s sin2 as 9. у = arcsin х j dx 10. y=arccosx f dx 11. у — arctg х j dx dy=TT^ 12. у=arcctg х , dx dy- 1+Я2 III. Правила дифференцирования*) выглядят так: I. d(cu) = c-du, II. d(u±v) = du + dv, d (uv) = U’dv + v-du, Ju] v• du-и-dv d - =-----;--. \V) V1 они легко получаются из соответствующих правил для про- Все изводных. Докажем, например, два последних: d(и • v) = {и -v)' • dx = (и' • v + и• г') dx = = v-(u' • dx) + и• (у' • dx) = v-du + u-dv, pA' dx_u'v-ud dx_v (u’-dx)~ и (v'-dx) _ ^Ivl lf> X v2 X v2 v2 v-du-u- dv v2 106. Инвариантность формы дифференциала. Правило дифферен- цирования сложной функции приведет нас к одному замечательному и важному свойству дифференциала. Пусть функции y=f(x) и х=ф(Г) таковы, что из них может быть составлена сложная функция: у =f(tp(t)). Если существуют производ- ные у'х и x't, то - по правилу V [98] - существует и производная y't=y'x-x’t. (7) Дифференциал dy, если х считать независимой переменной, вы- разится по формуле (5). Перейдем теперь к независимой переменной 1; в этом предположении имеем другое выражение для дифференциала: dy=y't-dt. *) Если речь идет именно о вычислении дифференциалов.
106] $ 2. ДИФФЕРЕНЦИАЛ 217 Заменяя, однако, производную у\ ее выражением (7) и замечая, что x't-dt есть дифференциал х как функции от t, окончательно по- лучим: dy=ух • x't dt =ух • dx, т. е, вернемся к прежней форме дифференциала! Таким образом, мы видим, что форма дифференциала может быть сохранена даже в том случае, если прежняя независимая переменная заменена новой. Мы всегда имеем право писать дифферен- циал у в форме (5), будет ли х независимой переменной или нет; разница лишь в том, что, если за независимую переменную выбрано t, то dx означает не произвольное приращение Лх, а дифференциал х как функции от t. Это свойство и называют инвариантностью формы дифференциала. Так как из формулы (5) непосредственно получается формула (6), выражающая производную ух через дифференциалы dx и dy, то и по- следняя формула сохраняет силу, по какой бы независимой переменной (конечно, одной и той же в обоих случаях) ни были вычислены названные дифференциалы. Пусть, например, у = У1 - х2( - 1 < х< Г), так что , _ X Ух~ yi-%2' Положим теперь х = sin г . Тогда у = У1 - sin2/ = cos t, и мы будем иметь: dx=cos t 'dt, dy= -sin t-dt. Легко проверить, что фор- мула sin t У* ~ cos t dt cos t дает лишь другое выражение для вычисленной выше производной. Этим обстоятельством особенно удобно пользоваться в случаях, когда зависимость у от х не задана непосредственно, а вместо этого задана зависимость обеих переменных х и у от некоторой третьей, вспомогательной, переменной (называемой параметром): x=<p(t), y=y(f). (8) Предполагая, что обе эти функции имеют производные и что для первой из них существует обратная функция г = 6(х), имеющая про- изводную [83, 94], легко видеть, что тогда и у оказывается функцией от х: y=ip(d(x))=f(x), (9) для которой также существует производная. Вычисление этой про- изводной может быть выполнено по указанному выше правилу: , dy_y't-dt yijp'jt) 'х dx xt-dt x't f'(t) ’ '
218 ГЛ. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [107 не восстанавливая непосредственной зависимо- сти у от х. Например, если x=sinl, y = cosl , то производную у'х можно определить, как это сделано выше, не пользуясь вовсе зависи- мостью у = У1 - х2. Если рассматривать х и у как прямоугольные координаты точки на плоскости, то уравнения (8) каждому значению параметра t ста- вят в соответствие некоторую точку, которая с изменением t описы- вает кривую на плоскости. Уравнения (8) называются параметри- ческими уравнениями этой кривой. В случае параметрического задания кривой, формула (10) позво- ляет непосредственно по уравнениям (8) установить угловой коэффи- циент касательной, не переходя к заданию кривой уравнением (9); именно, tga = ^'. (11) Замечание. Возможность выражать производную через диф- ференциалы, взятые по любой переменной, в частности, приводит к тому, что формулы dy _ 1 dy_dy du dx dx ’ dx du dx' dy выражающие в лейбницевых обозначениях правила дифференцирова- ния обратной функции и сложной функции, становятся простыми ал- гебраическими тождествами (поскольку все дифференциалы здесь мо- гут быть взяты по одной и той же переменной). Не следует думать, впрочем, что этим дан новый вывод названных формул: прежде всего, здесь не доказывалось существование производных слева, главное же - мы существенно пользовались инвариантностью формы дифференциала, которая сама есть следствие правила V. 107. Дифференциалы как источник приближенных формул. Мы видели, что при zfx-*O дифференциал dy функции у (если только представляет собой главную часть бесконечно малого при- ращения функции Лу. Таким образом, Ay~dy, так что Лу^Лу, (3) или подробнее 4ЯЛо) =Ж> + ^x) ~/<Л>) =/'(Хо) • Лх (За) с точностью до бесконечно малой высшего порядка, чем Лх. Это значит [62], что относительная погрешность этого равенства становится сколь угодно малой при достаточно малом Лх.
107) § 2. ДИФФЕРЕНЦИАЛ 219 Рассмотрим простой пример: пусть у = х?. Тогда Ау = (х0 + zfx)3 - х3 = Зх§ • Ах + Зх0 • Ах2 + zfx3, и линейной частью Ау (как мы это выше установили в общем виде), действительно, является дифференциал dy = 3x$'Ax=y'x-Ах. Поло- жим конкретно х0 = 2,3; если взять Zlx=0,1, то будем иметь Ау = = 2,43 - 2,33= 1,657 и 4у = 3 * 2,32 - 0,1 = 1,587, так что погрешность от замены первого числа вторым будет 0,070, а относительная погрешность превысит 4%. При zlx = 0,01 получим Др = 0,159391 и dy = 0,1587, что дает относительную погрешность, уже мень- шую 0,5°/0; при Ах = 0,001 - относительная погрешность меньше 0,05о/о и т. д. Цодобное же обстоятельство может быть и непосредственно усмо- трено из рис. 44, дающего геометрическое истолкование дифферен- циала. На графике видно, что при уменьшении Ах мы, действительно, все с большей относительной точностью можем заменять приращение ординаты кривой приращением ординаты касательной. Выгода замены приращения функции Ау ее дифференциалом dy состоит, как ясно читателю, в том, что dy зависит от Ах линейно, в то время как Ау представляет собою обыкновенно более сложную функцию от Ах. Если положить Ах=х-х0 и х0 + Ах = х, то равенство (За) примет вид /(х) - Дх0) =Д(х0) • (х - х0) или /(х) =Дх0) +Д(х0). (х - хД. По этой формуле, для значений х, близких к х0, функция Дх) при- ближенно заменяется линейной функцией. Геометрически это соответствует замене участка кривой у= f(x), примыкающего к точке (х0, ДхД), отрезком касательной к кривой в этой точке: У —f(.xo) +f’(x0) • (х - хД *) (ср. рис. 44). Взяв для простоты х0 = 0 и ограничиваясь малыми зна- чениями х, будем иметь приближенную формулу: Дх) =Д0) + Д (0) • х. *) Действительно, уравнение прямой с угловым коэффициентом к, проходя- щей через точку (х0, у0), будет У = Уо+к(х-хо); в случае касательной здесь следует положить ya=f(xa~), k=f'(x0')-
220 ГЛ. Ш. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [108 Отсюда, подставляя вместо f(x) различные элементарные функции, легко получить ряд формул: (1 + х)д=1 + fix, в частности, yi + х 1 + — х, ex—i+x, ln(l + x)A.v, sinx=x, tgx=x, и т. п. (из которых многие нам уже известны). Приведем примеры приближенных формул другого типа, также имеющих своим источником равенство (3). 1) Если длину тяжелой нити (провода, каната, ремня), подвешенной за оба конца, обозначить через 2s, пролет - через 21, а стрелу провеса - через f (рис. 45), то для вычисления s часто ;--------1--------пользуются (приближенной) фор- мулой Рис. 45. Величину f здесь будем считать независимой переменной, a s - функцией от f. Требуется установить связь между изменением As длины s и изме- нением Af стрелы провеса /. Заменяя As на ds, получим 4 f 3 1 As=------Af, откуда -------------As. 3 1 4 f Если, например, учесть изменение длины провода от изменения температуры или нагрузки, то отсюда можно предусмотреть и изменение стрелы провеса. 2) Известно, что круговой ток (рис. 46) действует на единицу так называе- мого «магнитного заряда», помещенную на его оси на расстоянии х от центра О, с силой к з ’ (а2+х2)2 где к - постоянный коэффициент, а - радиус. Найти выражение для силы, с какой круговой ток будет действовать на магнит NS длины Ах, расположенный по оси тока. При этом будем считать, что в полюсе N сосредоточен положительный «магнитный заряд» т, а в полюсе 5 - равный ему отрицательный «магнитный заряд» - т. Общая сила F действия тока на магнит выразится так: кт кт 1 ------------- - km А - Il 1 (а2 + х2)2 [а2 + (х + Zlx)2]2 L (а2+х2)!. Заменяя приращение функции (в предположении, что Ах мало) ее дифференциалом, получим 108. Применение дифференциалов при оценке погрешностей. Особенно удобно и естественно использовать понятие дифференциала в приближенных вычислениях
108] S 2. ДИФФЕРЕНЦИАЛ 221 при оценке погрешностей. Пусть, например, величину х мы измеряем или вычисля- ем непосредственно, а зависящую от нее величину у определяем по формуле: у= fix). При измерении величины х обыкновенно вкрадывается погрешность, Дх, которая влечет за собою погрешность Ду для величины у. Ввиду малой величины этих погрешностей, полагают т. е. заменяют приращение дифференциалом. Пусть 8х будет максималь- ной абсолютной погрешностью величины х: | Дх | =^8х (в обычных условиях подобная граница погрешности при измерении известна). Тогда, оче- видно, за максимальную абсолютную погрешность (границу погрешно- сти) для у можно принять 8у = |Л|-Зх. (12) 1) Пусть, например, для определения объема шара сначала (с помощью штан- генциркуля, толщемера, микрометра и т. п.) непосредственно измеряют диаметр D шара, а затем объем V вычисляют по формуле л V=-D3. 6 Так как Vo = — D2, то в этом случае, в силу (12), ак=-П2-<5О. 2 Разделив это равенство на предыдущее, получим 8У 8D — = 3 —, V D так что (максимальная) относительная погрешность вычисленного значения объе- ма оказывается втрое большей, чем (максимальная) относительная погрешность измеренного значения диаметра. 2) Если число х, для которого вычисляется его десятичный логарифм у=log х, получено с некоторой погрешностью, то это отразится на логарифме, создавая и в нем погрешность. . м Здесь ух = — (М—0,4343), так что, по формуле (12), х 8х <5у = 0,4343-— . х Таким образом, (максимальная) абсолютная погрешность логарифма просто определяется по (максимальной) относительной погрешности самого числа, и обратно. Этот результат имеет многообразные применения. Например, с его помощью можно составить себе представление о точности обыкновенной логарифмической линейки, со шкалой в 25 см = 250 мм. При отсчете или установке визира можно ипибиться, примерно, на 0,1 юсти в логарифме мм в ту или другую сторону, что отвечает погреш- 0,1 бу = _L. = 0,0004. 250 0.0004 Этсгода, по нашей формуле, 8х — = —----=0,00092... i 0,001. х 0,4343 )тносительпая точность отсчетов во всех частях шкалы одна и та же!
222 ГЛ. Ш. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [108 3) При вычислении угла <р по логарифмо-тригонометрическим таблицам встает вопрос, какими таблицами выгоднее пользоваться - таблицами синусов или тан- генсов. Положим yt = log sing? и y2 = logtgip и будем считать максимальные погрешности <5yt и 0у2 равными (скажем, половине последнего знака мантиссы). Если обозначить соответствующие максимальные погрешности в угле д? через и д2<р, то, как и выше, получим: „ М 8yi -------cos <р • 8г<р, sing? о м оу, ------sec2 <р 82<р, tg<p так что <52д> = дур- cos2 <р -= 8г(р. Таким образом оказывается, что при одинаковых ошибках в логарифме таб- В р _ лица тангенсов дает меньшую погреш- 1ИС‘ ность в угле, чем таблица синусов, и, стало быть, является более выгодной *). 4) В качестве последнего примера рассмотрим вопрос о точности измере- ния неизвестного сопротивления у с помощью мостика Уитстона (рис. 47). При этом подвижной контакт D передвигается по градуированной линейке АС до тех пор, пока гальванометр G не покажет отсутствие тока. Сопротивление у определяется по формуле где а=АС, x=AD, R - известное сопротивление ветви ВС. По формуле (12) получается: . ( Вх V aR 8у = ---- • ох -------дх', [a-xjx (а-х)2 если разделить почленно это равенство на равенство (13), то получим выражение (максимальной) относительной погрешности для у; 8у а-8х у х(а - х) Так как знаменатель х(а-х) достигает своего наибольшего значения при а х = у**), а погрешность 8х при измерении длины можно считать не зависящей *) При этих выкладках мы предполагали углы выраженными в радианах, но результаты, очевидно, справедливы безотносительно к тому, какой единицей измеряются углы. **) Из очевидного неравенства а2 ( а)2 х2 - ах •;-= I х-1 й=0 4 ( 2) непосредственно получаем а2 л-(а-х)^—, что и доказывает наше утверждение.
109) § 3. ОСНОВНЫЕ ТЕОРЕМЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ 223 от х, то наименьшее значение для относительной погрешности достигается а именно при х=—. Поэтому обыкновенно, для получения возможно точного ре- зультата, сопротивление R (с помощью магазина сопротивлений) устанавливается с таким расчетом, чтобы ток исчезал при положении контакта D, возможно более близком к середине линейки АС. § 3. Основные теоремы дифференциального исчисления 109. Теорема Ферма. Знание производной f'(x) некоторой функ- ции f(x) часто позволяет делать заключение и о поведении самой функции f(x). Вопросам этого рода и будут, в сущности, посвящены настоящий параграф и следующие за ним. Предварительно докажем простую лемму: Лемма. Пусть функция f(x) имеет конечную производную в точке х0. Если эта производная f'(x^>Q [/'(х0)“= то для значений х, до- статочно близких к х0 справа, будет f(x)>f(x^ [f(x)-=Дх0)], а для значений х, достаточно близких к х0 слева, будет f(x) <Дх0) [/W-Ле- иными словами этот факт выражают так: функция f(x) в точке х0 возрастает (убывает). Если имеется в виду односторонняя про- изводная, например, справа, то сохраняет силу лишь утверждение о значениях х, лежащих справа от х0. Доказательство. По определению производной, Л(х0) = Нш^^. х-х„ л л0 Если /'(хо)=-0 (ограничимся этим случаем), то, в силу 55, 2°, найдется такая окрестность (х0~д, х0+б) точки х0, в которой (при х#х0) f(x)-f(x„) Q х-хв Пусть сначала х0-=х«=х0 +й, так что х-хо=-О; из предыдущего неравенства следует тогда, что f(x)-f(x0)>0, т. е. f(x)>f(xa}. Если же х0 - <5 < х < х0 и х - х0 «= 0, то, очевидно, и f(x) - /(х0) т- е- Лх) </(х0). Лемма доказана. Теорема Ферма. (Р. Fermat) Пусть функция f(x) определена в некотором промежутке X и ео внутренней точке с этого проме- жутка принимает наибольшее (наименьшее) значение. Если существует двусторонняя конечная производная f'(c) в этой точке, то необходимо Г(с) = Ь*). Доказательство. Пусть для определенности f(x) принимает наибольшее значение в точке с. Предположение, что f'(c)#0, *) Это утверждение, разумеется, воспроизводит лишь сущность того при- ема, который применял Ферма для разыскания наибольших и наименьших значений функции (Ферма не располагал понятием производной).
224 ГЛ. Ш. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ приводит к противоречию: либо f'(c)>0, и тогда (по лемме) /(х)> > /(с), если х > с и достаточно близко к с, либо f(c) -= 0, и тогда /(х) > >f(c), если х<с и достаточно близко к с. В обоих случаях /(с) не может быть наибольшим значением функции f(x) в промежутке Я7. Полученное противоречие и доказывает теорему. Вспомним [91, 92] геометрическое истолкование производной у' = =f'(x) как углового коэффициента касательной к кривой у = /(х). Обращение в нуль производной /'(с) геометрически означает, что в соответствующей точке этой кривой касательная параллельна оси х. Рис. 48 делает это обстоятельство совершенно наглядным. В доказательстве существенно было использовано предполо- жение, что с является внутренней точкой промежутка, так как нам пришлось рассматривать и точки х справа от с, и точки х слева от с. Без этого предположения теорема перестала бы быть верной: если функция f(x) определена в замкнутом промежутке и достигает своего наибольшего (наименьшего) значения на одном из концов этого промежутка, то производная f'(x) на этом конце (если суще- ствует) может и не быть нулем. Предоставляем читателю подыскать соответствующий пример; геометрически этот факт иллюстрируется рисунком 49. В качестве приложения теоремы Ферма докажем одну любо- пытную теорему о производной функции. ПО. Теорема Дарбу (G. Darboux). Если функция f(x) имеет конеч- ную производную в промежутке [a, Z>] *), то функция f’(x) принимает, в качестве значения, каждое промежуточное число между f\a) и Доказательство. Сперва предположим, что f'(a) и /'(/>) имеют разные знаки, например, что /'(а)>0, a /'(&)< О, и докажем существование точки с между а и Ь, в которой производная обра- щается в нуль. В самом деле, из существования конечной производ- *) При этом мы считаем, что в точке а существует производная справа, а в точке b - производная слева. Они в дальнейшем обозначаются просто /'(а) и/'(/>).
Ill] § 3. ОСНОВНЫЕ ТЕОРЕМЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ 225 ной /'(х) следует непрерывность функции f(x) [96, 2°], а тогда, по 2-й теореме Вейерштрасса [85], f(x) принимает в некоторой точке с свое наибольшее значение. Эта точка с не может совпадать ни с а, ни с Ь, так как, согласно лемме, f(x) больше /(а) вблизи точки а (справа) и больше f(b) вблизи точки b (слева). Итак, а<с<Ь. Тогда, по теореме Ферма, получаем /'(с) = 0. Переходя к общему случаю, возьмем любое число С, заключен- ное между f'(a) и f'(by, пусть, для определенности, f'(a)>C> f\b). Рассмотрим вспомогательную функцию <р(х) = f(x) - Сх; она непре- рывна и имеет производную <р'(х) = f’(x)-С в промежутке [а, />]. Так как ср'(а) = f'(a) - С>0, a cp’(b)=f'(b) - С< 0, то по доказанному, существует такая точка с (а<с<Ь), в которой 9°'(с) =У'(с) — С=0, т. е. f(c) = C. Доказанная теорема имеет большое сходство со 2-й теоремой Коши [82], согласно которой всякая непрерывная функция пере- ходит от одного значения к другому, лишь переходя через все про- межуточные числа. Однако, теорема Дарбу отнюдь не является следствием теоремы Коши, так как производная /'(х) непрерывной функции сама может и не быть непрерывной функцией. 111. Теорема Ролля. В основе многих теорем и формул диффе- ренциального исчисления и его приложений лежит следующая про- стая, но важная теорема, связываемая с именем Ролля (М. Rolle) *). Теорема Ролля. Пусть 1) функция f(x) определена и непрерывна в замкнутом промежутке [а, />]; 2) существует конечная производ- ная f'ty), по крайней мере, в открытом промежутке (а, Ь); 3) на кон- цах промежутка функция принимает равные значения'. f(a)=f(b). Тогда между а и b найдется такая точка, с (скс<Ь), что f'(c)=0. Доказательство, /(х) непрерывна в замкнутом промежутке [а, Ь] и потому, по 2-й теореме Вейерштрасса [85], принимает в этом промежутке как свое наибольшее значение М, так и свое наи- меньшее значение т. Рассмотрим два случая: 1. М=т. Тогда /(х) в промежутке [а, Ь] сохраняет постоянное значение: в самом деле, неравенство m*sf(x)=sM в этом случае дает f(x) = M при всех х; поэтому /'(х)=0 во всем промежутке, так что в качестве с можно взять любую точку из (а, Ь). 2. М>т. Мы знаем, что оба эти значения функцией достигаются, но, так как f(a) = f(b), то хоть одно из них достигается в некото- рой точке с между anb. В таком случае из теоремы Ферма *) В действительности Ролль высказал это утверждение лишь для много- членов. 15 Г. М. Фихтенгольц, т. I
226 ГЛ. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [112 следует, что производная f'(c) в этой точке обращается в нуль. Теорема доказана. На геометрическом языке теорема Ролля означает следующее: если крайние ординаты кривой при х = 1, а производная /'(х) = 1 равенствами f{x)-x при 0==х y=f(x) равны, то на кривой найдется точка, где касательная параллельна оси х (рис. 50). Обращаем внимание на то, что непрерывность функции f(x) в зам- кнутом промежутке [а, 6] и су- ществование производной во всем открытом промежутке (а, Ъ) суще- ственны для верности заклю- чения теоремы. Функция f(x) = x~ -Е(х) удовлетворяет в промежутке [0,1] всем условиям теоремы, за ис- ключением того, что имеет разрыв везде в (0,1). Функция, определяемая si и /(х) = 1-х при i=sx=sl, также удовлетворяет всем условиям в том же промежутке, исключая лишь а 1 / "А то обстоятельство, что при х=^ не существует (двухсторонней) про- изводной; в то же время производная /'(х) равна +1 в левой поло- вине промежутка и -1 в правой. Точно так же существенно и условие 3) теоремы: функция f(x)-x в промежутке [0,1] удовлетворяет всем условиям теоремы, кроме условия 3), а ее производная f'(x) = 1 повсюду. Чертежи предоставляем читателю. 112. Формула Лагранжа. Обратимся к непосредственным след- ствиям теоремы Ролля. Теорема Лагранжа. Пусть 1) f(x) определена и непрерывна в зам- кнутом промежутке [а, Ь], 2) существует конечная производная f'(x), по крайней мере, в открытом промежутке (а, Ь) *). Тогда между а и b найдется такая точка с (а^с^Ь), что для нее выполняется равен- ство (1) Доказательство. Введем вспомогательную функцию, опре- делив ее в промежутке [а, 6] равенством: Мх) =/(x) -f(a) - (х - а). *) Конечно, непрерывность функции/(а) в (а, Ь), предположенная в 1), уже следует из 2), но мы ни здесь, ни в последующем не ставим себе целью расчленять условие теоремы на взаимно независимые предположения.
112] § 3. ОСНОВНЫЕ ТЕОРЕМЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ 227 Эта функция удовлетворяет всем условиям теоремы Ролля. В са- мом деле, она непрерывна в [а, Ь], так как представляет собой раз- ность между непрерывной функцией f(x) и линейной функцией. В промежутке (а, Ъ) она имеет определенную конечную производную, равную Наконец, непосредственной подстановкой убеждаемся в том, что F(a) = F(b~) = 0, т. е. F(x) принимает равные значения на концах про- межутка. Следовательно, к функции F(x) можно применить теорему Ролля и утверждать существование в (a, Z?) такой точки с, что F'(c) = 0. Таким образом, Г(с)_я^Ж=0, J ' Ь-а ’ откуда л/д /№)~/(ч) J ’ Ь-а ч. и тр. д. Доказанную теорему называют также теоремой о среднем значении (в дифференциальном исчислении). Теорема Ролля является част- ным случаем теоремы Л а г р а н- ж а; замечания относительно условий 1) и 2) теоремы, сделанные выше, сохраняют свою силу и здесь. Обращаясь к геометрическому истолкованию теоремы Л а г р а н- ж а (рис. 51), заметим, что отношение /(b)-f(а) ^СВ b-а АС есть угловой коэффициент секущей АВ, а /'(с) есть угловой коэффи- циент касательной к кривой у=/(х) в точке с абсциссой х = с. Таким образом, утверждение теоремы Лагранжа равносильно следую- щему: на дуге АВ всегда найдется, по крайней мере, одна точка М, в которой касательная параллельна хорде А В. Доказанная формула =/'(<> или f(b)-f(a)=f'(c)-(b-a) носит название формулы Лагранжа или формулы ко- нечных приращений. Она, очевидно, сохраняет силу и для случая а >Ь. Возьмем любое значение х0 в промежутке [a, и придадим ему приращение 4x50, не выводящее его за пределы промежутка. При-
228 ГЛ. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [113 меним формулу Лагранжа к промежутку [х0, х0 + dx] при Лх =-О или к промежутку [x0 + dx, х0] при dx<0. Число с, заключенное в этом случае между х0 и х0 + Лх, можно представить так: с = х0-1-6’Лх, где О<0<1*). Тогда формула Лагранжа примет вид: ^“'^^-/'(Xo + fldx) <1а> или Л/(х0) = /(х0 + Лх)-/(х0) = /'(х0 + 9Лх)-Лх (О-=0«=1). (2) Это равенство, дающее точное выражение для приращения функ- ции при любом конечном приращении Лх аргумента, естественно противопоставляется приближенному равенству [107, (За)]: ^/(хо) =/(ло + Лх) - Я*о) =/' (х0) • Лх, относительная погрешность которого стремится к нулю лишь при бесконечно малом Лх. Отсюда проистекает и самое название «фор- мула конечных приращений». К невыгоде формулы Лагранжа - в ней фигурирует неизвест- ное нам число 9 **) (или с). Это не мешает, однако, многообразным применениям этой формулы в анализе. 113. Предел производной. Полезный пример такого применил дает следующее замечание. Предположим, что функция f(x) непрерывна в промежутке [х0, х0 + 27] (27 >0) и имеет конечную производ- ную /'(х) для х =-х0. Если существует (конечный или нет) предел lim f'(x) = K, х-*хо+О то такова же будет и производная в точке х0 справа. Действительно, при 0-=Дх==/7 имеем (1а). Если dx-О, то - ввиду ограниченности величины 0 - аргумент производной х0 + 6Лх стремится к х0, так что правая часть равенства, а с нею и левая стре- мится к пределу К, ч. и тр. д. Аналогичное утверждение устанавли- вается и для левосторонней окрестности точки х0. *) Иногда говорят, что 0 есть «правильная дробь»; не следует только думать, что речь идет о рациональной дроби - число 0 может оказаться и иррациональным. ♦*) Лишь в немногих случаях мы можем его установить; например, для квад- ратичной функции f(x)=ax2+bx+c, как легко проверить, имеем 0 = — .
114] § 3. ОСНОВНЫЕ ТЕОРЕМЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ 229 Рассмотрим в качестве примера функцию f(x) = х arcsin х + У1 — х2 в промежутке [-1, 1]. Если -1-=х-=1, то по обычным правилам дифференциаль- ного исчисления легко найти: х х f'(x) = arcsin х-|—-------- arcsin x. У1 -x2 УТ-Г2 При x-1-0 (х--1+0) эта производная, очевидно, стремится к пределу — I - —I; значит и при х = ± 1 существуют (односторонние) производные 2 ( 2) 71 Г(±1)=±-. Часто сделанное замечание применяется при следующих обстоя- тельствах: из того факта, что найденное для производной выражение стремится к + оо (- «>) при приближении х к х0 с той или другой стороны, делается заключение, что в самой точке х0 соответствующая односторонняя производная равна + °° (~ °°). 1 2 Например, если вернуться к функциям /1(х) = х3 и /2(х) = х3 , которые мы рассматривали в п° 101, то для них (при х^О) имеем: . 1 . 2 /;(*)=А > Л(х)=4- Зх3 Зх3 Так как первое из этих выражений при х- ±0 стремится к +«, а второе при х-*+0 или при х—-0 имеет, соответственно, пределы + °о или -оо, то заключаем, что для f^x) в точке х = 0 существует двусторонняя производная: + со, в то время как для f2(x) в этой точке существуют лишь односторонние производные: +«> справа и -оо слева. Из сказанного вытекает также, что, если конечная производная /'(х) существует в некотором промежутке, то она представляет собою функцию, которая не может иметь обыкновенных разрывов или скач- ков: в каждой точке она либо непрерывна, либо имеет разрыв 2-го рода [ср. 102, 2°]. 114. Формула Коши. Формула конечных приращений обобща- ется следующим образом: Теорема Коши. Пусть 1) функции Дх) и g(x) непрерывны в зам- кнутом промежутке [а, Ь]; 2) существуют конечные производные f(x) и g'(x)> по крайней мере, в открытом промежутке (а, Ь); 3) g'(x) # О в промежутке (а, Ь). Тогда между а и b найдется такая точка с (а^с^Ь), что g(b)-g(a) g'(c) ’ ' Эта формула носит название формулы Коши.
230 ГЛ. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [114 Доказательство. Установим сперва, что знаменатель левой части нашего равенства не равен нулю, так как в противном случае выражение это не имело бы смысла. Если бы было g(&)=g(a), то, по теореме Ролля, производная g'(x) в некоторой промежуточной точке была бы равна нулю, что противоречит условию 3); значит g(Z>) #g(a). Рассмотрим теперь вспомогательную функцию FW = f(x) - f(a) [gW -g(a)]- Эта функция удовлетворяет всем условиям теоремы Ролля. В са- мом деле, F(x) непрерывна в [а, Ь], так как непрерывны f (х) и g(x); производная F'(x) существует в (а, Ь), именно, она равна Наконец, прямой подстановкой убеждаемся, что F(a) = F(b) = 0. Вслед- ствие этого в промежутке (а, Ь) существует такая точка с, что F'(c) = 0. Иначе говоря, 7 ' g(b)-g(a) или ,(с) 7 1’ g(b)-g(a) Разделив на g'(c) (это возможно, так как g'(c)^O), получаем тре- буемое равенство. Ясно, что теорема Лагранжа является частным случаем тео- ремы Коши. Для получения формулы конечных приращений из формулы Коши следует положить g(x)=х. Теорему Коши на- зывают обобщенной теоремой о среднем значении (в дифференциальном исчислении). Геометрическая иллюстрация теоремы Коши - та же, что и для теоремы Лагранжа. Чтобы читателю легче было это усмот- реть, перейдем к другим обозначениям: х заменим на t, а функции обо- значим через <p(t) и Если t изменяется в промежутке [а, Д|, то фор- мула Коши напишется так: Рассмотрим теперь кривую, заданную параметрическими уравнениями х=<р(1), y=y>(t) (5) Тогда левая часть формулы и здесь выражает угловой коэффициент хорды, соединяющей концы дуги этой кривой, а правая - угловой
115] § 4. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ 231 коэффициент касательной в некоторой внутренней точке дуги, отве- чающей t = y [106, (И)]. Замечание. Эти соображения подсказывают мысль о возмож- ности вывести формулу Коши из формулы Лагранжа. Суть этого вывода в том, что вместо параметрической зависимости (5) уста- навливают непосредственную зависимость: у = f(x), и тогда формула (4) оказывается равнозначащей с (1). § 4. Производные и дифференциалы высших порядков 115. Определение производных высших порядков. Если функция y=f(x) имеет конечную производную y'=f'(x) в некотором про- межутке X, так что эта последняя сама представляет новую функ- цию от х, то может случиться, что эта функция в некоторой точке х0 из Й7, в свою очередь, имеет производную, конечную или нет. Ее называют производной второго порядка или второй производной функции у = f(x) в упомянутой точке, и обозна- чают одним из символов 2, у", D2y, d^, /"(х0), PV(x0). Так, например, мы видели в 92, что скорость v движения точки равна производной от пройденного точкой пути s по времени t: v = ds ускорение же а есть производная от скорости v по времени: а. Значит, ускорение является второй производной от d2s пути по времени: а = • Аналогично, если функция у = /(х) имеет конечную вторую про- изводную в целом промежутке Й7 (т. е. в каждой точке этого проме- жутка), то ее производная, конечная или нет, в какой-либо точке х0 из $7 называется производной третьего порядка или третьей производной функции у = f(x) в этой точке, и обо- значается так: g, у'", D3y; , Г'Ы, рз/(х0). Подобным же образом от третьей производной переходим к чет- вертой и т. д. Если предположить, что понятие (п - 1)-й производ- ной уже определено и что (и - 1)-я производная существует и конечна в промежутке $7, то ее производная в некоторой точке х0 этого про- межутка называется производной и-г о порядка или и-й производной от исходной функции у=f(x); для обозначения ее применяются символы: g, УЧ Dny; d-^, Жх0), Dnf(x0).
232 ГЛ. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [116 Иной раз - при пользовании обозначениями Лагранжа или Коши - может возникнуть надобность в указании переменной, по которой берется производная; тогда ее пишут в виде значка внизу: Ух*, К*У, f^(x0), и т. п., причем, х2, х3, ... есть условная сокращенная запись вместо хх, ххх, ... Например, можно написать: a = sP. (Читателю ясно, что и здесь цельные символы g, /w или/^, Рп/или Pj>/ можно рассматривать как функциональные обозначения.) Таким образом, мы определили понятие л-ой производной, как говорят, индуктивно, переходя по порядку от первой произ- водной к последующим. Соотношение, определяющее п-ю производ- ную: J’(n) — [j/n— 1)]', называют также рекуррентным (или «возвратным»), поскольку оно «возвращает» нас от л-й к (л - 1)-й производной. Самое вычисление производных л-го порядка, при численно задан- ном п, производится по известным уже читателю правилам и формулам. На- пример, если 11 4 1 у = — х*-х3+2х2 Н— х--, 2 6 3 2’ то у"'=12х-1, yiv=12, так что все последующие производные равны тождественно 0. Или пусть у = 1п (х+ г 1); тогда 1 х 2х2 -1 у' =-----, у” —---------, у"' =--------, и т. д. yF+1 (х2 + Ш> (х2+1у/С Заметим, что по отношению к производным высших порядков так же, индуктивно, можно установить понятие односторон- ней производной [ср. 100]. Если функция y=f(x) определена лишь в некотором промежутке Й7, то, говоря о производной любого поряд- ка на конце его, всегда имеют в виду именно одностороннюю производную. 116. Общие формулы для производных любого порядка. Итак, для того, чтобы вычислить л-ю производную от какой-либо функции, вообще говоря, нужно предварительно вычислить производные всех
116] § 4. ПРОИЗВОДНЫЕ ВЫСШИХ ПОРЯДКОВ 233 водные всех предшествующих порядков. Однако в ряде случаев удаётся установить такое общее выражение для n-й производ- ной, которое зависит непосредственно от п и не содержит более обозначений предшествующих производных. При выводе таких общих выражений иногда бывают полезны формулы: (си)(п) = с и{п\ (и ±и)(я) = и(л) ± 'Р(л)> обобщающие на случай высших производных известные читателю правила I и II п° 97. Их легко получить последовательным примене- нием этих правил. 1) Рассмотрим сначала степенную функцию у = xt\ где р— лю- бое вещественное число. Имеем последовательно: у' = рх*~\ у" = (р — 1) х*-*, у'" = р (р — 1) (р, — 2) х11’3, ... Легко усмотреть отсюда и общий закон: у(п) = р(р — 1) .. . (р — „4-1)х!1п, но, строго говоря, он ещё подлежит доказательству. Для этого воспользуемся методом математической индукции. Допустив, что для некоторого значения п эта формула верна, продифференцируем её ещё раз. Мы придем к результату: [/«)]'=Уя+» = р(р- 1)... (р_„4-1) [х^л]'= =р(р — 1)... (р —„4-1) (р —и)^-^1), так что наша формула оказывается верной для (и4~ 1)’й произ- водной, если была верна для n-й. Отсюда и следует её справедли- вость при всех натуральных значениях п. Если, например, взять р = —1, то получим / 1 \(л) , „ (__ пл . и| (4) =(-i)(-2)...(-„)x-1- = L-LLrZLi 1 а при р=----- и т. п. Когда само р есть натуральное число т, то /и-я произ- водная от хт будет уже постоянным числом/и!, а все следующие — * Символом „1! обозначают произведение натуральных чисел, не превосхо- дящих п и о д н о й с ним чётности, так что, например, 7!! = 1 • 3 - 5 • 7. 101! = 2 • 4 • 6 • 8 • 10.
234 ГЛ. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [116 нулями. Отсюда ясно, что и для целого многочлена степени т имеет место аналогичное обстоятельство. 2) Для несколько более общего выражения у = (а 4- bxf (a, b = const.) столь же легко найдем: у(п) = [х _ !)... ([Х 1) . . (а Ьху~п В частности, получается, как и выше, / 1 \(п)_ (— 1)пп!£я \ а 4- Ьх) ~ (а 4- 6х)'1+1 ’ 1 У”) _ (— 1)п(2п—4)11 У» ^а-^-Ьх/ 2” (а 4- Ьх)п ]Лв 4~ Ьх' 3) Пусть теперь _у = 1пх. Прежде всего, имеем У = (1пху = -^. Возьмём отсюда производную (я—1)-го порядка пр соответст- вующей формуле из 1), заменив в ней я на я — 1; мы и получим тогда \ л у Л 4) Если у = ах, то у' = ах • In а, у’ = ах • (1п а)а,..-. Общая формула _у(п) = ах(1па)п легко доказывается по методу математической индукции. В частности, очевидно, (ехУп,=ех. 5) Положим у = sin х; тогда у’ = cos х, у" = — sin х, у’" = — cos х, IV . v у = sin X, у — cos X, . . . На этом пути найти требуемое общее выражение для я-й произ- водной трудно. Но дело сразу упрощается, если переписать фор- мулу для первой производной в виде у' = sin ^х ~Ьу становит- ся ясным, что при каждом дифференцировании к аргументу будет прибавляться у, так что (sin х)(л) = sin ( х я • -£-). \ / Аналогично получается и формула (cos х)( = cos ( х п • у
116] § 4. ПРОИЗВОДНЫЕ ВЫСШИХ ПОРЯДКОВ 235 6) Рассмотрим функцию у = • Представив её в виде _ 1 / 1___________1__\ У 2а \ х — а х 4- а )’ мы получаем возможность использовать пример 2) (и общие правила, указан- ные вначале). Окончательно, / 1 V»’ _(— 1)<п1 nt Г 1 1 U2 — «э/ — 2в |_(х —e)n+I (х4-в)"+‘ 7) В случае функции у = еах sin bx мы употребим более искусственный приём. Именно, имеем у' = аеах sin bx 4- бе0* cos bx; если ввести вспомогательный угол <р, определяемый условиями . Ъ а sin <р = — ........, COS <р = —, . ]/ва4-й3 ]/а34-б3 то выражение для первой производной можно переписать в виде: у1 = у/ а- 4- Ь2 • еах • (sin bx • cos <р 4~ cos bx sin <p) = = У a2 4- b2 • e°x • sin (bx 4- <p). Повторяя дифференцирование, легко установить общий закон п ут = (a3 -j- Ь2) 2 • е°* sin (bx 4- п<р) и обосновать его по методу математической индукции. 8) Остановимся ещё на функции у — arctg х. Поставим себе сначала за- дачей выразить у,п> через у. Так как x = tgy, то , 1 У ~ 1 4- Xs cos2у = cosy sin \У 4- у Дифференцируя вторично по х (и помня, что у чим ,, Г • I ( । ’ \ , у" = — sin у sin 4- yl + cosy ’ есть функция от х), полу- cos (у 4- у И • у’ = = cos3 .у • cos f 2у 4- -у cos2 у sin 2 (у у Следующее дифференцирование дает у"' = — 2 sin у cosy • sin 2 4- yj 4- 2 cos2 у • cos 2 (у 4- • у' = = 2 cos’y • cos Зу 4-2 • yj = 2 cos3 у • sin 3 (у 4- yj. Общая формула; y(n) = (n — 1)! cos" у • sin я fy + yj оправдывается по методу математической индукции. Если (при х > 0) ввести угол 1 л z = arctg — = у — у,
236 ГЛ. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [117 то эта формула может быть переписана так: Ут = (п — 1)!---------- . sin п (я — г) (1+№~ или, наконец, у(п> = (— l)n~i (п— 1)!-5—— • sin п arctg —. 9) Установим в заключение, в виде упражнения, формулу 1 - ех Dn{xn-iex) = (__xyi_L_ (п={, 2> 3> Справедливость её при п — 1 и п = 2 проверяется непосредственно. До- пустим теперь, что она верна для всех значений п вплоть до не- которого я ^>2, и докажем, что тогда она сохранит верность и при замене п на я-|-1*. С этой целью рассмотрим выражение L L L L £)П+1 (xneX ) = Dn[D (Хпех _ ВП{пхП-1еХ _ хп-2еХ ] _ 1_ 1_ = n-Dn (xn~lex) — D [£>”-» (хл~2е*)[. Пользуясь нашим допущением, можно переписать это выражение так: , -L 1 L ~ в* Г П 6х (хпех) = « . (- 1)» — - Dp- iy-iе_ J = (_ 1уш , ч. и тр. д. Итак, формула верна для всех натуральных значений ц. 117. Формула Лейбница. Как мы заметили в начале предыду- щего п°, правила I и II, 97, непосредственно переносятся и на случай производных любого порядка. Сложнее обстоит дело с правилом III, относящимся к дифференцированию произведения. Предположим, что функции и, v от х имеют каждая в отдель- ности производные до n-го порядка включительно: докажем, что тогда их произведение у = uv также имеет п-ю производную, и найдём её выражение. Станем, применяя правило III, последовательно дифференцировать это произведение; мы найдём: у = u'v uv’, у" = u"v Ц- 2u’v’ Ц- uv", у'" = u"’v 4- 3iiV + Зн'р" Ц- uv’", .'.. Легко подметить закон, по которому построены все эти формулы: правые части их напоминают разложение степеней бинома: u-^v, * Обращаем внимание читателя на эту своеобразную форму применения метода математической индукции; в действительности (см. текст ниже) мы используем справедливость нашей формулы для п и для п — 1.
117] § 4. ПРОИЗВОДНЫЕ ВЫСШИХ ПОРЯДКОВ 237 (гг-ро)4 (и-ро)3...лишь вместо степеней и, v стоят производные соответствующих порядков. Сходство станет более полным, если в полученных формулах вместо и, v писать н(0), Распростра- няя этот закон на случай любого п, придем к общей формуле*: Уп> = (ит»)(я’ =2Спи(П’/)г,(г) = U0 = uwv -Р -Рn(re1~-)- n^v" -Р. . . ... -р п{п~ у;2 •(п 7г +1} n^-i)vw -р.. ,-р nv^\ (1) Для доказательства её справедливости прибегнем снова к ме- тоду математической индукции. Допустим, что при некотором значе- нии п она верна. Если для функций и, v существуют и (п-[-1)-е производные, то можно ещё раз продифференцировать по х; мы получим: л л л ул+1) [«(»-0p(0у =^Ju(n-i+l)vW i — 0 i = О I = О Объединим теперь слагаемые обеих последних сумм, содержа- щие одинаковые произведения производных функций и и v (сумма порядков производных в таком произведении, как легко видеть, равна всегда га—р 1). Произведение иln+1)т>((,, входит только в пер- вую сумму (при I == 0); коэффициент его в этой сумме есть С„ = 1. Точно так же n(0)x>(n+1) входит только во вторую сумму (в сла- гаемое с номером i = ri), с коэффициентом С*=1. Все осталь- ные произведения, входящие в эти суммы, имеют вид причём 1 k п. Каждое такое произведение встретится как в первой сумме (слагаемое с номером I — k), так и во второй сумме (сла- гаемое с номером l = k — 1). Сумма соответствующих коэффициентов будет Сдр-С*-1. Но, как известно, Cfe | ___ п “Г” Ьл — Ьд-|-Г * Символ £ означает сумму однотипных слагаемых. Когда слагае- мые эти зависят от одного значка, меняющегося в определённых границах то эти границы и указываются (снизу и сверху). Например, п ^at = ао + а1 + • • • + ал> 1 = 0 т VI , । 1 I 1 । ,1 Zfe +2+3 + • - + т’ИТ'Д' 1
238 гл. hi. производные и дифференциалы [118 Таким образом, окончательно находим: ул+1) +2C»+ia«"+1)-*> w<*) _|_„(0)fl(n+l) _. fe=l н-l =2c^«[("+IWVM> k=O так как C^-|_| = C"^!= 1. Мы получили для Ул+1) выражение, вполне аналогичное выра- жению (1) (только п заменилось числом га —j— 1); этим и доказана справедливость формулы (1) для всех натуральных значений п. Установленная формула носит_ название формулы Лейбница. Она часто бывает полезна при выводе общих выражений для n-й произ- водной. Заметим, что такую же формулу можно было бы установить и для я-й производной произведения нескольких сомножите- лей у — uv ... t\ она имеет сходство с разложением степени многочлена 0я- 118. Примеры. 1) Найдём при помощи формулы Лейбница (1) произ- водную (х8 • cos ех)'601. Положим V = Xs, и = cos ах. Тогда u'*’ = ak • cos v’ = 2x, o" = 2, v"' =®lv = ... = 0. Таким образом, в формуле (1) все слагаемые, кроме трёх первых, равны нулю, и мы получаем: (uv)’501 = Xs • в” • cos (ах + 50 • j -[- • 2х • аы cos (ах + 49 • -ф 4- 50—49.2 • а48 • cos (ах 48 • = а48 [(2450 — в’х’) cos ах—100 ах • sin ах]. 2) Возвращаясь к примеру 7), 116, теперь мы можем получить общее выражение для n-й производной функции у = е0* • sin bx непосредственно по формуле Лейбница: ул>=е°*рп Ьх(ап —~ ап~г6>+ . . J + cos bx (nan~lb — --п —— ал-ай8 -ф . . 31. 3) Найдём выражение для (я 4- 1)-й производной функции у = arcsin х.
8] § 4. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ 239 Имеем, прежде всего, 1 1 1 У ..........................- = - ---- У1-х2 yi+x ут^х к что, по формуле Лейбница, ( 1 1 ¥л) ( 1 1 ( 1 yn-1) ( 1 V +1= ............- = — -...+я ------- --------- + lyi+x yi-xj lyi+xj yi-x Vyi+xj vyi-xj n(n-l)f 1 2V 1 'А n(n- 1)(и-2) f 1 yn-3)/ i V" 1'2 tyi+xj tyi~x/ 1-2-3 vyi+xj кУ1-х/ 1 Если теперь к вычислению последовательных производных от - 1 уг+х --- применить формулы, полученные в 116, 2), то придем к результату '1-х (п + 1) 1 Г(2и—1)!! п (2я-3)!!1!! л(л-1) (2л-5)!!3!! 1 2nyfT72 [ (1+х)п ~П (1 + х)"-’(1-х)+ 1-2 ‘ (1 + х)п"2(1-х)2 + ‘ ’J ’ 4) Требуется найти значения всех последовательных производных функции arctg х при х = 0. Так как у'=-----, то у'(1+х2)= 1. Возьмем л-ю производную от обеих частей 1 +х2 го равенства (пользуясь формулой Лейбница): (1 +х2)у(«+1) + 2их • /n>+n(n - 1) - у(«~1) = 0. гюжим здесь х = 0; если значения производных при х = 0 отмечать значками О зу, то получим: -п(п-1).у^~г\ При х = 0 производная 2х (1+х2)2 обращается в 0: у"0 = 0. Из найден- э соотношения ясно, что всегда у^2Л1^ = 0. Что же касается производных гтного порядка, то имеем для них рекуррентную формулу: Уо2т+1) - - (2m -1) • 2m • уо2т-1). шимая во внимание, что у^= 1, получаем отсюда: y?m+1) = (-l)m(2rn)!. Тот же результат можно было бы получить и из общей формулы примера 116. 5) То же - для функции у = arcsin х. У Казани е. Формулу Лейбница применить к соотношению; (1 - х2) у" - х • у' = 0. Ответ: Уо2т^ = О, у^т~- I2 З2 ... (2т-1)2 = [(2т- I)!!]2. Этот результат из их выражений в 3) получается не столь просто.
240 ГЛ. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [118 6) Многочлены Лежандра. В заключение остановимся на важных много- членах, носящих имя Лежандра (А. М. Legendre). Они определяются равен- ствами dn(x2-l)n Хл(х) = сп (п = 1, 2, 3, ...), ахп где постоянным коэффициентам сп придаются те или иные значения в зависимости от соображений удобства. Прежде всего убедимся в том, что многочлен Хп(х) (степени п) имеет п различ- ных вещественных корней, которые все содержатся между -1 и +1. Для простоты положим пока cn= 1. Легко видеть, что многочлен (х2-1)л = (х-1)л-(х+1)л и его л-1 последо- вательных производных обращаются в нуль при х= ±1. Тогда первая ее произ- водная, по теореме Ролля [111], будет иметь корень и между - 1 и +1; по той же теореме, вторая производная будет иметь два корня между -1 и +1, и т. д. вплоть до (л- 1)-й производной, которая, помимо корней -1 и +1, будет между ними иметь еще л -1 корней. Применив к ней еще раз теорему Ролля, придем к требуемому заключению. Сохраняя коэффициенты сп = 1, определим теперь значения многочлена Хп(х) при х = ± 1. По формуле Лейбница, рассматривая степень (х2-1)л как произведение (х+1)л на (х — 1)л, можно написать: Х„(х) = (х+1)л- dn(x-l)n Дх" </(х+1)л + С|Г-------- ах dx"-1 d"(x+l)n dxn •(х-1)л. Так как все слагаемые, начиная со второго, содержат множитель х - 1 и, следова- тельно, обращаются в 0 при х= 1, то очевидно: Хп(1) = 2п • л!. Аналогично получаем: Хп( -1) = (- 1)л 2п и!. Если в формуле, дающей общее определение многочлена Лежандра Хп(х), положить в частности 1 то получится многочлен, который чаще всего встречается; его именно мы будем впредь всегда обозначать через Рл(х). Он характеризуется тем, что в точкахх=1 и х= - 1 принимает значения Рл(1)=1, Рп(-1) = (-!)". С помощью формулы Лейбница легко установить далее, что многочлены Лежандра Хп(х) удовлетворяют следующему соотношению: (х2 - 1) Хп + 2х -Хп - л(л + 1)Хп = 0, которое играет важную роль в теории этих многочленов. В самом деле, полагая у = (х2-1)п, имеем у' = 2пх • (х2- 1)л-1, так что (х2-1) -у' = 2лх -у. Возьмем теперь (л+1)-е производные от обеих частей последнего равенства; по формуле Лейбница, (х2 - 1)у(л+2) + (л+1) 2х •у(п+1)+ ‘ 2 •Л^ = 2лх-у(л+1)+(л+1) • 2л • у(лХ Отсюда (х2 -1 )у (л+2)+2ху(л+- и(и +1 )у(л) = 0, и, по умножении на сп, получается доказываемое соотношение.
119] § 4. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ 241 119. Дифференциалы высших порядков. Обратимся теперь к диф- ференциалам высших порядков; они также определяются индуктивно. Дифференциалом второго порядка или вторым дифферен- циалом функции у=/(х) в некоторой точке называется диффе- ренциал в этой точке от ее (первого) дифференциала; в обозначениях d2y=d(dy). Дифференциалом третьего порядка или третьим дифференциалом называется дифференциал от второго диф- ференциала: d3y = d(d2y). Вообще, дифференциалом и-го порядка или п-м диф- ференциалом функции у = /(х) называется дифференциал от ее (и - 1)-го дифференциала: dny = d(d"~1y). Если пользоваться функциональным обозначением, то последова- тельные дифференциалы могут быть обозначены так: d2f{x0), d^f{x0),..., d-f(x0),..., причем получается возможность указать то частное значение х = х0, при котором дифференциалы берутся. При вычислении дифференциалов высших порядков очень важно помнить, что dx есть произвольное и независящее от х число, которое при дифференцировании по х надлежит рассматривать как постоянный множитель. В таком случае, будем иметь (все время - предполагая существование соответствующих производных): d2y = d(dy) = d(y' dx) = dy' dx = (y” • dx) • dx-у” dx2, d3y = d(d2y) = d(y” • dx2) = dy” • dx2 = (y”'dx) • dx2 = y'" • dx3 *), и t. д. Легко угадываемый общий закон dny=y('n> -dxn (2) доказывается методом математической индукции. Из него следует, что так что отныне этот символ можно рассматривать как дробь. Воспользовавшись равенством (2), легко теперь преобразовать фор- мулу Лейбница к дифференциалам. Достаточно умножить обе части ее на dxn, чтобы получить dn(uv) = C‘ndn~‘u • d‘v (d°u = и, d°v = v). i = 0 Сам Лейбниц установил свою формулу именно для дифференци- алов. *) Под dx1, dx3, ... и т. п. всегда разумеются степени от дифференциала: (dx)1, (dx)3, ... Дифференциал от степени будет обозначаться так: d(x2), d(x3), ... 16 Г. М. Фихтенгольц, т. I
242 ГЛ. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ (120 120. Нарушение инвариантности формы для дифференциалов выс- ших порядков. Вспоминая, что (первый) дифференциал функции обладает свойством инвариантности формы, естественно поставить вопрос, обладают ли подобным свойством дифференциалы высших порядков. Покажем, например, что уже второй дифференциал этим свойством не обладает. Итак, пусть y=f{x) и х=<р(/), так что у можно рассматривать как сложную функцию от t: y=f(<p(fj). Ее (первый) дифференциал по t можно написать в форме dy=yx-dx, где dx = x't-dt есть функция от Г. Вычисляем второй дифференциал по t: d2y = d(yx-dx') = dy'x-dx+yx-d(dx'). Дифференциал dy'x можно, снова пользуясь инвариантностью формы (первого) дифференциала, взять в форме dy'x=yxl>dx, так что окон- чательно =у". • dx2 + у'х • d2x, (3) в то время как при независимой переменной х второй дифференциал имел вид d2y = yx2’dx2. Конечно, выражение (3) для d2y является б о- лее общим: если, в частности, х есть независимая переменная, то d2x = 0 - и остается один лишь первый член. Возьмем пример. Пусть у = х2, так что, покуда х - независимая переменная: dy = 2х dx, d2y = 2dx2. Положим теперь x=t2; тогда у = 14, и dy = 4t3dt, d2y = 12t2dt2. Новое выражение для dy может быть получено и из старого, если туда подставить x = t2, dx = 2t dt. Иначе обстоит дело с d2y: сделав такую же подстановку, мы полу- чим 8/2 dt2 вместо 12r2 dt2. Если же продифференцировать равенство dy = 2xdx по t, считая х функцией от t, то, наподобие (3), придем к формуле d2y = 2dx2 + 2xd-x. Подставив сюда x=t2, dx = 2tdt, d2x = 2dt2, получим уже правильный результат: 12/2Л2. Итак, если х перестает быть независимой переменной, то диффе- ренциал второго порядка d2y выражается через дифференциалы х двучленной формулой (3). Для дифференциалов третьего и даль- нейших порядков число добавочных (при переходе к новой незави- симой переменной) членов еще возрастет. В соответствии с этим в выражениях высших производных у",, у"', ... через дифференциалы уже нельзя дифференциалы брать по любой переменной, но лишь по переменной х.
121] § 4. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ 243 121. Параметрическое дифференцирование. Можно, впрочем, на- писать выражения производных по х и через дифференциалы, взятые по любой переменной t, но они будут гораздо сложнее. Именно, с ч и- тая все ниже написанные дифференциалы взя- тыми по t, имеем последовательно г dv ,, (dy\' [dxj dx2 ТХ = Т-, У^= 'Г =—y-^ = - -----, x dx x \dx]_ cx rx t. e. „ dx • d-y - d'lx • dy Vv=- , --------' (5) затем, jdx • d2y - d-x dy 1 ,,, ( dx • d2y- d‘-x- dy i' _ I dxs J _ । । - - dx'-tdx d3y - d3xdy) - 3dx2d2x(dx d2y - d'-xdy) dx3 — dx и окончательно: ,,, dx(dx d-у- d3x dy')- 3d-x(dxd-y- d2xdy} Лз =-------------------------------- (6) и т. д. Формулы (5), (6), ... являются наиболее общими; если в них считать х независимой переменной, то d2x, сРх, ... обратятся в нуль - и мы вернемся к формулам (4). Полученные нами формулы для производных у по х осуществляют так называемое параметрическое дифференцирова- ние. Если х и у заданы в функции от параметра V. x=<p(t), y=y(t), то, как мы видели в 106, при известных условиях этим определяется и у как функция от х: у = /(х). При наличии последовательных произ- водных от х и у по t существуют соответствующие производные от у по х и выражаются выведенными выше формулами. Иногда удобнее иметь выражение производных у по х через про- изводные же (а не дифференциалы) от х и у по 1. Их легко получить из дифференциальных выражений, разделив числитель и знаменатель, соответственно, на dt, dt’’1, dt5, ... Таким путем придем к формулам: dy dx d2y d'-x dy , _dt _y't ,, _dt dt2 dt2 dt _х1У1г~xt-yt ' U)3 ; dt UJ 16*
244 ГЛ. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [122 аналогично: _ x^xfyt, - xt3 yt) - IxtAxty't'i - xpy't) y“ Crip и т. д. 122. Конечные разности. Пусть функция /(х) определена в некотором проме- жутке Д7 и все значения х, которые будут встречаться, считаются принадлежащими этому промежутку. Фиксировав некоторое приращение zlx переменной х (мы будем предполагать, для определенности, zlx^O, хотя ничто не мешало бы рассмат- ривать и zlx^O), положим 4f(x) =f(x+zlx) -/(х) и назовем это выражение первой разностью нашей функции. Второй разностью называется первая разность от первой разности: zl2/(x) = zl[zl/(x)] = zl/(x+ zlx) - zl/(x) = /(x+2 zlx) - 2f(x+zfx)+/(x). Высшие разности определяются индуктивно: zP/(x) = zf[zP-i/-(x)]. Впрочем, для л-й разности может быть установлена и формула zJ"/(x)= Z(-l)‘c‘nf(x+7riAx) = 1=0 П --------- п(п -1) ---- = /(х+п zlx) - —f(x+п -1 zlx) + /(х+л - 2 zlx) -...+(- 1)п/(х), выражающая эту разность непосредственно через значения самой функции /(х) в равноотстоящих точках х, x+zlx, x+2z1x, ..., x+nzlx. Эта формула легко доказывается по методу математической индукции, что может быть предоставлено читателю. Сопоставим теперь эти конечные разности с производными и дифференциа- лами. Предположим, что функция/(х) имеет л-1 непрерывных производных /'(х), /"(х)... в замкнутом промежутке [х0, х0+л zlx] и конечную л-ю производную f<nXx), по крайней мере, в открытом промежутке (х0, х0+л zlx). Тогда имеет место формула Лп /(х0) = f<nX£n) • zlxn, где х0 - in *= х0 + л zlx. (7) При л = 1 дело сводится к формуле конечных приращений, которая является простейшим частным случаем формулы (7). Намереваясь провести доказательство нашего утверждения по методу математической индукции, мы допустим справед- ливость измененной формулы (7), получаемой при замене п на л-1, разумеется, при соответственно измененных предположениях, и докажем (7), при сделанных предположениях. Из них следует, что для функции z)/(x)=/(x+dx)-/(x) в проме- жутке [х0, Хо+л-1 zlx] с избытком выполняются условия применимости изменен- ной формулы (7), и мы можем написать zl"-’[z!/(x0)] = zf"/(x0) = [/<n-O(^_1+zlx) - /("-’X^-j)] /lx"'1, (8)
122] § 4. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ 245 где Xo^Sn^^Xo+п-1/1х. Применяя к правой части этого равенства формулу конечных приращений *), получим непосредственно формулу (7), причем хи^п-1^п^п-1+Ах-= х.+п Ах. Заметим, что, если производная /(п)(х) существует также в точке х0 и притом непрерывна в этой точке, то из соотношения (7) при Ах-* О (тогда£п-х0) следует, что /<")(x0>lim^. (9) их->о Ахп Впрочем, эта интересная формула, устанавливающая возможность получения и-й производной с помощью лишь одного предельного перехода, справед- лива при единственном предположении, что эта производная существует именно в точке х.. Это значит, что в некоторой окрестности тонких. суще- ствуют производные Г(х), /"(х)./(«-0(х) и, следовательно, при достаточно малом zlx, может быть применена формула (8). Ввиду существования производной /<")(х0), воспользовавшись фор- мулой (2) п° 96, можем написать /("-’Ч^-,)- /("-OCX.) = /<">(х0) • (Sn-i -х.)+а - - X.) и /("-^(f^j + zlx)- /<"-1)(х.) = /<")(х0) • (4„_x+z1x-xo)+0 • (^-hzlx-x.), где а и fl зависят от zlx и вместе с ним стремятся к нулю. Отсюда и из (8) выте- кает **): /l"/(x.) = [/(">(x0)+y].zlx", где у - новая бесконечная малая. Наконец, деля это равенство почленно на zlx" и переходя к пределу при Ах~О, придем к формуле (9). Подчеркнем, что она имеет место лишь в предположении, что существует производная /("Хх0). Предел справа может существовать и тогда, когда этой производной нет ***). Рассмотрим, например, функцию, опре- деленную так: /(x) = x3-sin— (х^О), /(0) = 0, х взяв х. = 0. Для нее существует первая производная /'(х) = Зх2 sin-х • cos — (х 0), /'(0) = 0, х х но нет в точке 0 второй производной, ибо отношение /z(0+zlx)-/'(0) zlx 3 zlx2- sin-----zlx • cos — zlx zlx .11 ------------------------------------------------------------------ 3 zlx • sin-cos — zlx---------------------------------------------zlx zlx *) На что мы имеем право, так как функция /(п-11(х) непрерывна в про- межутке [fn-i.^n-x+^x], а внутри него имеет конечную производную/(")(х). **) Учитывая, что 0<^п_1-х0<(л-1) Zlx (при zlx=-0). ***) Так что формула (9) отнюдь не дает нового определения самого понятия и-й производной, равносильного старому!
246 ГЛ. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [123 при Дх-*0 предела не имеет. В то же время выражение 8 Дх3 sin-2 Дх3 • sin — Д2/(0) /(0+2 Дх)-2/(0+Дх) + /(О) 2Ах Дх Дх2 Дх2 Дх2 = 8 Дх • sin---2 Дх • sin------ 0. 2 Дх Дх § 5. Формула Тейлора 123. Формула Тейлора для многочлена. Если р(х) есть целый много- член степени п: р(х) = а0 + arx + я2х2 + а3х:1 + ... + апхп, (1) то, последовательно дифференцируя его п раз: р'(х) = аг + 2 • а2х + 3 • а3х2 + ...+«• апхп~\ р"(х) = 1 • 2 • а2 + 2 • 3 • я3х + ... + (п - 1)и • апхп~2, р"'(х) = 1 • 2 • 3 • я3 + ...+(«-2)(п- 1)л• anxn~s, р<«)(х) =1-2-3 ... п-ап и полагая во всех этих формулах х = 0, найдем выражения ко- эффициентов многочлена через значения самого многочлена и его производных при х = 0 р'(0) р"(0) ~ Р(Р\ J, , а2 — Ji > п -/’"'(О) „ _>п)«» Оз- 3, я„- я, . Подставим эти значения коэффициентов в (1): Эта формула отличается от (1) записью коэффициентов. Вместо того чтобы разлагать многочлен по степеням х, можно было бы взять его разложение по степеням х-х0, где х0 есть некото- рое постоянное частное значение х: р(х)=Ао + Л(х - х0)+Л2(х - х0)2 + +А3(х - х0)3 + .., + Ап(х - х0)п. (3)
123] § 5. ФОРМУЛА ТЕЙЛОРА 247 Полагая х-х0=£, р(х)=р(х0+1-) = Р(£), для коэффициентов много- члена P(g)=A0+A1S+A2?+A3? + ... +Ап? имеем, по доказанному, выражения: А-Р(О), А А _ *">«)) Лз- л ....... лп~ п1 Но Ptf)=p(x0+g), P\^)=p'(x0+S), Р”(^)=р"(х0+^, ДО) =р(х0), Р'(0) =Р'(х0), Р"(0) =р"(х0), ... Л0=р(х0), Лх=^, Л2=^, j _р'"(хо) . _р(п)(х0) лз- 3! ... лп~ ,) (4) т. е. коэффициенты разложения (3) оказались вы- раженными через значения самого многочлена и его производных при х=х0. Подставим в (3) выражения (4): р(х) =Р(ХО) +^-jp (х - х0) (х - х0)2 + + (х _ ХО)3 + ... (X - х0)". (5) Формула (5), так же как и ее частный (при хо=О) случай (2), назы- вается формулой Тейлора (В. Taylor) *). Известно, какие важ- ные применения она имеет в алгебре. Сделаем (полезное для дальнейшего) очевидное замечание, что если многочлен р(х) представлен в виде Х*) = с0 + ]7 (х-Хо)+% (х-х0)2+у*(х-х0)3+ ... + % (х-х0)п, то необходимо Р(х0) = с0, р'(х0) = q, р"(х0) = с2, ..., р(п)(х0) = сп. *) Впрочем, формулу (2) часто называют формулой Маклорена (С. Мас- lawin).
248 гл. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ (124 124. Разложение произвольной функции; дополнительный член в форме Пеано. Обратимся теперь к рассмотрению произвольной функции f(x), вообще не являющейся целым многочленом. Предполо- жим, что для нее в некоторой точке х0 существуют производные всех порядков до я-го включительно. Это значит, точнее говоря, что функ- ция определена и имеет производные всех порядков до (я - 1)-го вклю- чительно: /'(х), /"(х), /'"(х), ..., f^(x) в некотором промежутке [а, 6], содержащем точку х0, и, кроме того, имеет производную и-го порядка /(п)(х0) в самой точке х0*). Тогда, по образцу (5), и для функции f(x) может быть составлен много- член р(х) = /(ХО) +-ф (х - х0) (X - хо)2 I . . . ...^(х-х,)». (6) Согласно предшествующему замечанию, этот многочлен и его производные (дои-йвключительно)в точке х0 имеют те же значения, что и функция /(х) и ее производ- н ы е. Но на этот раз, если только /(х) не есть целый многочлен и-й степени, уже нельзя утверждать равенства /(х)=р(х). Многочлен р(х) дает лишь некоторое приближение функции /(х). Поэтому особый интерес приобретает изучение разности т(х) = /(х)-р(х). (7) Установим, прежде всего, что при х—х0 эта разность представ- ляет собой бесконечно малую порядка выше п-го (по сравнению с х-х0): г(х) = о((х-хо)п). (8) По свойству многочлена р(х), для функции г(х), очевидно, будут иметь место равенства '(Хо) = г'(х0) = г"(х0) = ... = г(п)(х0) = 0. (9) Мы сейчас установим общее утверждение: если для какой- либо функции г(х), имеющей в точке х0 производные до п-го по- рядка включительно, выполняются условия (9), то имеет место соот- ношение (8). Доказательство проведем по методу математической индукции. При п = 1 это утверждение имеет вид: если функция г(х), имеющая *) Если точка х0 является одним из концов промежутка [а, 6], то, говоря о производных в этой точке, мы имеем в виду односторонние производные.
124] § 5. ФОРМУЛА ТЕЙЛОРА 249 в точке х0 производную (первого порядка), удовлетворяет условиям г(хо) = г'(хо) = О, то г(х) = о(х~х0). Его справедливость проверяется непосредственно: lim =-^ = lim ^^=г'(хо) = О. Y_Y X-XQ „ „ X~Xq 4 U/ X-*-AO A-*-AO Предположим теперь, что сформулированное выше утвер- ждение справедливо для какого-либо иэ--1, и докажем, что оно остается верным и при замене п на п + 1, т. е. что: если для какой- либо функции г(х), имеющей в точке х0 производные до (п + 1)-го порядка включительно, выполняются условия г(х0) = г'(х0) = г"(х0) = ... = гп(х0) = г<п+1\х0) = 0, (9*) то г(х) = о((х-х^п+г). (8*) Из (9*) усматриваем, что функция г'(х) удовлетворяет условиям типа (9), а значит для нее по предположенному уже имеем: г'(х) = о((х-х0)п). Но, по формуле конечных приращений [112], г(х) = г(х) - г(х0) = г’(с) • (х - х0), где с содержится между х0 и х; так как |с-х0| < |х-х0|, то г'(с) = о((с - х0)п) = о((х - х0)п), и мы окончательно приходим к (8*), что и требовалось доказать. Таким образом, наше утверждение оправдано для любого нату- рального п, и для разности (7) действительно выполняется соотноше- ние (8). Принимая во внимание (6), мы получаем формулу /(х) = f(x0) (X - х0) (х - Х0)3 + . . . • • (X - х0)п + о((х - х0)"), (10) которая от формулы (5) для многочлена разнится наличием допол- нительного члена (8). В указанной форме дополнительный член был дан Пеано (G. Peano). Формула (10) и называется фор- мулой Тейлора с дополнительным членом в форме Пеано. Доказанная формула является естественным обобщением формулы (3) п° 96, которую можно написать так: /(х) ~ /(х0) + /'(х0)(х - х0) + о(х - х0);
250 ГЛ. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [124 она отвечает и = 1. Там функция /(х), с точностью до бесконечно малой порядка выше первого, представлялась в виде линейной функции, здесь же мы представляем ее целым многочленом и-й степени, но уже с точностью до бесконечно малой порядка выше п-го. Легко показать, что такое представление функции /(х) единственно, т. е. что, если имеем одновременно вблизи х0 /(х) = Ао + А^х - х0) + А2(х - х0)2 + ... + Ап(х - х0)" + о((х - х0)") и /(х) = А о + А&с - х0) + А 2<х - х0)2 + ... + А '(х - х0)" + о((х - x0)"), то необходимо А^^А^, ...,Ап=Ап. Действительно, из тождества Ао+Аг(х - х0)+А2(х - х0)2 + ... + Ап(х - х0)п = = А'о + А1(х - хо) + А'г(х - *о)2 + • • + А'п(.х ~ х0)п + °((х “ хо)п) при х—х0 сразу получаем АО=А'О. Уничтожив эти члены и деля их на х-х0, получим: Я1+Л2(х-х0)+ ... +Ап(х - хо)<"-О= =A'i+А&х - х0) + ... + А '(х - Хо)"-1 + о((х - Хо)""1), откуда, аналогично, Аг=А{, и т. д. Иногда удобно формулу (10) применять в другой форме. Допол- нительный член г(х) можно представить так: г(х) = ^(х-хо)п, где а зависит от х и стремится к 0 вместе с х-х0. Подставляя это выражение, получим /W=/(XO)+^ (х-х0)+^ (х-х0)2+ ... +в^(х-х0)". (Юа) Далее, перенося в формуле (10) /(х0) налево и полагая х-х0=Дх, можно переписать ее в виде 4/Vo) = /'(xoWx+ /"(*<})• 4*2 + , . +^/(">(х0)-Лл" + о(Дх"). (106)
125] § 5. ФОРМУЛА ТЕЙЛОРА 251 В этой форме она еще ближе к формуле (3) п° 96: zf/(x0) = /'(*о) ’ ^х + o(z1x). Последняя выделяет лишь один главный член из бесконечно малого приращения функции zl/(x0) - считая, как всегда, Zlx за основную бесконечно малую, в то время как в формуле (106) выписаны члены всех порядков до n-го включительно, причем все они являются про- стейшими бесконечно малыми в смысле п° 63. • С точностью до дополнительного члена, таким образом, при- ращение функции разложено по степеням при- ращения независимой переменной. Наконец, вспоминая, что /'(х0) • Zlx = #(х0), /"(х0) • Zlx2 = d2f(x0), ..., /(п)(х0) • Лхп = t/'7(x0), мы можем переписать (106) в такой форме: 4У(х0) = df(х^ + ^2/(х0) + • • • + dnfW + о(Лхп). Отсюда видим, что (при Zfx—O) последовательные дифференциалы представляют собой, с точностью до факториалов в знаменателе, именно простейшие бесконечно малые члены соответственных поряд- ков в разложении бесконечно малого приращения функции. 125. Примеры. Всего проще выглядит формула Тейлора, если хо = 0*): /(х) =/(0) х х2 + ... + х- + о(х”). (11) К этому частному случаю всегда можно свести дело, взяв х-х0 за новую независимую переменную. Рассмотрим в виде примера некоторые конкретные разложения по этой формуле для элементарных функций. 1) Пусть /(х) = ех; тогда /(/t\x) = ex при любом к= 1, 2, 3, ... Так как в этом случае /(0) = 1, /w(0) = l, то, по формуле (11), ex = 1+^+|r+...+g + o(x7. 2) Если Дх) = sin х, то /(/Дх) = sin ^x + fcj) , так что /(0) = 0, /(2n!)(0)=sin тил = 0, y(2'n-iJ(0)=sin рил-|| =(-1)™-1 (ти = 1,2, 3, ...). ♦) И эту формулу связывают с именем Маклорена (см, сноску на стр. 247),
252 ГЛ. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [125 Поэтому, положив в формуле (11) n=2m, имеем уЗ уб у2Л1 —1 sinX = X-3!+5!--- - + (“ 1)m“ W7!)! 3) Аналогично, при /(x) = cosx: fW(x) = cos (х + к • ; ДО) = 1, Д2т\0) = ( - 1)т, /<2'"-1>(0) = 0 (т = 1,2, 3, ...). Таким образом (если взять п = 2т + 1): у 2 у 4 у2Ш cos х = 1 - 2! + s -...+(-l)m + o(*2m+1). 4) Рассмотрим теперь степенную функцию хт, где т - не нату- ральное число и не нуль. В этом случае при х-*0 либо сама функ- ция (если т<0), либо ее производные (начиная с некоторого порядка, при п>т) бесконечно возрастают. Следовательно, здесь уже нельзя брать хо = О. Возьмем х0= 1, т. е. станем разлагать хт по степеням х-1. Впро- чем, как уже упоминалось, можно ввести в качестве новой переменной х-1; мы ее по-прежнему будем обозначать через х, и станем раз- лагать функцию (1+х)т по степеням х. Как мы знаем [И6, 2)], ДДх) = m(m -1) ... (m - к + 1)(1 + х)т-", так что ДО) = 1, /<л>(0) = m(m - 1) ... (m - к +1). Разложение имеет вид (1 + x)m = 1 + mx + x+ ’ ‘ ’ + --1 2 n------~ x + °(x В частности, например, при п = 2 и т= -1,у, будем иметь j-i- = 1 - х + х2 + о(х2), 1+х v ’ /1+х=1 + |х-|х2+ о(х2), 2, о - 1 =1 - х X + X2 + о(х2). yi+x 2 ° Первое из этих разложений очень легко получается элементарно - д^З дополнительный член здесь просто равен . Второе же и третье Потребовали бы более длинных выкладок [ср. 63].
125] § 5. ФОРМУЛА ТЕЙЛОРА 253 5) Если перейти к логарифмической функции 1пх, которая стре- мится к - оо при х -* + 0, то, как и в предыдущем примере, мы пред- почтем рассматривать функцию /(x) = ln (1 +х) и разлагать ее по сте- пеням х. Тогда [116, 3)] (-1М-1)! *) (1+х)* Отсюда /(0) = 0, /W(0) = (-iy-1(fc-l)!. In (1 + х) = х -f. + ( -l)n-1+ o(x*). 6) Пусть теперь f(x) = arctg x. Мы имели в 118, 4) значения ее про- изводных при х = 0: = 0, /2п'-1>(0) = ( - 1)от- \2т - 2)!, так что ее разложение представится в виде -у-3 у5 -у2 т •“ 1 arctgx = x-y+y- ... +(-l)m”1yyy+ o(x2m). 7) Для функции /(x) = tgx закон образования коэффициентов в формуле Тейлора сложен. Тем не менее, несколько первых членов ее написать нетрудно. Так как, например, /'W = -4-, /"(х) = 2-^, /"'( COS2X v ' COS2X eivz \ о 2+ sin2 x fiV(x) = 8 sin x l+2sin2x cos’x cos6 то Л0)=0, /'(0) = 1, /"(0)=0, так что „з /'"(0) = 2, /IV(0) = 0, tg X = X + у + о(х4). Пользуясь известными разложениями, можно, уже не вычисляя производных, непосредственно писать разложения и для более сложных функций. Например, предыдущая формула могла бы быть получена из разложений для sin х и cos х. Приведем новые примеры; при этом все степени х, до назначенной включительно, мы будем точно учитывать, а более высокие степени (не выписывая их) будем сразу включать в дополнительный член. 8) Написать разложение функции esin х до х3. В силу 1), но, по 2), так что 1 1 esinx= i+sin х-|— sin2 хЧ— sin3 х+о(х3) **); 2 б 1 sinx = x----х3+о(х4), 6 esin х = 1 -|- х-х3 Ч—- х2Ч— х3+о(х3). 16)2 6 *) Под 0! мы, как всегда, разумеем 1. ** ) Следовало бы написать o(sin3x), но, ввиду эквивалентности бесконечно малых х и sin х, это все равно, что о(х3). Л*) =
254 ГЛ. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [126 Член с х3 исчезает и, окончательно, 1 esin х = 1 + х 4— х2 4- о(х3). 2 Аналогично, 1 1 etgx=l+x+ — х2+—х3+о(х3). 9) Написать разложение функции In cos х до члена с х6. Согласно 5), 1" х= 1 1 = 1п [1 + (cos х-1)] = (cos х- I)-— (COSX- 1)2 + у (cosx- l)3+o(xe) *). При этом, ввиду 3), 1 1 1 cos х - 1 =-х2 4— х4---х6 -I- о(х7); 2 24 720 отсюда ( 1 1 131/1 131/13 lncosx=-----Х24--X4----х6---— X4-----Xе 4-----Xе +о(хе) I 2 24 720 7 2 1 4 24 J 3 ( 8 J или - после приведения - 1 1 1 In cos х =----X2----X4---х6+о(х6). 2 12 45 Аналогично, , ,,____, 1 3 In (х+ у 14-х2) = х-х34— х54-о(х5) 6 40 sin х 1 1 1 In ------------х2------х4-------х64-о(х6). х 6 180 2835 Все эти разложения, полученные без непосредственного использования формулы Тейлора, могли бы, конечно, быть получены и по этой формуле, и притом - в точности с теми же коэффициентами, ввиду установленной выше единственности подобного разложения функции. Замечание. Так как рассмотренные здесь функции имели в окрестности точки х=0 производные всех порядков, то мы ничем не были стеснены в выборе числа п в формуле (11), т. е. могли про- должать разложения этих функций вплоть до любой степени х. 126. Другие формы дополнительного члена. Формула Тейлора с дополнительным членом в форме Пеано имеет многообразные приложения (см. следующую главу); но все они, так сказать, «локаль- ного» характера, т. е. относятся к самой точке х0. Если в них иной раз и идет речь о других значениях х, то эти значения предполагаются *) Так как 1-cosx одного порядка с х2 [61], то о ((cos х-I)3) в то же время есть о(х6).
1261 § 5. ФОРМУЛА ТЕЙЛОРА 155 «достаточно близкими» к х0 и наперед не могут быть взяты по произ- волу. Между тем естественно попытаться использовать многочлен р(х) как приближение к функции f(x), с помощью которого она и может быть вычислена с нужной степенью точности. Для того чтобы многочлен р(х) был пригоден для этой роли, не- обходимо иметь возможность оценивать разность (7) для дан- ного л. В этом случае форма Пеано, характеризующая лишь стремление г(х) к 0 при х—О, служить не может. Она не позволяет устанавливать для каких значений х многочлен р(х) воспроизводит функцию f(x) с наперед указанной степенью точности; ничего не гово- рит она также о том, как можно было бы - при данном х - воз- действовать на величину дополнительного члена г(х) = гп(х) за счет увеличения л*), и т. д. Поэтому мы обратимся к выводу других форм дополнитель- ного члена гп(х). Для определенности будем рассматривать промежу- ток [х0, х0 + Я] (Я=»0) вправо от точки х0 и будем считать функцию f (х) определенной в этом промежутке; случай, когда функция задана в промежутке [х0-//, х0], исчерпывается аналогично. На этот раз сделаем более тяжелые предположения, именно, до- пустим, что во всем промежутке [х0, х0 + Н] существуют и непрерывны первые л производных: f"(x), f"'(x),..., _/™(х) и кроме того, по крайней мере, в открытом промежутке (х0, х0 + Н) существует и конечна (л+1)-я производная /(п+1)(х). Отметим, что, ввиду (6) и (7), гп(х) = /(х) -/(х0) - (X - х0) (х - хоу - . . . . _е^)(х_Хо)п. (12) Фиксируем теперь любое значение х из промежутка [х0, х0 + Я], и по образцу правой части формулы (12), заменяя постоянное чи- сло х0 на переменную z, составим новую, вспомогательную функцию: g9(z) =/(х) - /(z) -f-~- (х - z) (х - z)2 - ... (х - z)n, причем независимую переменную z считаем изменяющейся в проме- жутке [х0, х]. В этом промежутке функция <p(z) непрерывна и прини- мает на концах его значения [см. (12)]: <р(Хо) = гп(х), <Дх)=0. *) Нужно помнить, что дополнительный член г(х) зависит, вообще говоря, от п, для подчеркивания этого обстоятельства мы и будем впредь обозначать его через гп(х).
256 ГЛ. Ш. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [126 Кроме того, в промежутке (х0, х) существует производная = -/'(z) - (х - z) - /'(z) j - (x - z)2 -f-Q (x - z) j - или, после упрощения, y'(z)= -/("^,1)(z)(x-z)n. Возьмем теперь произвольную функцию i/>(z), непрерывную в про- межутке [х0,х] и имеющую не обращающуюся в нуль производную по крайней мере, в открытом промежутке (х0, х) К функциям <p(z) и y(z) применим формулу Коши [114]: у(х)-у(х0) у'(с) Ч>(х)-у>(Хо) v'(.c)’ где х0<с<х или с = х0 + 0(х - х0) (0-^0-=-1). Так как <р(х) = 0, <р(х0) = гп(х), ср'(с) = - /("^,1)(с) (х - с)п, то Г (х) - vW-yfa). /(п+1)<с) (х _ С)П rnW ~ у,'(c) п! С) Теперь, если подставлять вместо ip(z) любые удовлетворяющие поставленным условиям функции, мы получим различные формы до- полнительного члена гп(х). Пусть y(z) = (x-z)₽, где р>0. Имеем: y>'(z) = -р(х - z)p~ 1 (х0 < z -= х). Очевидно, эта функция удовлетворяет поставленным требованиям. Поэтому Так как с = х0 + 0(х-х0), то х-с = х-х0-0(х-х0) = (1 -0)(х-х0), и окончательно: Гп(х) = • (1 - 0)"+1-Р(х - Х0)п+Т (0 < е -= 1).
127) S 5. ФОРМУЛА ТЕЙЛОРА 257 Это выражение называется дополнительным членом в форме Шлемильха и Роша (О. Schlomilch - Roche). Из него, придавая р конкретные значения, можно получать более частные формы дополнительного члена. Положив р=л+1, получим дополнительный член в форме Лагранжа: Гп(*) (* ~ *o)n+1 (x0§cSx), который выглядит особенно просто. Он напоминает следующий оче- редной член формулы Тейлора, лишь вместо того, чтобы вы- числить (л+ 1)-ю производную в точке х0, эту производную берут для некоторого среднего (между х0 и х) значения с. Формула Тейлора с дополнительным членом в форме Ла- г р а н ж а, таким образом, имеет вид Л«)-/М+пг («-».)+ (13) (х0$с§х). Если перенести в ней член /(х0) налево, то легко усмотреть в ней прямое обобщение формулы конечных приращений [112], которую можно написать так: f(x) ~f(x0) =f'(c) • (X - Xq). Хотя охотнее всего пользуются дополнительным членом именно в форме Лагранжа, ввиду ее простоты, все же в отдельных слу- чаях эта форма оказывается непригодной для оценки дополнительного члена, и приходится прибегать к другим формам, менее простым. Из них упомянем здесь о дополнительном члене в форме Коши, который получается из общей формы Шлемильха и Роша при р = 1: Г„(Л) = + (1 _ 0)п(х _ Хо)п+1. 127. Приближенные формулы. Положим, для простоты, в формуле (13) хо = О, а вместо с станем писать 0х, где 0-=6-=1: Лх)-Л0)+®х+вх»+...+^х.+/^®>^.. (14) Если отбросить здесь дополнительный член, то получится прибли- женная формула: г/ 3 У/ЛЧ /'(0) /"(0) 2 /(п)(0) „ /(х) =/(0) + 4г X +<-^~ х2 + ... + хп, 17 Г. М. Фихтенгольц, т. I
258 ГЛ. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [127 заменяющая функцию сложной природы целым многочленом. Но на этот раз мы в состоянии оценить погрешность этой фор- мулы, ибо она как раз и равна (по абсолютной величине) отбро- шенному члену. Например, если (л+1)-я производная (по крайней мере, при изменении аргумента между 0 и х) ограничена по абсолют- ной величине числом М, то Для примеров обратимся к элементарным функциям. Нам нет на- добности повторять выкладки п° 125, лишь дополнительный член мы будем писать в новой форме. 1) Положим /(х) = ех. Приближенная формула: х". и! ’ Y , X X ^=1 + П + 2!+-- так как дополнительный член здесь Гл(х) = (^1)!Х -л+1 то, например, при х>0 погрешность оценивается так: («+!)! £ и!’ В частности, если х=1, . , 1 1 е~1 + п + 2!+ • • • + Подобной формулой мы уже пользовались в 37 для приближен- ного вычисления числа е, но оценка дополнительного члена, получен- ная другим путем, там была более точной. 2) Взяв /(x)=sinx, получим -%-3 у5 у2ГП~"1 Sin Х==Х - ¥+ 5, -...+(-I)"1-1 • В этом случае дополнительный член: sin 0x+(2m+l) — х = (2т+1)!----+1 = ( - Dm cos 0х • , и погрешность оценивается легко:
127J § 5. ФОРМУЛА ТЕЙЛОРА 259 В частности, если мы довольствуемся одним членом и полагаем sin х=х, то для того, чтобы погрешность была меньше, скажем, чем 0,001, достаточно взять (считая х>0) у-З ^-<0,001 6 или х<0,1817, что примерно равно 10°. При пользовании двучленной формулой х3 Sin Х = Х , о для достижения той же точности уже достаточно взять или х< 0,6544(^37°,5); если же ограничиться углами х< 0,4129 (=23°,5), то погрешность будет даже <0,0001, и т. д. Мы видим, что с увеличением числа членов многочлена Тейлора он с все большей точностью и на большем протяжении воспроизводит исходную функцию. Этот факт наглядно иллюстрируется рис. 52а, где наряду с графиком функции у=sin х представлены графики много- членов х$ х5 у=х, у = х--^, у = Х-~+ , и т. д. 6 6 120 3) Аналогично, для /(x) = cosx имеем у2 у‘4 cosx^l-2F+¥-...+(-ir^, причем л у2/П4-2 Г2т+1(%) = ( - l)m + 1 COS BX -(2w+2), , так что I г V |x|2m+2 /2"'+1(х)И (2w + 2)! • Например, для формулы • 1 х* COS Х= 1 - у погрешность 17*
260 ГЛ. Ш. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [127 и наверное будет, скажем, <0,0001 для х<0,2213 (=13°), и т. п. На рис. 526 представлены для сравнения графики функции у=cos х и гра- фики последовательных многочленов 7=1, J=l-T, 7=1-у+24 ит. д. Мы обращаем внимание читателя на существенное продвижение вперед по сравнению с формулами пп° 62, 63, 107: теперь мы умеем устанавливать границы погрешности и располагаем формулами любой точности. Укажем еще, что формула Тейлора является источником для построения приближенных формул совершенно иного типа. 4) В качестве первого примера остановимся на формуле Гюйгенса (Ch. Huygens) для приближенного спрямления дуги окружности, малой по сравнению с радиусом.
127] § 5. ФОРМУЛА ТЕЙЛОРА 261 Пусть s - длина дуги, d - соответствующая ей хорда, ай- хорда, соответ- ствующая половине дуги (рис. 53а). Поставим себе задачей представить s в о з- можно точнее приближенной формулой вида s=Ad+ В8, где А, В - коэф- фициенты, подлежащие определению. Рис. 53. Если г - радиус окружности, а 2х - центральный угол, соответствующий дуге s, то имеем ( 1 0' ' <Z=2r-sinx=2r х----х3Ч----х5 I 6 120 , (0-0'-= 1) и, аналогично, заменяя х на — 2 х (1 1 0" ) <5 = 2rsin — = 2г — х-х3-!---х3 (О-0"-1). 2 ( 2 48 3840 ) Отсюда г( 1 ) (1 1 ) /0' 0" ) 1 ^+В«-24[Л+-В]„.+[-Л+—1>].^. в то время как s=2гх. Естественно выбрать Ап В так, чтобы было а+\в^ ибо тогда разница между левой и правой частями рассматриваемой формулы будет лишь в членах, содержащих х3. Для коэффициентов А и В получаем значения 1 8 А= у, и формула принимает вид 8<5-rf . 28-d s=—— = 28+———. 3 3 Ее погрешность А, как легко видеть, оценивается так: Xе |J| -= г---. 1 180
262 ГЛ. 111. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [127 Например, при центральном угле в 30°, т. е. х = —, имеем, согласно этой оценке, |Л| -= г 0,000007; в действительности s= г-0,523599 ..., а по формуле Гюйгенса получается s=г 0,523593. - -, так что расхождение не превосходит установленной границы. 5) Для той же цели П. Л. Чебышев дал следующее правило: дуга прибли- женно равна сумме равных сторон равнобедренного треугольника, построенного 1?4 на хорде и имеющего высотой I/ у стрелки (рис. 536). Г 4 мы действительно получаем - в некотором смысле - наилучшее приближение. Как мы видели только что, 1 ( 1 е1 i — d=r-sinx=r х-----------х3+—х5 (0-=ех-=1); 2 I 6 120 J аналогично, /1 02 h=yf= yr(l - cos х) = у г I — х2 - — (О-02-1). Обозначая через з* сумму сторон равнобедренного треугольника, о которой упоми- нается в правиле Чебышёва, имеем 1/fl V ]/{ 1 0i )2 (1 02 )2 s* = 2 / -rf + h2=2rx / 1--х2+—^-х4 +у2 -х-^х3" V 12 I ]1 I 6 120 I 12 24 ) х2 + ох4+fex®+ех3 Теперь, именно для того, чтобы уничтожить под корнем член с х2, положим его 1/"4 коэффициент равным 0, откуда и находим у = / —! Для оценки погрешности перепишем выражение для з* в виде s* = 2гх у 1 +Ах4, (15) причем выражение А окажется содержащим вторую и четвертую степени х. Пред- л полагая х^у, будем иметь: х2-=2,5, х4-=6,5, а тогда для А получится оценка |Л| -=0,06, так что |Л[х4-=0,4. Обозначив для удобства Лх4 через у, по формуле конечных приращений [112] будем иметь угмя ^yi+?=i+ ----- (o<0-=D. 2уГ+0у Последняя дробь оценивается так: I у 1г1 _ И к4 0,06x4-1 01х4, Iгуг+0у гу’ГлЯ 2yi-|л|х4 губ/i 2
128] § 6. ИНТЕРПОЛИРОВАНИЕ 263 Сопоставляя выражение (15) для s* с только что полученными результатами ви- дим, что s* = s+q, где |@|<0,1гх5. Порядок погрешности тот же, что и в формуле Гюйгенса. Мы вернемся к формуле Тейлора с дополнительным членом в главе XI второго тома, посвященной бесконечным рядам; там эта формула будет играть весьма важную роль. § 6. Интерполирование 128. Простейшая задача интерполирования. Формула Лагранжа. Представим себе, что для некоторой функции /(х), определенной в промежутке [а, Ь}, вычислены т +1 ее значений в точках х0, хг, ..., хт промежутка: f^,f(x^,...,f(xm), (1) и требуется по этим значениям вычислить значение Дх) при каком-либо новом значении х. В этом и состоит простейшая задача интерполирования. Конечно, в такой постановке вопроса содержится много неопределен- ного. Обычно задачу понимают так: ищется целый многочлен Дх) наинизшей степени, который в заданных точках х( 0=0,1, ...,т), называемых узлами интерполирования, принимает те же значения Дх,) что и функция Дх), и приближенно полагают для любого х из [а, й]: Лх) = Цх). (2) Подобное приближенное равенство называется интерполяционной фор- мулой. Итак, надлежит прежде всего найти интерполяционную формулу, а затем - при определенных предположениях относительно функции Дх) - оценить погрешность приближенной формулы (2). Для разыскания многочлена Дх), удовлетворяющего условиям ОД=Дхг) 0=0,1, ...,т), (3) удобно ввести многочлены /и-й степени I Д) = (*-*<>)• • •(x-xfc_1)(x-xfc+1). -(Х-Хпд 7 (хк-х0)• • • (х*-Xk-i)(Xk-хк+1)...(хк-Хт) ’ (к = 0, 1, ..., т), которые, соответственно значку, принимают значение 1 при х-хк и обращаются в 0 при х = х,, если i^k. Теперь ясно, что многочлен т Цх) = 2Яхк)1к(х) (4) А=0 удовлетворяет всем условиям (3). Степень этого многочлена не выше
264 ГЛ. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [129 т и стало быть условиями (3) он определяется однозначно, его назы- вают интерполяционным многочленом Лагранжа, а приближен- ное равенство (2) - интерполяционной формулой Лагранжа. Заметим, что многочлен /А(х) можно написать более сжато, если ввести выражение со(х) = (х - Хо)(х - xj ... (х - хт), обращающееся в 0 как раз в узлах интерполирования х0, х1; ..., хт. Именно, очевидно, (х - х0) • • • (* - Хк-1)(Х - ХА+1) ... (х - хт) = (х # хА), Л — A/f а (Xfc — Хо) . . . (Xfc — 1)(%/с — ^А4-1) . . . (Xfc ~ Хт) == х-х»*~хЛ Таким образом, = lim^Zafa)=a/(xft)- x-xt х хк 'кДл - Xfr) 129. Дополнительный член формулы Лагранжа. Обратимся теперь к оценке разности/(х)-L(x), где хесть любое фиксированное значение в промежутке [а, Ь], отличное от узлов интерполирования. Предположим, что функция f(z) в этом промежутке имеет произ- водные всех порядков до (т + 1)-го включительно. Какова бы ни была постоянная К, функция <p(z)=f(z)-L(z)-K’a>{z) тоже имеет т+1 производных и к тому же обращается в 0 в узлах xz (1=0,1, ..., т). Мы выберем теперь постоянную К так, чтобы и при z = x было <р(х) = 0, т. е. положим со(х) ' (так как х#х(, то ю(х)#0). По теореме Ролля [111] в т + 1 про- межутках между т + 2 корнями х, х0,хх, ...,хт функции <p(z) най- дется т+1 различных корней ее производной <p'(z). Применяя снова теорему Ролля к функции <p'(z) и к и промежуткам между ее т +1 корнями, установим существование т различных корней второй про- изводной и т. д. Продолжая это рассуждение, на (т + 1)-м его шаге придем к существованию корня 5 (ти + 1)-й производной <fl”+1\z), так что 9Xm+D(|) = 0 (а^-Л)). (6)
1301 § 6. ИНТЕРПОЛИРОВАНИЕ 265 Но 7/m+1)(z) = 0, ибо степень многочлена L(z) не выше m, a co(m+1\z)= = (т +1)! Учитывая определение вспомогательной функции <p(z), имеем g9(m+1)(z)=/(m+1)(z)-A’«(»l+ 1)!, так что из (6) получается, что /(m+Dtf) (т+1)! ' Окончательно, из (5) находим: /(х) = Цх)+^в£о(х) (а^Ь). (7) Это - интерполяционная формула Лагранжа с дополнительным членом. В отличие от (2), она является точной! Замечание. Если в промежутке [а, Л] max =Mn+i<oo, то, так как в этом промежутке |ct>(z)[=s(Z>-a)m+1, получаем такую оценку для погрешности формулы (2) \f(x)-L(x')\=s^^(b-a)m+1. Правая часть при т-*°° стремится к нулю лишь для очень узкого класса функций f(x); например, это будет иметь место для таких функций, которые в [а, Ь] дифференцируемы любое число раз, при- чем все их производные ограничены одной постоянной М. В этом случае по мере возрастания числа узлов интерполирования и н е- зависимо от закона, по которому выбираются эти узлы, погрешность формулы (2) будет равномерно стремиться к нулю. Как доказал Марцинкевич (J. Marcinkiewicz), для каждой отдельно взятой непрерывной функции можно достигнуть такого же эффекта путем надлежащего выбора последовательных систем узлов. Но - по теореме Фабера (G. Faber) - не существует такого закона выбора узлов, который годился бы в этом смысле для всех непрерывных функ- ций одновременно. В подробности относительно этих и им подобных вопросов мы здесь входить не имеем возможности. 130. Интерполирование с кратными узлами. Формула Эрмита. Можно поставить более общую задачу интерполирования, задав в узлах х0, х1г .. .,хт, кроме значений самой функции/(х), также и значения последовательных ее производных: Ж)>Г(*о)> • • V<n<W, fWM, .. „f^xj, (8)
266 ГЛ. III. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ [130 где л0, п19 ..., пт - неотрицательные целые числа. Общее число этих условий равно («о +1) + («1 +1) + ... + (лт +1) =N. Задачу вычисления значения функции f(x) при любом отличном от узлов значении х из [а, Ь] - с использованием всех данных (8) - мы, подобно простейшему случаю, будем понимать так. Ищется целый многочлен Н(х) наинизшей степени, который в каждом узле х, , вместе со своими производными до порядка п,- включительно, принимает те же значения, что и сама функция Дх) и ее соответствующие произ- водные, а затем приближенно полагают Дх) = Я(х). (9) Узлы х, называются узлами интерполирования, соответственно крат- ности nj+1. Можно доказать существование и единственность многочлена Н(х) степени не выше N-1, удовлетворяющего всем поставленным усло- виям. Его называют интерполяционным многочленом Эрмита, а формулу (9) - интерполяционной формулой Эрмита (Ch. Hermite). Если все л( положить равными нулю, то мы вернемся к формуле Лагранжа (2). Мы встречались и с другим частным случаем фор- мулы Эрмита: возьмем один лишь узел х0, но кратности и +1, т. е. от многочлена не выше л-й степени, Т(х), потребуем, чтобы в точке х0 его значение и значения л его производных совпадали, соответ- ственно, со значениями самой функции f(x) и ее производных. Мы знаем, что этим требованиям удовлетворяет многочлен Тейлора [124 (6)] 7Хх)=/(х0)+^(х-х0)+ ... +Z^(x-Xo)n. Таким образом приближенная формула /(х) = Дх) [ср. п° 127] также является частным случаем интерполяционной фор- мулы Эрмита. Дополнительный член формулы (9), восстанавливающий ее точ- ность, выводится с помощью рассуждений, аналогичных приведен- ным в предыдущем номере. Рассмотрим многочлен N-й степени ^(z) = (z-x0)n«+1(z~x1)n*+1 . . . (z-Xm)n’»+1 и положим для a=sz=s,b Ф(г) =f(z)~ H(z) - К • ^(z), где К = const. Если предположить, что функция f(z) в промежутке [a, Z>] имеет N последовательных производных, то это будет справедливо и для Ф(г).
130] § 6. ИНТЕРПОЛИРОВАНИЕ 267 Фиксируя значение z = х, отличное от узлов, мы выберем постоянную К так: K=fJ^r> 0!Ь (ю) при таком выборе функция Ф(г) обращается в 0 и при z = x. Всего она будет иметь IV+1 корней, если каждый корень считать столько раз, какова его кратность*). Применяя последовательно теорему Ролля как и выше (с тем лишь усложнением, что каждый крат- ный корень функции ,0(z) еще в течение нескольких шагов будет фигурировать и как корень ее последовательных производных), окон- чательно придем к утверждению, что в некоторой точке £. обратится в 0 производная Ф^(г). Отсюда r 7W) Х=“Ж“’ и ввиду (10) /(х)=ад+®Д(х). (И) Это и есть интерполяционная формула Эрмита с дополнительным членом. Формула Лагранжа с дополнительным членом [(7)] является ее частным случаем. Точно так же, взяв единственный узел х0 крат- ности п + 1, мы как частный случай формулы (11) получим формулу Тейлора с дополнительным членом в форме Лагранжа [126 (13)]. *) Мы распространяем понятие кратности корня, привычное для чита- теля по отношению к целому многочлену, на любую функцию ®(z): число а назы- вается ее корнем р-й кратности, если а обращает в 0, вместе с Ф(г), и р -1 ее произ- водных.
ГЛАВА ЧЕТВЕРТАЯ ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ § 1. Изучение хода изменения функции 131. Условие постоянства функции. При изучении хода изменения функции на первом месте появляется вопрос об условиях, при кото- рых функция сохраняет в данном промежутке постоянное значение или изменяется в нем монотонно [57]. Теорема 1. Пусть функция f(x) определена и непрерывна в проме- жутке X *) и имеет внутри него конечную производную f'(x). Для того, чтобы f(x) была в X постоянной, необходимо и достаточно условие f'(x) = 0 внутри X. Необходимость условия очевидна: из Дх)=const следует f'(x)=0. Докажем теперь обратное. Достаточность. Пусть условие выполнено. Фиксируем не- которую точку х0 из промежутка X и возьмем любую другую его точку х. Для промежутка [х0, х] или [х, х0] удовлетворены все усло- вия теоремы Лагранжа [112], следовательно можем написать Дх) - Дх0) =Д(с)(х - Хо), где с содержится между х0 и х и значит заведомо лежит внутри X. Но по предположению Д(с) = 0, так что для всех х из X f(x)=f(x0) = const, и наше утверждение доказано. В интегральном исчислении важное приложение найдет вытека- ющее отсюда простое предложение. Следствие. Если две функции Дх) и Дх) определены и непрерывны в промежутке Хи внутри него имеют конечные производные f'(x), g'(x), причем f'(x)=g'(x) (внутри X), *) Промежуток X может быть замкнутым или нет, конечным или бесконечным.
131] si. ИЗУЧЕНИЕ ХОДА ИЗМЕНЕНИЯ ФУНКЦИИ 269 то эти функции во всем промежутке X разнятся лишь на постоян- ную'. j\x)=g(x)+C (С=const). Для доказательства достаточно применить теорему к разности /(x)-g(x): так как ее производная fty-gix) внутри X сводится к О, то сама разность будет постоянной. Особенности пользования этой теоремой выясним на примерах: 1) Рассмотрим две функции X arctg х и arcsin — У1+х2 Так как производная второй из них _________________________________________ х2 У1+Х2 —- X 1 У1+х2 1 D arcsin ------ ---------------------------- yi+x2 U х2 И-*2 i+*2 У ~1+х2 совпадает с производной первой функции, то эти функции во всем промежутке от - до ч-оо9 разнятся на постоянную: х arctg х - arcsin — + С. уГн? Для определения значения этой постоянной можно, например, положить здесь х = 0; так как при этом арктангенс и арксинус оба обратятся в 0, то и С должно быть нулем. Итак, мы доказали тождество х arctg х = arcsin--- (-~<х-= + “), У1+х2 которое, впрочем, в 50 было выведено из элементарных соображений. 2) Предлагается, аналогично, доказать, что х arcsin х = arctg —- (-1-=х-=1). У1 - х2 3) Рассмотрим теперь функции 1 2х ‘ arctg х и — arctg -. 2 1-х2 Легко проверить, что их производные совпадают во всех точках х, исключая х = ± 1 (где вторая из функций теряет смысл). Поэтому тождество 1 2х — arctg---= arctg х+С 2 1-х2 оказывается установленным лишь для каждого из промежутков (-1, +1), (-<=», -1), (+1, +~) в отдельности. Любопытно, что и значения постоянной С для этих про- межутков будут различными. Для первого из них С= 0 (в чем убеждаемся, полагая
270 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [132 . л п х = 0), а для двух других имеем, соответственно, С= — или С--(что легко 2 2 усмотреть, если, например, устремить х к - ~ или + ~). Все эти соотношения также могут быть доказаны элементарно. Замечание. Значение теоремы 1 проявляется в теорети- ческих исследованиях и вообще в тех случаях, когда функция за- дана так, что из ее определения непосредственно не вытекает, что она сохраняет постоянное значение. Подобные случаи нам не раз встре- тятся в дальнейшем. 132. Условие монотонности функции. Выясним теперь, как по произ- водной функции можно судить о возрастании (убывании) самой функ- ции в данном промежутке. Остановимся сначала на случае функции, монотонно возрастающей в широком смысле, т. е. не убы- вающей (или монотонно убывающей в широком смысле, т. е. не возрастающей) [57]. Теорема 2. Пусть функция f(x) определена и непрерывна в про- межутке Хи внутри него имеет конечную производную f'(x). Для того чтобы f(x) была в X монотонно возрастающей (убывающей) в широком смысле, необходимо и достаточно условие /'(x)s=0 (==0) внутри X*). Необходимость. Еслиf(x) монотонно возрастает, хотя бы в широком смысле, то, взяв х внутри X и придав ему приращение Лх>0, будем иметь: f(x + Zlx)^f(x), Ах+^)-/(х)^0, и в пределе, при Jx-*0, получим f(x)»0. Достаточность. Пусть теперь, обратно, дано, что /'(х)г=0 внутри X. Возьмем два значения х' и х" (х' <х") из промежутка X и к функции f(x) в промежутке [х', х"] применим формулу Лагран- жа: f(x")-f(x')=f(c)-(x"-х') (х'<с-=х"). Так как /'(с)э=0, то /(х">/(х'), и функция Дх) будет возрастающей, по крайней мере, в широком смысле. До сих пор для функции Дх) не была исключена возможность сохранять в некоторых промежутках и постоянные значения, а для *) Хотя формулируем теоремы мы параллельно и для возрастающих и для убывающих функций, но при доказательстве ограничиваемся лишь случаем воз- растания.
132] § 1. ИЗУЧЕНИЕ ХОДА ИЗМЕНЕНИЯ ФУНКЦИИ 271 ее производной - обращаться в этих промежутках тождественно в 0. Если мы эту возможность исключим, то придем к случаю возрастания (или убывания) в строгом смысле. Теорема 3. При сохранении тех же предположений относительно непрерывности функции f(x) и существования ее производной f'(x), для того чтобы f(x) была монотонно возрастающей (убывающей) в строгом смысле, необходимы и достаточны условия'. 1) /'(x)s=0 (==0) для х внутри X. 2) Д(х) не обращается тождественно в 0 ни в каком промежутке, составляющем часть X. Необходимость. ЕслиДх) возрастает в промежутке X, то по теореме 2 имеем Д(х)г=0, так что условие 1) выполняется. Выпол- няется и условие 2), так как, если бы производная обращалась в 0 в некотором промежутке сплошь, то по теореме 1 в нем Дх) была бы постоянной, что противоречило бы предположению. Достаточность. Пусть выполняются условия 1), 2) теоремы. Тогда, в силу теоремы 2, функция Дх) является, во всяком случае, неубывающей. Если взять в X два значения х' и х" (х! -= х"), то будем иметь не только Дх')<(х"), (1) но и Л*Э^/(*)^Л*") Для хв[х', х"]. (2) Докажем, что знак равенства в (1) на деле осуществиться не мо- жет. Если бы было Дх')=Дх"), то, ввиду (2), получили бы /(*')=/(*)=/(*") Для хв[х', х"], т. е. функция Дх) была бы постоянной в промежутке [х', х"], и мы имели бы Д(х)=0 в этом промежутке сплошь, вопреки условию 2). Итак, Дх') </(*") при х' < х", т. е. функция Дх), в строгом смысле, возрастает. Этим теорема до- казана. Установленная связь между знаком производной и направ- лением изменения функции геометрически совершенно оче- видна, если вспомнить [91, 92], что производная представляет собой угловой коэффициент касательной к графику функции. Знак этого углового коэффициента показывает, наклонена ли касательная вверх или вниз, а с нею - идет ли вверх или вниз и сама кривая (рис. 54). Однако в отдельных точках касательная при этом может ока- заться и горизонтальной, т. е. производная - даже в строгом смысле - возрастающей (убывающей) функции может для отдельных значений х обращаться в 0.
272 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [132 Примеры. 1) Простейший пример последнего обстоятельства доставляет функция f (х) = х3: она возрастает, и тем не менее производная ее f '(х) = Зх2 при х = 0 обращается в 0. 2) Аналогично, возрастающей будет и функция f (х) = х - sin х, ибо ее производная /'(x)=l-cosx не отрицательна, обращаясь в 0 для значений х = 2кп (к = 0, ±1, ±2, ...). 3) Наконец, чтобы показать, что для возрастающей функции производная может даже в конечном промежутке обращаться в 0 бесконечное множество раз, рассмотрим функцию . 1 1 sin--- 1/(х) = е х х для х>0, 1/(0)=0. Очевидно, lim /(х) = 0, х->+0 так что наша функция непрерывна и при х = 0. Имеем, для х > 0: ( х J х2 причем эта производная обращается в 0 при х = — {к = 1, 2, 3, ...). 7кп Заметим, что 1 X2 0=s/'(x)-=2e-^j--<-0 при х-+0, ех отсюда [113] и /'(0) = 0. Можно построить примеры возрастающих (убывающих) функций, для которых точки, где производная обращается в 0, распределены еще более сложным образом. Однако, подобные случаи встречаются редко, и для практических целей обычно пользуются таким доста- точным признаком: если производная f\x) =-0 (<0) повсюду.
133] § 1. ИЗУЧЕНИЕ ХОДА ИЗМЕНЕНИЯ ФУНКЦИИ 273 исключая разве лишь конечное число значений х, то функция f(x) будет возрастающей (убывающей). Этот признак очень удобен в приложениях. Для примера рассмотрим функцию /(х)= П— при х^О и докажем, что V х) она возрастает. Достаточно доказать, что возрастает ее логарифм g(x)=In f(x) = x[ln (х +1) - In х]. Имеем 1 g'(x) = [In (х+1) - In х]-- . x+1 Так как, по формуле конечных приращений [112], in (х+1)-1п х=у, где x^J^x+l, то £'(х)=>0: g(x) возрастает, что и требуется доказать. 133. Доказательство неравенств. Изложенный простой критерий монотонности успешно применяется к доказательству неравенств. 71 1) Докажем, что для 0-=х*=— имеем 2 sin X > - X. Пусть /(х)= . Производная cosx(x-tgx) У'(х) =----------- 2 будет отрицательна, так как x^tgx. Значит, функция /(х) убывает и/(х) „(лЛ 2 ^2 2 1 2) Функция/(х) = cos х- 1 +— х2 обращается при х = 0 в нуль. Ее производная, при х=»0, f'(x) = - sin х+ х = 0 (ибо sin х < х). Значит, функция /(х) для х=»0 оказывается возрастающей, и при х=-0 будет /(х) =’/(0) = 0, т. е. 1 COS х => 1--X2. 2 Отсюда, аналогично, при х=-0 получим, что 1 SfflX>X---------------------------------Xs, 6 и т. д. п 3) Доказать, что при 0^х-=у будет 1 tgX=-X + y Ха. 18 Г. М. Фихтенгольц, т. I
274 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [133 Для этого достаточно установить, что для указанных х производная функции tg х — х — i х’, равная sec* х — 1 — х’, положительна, т. е. что tg’ х — х’ > О, а это приводит к известному неравенству tg х > х [54 (9)]. 4) Так как функция /(х) = 1пх — х (х>0) имеет производную f(x)=l-l Т > 0 при 0 < х < 1 4 ’ х I <0 при х> 1, то функция эта возрастает, пока х изменяется в промежутке (0,1], и убы- вает в промежутке [1,-[- оо). Отсюда ясно, что /(1) = —1 будет наиболь- шим значением функции, так что для х > О In х g х — 1. 5) Рассмотрим еще функцию /(х) = х® — ах для х^О (предполагая 0 < а < 1). Имеем и — аналогично 4) — заключим, что для х > 0 х“ — ах sg 1 — а. (3) Полученное простое неравенство является источником для вывода ряда классических неравенств. В связи с этим полезно представить его еще и в других формах. Полагая х — , где а и 6 произвольные положительные числа, и обо- значая 1 — а через ₽, приведем (3) к виду а“ Ь? sg аа + (За) (а, Ь, а, (3 > 0, а 4- 3 =• I). 1 1 k Иногда вводят числа fe= —>1ий’ = -д>1, так что = v-----------------г-.Заме- а р й — 1. няя в предыдущем неравенстве а и Ь, соответственно через ак и Ьк, полу- чим ай-4- 1^6к’. k К (36) А- + 1; - 1). ft ft 6) Прежде всего, неравенство (За) можно распространить на случай лю- бого числа перемножаемых степеней. От двух к трём переход осуществляется так (с двукратным применением неравенства (За)): / 3___ ___\₽4-т 3__ т____ a“Wd ==аа+ 7 ср + 7/ sg аа + (₽ + у) • +7 с9 +1 sg аа + (₽ + Ь + с) = аа + ₽« + ус, так что окончательно в®£М ;g аа + ЪЬ + ус. (а, Ь. с, а, р, к > 0, « + ? + Аналогично можно было бы совершить и переход от п к п +1 и доказать — по методу математической индукции — общее. неравенство, которое (в изме- нённых обозначениях) имеет вид: а? 9^1 + ?2а2 + • • • + ЧгАп. («I....о,). 91, .... Чп > °. ?1 + .. + ?/)=- 1)
133] § 1. ИЗУЧЕНИЕ ХОДА ИЗМЕНЕНИЯ ФУНКЦИИ 275 Взамен qi можно ввести произвольные числа pt > 0, полагая qt = —, Тр. J 7 так что сумма V = 1. Неравенство напишется так: 1 vp (aplapa ар*У -z Pl<h + Pi°- + • • • +Prfin (4) V * 2 " п ' Pi+Pi + ---+Pn ’ (®1....ап. Р1....Рп>°) При pi = ра =... =рп— 1 мы придём к известному неравенству уataa • ...-ап «S ------------------, (4а) устанавливающему, что среднее геометрическое ряда положительных чисел не превосходит их среднего арифметического. Таким образом, неравен- ство (4) является естественным обобщением этого классического утвер- ждения. 7) Обратимся к доказательству, так называемого, неравенства Коши — Г е л ь д е р a (A. L. Cauchy — О. Holder) Коши установил это неравенство для частного случая k = k' — 2: (5а) Предположим сначала, что (6) так что подлежащее доказательству неравенство примет вид п «Л ss 1- i=l Положим в неравенстве (Зб) поочерёдно а = в;, b = bt (1= 1,2,..., п) и про- суммируем все полученные неравенства; учитывая условие (6), придём к тре- буемому результату. Общий случай приводится к рассмотренному частному, если взамен чисел ai, bi ввести числа
276 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИЙ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [134 для которых уже выполняются условия типа (6). По доказанному п /=1 а это равносильно (5). 8) Из неравенства Коши — Гёльдера сразу получается ещё одно важ- ное неравенство, носящее имя Минковского (Н.Minkowski) п 1 п 1 п 1 1=1 i=1 i=i (Oj J,- >0, к > 1) Очевидно, п п п 2 (“i + <л + bi)k~l * 2bi {ai + bi}k"1 i=l i=l i=l Если к каждой из последних двух сумм применить неравенство (5), то по- лучим*: п п 1 п 1 2 +bi>k {2а«- Г {1(а;+&i)(fc-1) k' F+ i=\ i = l i=l n 1 n 1 +{2ь* F • {1 T= i=l i=l n 1 n 1 n 1 =({2<+{2<Н2(“'+‘'>Т i=l iel i=l и, наконец сократив на последний множитель, придём к (7). 134. Максимумы и минимумы; необходимые условия. Если функция f(x), определённая и непрерывная в промежутке [а, Ь], не является в нём монотон- ной, то найдутся такие части [а, р] промежутка [а, Ь], в которых наибольшее или наи- меньшее значение достигается функцией во внутренней точке, т. е. между а и р. На графике функции (черт. 55) х таким промежуткам соответ- ствуют характерные горбы или впадины.
134) § 1. ИЗУЧЕНИЕ ХОДА ИЗМЕНЕНИЯ ФУНКЦИИ 277 Говорят, что функция j(x) имеет в точке х9 максимум (или минимум)*, если эту точку можно окружать такой окрестно- стью (х9—8, х0-[-8), содержащейся в промежутке, где задана функция, что для всех её точек х выполняется неравенство /(*) /(х0) (или /(х) S=/(x0)). Иными словами, точка хл доставляет функции /(х), макси- мум (минимум), если значение /(х0) оказывается наибольшим (наи- меньшим) из значений, принимаемых функцией в некоторой (хотя бы малой) окрестности этой точки. Отметим, что самое определе- ние максимума (минимума) предполагает, что функция задана п о обе стороны от точки х0. Если существует такая окрестность, в пределах которой (при х Ф х0) выполняется строгое неравенство /(•*)</(*<») (или/(х)>/(х0)), то говорят, что функция имеет в точке х0 собственный макси- мум (минимум), в противном случае — несобственный. Если функция имеет максимумы в точках хв и хь то, применяя к промежутку [х0, xj 2-ю теорему Вейерштрасса [85], ви- дим,' что наименьшего своего значения в этом промежутке функция достигает в некоторой точке ха ме ж ду х9и xt и имеет там мини- мум. Аналогично, между двумя минимумами непременно найдётся максимум. В том простейшем (и на практике — важнейшем) случае,. кЬгда функция имеет вообще лишь конечное число максимумов и ми- нимумов, они попросту чередуются. Заметим, что для обозначения максимума или минимума сущест- вует и объединяющий их термин — экстремум**. Поставим задачу 6 розыскании всех значений аргумента, достав-* ляющих функции экстремум. При решении её основную роль будет играть производная. Предположим сначала, что для функции /(х) в промежутке (а, V} существует конечная производная. Если в точке х0 функция име- ет экстремум, то, применяя промежутку (х0 — 8, х0-^8), о кото- ром была речь выше, теорему Ферма [109), заключаем, что/'(х0) = = 0: в этом состоит необходимое у с л о в и е экстремума. Эк- стремум следует искать только в тех точках, где производная рав- на нулю; такие точки будем называть стационарными***. Не следует думать, однако, что каждая стационарная точка до- ставляет функции экстремум: указанное Только что необходимое условие не является достаточным. Мы видели, например, в 132,1),, * По-латыни слова maximum и minimum означают «наибольшее» и «наи- меньшее» (значение). , ’ ** Латинское extremum, что означает «крайнее» (значение). ***~В них изменение функции как бы «приостанавливается»: скорость этого изменения [Э2] обращается в нуль.
278 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [135 что для функции х3 производная Зх’ обращается в нуль при х = 0, но в этой точке функция не имеет экстремума: она веб время воз- растает. Если расширить класс рассматриваемых функций /(х) и допу- стить, что в отдельных точках двусторонней конечной производ- ной не существует, то не исключена возможность того, что экст- ремум придется на какую-либо из таких точек: ведь теорема Ферма утверждает равенство /(х) = 0 лишь в предположении, что существует двусторонняя конечная производная! Например, _2 функция х3, очевидно, имеет минимум при х = 0, в то время как в этой точке ее производная слева равна — 007 а справа оо [101]; точно также в точке х = 0 имеет минимум функция | х |, хо- тя двусторонней производной для нее в этой точке нет [100]. Сле- довательно, и точки, в которых не существует двусторонней конечной производной, также могут доставлять функции экстремум. Но, разумеется, и в этом случае также не может быть гарантиро- вано наличие экстремума во всех таких точках. Примерами могут 1 1 служить функции _у = х3 H_y = x>sin— (с дополнительным усло- вием: у = 0 при х = 0). Первая из них имеет бесконечную произ- водную в точке х = 0 [101], вторая же вовсе не имеет производ- ной в этой точке [102, 1°], но точка х = 0 не доставляет экстре- мума ни той, ни другой функции (ибо в любой еб окрестности обе функции принимают и положительные и отрицательные значения). 135. Достаточные условия. Первое правило. Итак, если точка х0 есть стационарная точка для функции /(х) или если в этой точке не существует для нее двусторонней конечной производной, то точка х0 представляется, так сказать лишь «подозрительной» по экстремуму и подлежит дальнейшему испытанию. Это испытание состоит в проверке достаточных условий для существования экстремума, которые мы сейчас установим. Предположим, что в некоторой окрестности (х0 — 8, х0 8) точки ха (по крайней мере, для х х0) существует конечная про- изводная f (х) и как слева от х0, так и справа от х0 (в отдель- ности) сохраняет определенный знак. Тогда возможны следующие три случая: 1. ПРИ и /ИО ПРИ х^>хо> т- е- призвод- ная f(x) при переходе через точку х0 меняет знак плюс на ми- нус. В этом случае, в промежутке [х0 — 8, х0] функция /(х) воз- растает, а в промежутке [xe, х0 -f- &] убывает [132], так что значе- ние /(х0) будет наибольшим в промежутке [х0 — 8, х0-|-8], т. е. в точке х0 функция имеет собственный максимум. II. f (х) 0 при х х0 и f (х) ]> 0 при х^> х0 т. е. производная f (х) при переходе через точку х0 меняет знак минус на плюс. В этом
135] § 1. ИЗУЧЕНИЕ ХОДА ИЗМЕНЕНИЯ ФУНКЦИИ 279 случае аналогично убеждаемся, что в точке ха функция имеет соб- ственный минимум. III. /(х)^>0 как при х<^х0, так и при х^>х0, либо же /(х)<^0 и слева и справа от х0, т. е., при переходе через хй, f (х) не меняет знака. Тог ла функция либо всё время возрастает, либо всё время убывает; в любой близости от х0 с одной стороны найдутся точки х, в которых /(х)<С/(х0), а с другой — точки х, в кото- рых /(х)^>/(хо), так что в точке хй никакого экстремума нет. Графическая иллюстрация простейших возможностей дана на черт. 56 а, б, в. Итак, мы получаем первое правило для испытания «подо- зрительного» значения хй: подставляя в производную f (х) сначала х<^хй, а затем х^>х0, устанавливаем знак производной вблизи от точки х0 слева и справа от неё; если при этом производная f (х) меняет знак плюс на минус, то налицо максимум, если ме- няет знак минус на плюс, то — минимум; если же знака не меняет, то экстремума вовсе нет. Это правило полностью решает вопрос в том случае, когда в промежутке (а, Ь), как это обычно бывает, всего лишь конечное число стационарных точек или точек, где отсутствует конечная производная: а<АГ1<;хз<...<хй<хй+1 <...<;x„<;z>. (4)
280 ГЛ. tv. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [136 Именно, тогда, прежде всего, в любом промежутке (a,, Xi), (х1( х8), ..., (xk, xfc+1), ... (х„, b) существует конечная производная f (х) и, кроме того, в каждом таком промежутке f (х) сохраняет постоянный знак. Действительно, если бы f(x) меняла знак, например, в про- межутке (xh, xh+i), то, по теореме Дар б у [110], она обращалась бы в нуль в некоторой точке между xk и xft+1, что невозможно, по- скольку все корни производной уже содержатся в ряду точек (4). Последнее замечание бывает полезно в некоторых случаях на практике: знак производной f (х) во всём промежутке (xk, xfc+1) определится, если вычислить значение (или даже только установить знак) её в одной какой-либо точке этого промежутка. 136. Примеры. 1) Найти экстремумы функции /(х) = (х 2)’ (х—1)*. Её производная всегда существует и конечна: /' (х) = 2 (х + 2) (х — I)8 + 3 (х + 2)а (х — I)8 = (х + 2) (х — I)8 (5х 4- 4). Корнями производной (стационарными точками) будут: 4 xt = — 2, х8 =—=- = — 0,8, х8 = 1. О Этими значениями весь промежуток (— оо, + оо) разбивается на следующие части: (— оо, — 2), (— 2, — 0,8), (— 0,8, 1), (1, + оо). Для определения знака производной в этих промежутках можно, вос- пользовавшись сделанным выше замечанием, установить его для конкретных значений, например, для —3, — 1,0 и 2. Определяя знаки отдельных множи- телей, для всей производной получаем следующие знаки: в промежутке (— оо, — 2) (—) (+) (—) = 4- > > (-2, -0,8) (+)(+)(-) = _ > » (-0,8, 1) (+) (+)(+) = + > > (1,+оо) (+)(+)(+) = -|- Отсюда ясно, что при х = — 2 функция /(х) имеет максимум, при х = — 0,8 она имеет минимум, а при х = 1 экстремума вовсе нет. Однако, обычно поступают иначе, не подставляя в производную конкрет- ных значений. Начнём с х = — 2. Произведение двух последних множителей производной (х—1)а и 5х-|-4 при х = — 2 имеет знак минус, следователь- но (по непрерывности) сохраняет тот же знак и вблизи этой точки (как сле- ва, так и справа). Множитель же х-|-2, когда х, возрастая, проходит через значение — 2, меняет знак минус на плюс, так что производная меняет знак 4 плюс на минус, и функция имеет максимум. При х = — -g- (и вблизи этого значения) первые два множителя производной имеют знак плюс; последний же множитель 5х -|- 4 (а с ним и вся производная) при прохождении через это значение меняет знак минус на плюс; функция здесь имеет минимум. На- конец, при переходе через значение х = 1, не только первый и третий мно- житель сохраняют знак, но и второй множитель также, ибо квадрат всегда положителен; экстремума здесь нет.
136] § 1. ИЗУЧЕНИЕ ХОДА ИЗМЕНЕНИЯ ФУНКЦИИ 281 Зна>. точки х, доставляющие нашей функции экстремальные значе- ния, легко вычислить теперь и сами эти значения: максимум /(—2) = 0 и минимум /(—0,8) = — 8,40. На черт. 57 дан график, иллюстрирующий Изменение этой функции *. 2) Найти экстремумы функции /(x) = sins х -f- + cos’ х. Ввиду того, что функция имеет период 2л, достаточно ограничиться теми значениями х, ко- торые содержатся в промежутке [0,2л]. Произ- водная этой функции существует везде: f' (х) — 3 sin’ х • cos х — 3 cos’ х • sin x = = 3 sin x • cos x • (sin x — cos x). Корни производной случае будут: „л л °-т-т> переходе через знак минус на знак плюс на (стационарные точки) в этом 5lt 311 л- Т’ <2л>- х ~ 0 множитель sin х ме- плюс, а вся производная ме- минус, ибо последние два При няет няет множителя сохраняют вблизи х = 0 знак минус; налицо максимум. Множитель sin х—cosx, обра- щающийся в нуль при х = — , при переходе че- рез эту точку меняет знак минус на плюс. То же будет и с производной, так как первые два множителя положительны; следовательно, здесь будет минимум. Аналогично исследуются и осталь- ные стационарные точки: все они поочерёдно доставляют функции макси- мумы и минимумы. Подставляя их в выражение функции, получим сами максимальные и ми- нимальные значения: максимумы: f (0) =/(2л) = 1,/ = 1,/ = _ о,71, ,/ Л \ У” 2 . _ . . IЗл \ минимумы: = 2~ =0,71, /(л) = —1, = — 1. Черт. 58. График функции представлен на черт. 58 [ср. 147, 1)]. — 1 3) Найти экстремумы функции f(x) = х3 — (х3 — I)3 ’ * Здесь и в следующих примерах изменение функции мы иллюстрируем графиками, но самый вопрос о построении графиков будет подробно рассмотрен лишь в § 3. См., в частности, 149, 3).
282 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ (136 На этот раз конечная производная 2 -- 1 -- 2 /'W=| х 3-|(х2-1) 3 -2х=— 1 £ (х‘-1)3-х3 ~г г х3.(х»-1)3 существует везде, исключая точки х=0их= ±1. При приближении х к этим значениям (с обеих сторон) производная стре- мится к ±~. Для определения корней производной, приравниваем нулю ее числитель; мы найдем х= ±—. Итак, «подозрительными» по экстремуму будут точки: V2 1 1 -1. , 0, —, +1. V2 V2 При х = 0 (и вблизи этой точки) числитель и второй множитель знаменателя 1 имеют знак плюс. Множитель же х3 знаменателя меняет знак минус на плюс, производная - тоже: минимум. При х = — и (вблизи) знаменатель сохраняет V2 1 знак плюс. Числитель же, имея в виду значения х, близкие к —, перепишем так: 2 £ j V2 (1-х2)3 -х3 ; он обращается в нуль при х=—, с уменьшением х - увеличивается, 72 а с увеличением - уменьшается, так что меняет знак плюс на минус, и налицо 2 1 з максимум. То же и при х=--------. При переходе через х=1 множитель (х2-1) У2 в знаменателе, который обращается в этой точке в нуль, не меняет знака; это же справедливо и для производной, так что при х = 1 экстремума нет. То же и при х= -1. Итак, максимумы / ±—1= V4 = 1,59, а минимум /(0)=1. к ]/2? График на рис. 59 [ср. 149, 4)]. 4) Затухающие колебания. Пусть движение точки происходит по следующему закону: s=Ae~kt sin cot,
136] § 1. ИЗУЧЕНИЕ ХОДА ИЗМЕНЕНИЯ ФУНКЦИИ 283 где з - пройденный путь (отсчитываемый от начального положения), a t - время (отсчитываемое от начального момента). Будем считать все постоянные А, к, ш, а также переменную t - положительными. Выясним вид графика этой зависи- мости; его интересно сопоставить с уже знакомой нам синусоидой s=A sin wt. Так как е~ы =-0, то, очевидно, оба графика пересекают ось х в одних и тех же точках л t = n — (л=1, 2, 3, ...). Заметим, что функция s=A sin <ot имеет попеременно макси- л> (Пл мумы и минимумы в точках t - л Н— I —, где обращается в нуль ее производная V 2/ со s'=Aw coscut Составим производную для заданной функции [ср. 99, 30)]: (со к । ----cos wt —-—rrn sin cot I. y<u2+Z:2 y<u2+Z:2 ) Вводя вспомогательный угол <p под условиями: со к -—===-=cos <р, ---------- sin <р, У^+*2 Усо2+Л2 перепишем выражение производной в виде s'=А y<u2+fc2e-w cos(wt+<p). Она обращается в нуль в точках (1) п <р я+у--------, 2) w со и так как косинус, проходя через нуль, меняет знак, то легко сообразить, что при этих значениях наша функция, действительно, имеет максимумы при п четных и минимумы при п нечетных. По сравнению с синусоидой, произошло смещение Ч> экстремальных точек влево на —. со Нетрудно проверить, что все максимумы будут положительны, а минимумы отрицательны. Если величину л-го экстремума обозначить через Ап, то Ап кп ^n+i так что размахи убывают в геометрической прогрессии. График (для простого частного случая) представлен на рис. 60. Движение подобного типа носит название затухающего колебания. Замечание. В большинстве представляющихся на практике случаев из- ложенного в предыдущем п° правила оказывается вполне достаточно для исследо- вания «подозрительных» значений. Однако следует дать себе отчет в том, что могут быть случаи, где оно неприложимо: это будет тогда, когда в любой бли- зости от испытуемой точки содержится бесконечное множество других подобных же точек, и производная не сохраняет определенного знака с той или с другой стороны от этой точки. Рассмотрим для примера функцию, определяемую равенствами: /(x) = x2-sin — (при х^О) и /(0) = 0. х
284 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [137 Мы уже знаем, что она при х = 0 имеет производную /'(0)=0 [102, 2°]. Однако в любой близости от стационарной точки х = 0 как слева, так и справа произ- водная /'(х) = 2х • sin—- cos — X X бесконечное множество раз меняет знак. Здесь в точке х = 0 нет экстремума. Если же определить функцию так: ( 1) /(х) = х2 1 +sin — при х # 0, /(0) = 0, I х ) то она обнаруживает такую же особенность, но на этот раз при х = 0, очевидно будет минимум. Правило в обоих случаях неприложимо. 137. Второе правило. При разыскании экстремумов исследова- ние знака производной вблизи испытуемой точки можно заменить исследованием знака второй производной в самой этой точке; по- кажем это. Итак, пусть функция f(x) не только имеет производную f'(x) в окрестности точки х0, но и вторую производную в самой точке х0: /"(х0). Точка х0 - стационарная, т. е. Д(хо) = О. Если f"(x0)>0, то, по лемме п° 109, - функцияД(х) в точке х = х0 возрастает, т. е. вблизи точки х0 слева f’(x) f'(x^ = 0, а справа f'(x) >-Д(х0) = 0. Таким образом, производная f'(x) меняет знак минус на плюс и, сле- довательно, Дх) имеет в точке х=х0 минимум. Если /"(хо)<0, то Д(х) в точке х=х0 убывает, меняя знак плюс на минус, так что налицо максимум. Таким образом, можно сформулировать второе правило для испытания «подозрительного» значения х0: подставляем х0 во вто- рую производную f"{x)-, если /"(х0)^0, то функция имеет минимум, если же f"(x0)-=6, то - максимум.
137] § 1. ИЗУЧЕНИЕ ХОДА ИЗМЕНЕНИЯ ФУНКЦИИ 285 Это правило имеет, вообще говоря, более узкий круг применения; оно, например, явно неприложимо к тем точкам, где не существует конечной первой производной (ибо там и речи быть не может о вто- рой). В тех случаях, когда вторая производная обращается в нуль, правило также ничего не дает. Решение вопроса зависит тогда от поведения высших производных [см. следующий п°]. Если пожелать приложить это правило к примеру 2), то нужно вычислить вторую производную: /"(х) = б sin х cos х (cos х+sin x) - 3(sin3 x+cos3 x). л 3л Прих = 0(2л), —, л, — первое слагаемое обращается в нуль и знак /"(х) противо- 2 2 я положен знаку /(x) = sin3x+cos3x; это будет минус для х = 0 (2л), — (здесь макси- Зл л 5л мумы) и плюс для х=л и — (здесь минимумы). Для х=— и — , ввиду равенства 2 4 4 sin x=cosx, /"(х) сведется к 6 sin3 х, так что в первой из этих точек знак второй производной будет плюс (минимум), а во второй минус (максимум). х3- 5х+6 Вот новый пример: найти экстремумы функции /(х)=-----------------. х2+1 х2 - 2х -1 Производная f'(x) = 5—----— обращается в нуль вместе с числителем; (х2+1)2 ее корни будут xt = 1 - ]/2= -0,41 и х2 = 1 + У2 = 2,41. Дифференцируем производ- ную снова как произведение: (х2+1)2 причем точками заменен член, содержащий множителем х2-2х-1 и нам не нужный, ибо для тех значений х, которые мы собираемся подставлять, он заведомо нуль. Легко видеть, что /"(xJ^O, а /"(х2)=»0, следовательно, значение /(хг)==7,04 есть максимум, а/(хг)^ -0,03 - минимум. График функции данна рис. 61 [см. 149, 5)].
286 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [138 Наконец, рассмотрим еще такую задачу геометрического содержания: найти экстремальные значения для расстояния г от данной (на плоскости) точки Р{1, у) до точек М (х, у) кривой (20, заданной своим уравнением: У = f(x) (рис. 62). Вместо функции г можно рассмотреть функцию и = у г2 = [(х - Й2+(у -1?)2], где у=/(х). Приравнивая нулю производную: и'х = х-£+(у-у)-у'х, видим, что для того, чтобы точка М(х, у) на кривой (К) доставляла экстремум расстоя- нию г9 необходимо выполнение условия: f-x+yi(’7-y) = 0. Иными словами, точка Р (%, у) должна лежать на прямой Х-х+у£(У-у) = 0, проведенной через точку Af(x, у) кривой перпендикулярно к касательной*); ее называют нормалью к кривой. Дойустим же, что точка Р(й у) действительно лежит на нормали к кривой (К) в точке М(х, у); будет ли расстояние РМ экстремум? Решение этого вопроса зависит от знака второй производной: = 1 + Ух + (У - У) Ух' Это выражение обращается в нуль (предполагая у*« # 0) лишь в точке Q с коорди- натами: f"X-yJ- 1+У? Ух' , 1+у? у=у+—— Ух' для нее вопрос остается открытым. Точка С отделяет на нормали те точки Р, для которых и"«0, и расстояние РМ будет максимум, от тех точек Р, для которых и" =- 0, и это расстояние есть минимум. Впоследствии [243, 253] мы увидим, что эта пограничная точка С на нормали замечательна во многих отношениях. 138. Использование высших производных. Мы видели, что если /'(хо) = 0 и /”(хо) =“0, то Функция f(x) достигает в точке х0 минимума; если же /'(хо) = 0 и /"(х0) -= 0, то функция имеет в этой точке макси- *) Ее угловой коэффициент----обратен по величине и по знаку угловому yi коэффициенту у* касательной.
138] § 1. ИЗУЧЕНИЕ ХОДА ИЗМЕНЕНИЯ ФУНКЦИИ 287 мум. Случай, когда и Д(хо)=0 и f"(xo~) = 0, был оставлен нами неис- следованным. Предположим теперь, что функция Дх) имеет в точке х=х0 п по- следовательных производных, причем все они, вплоть до (п-1)-й, в этой точке обращаются в нуль: /'(х0)=/"(х0) = ... =/С-Ц(хо)=0, между тем как f^n\x^^Q. Разложим приращение Дх)-Дх0) функ- ции Дх) по степеням разности х-х0 по формуле Тейлора с до- полнительным членом в форме Пеано [124, (10а)]. Так как все про- изводные порядков меньших, чем и, равны в точке х0 нулю, то /(x)-Ax0)=/(-(^+a(x-x^. Вследствие того, что а-«-О при х-»х0, при достаточной близости х к х0 знак суммы в числителе будет совпадать со знаком ДДх^ как для х-=х0, так и для х=-х0. Рассмотрим два случая. 1° и - нечетное число: n = 2fc + l. При переходе от зна- чений х, меньших, чем х0, к значениям, большим, чем х0, выражение (х-х0)п изменит знак на обратный, а так как знак первого множителя при этом не меняется, то и знак разности Дх) -Дх0) изменится. Та- ким образом, в точке х0 функция Дх) не может иметь экстремума, ибо вблизи этой точки принимает значения как меньшие, так и боль- шие, чем Дх0). 2° п - четное число: и = 2fc. В этом случае разность Дх)- ~Дхо) не меняет знака при переходе от х меньших, чем х0, к боль- шим, так как (х-х0)п>0 при всех х. Очевидно, вблизи х0 как слева, так и справа знак разности Дх)-Дх0) совпадает со знаком числа ДДх0). Значит, если ДДх0)>0, то Дх)>Дхо) вблизи точки х0, и в точке х0 функция Дх) имеет (собственный) минимум; если же Дп)(х0)< <0, то функция имеет (собственный) максимум. Отсюда получаем такое правило: Если первая из производных, не обращающихся в точке х0 в нуль, есть производная нечетного порядка, функция не имеет в точках х0 ни максимума, ни минимума. Если такой производной является произ- водная четного порядка, функция в точке х0 имеет максимум или минимум, смотря по тому, будет ли эта производная отрицательна или положительна. Например, для функции/(х) = ех+е-х+2 cosx точка х = 0 является стационар- ной, так как в этой точке обращается в нуль производная /'(х) = ех - е ~х - 2 sin х. Далее: /" (x)=--ex+e~x-2cosx, f"(Q) = O; f"'(x) = ex-e~x+2sin х, f"'(0) = 0; /iv(x) = ex+e-x+2 cos x, /IV(O)=4,
288 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [139 Так как в нуль не обратилась первой производная четного порядка, то налицо экстремум, а именно минимум, ибо/lv(0)»0. Замечание. Хотя выведенный выше критерий решает вопрос об экстре- муме в весьма широком классе случаев, но, теоретически говоря, он все же не является всеобъемлющим: функция, не будучи тождественно постоянной, может иметь в окрестности испытуемой точки производные всех порядков, которые, однако, в этой точке все зараз обращаются в нуль. В качестве примера рассмотрим (вместе с Коши) следующую функцию: 1 /(х) = е Х (при х#0), /(0) = 0. При х#0 она имеет производные всех порядков: /'(х)=^е х‘, е ••• X3 ( X* 1 X®) и, вообще, (л=1, 2, 3, ...), (9) где Pn(z) есть целый многочлен (степени Зп). В общности этого закона легко убе- диться по методу математической индукции. Установим теперь, что и в точке х = 0 для нашей функции существуют производные всех порядков, причем все равны нулю. Действительно, прежде всего, 1 Дх)-/(0) х —0 при х-0*), е так что /'(0) = 0. Допустим, что доказываемое утверждение верно для всех произ- водных до n-го порядка включительно. Тогда [см. (9)] 1 Г1! ------------------------------ - 0 при х-0, X-------------------------1 х* поскольку числитель представляет собой сумму членов вида —. Значит, хт и /<п+1)(0) = 0. По методу математической индукции утверждение оправдано полностью. Хотя непосредственно ясно, что данная функция при х = 0 имеет минимум, но установить этот факт с помощью рассмотрения ее последовательных производных в этой точке - не удалось бы. 139. Разыскание наибольших и наименьших значений. Пусть функция Дх) определена и непрерывна в конечном замкнутом про- *) Напомним, что ег при z — +«> будет бесконечно большой высшего порядка, чем любая степень zft, т. е. zk Inn — = 0 1 [65]. Здесь роль z играет — (при х—0).
139] ; 1. ИЗУЧЕНИЕ ХОДА ИЗМЕНЕНИЯ ФУНКЦИИ 289 межутке [а, £]. До сих пор мы интересовались лишь ее максимумами и минимумами, теперь же поставим вопрос о разыскании наиболь- шего и наименьшего из всех значений, которые она принимает в этом промежутке*); по 2-й тео- реме Вейерштрасса [85], такие наибольшие и наименьшие значения существуют. Остановим- ся для определенности на наи- большем значении. Если оно достигается в неко- . торой точке между aub, то это одновременно будет одним из максимумов (очевидно, наи- большим); но наибольшее значе- ние может достигаться и на одном Рис. 63. из концов промежутка, а или b (рис. 63). Таким образом, нужно сравнить между собой все максимумы функции f(x) и ее граничные значения f(a) и f(b); наиболь- шее из этих чисел и будет наибольшим из всех значений функции f(x) в [а, Ь]. Аналогично разыскивается и наименьшее значение функции. Пусть, например, разыскиваются наибольшее и наименьшее значения функ- [л 3л1 - —, — I; два максимума, равных 1, больше граничных значений /I---=/| —1=0, следовательно, 1 и будет наибольшим зна- чением функции в указанном промежутке. Минимум, равный 0,7 ..., больше граничных значений, так что наименьшим значением будет 0. Для промежутка Гл 3я1 —, — в качестве наибольшего значения пришлось бы взять больший из двух L 4 2 J я 5 л максимумов 1 и - 0,7 ..., достигаемых при х= — и —, ибо на концах принимают- (л) /ЗлА 2 4 ся значения fl —1=0,7 ... и fl— = -1, меньшие, чем 1. Наименьшее значение достигается на правом конце, в то же время, при х=л, совпадая с минимумом. Если желают избежать исследования на максимум или минимум, то можно поступить иначе. Нужно лишь вычислить значения функции во всех «подозри- тельных» по экстремуму точках и сравнить их с граничными значениями /(а) и /(6); наибольшие и наименьшие из этих чисел, очевидно, и будут наибольшим и наименьшим из всех значений функции. [Л 3л1 ( —, — сравниваем значения /(0) = 1, /1 — 1 = 4 4J (4/ = 0,7 ..., = с граничными /| О, а для промежутка *) Таким образом, мы сохраняем за термином максимум его «локальный» смысл (наибольшее значение в непосредственной окрестности соответствующей точки) и отличаем его от наибольшего значения функции во всем рассматриваемом промежутке. То же относится к минимуму и наименьшему значению функции. 19 Г. М. Фихтенгольц, т. I
290 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [140 сравниваем числа Лу 1“1» /(”) = - 0,7 ... с граничными значениями яичными значениями ясно, что Л- =0,7 ... и/ — --1. И/ (2J Замечание. В прикладных задачах чаще всего встречается простой слу- чай, когда между а и b оказывается лишь одна «подозрительная» точка х0. Если в этой точке функция имеет максимум (минимум), то без сравнения с гра- это и будет наибольшее (наименьшее) зна- чение функции в промежутке (см. рис. 64). Часто в подобных случаях ока- зывается более простым произвести исследование на максимум и минимум, чем вычислять и сравнивать частные значения функции (особенно, если в состав ее выражения входят буквен- ные постоянные). Важно подчеркнуть, что сказанное приложимо в полной мере и к от- крытому промежутку (а, />), а также к бесконечному промежутку. 140. Задачи. Изложим теперь, в виде примеров, ряд задач из разных областей, решение которых приводится именно к разысканию наибольшего или наименьшего значения функции. Впрочем, чаще всего интерес представляют не столько сами эти значения, сколько те точки (те значения аргумента), которые доставляют их функции. 1) Из квадратного листа жести со стороною а, вырезая по углам равные квад- раты и сгибая края (рис. 65), составляют прямоугольную открытую коробку. Как получить коробку наибольшей вмести- мости? Если сторону вырезаемого квадрата обозна- чить через х, то объем у коробки выразится так: у-х(а-2х)2, причем х изменяется в промежутке ^0, . Вопрос привелся к нахождению наиболь- шего значения функции у в этом промежутке. Так как производная У = (а - 2х) (а - 6х) между а а 0 и — имеет единственный корень х= —, то убедив- 2 6 шись в том, что это значение доставляет функции максимум, одновременно получаем и искомое наи- а большее значение. Или иначе: при х = — имеем 6 2а8 а у~ —, в то время как граничные значения у равны 0; следовательно, при х=—, 27 6 действительно, получается наибольшее значение для у. 2) Дано бревно с круглым сечением диаметра d. Требуется обтесать его так, чтобы получилась балка с прямоугольным сечением наибольшей проч- ности. Указание. В сопротивлении материалов устанавливается, что прочность прямоугольной балки пропорциональна, произведению bh\ где b - основание прямоугольника в сечении балки, ай- его высота.
140] § 1. ИЗУЧЕНИЕ ХОДА ИЗМЕНЕНИЯ ФУНКЦИИ 291 Так как №=d2-b2, то речь идет о наибольшем значении для выражения = 6A2=6(d2-b2), причем «независимая переменная» b изменяется в промежутке (0, d). Производная y' = d2-3i2 обращается в нуль лишь однажды внутри этого d промежутка, в точке 6=—. Вторая производная у"=-66-=0, следовательно, ут в указанной точке достигается максимум, а с ним и наибольшее значение. При Ь =—будет h = d ]/ —, так что d:h:b-УЗ: У2:1. Из рис. 66 видно, уг ( 3 как построить требуемый прямоугольник (диаметр разделен на три равные части, в точках деления восставлены перпендикуляры). В строительном деле обычно предписывается отношение h: b = 7:5; это и есть приближенное значение У2=1,4 ... 3) Вокруг полушара радиуса г описать прямой круговой конус наимень- шего объема; при этом предполагается, что основания полушара и конуса лежат в одной плоскости и концентричны (рис. 67). Здесь нужно еще рационально выбрать независимую переменную; пусть ею будет угол <р при вершине конуса. При обозначениях чертежа будем иметь 7? = г г =-----, h =-----, так что объем конуса cosy smy 1 — nr3 1 , 3 v = — nR2h ---------. 3 cos2y-siny Для того чтобы объем v имел наименьшее значение, очевидно, нужно, чтобы выражение у=cos2 у sin у, стоящее в знаменателе, получило свое наи- ГяЛ 0, — I. Имеем - 2 cosy-sin2 у+cos3y = 2 cos3y между 0и — производная обращается в нуль лишь при tg у ---------, у = arctg--- 2 ут ут (что отвечает 35°15'52"), меняя при этом знак плюс на минус. Этот угол достав- ляет выражению у наибольшее значение, а объему v — наименьшее. 19’
292 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [140 4) Груз веса G, лежащий на горизонтальной плоскости, должен быть сдви- нут приложенной к нему силой (рис. 68). Под каким углом к горизонту - при наличии трения - надлежит приложить эту силу, что- бы величина ее F была наименьшей? Ко- эффициент трения д дан. Указание. Трение считается пропорциональ- ным силе, прижимающей тело к плоскости (закон Кулона), и направлено против движения. Множи- тель пропорциональности д и есть «коэффициент тре- ния». Определим силу F, которая соответствует дан- ному углу в. Разлагая ее по горизонтальному и верти- кальному направлениям, получим для составляющих величины F-COS0 и F-sin 0. Сила, прижимающая тело к плоскости, будет G- - F-sin 0, так что, по закону Кулона, трение R=/i(G- F-sin 0); горизонталь- ная составляющая F-cos 8 тянущей силы F как раз и должна уравновешивать его трение: F-cos 0 =д-(С-F-sin 0), откуда fiG cos в +д sin 0 Речь идет о разыскании наименьшего значения этой функции - или наибольшего значения функции у = cos 0 +д sin 0 - при изменении 0 в про- межутке [О, . Производная у'в=дсоа 0 -sin 0 обращается в нуль, если tg 0 =д или 0 = arctg д; этот угол 0 называется «углом трения». Так как j$= -дат 0-cos0< -= 0, то прилагать силу под углом трения оказывается наиболее выгодно. Например, если нужно сдвинуть камень по деревянному настилу, то д= 0,4 и 0^=22°. 5) Известно, что стоимость плавания судна в течение часа выражается в руб- лях эмпирической формулой a+bv3, где а и b - постоянные, которые должны быть установлены отдельно для каждого судна, a v - скорость судна в узлах (узел= 1,85 км/час)*). При какой скорости («экономической») судно покроет любое расстояние с наименьшими затратами? 1 1,85г» ’ J ' г На покрытие 1 км потребуется -—— часа, соответствующие затраты выразят- ся формулой 1>85г’ 1 1 ( а) -----(a+bv3) = tv2-]— . 1,85г» 1,85 ( v) Приравнивания нулю производную выражения y = bi^+—, получим yi-=2bv- V а 1Га 2а ----=0, откуда г>= / —. Так как yv> = 2b-l—=-0, то при найденном значении v V 2b v3 затраты действительно достигают наименьшей величины. з___ Численный пример: а=40, 6 = 0,01, г» = У2000= 12,6 (узлов). *) В этой формуле постоянная часть расхода а относится к амортизации и к содержанию команды, а второй член bv3 — к стоимости топлива.
140] § 1. ИЗУЧЕНИЕ ХОДА ИЗМЕНЕНИЯ ФУНКЦИИ 293 б) Пусть электрическая лампочка может передвигаться (например, на блоке) по вертикальной прямой ОВ (рис. 69). На каком расстоянии от горизонтальной плоскости ОА ее следует поместить, чтобы в точке А этой плоскости получить наибольшую освещенность? Указание. Освещенность J пропорциональна sin(р и обратно пропорцио- нальна квадрату расстояния г=АВ, т. е. sin 9? где с зависит от силы света лампочки. Если за независимую переменную вы- брать h = ОВ, то h „----------- siny = —, r= VfP+c? г и h J—с*---------- (0-=й<+~). (Л2+а2)»/2 1 ' Далее, производная , аг-2кг Jh = с--------- Рис. 69. обращается в нуль при й =—= 0,7я, меняя знак при переходе через это значение с плюса на минус. Это и есть наивыгоднейшее расстояние. Можно выбрать за независимую переменную угол д>; тогда г=----, J=—cos2ysiny, cosy о2 и дело сводится к разысканию наибольшего значения для функции у=cos2 у sin у ( 711 в промежутке 0, — . Но мы уже знаем [см. задачу 3)], что это наибольшее значение достигается при угле у0, для 1 которого tgy0 =—. Для расстоя- V2 ния h получаем прежнее значе- а HHeatgy0=—. У2 7) Из точки А, находящейся на железнодорожной магистрали АВ (рис. 70), грузовой поток направляется в точку С, отстоя- щую на расстояние СВ=1 от линии железной дороги. Стои- мость провоза весовой единицы на единицу расстояния есть а - по железной дороге и /? - при гужевой транспор- тировке. К какой точке М следует провести шоссе МС, чтобы провоз груза из А в С (по линии АМС) был возможно дешевле? При обозначениях чертежа стоимость провоза весовой единицы груза - при произвольном положении точки М - оказывается равной у=a(rf-x)+/5yx2+/2 (0^x=^d).
294 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [141 Имеем Ух~ Vх _ о( х --------а == р I--- 1/х* + в Vfifl+P -к Если ks=l (о№*0), то это выражение сохраняет знак минус, не обращаясь вовсе в нуль. Функция у убывает с возрастанием х от 0 до d и, очевидно, достигает своего наименьшего значения при x-d. В этом случае всего выгоднее начинать шоссе непосредственно у точки А. То же справедливо и при А-с 1, если только одновременно -±^d. /1-А2 Действительно, при к< \ выражение У%2+/2 имеет единственный корень kl - уг^’ Но при сделанном предположении этот корень оказывается лежащим вне до- пустимого для х промежутка изменения (или на конце его), так что внутри проме- жутка производная у£ оказывается отрицательной. Лишь в том случае, если упомянутый корень будет это значение х опре- деляет положение точки М между А и В, при котором расходы по перевозке будут наименьшими. Замечание. Пользуемся случаем обратить внимание читателя на сле- дующее обстоятельство. При разыскании наибольшего или наименьшего значе- ния функции для определенного промежутка изменения аргумента легко может оказаться, что внутри этого промежутка вовсе нет корней производной (или других «подозрительных» значений). Это свидетельствует о том, что в рассматриваемом промежутке функция оказывается монотонно возрастающей или убывающей и, следовательно, достигает как наибольшего, так и наименьшего своего значения на концах промежутка. В последней задаче при определенных соотношениях между входящими в нее величинами как раз и осуществляется подобное положение. § 2. Выпуклые (и вогнутые) функции 141. Определение выпуклой (вогнутой) функции. После класса монотонных функций, возрастающих или убывающих, выделяется класс так называемых выпуклых или вогнутых функций. Функция f(x), определенная и непрерывная в промежутке X♦), называется выпуклой (выпуклой вниз), если для любых точек и х2 из X (х^х.У) выполняется неравенство ЛЯЛ + q2x^qi -/(хЭ + -f(x2), (1) *) Здесь X снова может быть замкнутым или нет, конечным или бесконечным.
141] $ 2. ВЫПУКЛЫЕ (И ВОГНУТЫЕ) ФУНКЦИИ 295 каковы бы ни были положительные числа q^u q2, в сумме дающие еди- ницу. Функция называется вогнутой (выпуклой вверх), если - вместо (1) - имеем*) f(qiXr + q&)»qi -f(xj) + q2 -f(x2). (la) Очевидно, что, если функция f(x) выпукла (вогнута), то функция - f(x) оказывается вогнутой (выпуклой), и наоборот. Это простое замечание позволит нам во многих случаях ограничиваться изучением лишь выпуклых функций. Приведенное определение выпуклой функции имеет простой гео- метрический смысл. Прежде всего отметим, что выражение x = 0iXi + ?2X2 Ох-=*2). (2) при наложенных на qt и q2 условиях, содержится между хх и х2; об- ратно, каждое число х, которое содержится' между хх и х2, может быть единственным образом представлено в указанной форме, с. ко- эффициентами 1 Х2-Xi и (2а) _ Х-Х1 ^2~X2-Xi ' Если рассмотреть график функции f(x) (рис. 71) и его дугу между точками Л1(Х1,ух) и Л2(х2,у2), где У1=/01), J2=/(x2), то в ле- вой части неравенства (1) - при коэффициентах (2а) - мы имеем ординату точки А дуги АгА2 с абс- циссой х. В правой же части этого неравенства стоит ордината точки В хорды АГА2 с той же абсциссой. Таким образом, выпуклая функция харак- теризуется тем, что все точки любой дуги ее графика лежат под *) Понятие выпуклой (вогнутой) функции было введено Йенсеном (J. L. W. V. Jensen), который исходил, однако, из более частного соотношения, чем (1) [или (1а)], именно: fхг+хЛ ^/(хО+Дхг) Ч 2 Г 2 оно отвечает qv = q2 = —. В случае непрерывных функций, которыми мы ограничиваемся, его определение равносильно данному в тексте.
296 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [142 соответствующей хордой или н а ней. (В случае вогнутой функ- ции вместо «под» следовало бы сказать «над».) Одновременно с самой функцией f(x) выпуклой (вогнутой) называют и кривую У=Ф(х)- Тривиальным примером выпуклой (и - одновременно - вогнутой) функции служит линейная функция f(x) = ax+b: для нее соотношение (1) выполня- ется всегда со знаком равенства. Выпуклой функцией будет и функция /(х) = = х2, что легко проверить непосредственно по определению: (ЯМ + <72х2)2 = ^х’ + q^xl+ад/xj - х2)2 < qtXi + ?2x2, если ?t> = Другие примеры выпуклых функций читатель найдет ниже. 142. Простейшие предложения о выпуклых функциях. 1°. Произ- ведение выпуклой функции на положительную постоянную есть вы- пуклая функция. 2°. Сумма двух или нескольких выпуклых функций тоже выпукла. В обоих случаях доказательство сразу получается из опреде- ления. Замечание. Произведение двух выпуклых функций может не оказаться выпуклой функцией. Пример тому будет дан ниже (в сноске на стр. 300). \ 3° Если <р(и) есть выпуклая и притом возрастающаяся функция, a u=f(x) также выпукла, то и сложная функция ф(/(х)) будет вы- пуклой. Действительно, ввиду выпуклости /[см. (1)] и возрастания <р имеем <р(/(9Л + ад)) «ф(91 ’ ЛХ1)+92 а в силу выпуклости последнее выражение не превосходит ^-^(/(xj)) + + 92‘Ч’(/(Х2))> так что окончательно получаем неравенство ^(/(ад + ад)) «91 • ф(/(*1)) + 9г • <Р(/(Х2)) > которое и представляет собой соотношение типа (1) для функции <?(/(*))• Предлагаем читателю доказать аналогичные утверждения, содер- жащиеся в таблице: ф(и) u=f(x) выпукла, убывает вогнута, возрастает вогнута, убывает вогнута вогнута выпукла выпукла вогнута вогнута
142) 6 2- ВЫПУКЛЫЕ (И ВОГНУТЫЕ) ФУНКЦИИ 297 4°. Если y-f(x) и x=g(y) суть однозначные взаимно обратные функ- ции (в соответствующих промежутках), то одновременно f<X) g(y) выпукла, возрастает выпукла, убывает вогнута, убывает вогнута, возрастает выпукла, убывает вогнута, убывает Пусть, например, в первой строке из предположения относительно/ мы хотим вывести заключение относительно g. Положим Я^)=Л» f(x^=y2, так что x^gtyj, x2=g(y2). Имеем, по основному неравенству (1) Я?Л + «Н1 ’/(*1) + & -/W = У1 + Ч2У2 • Так как, по теореме об обратной функции [83], функция g(y) также будет возрастающей, то ё(Я1У1 + <ЬУг)^8(/(Я1Х1 + ?2*г)) = <h' #( Ji) + 7г • 8<.У^> что и доказывает вогнутость функции g [см. (1а)] ♦). 5°. Выпуклая в промежутке X функция f(x), отличная от постоян- ной, не может достигать наибольшего значения внутри этого промежутка. Допустим противное: пусть функция достигает наибольшего зна- чения во внутренней точке х0 промежутка. Так как функция отлична от постоянной, то эту точку можно заключить в такой промежуток (*i, *s): Xj -= Xq -= х2, чтобы хоть на одном из концов значение функции было строго мень- ше, чем в точке х0. Пусть, скажем, /(*i)-=/W, /(.^^/(Хо). Полагая х0=^1х1 + ^2х2, умножим обе части первого неравенства на qlt а второго на q2 и сложим. Мы получим + ?2 -Я*г) ^f(x0) =/(7Л + <hxJ, что противоречит выпуклости функции /. Этим наше утверждение доказано. 6°. Если промежуток [хх, х2], где х1-=х2, содержится в промежутке X, в котором функция /(х) выпукла, то соотношение (1) выполняется либо всегда со знаком равенства, либо всегда со знаком не- равенства. Возвращаясь к обозначениям рис. 71, геометрически это можно выразить так: дуга АГА2 либо сливается с хордой АГА2, либо же (за исключением концов) вся лежит под хордой. *) Все сформулированные в таблице утверждения очевидны из чертежа.
298 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [143 Для доказательства рассмотрим линейную функцию (3), ко- торая в точках хг и х2 принимает те же значения, что и функция /(х); для краткости обозначим эту функцию через /(х). Разность ?(х)=/(х)-/(х)=/(х)+ [-/(*)], ввиду выпуклости функций f я -I, тоже будет выпуклой [2°]. Тогда либо д>(х)=0 в промежутке [хх, xj, либо этого нет. В первом случае f(x)=l(x~) в этом промежутке, т. е. дуга сливается с хордой, и соотношение (1) выполняется всегда со знаком равенства. Во втором случае во всем промежутке (Xj, х^) должно быть <р(х)<0, ибо, если бы функция д> принимала в этом промежутке и неотрицательные значения, то она достигала бы своего наибольшего в промежутке [xi, xj значения внутри этого промежутка, что для отличной от постоянной выпуклой функции невозможно [5°]. Итак, внутри про- межутка /(х) < /(х), кривая лежит под хордой, и соотношение (1) выполняется всегда со знаком неравенства. Если для любого промежутка [х1э xj, х1<х2, содержащегося в X, соотношение (1) выполняется со знаком неравенства, мы будем функцию f(x) называть строго выпуклой. Аналогично уста- навливается понятие строго вогнутой функции. Эта терми- нология применяется одновременно и к кривой y=f(x). 143. Условия выпуклости функции. Учитывая (2) и (2а), можно основное неравенство (1) переписать так: /(*>^/(*1) + A2 А-2 *'1 или - более симметрично - (х2 - x)y(xj) + (хх - х2)/(х) + (х - х^Дх^&О. (4) Наконец, эту условие может быть записано и с помощью опреде- лителя: (5) Во всех случаях предполагается, что х содержится между хх и х2; для опреде- ленности будем впредь считать х1<х2. Заметим, попутно, что условие выпукло- сти функции в форме (5) получает не- посредственное геометрическое истолкование, если вспомнить, что написанный определитель выражает удвоенную площадь ^ЛХЛЛ2 (рис. 72) с плюсом именно тогда, когда треугольник положи-
143] § 2. ВЫПУКЛЫЕ (И ВОГНУТЫЕ) ФУНКЦИИ 299 те ль но ориентирован, т. е. периметр его Ах-А-А2 описывается против часовой стрелки. Отметим особо, что, если речь идет о строгой выпуклости, то во всех этих условиях знак равенства должен быть исключен. Удобные для проверки условия выпуклости функции /(х) полу- чаются, если привлечь ее производные. Теорема 1. Пусть функция f(x) определена и непрерывна в проме- жутке ЗС и имеет в нем конечную производную f'(x). Для того, чтобы f(x) была выпуклой в 33, необходимо и достаточно, чтобы ее произ- водная f’(x) возрастала (в широком смысле). Необходимость. Пусть функция f(x) выпукла. Предпола- гая х1<х-=х2, препишем условие (4) в виде: /(x)-/(xi) ^.Дх^-Дх) X-Xi х2-х ' ' Если теперь устремить здесь х к хх или к х2, то в пределе, соответ- ственно, получим s/(*2)-/(Xl) Л7аЧ x2-xt (76) х2 ~ Х1 откуда /'(xj)=s/'(x2)> так что Функция f'(x) действительно оказывает- ся возрастающей (в широком смысле). Достаточность. Предположим теперь выполнение этого последнего условия. Для доказательства неравенства (6) применим к каждой из его частей формулу конечных приращений [112] Л л2 ** причем х:-=х-=$2-=х2. Так как, по предположению, /'($1)^/'(^)> то соотношение (6), действительно, имеет место, а из него можно восстановить соотношение (4), обусловливающее выпуклость функции /(X). Теорема 2. Пусть функция f(x) определена и непрерывна вместе со своей производной f'(x) в промежутке 33 и имеет внутри него конечную вторую производную f"(x). Для выпуклости функции f(x) в ЗС необходимо и достаточно, чтобы внутри 33 было /"(х)^0. (8) В связи с предыдущей теоремой, достаточно применить к функ- ции f'(x) теорему 2 п° 132. •) В интересах последующего подчеркнем, что при выводе неравенств (7а) и (76) использовано было только существование производной, соответст- венно, в точке Xj или х2.
300 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [143 Для вогнутости функции аналогично получается условие /"(х)^0. (8*) Таким образом, требование /"(х)>0 (<0) (9) заведомо обеспечивает строгую выпуклость (вогнутость), ибо исключает возможность для функции /(х) быть линейной в каком бы то ни было промежутке [142, 6°]. Теперь сразу облегчается построение любого числа примеров как выпуклых, так и вогнутых функций: 1) Функция ах («=-0, а^1) является выпуклой в промежутке (-«=, +~), так как (ах)" = ах • (In а)2 => 0; 1 2) функция In % вогнута в промежутке (0, +<»), ибо (1пх)"=-—<0 [ср. 142, 4°]; *2 1 3) для функции х-1пх (в том же промежутке) вторая производная ~>0, и функция выпукла; х 4) для функции хг (в том же промежутке) вторая производная равна г(г- 1)хг-2: отсюда видно, что при г =-1 и 0 функция выпукла, апри0-=т<1 вогнута*), и т. д. Во всех этих примерах фактически имела место строгая выпуклость или вогнутость. В заключение, мы укажем еще одну важную геометрическую характеристику выпуклой функции f(x). При этом, вместо хорды графика функции y=f(x), ко- / торую мы рассматривали в .Л п° 141, здесь мы привлечем к рассмотрению касатель- Уи у ю в любой точке графика (рис. —Теорема 3. Пусть функция f(x) определена и непрерывна ______________I в промежутке X и имеет О хи_в нем конечную производную Рис. 73. f'(x). Для выпуклости функции f(x) необходимо и достаточно, чтобы ее график всеми точками лежал над любой своей касательной (или на ней). Необх одимость. Касательная к кривой у - f(x) в точке Л0(х0, /(хо)) имеет угловой коэффициент /'(х0). Уравнение касатель- ной напишется так: J=/(^o)+/'(xo)(x-xo). *) Этот пример дает возможность - попутно - показать, что произведение двух выпуклых функций может не быть выпуклой функцией; так, функция -х1/з выпукла, в то время как ее квадрат, т. е. функция х2/з оказывается вогнутой,
144] § 2. ВЫПУКЛЫЕ (И ВОГНУТЫЕ) ФУНКЦИИ 301 Надлежит показать, что выпуклость функции f(x) влечет, для любых точек х0 и х из ЭС, неравенство /(х)&./(х0)+/'(х0)(х-х0). (Ю) Оно равносильно двум таким для х>х° (11а) И Для х^хй, (116) а эти неравенства совпадают, соответственно, с неравенствами (7а) и (76), полученными при доказательстве теоремы 1 (именно в пред- положении выпуклости функции), если в первом из них положить х2—х, хг = х0, а во втором х2 = х0, хх-х. Достаточность. Предположим, наоборот, что выполняет- ся неравенство (10) или - что то же - неравенства (Па) и (116). Тогда по ним можно восстановить неравенства (7а) и (76), откуда следует, что так что производная f'(x) будет возрастаю- щей функцией. Это же, в свою очередь, как мы знаем (теорема 1) влечет за собой выпуклость функции f(x). Замечание. Обращаем внимание читателя на то, что факти- чески (см. сноску на стр. 299) необходимость неравенства (10) - для данного х0 и произвольного х # х0 - доказана в пред- положении лишь существования производной /'(х0) в самой точке х0. 144. Неравенство Йенсена и его приложения. Согласно определению выпуклой функции [см. (1)], имеем f(<hXi + <72x2)^<7i -/Ui) + q2 f(x2). Можно доказать, что для выпуклой функции имеет место более общее неравенство (которое связывают с именем Йенсена): /(9Л+?2х2+ ... +qnxn)^qrf(xl)+q2-f(x^+ ... + qn-f(xn) (12) (<?i.....д1+.,. + дл=1) каковы бы ни были значения ха, х,, • •, хп из основного промежутка Для п = 2 оно, как мы знаем, верно; допустив теперь, что оно верно для какого-либо нату- рального числа лэ=2, докажем, что оно верно и для л+1, т. е. что, взяв п+1 значе- ниях!, .. .,хп,хп+1из Эи ил+1 положительных чисел .. сумма которых равна единице, будем иметь /(<71*! + • • • + qnxn + ?n+iXn+i)=s?i -/СО + • • • + qn -f(.xn) + qrt+1-f(xn+J). (13) С этой целью, заменим слева сумму двух последних слагаемых q4Xn+qn+1xn+1 одним слагаемым , . х / Яп qn+\ 1 \qn -T<7n-i-i) -----Хп~\---------Xj+i , \.qn+qn+i qn + qn+i )
302 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [144 это даст возможность воспользоваться неравенством (12) и установить, что выра- жение в (13) слева не превосходит суммы ?1’/(*1) + • • • +(?n + 9n+t)’/|-xn-f-----——Xn+ii • wi+<7n+i <7n + <7n+i ) Остается лишь применить к значению функции в последнем слагаемом основ- ное неравенство (1), чтобы придти к (13). Таким образом - по методу математи- ческой индукции - неравенство (12) полностью оправдано. Обычно, вместо множителей qt, сумма которых равна единице, вводят произ- вольные положительные числа д,. Полагая в неравенстве (12) Hl 9 Р1+ • • • +Рп приведем его к виду (SptxA Xpi-ftXi) Ч-ЕлЛ ZPi ’ ( } В случае вогнутой функции / очевидно, знак неравенства нужно изменить на обратный. Выбирая различными способами функцию /, можно получать важные конкрет- ные неравенства - и притом все из одного источника! Приведем примеры. 1) Пусть f(x) = xk, где х=»0, £=-1 (выпуклая функция). Имеем /' ZpjXj\k L'Pix'i ( Spi J Spj или {Sptx^Sp^-Spixt к _ .A—1 ai Заменяя здесь д, на bi , a x, на -, придем к уже известному нам неравен- ству Коши - Гельдера 1 ( Еа^{2ак}к-\sbk J к [ср. 133 (5)]. 2) Полагая /(х) = In х, где х =- 0 (вогнутая функция), получим Spi-laxi Sp;xt ------==ln---. Spt Spt Отсюда, потенцируя, придем тоже к уже встречавшемуся неравенству {П^^уХ1 [ср. 133 (4)]. 3) Наконец, возьмем /(х) = х-1п х, где х>0 (выпуклая функция). Тогда окажется, что SPl SPi Spt *) Наподобие того, как S означает сумму, знак JJ означает произ- ведение.
145] § 2. ВЫПУКЛЫЕ (И ВОГНУТЫЕ) ФУНКЦИИ 303 Умножая на Л'р, и потенцируя, получим неравенство 1 В частности, положив здесь р, = — , будем иметь Xi п №i. Если распространить понятие среднего гармонического*) на случай нескольких чисел, то неравенство это можно сформулировать так: среднее гармо- ническое ряда положительных чисел не превосходит их среднего геометрического. 145. Точки перегиба. При построении графиков функций (чему будет посвящен следующий параграф), представляют интерес, так называемые, точки перегиба кривой у = f(x). Точку М(х0, Дх0)) кривой называют ее точкой перегиба, если она отделяет участок кривой, где функция f(x) выпукла (вы- пукла вниз), от участка, где эта функция вогнута (выпукла вверх) (рис. 74). Рис. 74. Если предположить, что в рассматриваемом промежутке функция f(x) имеет конечную производную, то эта производная, по теореме 2, возрастает в некоторой окрестности [х0 - д, х0] слева от х0 и у бывает в окрестности [.х0, х0 + <5] справа, или наоборот - убывает слева и возрастает справа. В первом случае f'(x) имеет при х = х0 максимум, а во втором - минимум. Если допустить еще существование конеч- ной второй производной f"(x) хотя бы только при х=х0, то необходимо f"(x^ = Q (ср. 134]. Это условие Д'(хо) = О играет такую же роль в отношении точек перегиба, какую играло условие f'(x^ = d при разыскании экстре- мумов функции f(x)'. оно необходимо, но не достаточно. *) См. сноску на стр. 74.
304 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [145 В последнем легко убедиться на примере - пусть f(x) = xi, тогда /"(х) = 12х2=»0 в промежутке (- ~, + •=), так что, по теореме 2, функ- ция f(x) выпукла во всем этом промежутке, хотя /"(х) обращается в нуль в точке х = 0. Если вторая производная f"(x) существует везде внутри рассма- триваемого промежутка, то абсциссы точек перегиба следует искать среди корней этой производной. Но каждый корень х0 подлежит испытанию. Пусть в некоторых окрестностях [х0-3, х0) и (х0, х0 + 3] слева и справа от х0 производная /"(х) сохраняет опре- деленный знак. Тогда для распознавания точки перегиба можно дать такое правило: если при переходе через значение х = х0 производная f"(x) меняет знак, то налицо перегиб, если же знака не меняет, то перегиба нет [ср. 135]. Отметим, что при этом на участках кривой, отделенных точкой (х0,/(хб)), кривая оказывается строго выпуклой на одном и с т р о- г о вогнутой на другом. Рассмотрим, для примера, функцию f(x) = sin х; для нее /"(х) = - sin х обра- щается в нуль в точках х=кп (к - целое), меняя при этом знак. Следо- вательно, все точки синусоиды, лежащие на оси х, являются точками перегиба; легко видеть, что в промежутках (2т -1л, 2тп) синусоида выпукла (выпукла вниз), а в промежутках (2тл, 2т+ 1л) она вогнута (выпукла вверх). Можно было бы, как мы это сделали в п° 138 при разыскании экстремумов функции, привлечь и высшие производные в испытуемой точке х0, для которой /"(хо) = О. Таким путем получается правило: если первая из производных (выше второго порядка), не обращающихся в точке х0 в нуль, есть производная нечетного порядка, то налицо перегиб', если же такой производной является производная четного порядка, то перегиба нет. В заключение, укажем замечательное свойство кривой y=f(x) относительно касательной к ней в точке перегиба (если такая каса- тельная существует): кривая переходит в этой точке с одной стороны касательной на другую, т. е. кривая и касательная взаимно пересекают- ся (см. рис. 74). Это обстоятельство очевидно, если касательная вертикальна (ср. рис. 43, а и б). Обратимся к случаю наклонной или горизонтальной касательной, предполагая существование конечной производной /'(х0). Допустим для определенности, что левее точки перегиба, для х0 - =sx<x0, кривая выпукла, а правее, для х0<х=ех0 + <5, кривая вогнута (это отвечает рис. 74, б). В этом случае установим, что для х-=х0 кривая лежит над касательной (или на ней), а для х >х0 - под касательной (или на ней), т. е. что f<x)»f(x^+f'(x^(x-x^, если х<х0 и /(х)^/(х0)+/'(х0)(х-х0), если х>х0.
146] § 3. ПОСТРОЕНИЕ ГРАФИКОВ ФУНКЦИЙ 305 Но первое из этих неравенств совпадает с неравенством (10) [143] (следует иметь в виду замечание, там же). Второе есть аналог неравенства (10) для вогнутой функции. Замечание. Часто именно это свойство кривой принимают просто за определение точки перегиба. Такое определение вовсе не равносильно данному выше. Кривая прежде всего может не иметь касательной в точке перегиба, так что второе определение окажется неприложимым. Может случиться обрат- ное: кривая пересекает касательную в точке, которая не отделяет выпуклого участка кривой от вогнутого, и первое определение не- приложимо. Таковы кривые на рис. 43, в и г; но интереснее кривая у = х5 (1 +sin2 при х#0, j = 0 при х = 0, которая в начале координат касается оси х и пересекает ее; здесь существует даже непрерывная вторая производная, но она бесчисленное множество раз меняет знак вблизи точки х — 0 как слева, так и справа от нее. § 3. Построение графиков функций 146. Постановка задачи. Во всеоружии методов дифференциаль- ного исчисления вернемся к вопросу о построении графиков функций [ср. 47]. Пусть сначала требуется построить график не- прерывной в конечном промежутке [а, Ь] функции y=f(x). При этом сейчас основной целью для нас является возможно точная харак- теристика самого хода изменения функции', точность отдель- ных ординат интересует нас в меньшей степени. Обычно применяемый прием построения «по точкам» [47], взятым более или менее густо, но случайно и без отношения к (неиз- вестным наперед) особенностям графика, непригоден. Он прежде всего требует вычисления большого числа координат, что практи- чески неудобно. Но главное в другом: он непригоден принци- пиально, потому что именно ввиду случайности вычисляемых ординат он все же не обеспечивает достижения поставленной цели. Предположим теперь, что функция у =f(x) вообще имеет конечную производную у' = /'(х); исключение может представиться лишь в ко- нечном числе отдельных точек, где производная оказывается беско- нечной - определенного знака или разных знаков справа и слева. Тогда методы дифференциального исчисления дают возможность уста- новить некоторое число «опорных» точек, характерных имен- но для данного графика, по которым график строится уже с достаточной точностью. Прежде всего, мы имеем здесь в виду поворотные точки графика, т. е. вершины его горбов и впадин, отвечающие экстре- мальным значениям функции [134-138]. Впрочем, к ним следует 20 Г. М. Фихтенгольц, т. I
306 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [147 присоединить все вообще точки, где касательная горизонтальна или вертикальна, даже если они не отвечают экстремумам функции. Разу- меется, должны быть отмечены и концы графика. Когда упомянутые только что точки нанесены на чертеж (а число их обычно невелико), этого, собственно, уже достаточно для построе- ния графика. Построенный подобным образом график уже довольно полно отображает ход изменения функции, точно отмечая промежутки ее возрастания и убывания, а также точки, где скорость изменения функции падает до нуля (j' = 0) или возрастает до бесконечности (У - ± ~). Можно достигнуть дальнейшего уточнения графика, если учесть его выпуклость (выпуклость вниз) или вогнутость (вы- пуклость вверх) на отдельных участках и положение отделяющих их точек перегиба [143, 145]. 147. Схема построения графика. Примеры. Итак, пусть функция y=f(x) в рассматриваемом промежутке [a, Z>] дважды дифференци- руема, исключая отдельные точки, в которых производная y'=f'(x) 'zm.qq't бесконечное значение, определенного знака с обеих сторон или разных знаков справа и слева. Тогда для построения графика функции y=f(x) надлежит выпол- нить следующее: 1) определить значения х, для которых производная у' = /'(х) равна нулю или бесконечности, и подвергнуть их исследованию на экстремум; 2) определить значения х, для которых вторая производная у" = =f"{x) равна нулю, и подвергнуть их исследованию на перегиб; 3) вычислить значения самой функции y=f(x), отвечающие всем этим значениям х, а также концам а и b рассматриваемого промежутка. Результаты удобно расположить в виде таблицы [см. ниже при- меры], с непременным указанием особенности вычисленной точки графика: максимум, минимум, у' = 0, у' = + ~ или - у' = ± ~ или + ~*), перегиб. Иногда к названным точкам графика при желании присоединяют еще и некоторые другие, например, точки пересечения графика с осями. После нанесения на чертеж всех вычисленных точек через них проводят самый график, учитывая при этом все упомянутые их осо- бенности. Мы имеем в виду, конечно, обычный в практике построения графиков случай, когда первая производная обращается в 0 (или в ± ~) или вторая производная обращается в 0 - лишь в конечном числе точек. *) Так мы условно будем отмечать тот факт, что производная слева есть +~, а справа - или наоборот.
147| § 3. ПОСТРОЕНИЕ ГРАФИКОВ ФУНКЦИЙ 307 Тогда в промежутках между ними график идет все время вверх или все время вниз, а также оказывается выпуклым, вниз или вверх. Вычисления и проведение кривой упрощаются, если функция не изменяет своего значения при изменении знака х (четная функ- ция), так что график симметричен относительно вер- тикальной оси. Аналогичную услугу может оказать и сим- метрия относительно начала координат, которая аналитически выражается в том, что функция при изменении знака х также лишь меняет знак (нечетная функция). Примеры. 1)В 136, 2) мы уже исследовали поведение функции у = sin3 x + cos3 х; с помощью ее производной мы установили значения х, доставляющие функции экстремумы, а также вычислили и сами экстремальные значения функции. При этом, ввиду периодичности функции, мы ограничились промежутком [0, 2л] изме- нения х. График функции также достаточно построить для этого промежутка. Теперь нам нужно найти корни второй производной. Если представить ее в виде 9 ( 2 у" = ~ (sin x+cos х) Isin 2х-у Зл то легко видеть, что первый множитель в скобках обращается в 0 при х = — = 7л 4 + 2,36 и — + 5,50, а второй - при х+0,36 (21°), 1,21 (69°), 3,51 (201°) и 4,35 (249°); 4 во всех случаях знак у" меняется, так что налицо перегиб. Составляем таблицу: х=0 0,36 0,78 1,21 1,57 2,36 3,14 3,51 3,94 4,35 У=1 0,86 0,71 0,86 1 0 -1 -0,86 -0,71 -0,86 У=о макс. перегиб У==о мин. перегиб у=о макс. перегиб У = 0 мин. перегиб у=о макс. перегиб №=4,71 5,50 6,28 х=-1 0 1 у=о мин. перегиб _у'=0 макс. По этой таблице и построен график, изображенный на рис. 58. Замечание. Читатель должен иметь в виду, что приводимые в книге чертежи, ввиду малого масштаба, не полностью ис- пользуют те точные данные, которые полу- чены вычислением. Рекомендуется повторить эти чертежи в большом масштабе. 2) Рассмотрим функцию y = sin x + sin 2х. Она не только периодична, но и нечетна. Это позволяет сократить еще про- межуток изменения х, сведя его к [0, л]. В этом промежутке производная у'-cos х + 2 cos2х = 4 cos2 x + cos х -2 20»
308 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [148 обращается в 0, если cos х---------, т. е. при х ’ 0,94 (54") и 2,57 (147"). Так 8 как вторая производная у” = - sin х - 4 sin 2х = - sin х(1 + 8 cos х) при первом из этих значений, очевидно, отрицательна, то она доставляет функции максимум; аналогично, при втором значении имеем минимум. Сама вторая производная обращается в 0 вместе с sinx при х = 0 или х=л^3,14, а также вместе с множителем в скобках при х=1,70 (97°) - во всех случаях меняя знак (перегиб). Таблица: х=0 0,94 1,70 2,09 2,57 3,14 у=0 1,76 0,74 0 -0,37 0 перегиб У = 0 .макс. перегиб У=0 мин. перегиб 2 К указанным выше значениям х мы присоединили здесь еще значение х = — л = 3 = 2,09 (120°), при котором у --0 (график пересекает ось х). График, построенный по этим точкам, изображен на рис. 75; для промежутка [-л, 0] он получается двойным перекладыванием: вокруг оси у, а затем - вокруг оси х. 148. Бесконечные разрывы, бесконечный промежуток. Асимптоты. Полезно расширить класс рассматриваемых функций в двух направле- ниях. Во-первых, мы допустим теперь для функции у = f(x) возмож- ность обращаться в бесконечность для отдельных значений х. Это значит, - если х0 есть одно из таких значений, что, при приближении х к х0 с той или с другой стороны, /(х) стремится к + ~ или к - ~. Во-вторых, нас может интересовать поведение функ- ции ив бесконечном промежутке. Так как размеры чертежа, разумеется, конечны, то в обоих этих случаях приходится довольствоваться частью всего графика. За пре-
148] § 3. ПОСТРОЕНИЕ ГРАФИКОВ ФУНКЦИЙ 309 делами чертежа стараются оставить такие части графика, о виде которых легко наперед составить себе представление, исходя из того, что начерчено. Остановимся на случае бесконечного разрыва функции, скажем, при х=х0. При приближении х к х0 с одной стороны функция стре- мится к бесконечности (того или иного знака) монотонно - если, по крайней мере, в конечной части промежутка - производная у' = f'(x) лишь конечное число раз меняет знак. С разных сто- рон от л'о (если л'о не есть конец промежутка) функция может иметь пределы и разных зна- ков. Во всяком случае, график будет безгранично прибли- жаться, уходя в бесконечность, к вертикальной прямой х = х0 в верхней или в нижней его части, смотря по знаку бес- конечного предела. Эта пря- мая позволяет отчет- ливо представить се- бе вид графика и за пределами чертежа (рис. 76). Примерами могут служить и уже известные нам графики функций у = при х = 0 (рис. 10), у = tg х при x = (2fc + l)~ (рис. 16), y = logax при х = 0 (рис. 14). В случае бесконечного (в одну сторону или в обе) промежутка, подобную же услугу иногда оказывает горизонтальная или наклонная прямая, к которой график приближается безгранично. В связи с этим, дадим следующее общее определение. Пусть имеем кривую, ветвь которой в том или ином направлении удаляется в бесконечность. Если расстояние 3 от точки кривой до некоторой определенной прямой по мере удаления точки в бесконеч- ность стремится к нулю, то эта прямая называется асимптотой кривой. Только что мы имели дело с вертикальными асимптотами; теперь займемся асимптотами горизонтальными и на- клонными - все время для кривой, заданной уравнением у = f (х). Примеры горизонтальных асимптот нам уже встречались: для кривой у = | - прямая у = 0 при х^±~ (рис. 10), для кривой у = arctg х прямые у=| и у = , соответственно, при х-н ~ и х — (рис. 21), для кривой у = ах - прямая у = 0 при х — если а 1 и при х-- + ~, если 1 (рис. 13).
310 гл. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ (148 Для того чтобы, например, при х—+ ~, прямая Y=b служила асимптотой для кривой у=f (х), очевидно (рис. 77), необходимо и достаточно, чтобы было lim (5 = lim |y-Z>| =0 или limy = lim/(x) = Z>. х-*--Н» х-*+°° х-*+-» Х-»4-°е‘ Таким образом, вопрос о горизонтальной асимптоте сводит- ся попросту к вопросу об этом пределе. Отдельно нужно искать подобный предел и при х-+ - при этом (как, например, в случае кривой у = arctg х) может получиться и другая асимптота. Переходя к наклонным асимптотам, упомянем, что приме- рами их могут служить известные читателю из аналитической геомет- рии асимптоты у — ±^х гиперболы ^-^=1 или у=±-/х2-п2 (1) а2 о2 J а (см. также рис. 7). Предположим теперь, что кривая у = /(х) имеет наклонную асимптоту Y=ax + b (2) (рис. 78), скажем, со стороны положительной части оси х. Так как разность ординат |у- У| лишь постоянным множителем (равным косинусу угла между асимптотой и осью х) разнится от расстояния д, то при х — + °° одновременно с 3 должна стремиться к нулю и эта разность: lim (y-ax-b) = 0. (3) х->+°° Разделив на х, получим отсюда: lim ^=а; (4) Х-+"° л кроме того, равенство (3) непосредственно дает lim (у - ах) = Ь. (5) х-*+«>
149] § 3. ПОСТРОЕНИЕ ГРАФИКОВ ФУНКЦИЙ 311 Итак, для того чтобы прямая (2) была асимптотой для данной кри- вой, необходимо выполнение условий (4) и (5). Обратное рас- суждение легко покажет и их достаточность. Вопрос здесь свелся к последовательному разысканию пределов (4) и (5), кото- рыми уже и определятся коэффициенты уравнения прямой (2). Разумеется, для х — - ~ нужно повторить все исследование. Например, в случае гиперболы (1), считая х — + ~, имеем у -а2___1Л аг . х а х ~ а 1 хг ~ а’ затем, b , b /-.г., г, \ ab п у + -х = ± - (Ух- - ст - х) = +-—=-*0, а а х+Ух2-а- и мы приходим к известным уже нам асимптотам: , ь у = ±-х. а Возвращаясь к задаче о проведении графика функции, теперь мы добавим к сказанному в предыдущем п° в пунктах 1), 2), 3), что сле- дует еще: 4) определить значения х, обращающие функцию у =/(х) в бес- конечность, с учетом знака, и построить соответствующие верти- кальные асимптоты; 5) найти горизонтальную или наклонную асимптоту графика (и притом отдельно при х — + ~ и при х — - если промежуток беско- нечен в обе стороны). Обратимся снова к примерам. 149. Примеры. 3) Вернемся к функции у = (х + 2)2(х-1)3, для которой мы уже искали экстремумы в 136, 1). Эта функция сохраняет непре- у рывность при - ~ -= х-= +=». При х- ± ~ не только у, но и — стремится к ~, так что асимптот нет. х Рассмотрим дополнительно вторую производную у" = 2(х- 1)(10х2 + 16х +1). Она обращается в 0 при х = 1; -0,07; -1,53, меняя при этом знак (перегиб). Составляем таблицу: х = —2 -1,53 -0,8 -ЩУ1 0 1 Г = о -3,58 -8,40 -4,56 — 4 0 у=о макс. перегиб У«=0 мин. перегиб у=о перегиб
312 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [149 График мы уже имели на рис. 57. 1) Пусть 2 1 y = xs — (х2 — I)3 [см. 136, 3)]. Функция сохраняет непрерывность в промежутке (-~, +~). Пред- ставив ее в виде 1 у =--------------------- _ 1 2 Х3+Х3(х2-1)3+(х2-1)3 легко установить, что у-0 при х-±~, так что график нашей функции имеет асимптотой ось х (и направо и налево). Вторая производная у" не имеет корней; перегибы будут лишь в точках, где производная у' обращается в бесконечность. Ввиду четности функции - симметрия относительно оси у. Таблица: х=-~ -1 — 0,71 0 0,71 1 У=0 1 1,59 1 1,59 1 0 j'= 4-00 макс. у'= +«*> мин. у=о макс. у’ = — оо График - на рис. 59. х2- 5х+6 5) ? = "ЛГТ 1см- 137Ь Непрерывна в (-~, +~). При х-±<», очевидно, limy-1: горизонтальная асимптота. Вторая производная „ (х+1)(х2-4х+1) у - - 10-------------- (х2 + 1)3 обращается в нуль при х= - 1, 2+ ]/3 = 2,41 и 2 - ^3 ==0,27, меняя знак (перегиб). Таблица: -10 -5 -1 -0,41 0 0,27 2 2,41 3 3,73 5 10 -)-оо У=1 1,55 2,15 6 7,04 6 4,40 0 -0,03 0 0,08 пере- гиб 0,23 0,55 1 пере- гиб у=о макс. пере- гиб у=о мин. График на рис. 61. Небольшой масштаб здесь мешает отчетливости чертежа, особенно в промежутке изменения х от 2 до 5; эта часть графика представлена в увеличенном масштабе. Дадим теперь ряд новых примеров. С*"1)3 6) у -------. (х+1)2
149] § 3. ПОСТРОЕНИЕ ГРАФИКОВ ФУНКЦИЙ 313 Функция обращается в бесконечность (-~) при х = -1. Так как при х~ +=» имеем У~х = -5х2 + 2х-1 (х4-1)2 -5, то кривая имеет асимптоту: Y=x-5. Вычислим производные: (х-1)2(х+5) „ 24(х-1) У (х + 1)3 ’ У “ (х + 1/ ’ Первая обращается в нуль при х = 1 (перегиб) и при х = - 5 (максимум); других точек перегиба нет. По таблице: Л- =—10 —5 —3 —1 0 1 5 10 у——16,4 —13,5 „16 — оо —1 0 1,78 6,05 Ло макс. перегиб строим график, с учетом асимптоты (рис. 79). (а-0). По этой формуле функция по- лучает вещественные значения, лишь если х==0 или х=»а; при х = а функ- ция обращается в бесконечность. Считая х а, имеем при х — + <» а а так что, со стороны положитель- ных х, кривая приближается к Рис. 79. а асимптоте у=х-\—. Аналогично 2 а получается со стороны отрицательных х другая асимптота у = - х - у. Производная ( 3 ) 1 I 2)1 311/ х у' = —------------ х----а] 1/ ----- у (х-а)2 ( 2 J Ц (х-а)3 3 обращается в нуль при х - у я, меняя знак минус на плюс (минимум). Она обра- щается в нуль и при х = 0, но это - конец промежутка (- ~, 0], в котором мы Функцию рассматриваем, и об экстремуме здесь не может быть и речи.
314 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [150 Вторая производная: у (х - а)3 ’ Переменная х может изменяться лишь в промежутке (0, а]; при х = 0 функция обращается в бесконечность. Производная а3+2х3 1 (х у у' ---------—-----I---1-- бх2у 2 х всегда отрицательна, так что функция убывает. При х = а производная у’= Вторая производная 1 I1 1 ) а обращается в нуль, меняя знак, лишь при у = х =— = 0,63а (перегиб); при этом, очевидно, у' = -1. График представлен на рис. 81. § 4. Раскрытие неопределенностей 150. Неопределенность вида . Мы применим теперь понятие производной и доказанные в §§ 3, 5 предшествующей главы теоремы для раскрытия неопределенностей. Последующие тео- ремы 1 - 4 в основном принадлежат Л о п и т а л ю (G. F. de 1’Hospi- tale) и И. Бернулли (Joh. Bernoulli). Высказанное в них правило
150] § 4. РАСКРЫТИЕ НЕОПРЕДЕЛЕННОСТЕЙ 315 обычно называют правилом Лопиталя. Сначала мы зай- 0 мемся основным случаем неопределенности вида , т. е. исследуем вопрос о пределе отношения двух функций /(х) и g(x), стремящихся к нулю (при определенном предельном переходе х—а). Начнем с простой теоремы, непосредственно использующей самое понятие производной. Теорема 1. Пусть'. 1) функции f(x) и g(x) определены в промежутке [а, Ь], 2) lim /(х) = 0, limg(x) = 0, 3) существуют конечные производные х—а х-*а f'(a) и g'(a), причем g'(a) 0. Тогда х~а g(x) g (а) ' Доказательство. Существование конечных производных f'(a) и g'(a) обеспечивает непрерывность функций /(х) и g(x) в точке а. В силу 2) имеем: /(a) = lim /(х) = 0 и g(a) = lim g(x) = 0. Ввиду того, х—а х-+а что g'(a)#0, по лемме п° 109, g(x)#0 для значений х, достаточно _ /(х) близких к а', ими мы и ограничимся, так что отношение -р- имеет смысл. Теперь это отношение можно переписать в виде fix) - fla) f(x) = fix)- f (а) = x-a g(xj g(x)-g(a) g(x)-g(a) x-a Переходя здесь к пределу при х—а, и получим требуемый результат. Примеры. 1) Найти предел ех-е~х lim---------------------------------. x-oln (е-лг)Н-х-1 По теореме он равен вычисленному при х = 0 отношению производных ех + е 2 _ 2е ~~1 ~ 7-1 ’ 2) Найти предел ]/2х-х‘- ]/х Он равен 1-2Х3 1 V2x - х* 3,— ' 3 Ух2 16 з ~7' 4 ]/х
316 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [150 В том случае, когда одновременно /'(а) = 0, g'(a) = 0, можно вос- пользоваться следующим обобщением теоремы 1, привлекающим к рассмотрению производные высших порядков: Теорема 2. Пусть'. 1) функции f(x) ug(x) определены в промежутке [a, h], 2) lim/(х) = 0, limg(x) = 0, 3) в промежутке [а, Ь] существуют х-0 х-0 конечные производные всех порядков до (и-1)-го включительно f\x), f"(x), ..., /(п-1)(х), g'(x), g"(x), g^^x), 4) при x = a они все обращаются в 0, 5) существуют конечные производные и $л\а), причем gW(a)^0. Тогда Птлх)=/£ад g(x) g(nXa) Доказательство. Приложим к каждой из функций /(х), g(x) в промежутке [а, х] (a<x*sb) формулу Тейлора с допол- нительным членом в форме Пеано [см. 124, (10а)]. Ввиду 2), 3) и 4), получим где а и jS—O при х —а. Второе из этих равенств, вследствие условия g(n)(a)#0, прежде всего показывает, что g(x) отлично от нуля, по крайней мере, для значений х, достаточно близких к а. Если этими значениями ограни- /(х) читься, то отношение -44 имеет смысл. Тогда из написанных равенств непосредственно и получается тре- буемый результат: /(п)(а)+а /(n)(a) g(nXa)+^- g(n)(a) lim^7^ = lim х-а g(x) х^а Пример. 3) Найти предел ех-е~х-2х lim--------- х-о x-sin х Здесь имеем: f(x) = ex-e х-2х, f'(x) = ex + e~x-2, f"(x) = ex-e~x, f'"(x) = ex + e~x, /(0) = 0; /'(0) = 0; /"(0)=0; /'"(0) = 2; g(x) = х - sin х, g'(x) = 1 - COS X, g"(x) = sin x, g"'(x) = cos x, ?(0) = 0; H0) = 0; Г(0) = 0; 4"(0)=l. Следовательно, искомый предел равен 2. Хотя в большинстве случаев для раскрытия неопределенности 0 - вида уже достаточно доказанных теорем, но на практике обычно удобнее следующая
150] § 4. РАСКРЫТИЕ НЕОПРЕДЕЛЕННОСТЕЙ 317 Теорема 3. Пусть: 1) функции f (х) и g(x) определены в промежутке (а, Ь], 2) lim f (х) = 0, lim g(x) =0, 3) в промежутке (а, Ь] существуют х—а х—а конечные производные f'(x) и g'(x), причем g'(x) 0, и наконец, 4) суще- ствует (конечный или нет) предел Тогда и lim^ = AL S (х) lim^ = K х_~а ё(х) Доказательство. Дополним определение функций f(х) и g(x), положив их при х = а равными нулю: f(a) = g(a) = 0*). Тогда эти функции окажутся непрерывными во всем замкнутом промежутке [а, /ф их значения в точке а совпадают с пределами при х->а [ввиду 2)], а в прочих точках непрерывность вытекает из существования конечных производных [см. 3)]. Применяя теорему Конги [114], получим /(х)_/(х)-/(0) Т'(с) g(x) g(x)-g(a) rg'(c) ’ где tz<c-=x. То обстоятельство, что g(x)#0, т. е. g(x)^g(a), есть следствие предположения: g'(x)^0, как это было установлено при выводе формулы Коши. Когда х-а, очевидно, и с - а, так что, в силу 4), lim^ = lim = К, х-а g(x) е~а g (с) что и требовалось доказать. Таким образом, доказанная теорема сводит предел отношения функций к пределу отношения производных, если последний существует. Часто оказывается, что нахождение предела отно- шения производных проще и может быть осуществлено элементар- ными приемами. Пример. 4) Найти предел tgx-x lim--------. х - sin х Отношение производных последовательно упрощается: 1 -------1 COS2 X-1 1 - COS2 X 1 + COS X 1 - COS X COS2 X 1 - COS X COS2 X при x-0 оно, очевидно, стремится к 2. Таков же будет, согласно теореме, и иско- мый предел. *) Конечно, можно было бы просто предположить заранее функции опреде- ленными и непрерывными при х = а: но в приложениях иной раз удобнее форму- лировка условий теоремы, данная в тексте (см., например, теорему 3*).
318 гл. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [150 Теорема 1 в этом случае была бы неприложима, ибо при х = 0 производные числителя и знаменателя обе равны 0. Что же касается теоремы 2, то, хотя с ее помощью задача могла бы быть разрешена, но для этого потребовалось бы (в чем легко убедиться) вычислить три последовательных производных от заданных функций. Обращаем внимание читателя на то, что здесь и отношение производных 0 снова представило неопределенность вида — , но раскрыть эту неопределенность оказалось возможным путем элементарных преобразований. В других случаях может понадобиться применить теорему повторно. Важно подчеркнуть, что при этом допустимы всякие упрощения получаемых выражений, сокращение общих множителей, использо- вание уже известных пределов ит. п. (Всего этого делать нельзя, если применяется теорема 2!) В следующем примере теорема 3 применяется по- следовательно три раза; после первого мы сокращаем на ех, а после второго - отбрасываем множитель ех в знаменателе (ибо он стремится к 1). Этим выкладки упрощаются. Примеры. 5) хе2х + хех-2е-х+2ех 2хе2х + е2х+ хех + ех - 4е2х + 2ех --------------------lim---------------------------- (ех-1)3 х,о 3(ех-1)2-ех lim х-*0 2хех-3ех+3 + х 1 2хех+2ех-Зех+1 lim--------------- — lim------------- х-о 3(ех-1)2 Зх-о 2(ех-1)ех 1 (1 + х)х - е 7 6) lim------------= lim (1 + х) х->о х х—о 1 -ех + 2хех + \ 1 2хех + ех = — lim------------= — lim--------- 6 х—о ех-1 6 х—о ех х-(1 + х) In (1 + х) х2(1 + х) Так как первый множитель справа стремится к е, то достаточно заняться вто- рым множителем. С помощью двухкратного применения теоремы 3 найдем, что 1 предел его равен - — . е Ответ:-----.* Теорема 3 легко распространяется на случай, когда аргумент х стремится к бесконечному пределу: а = ± °° (этого, разумеется, нельзя сделать в отношении теорем 1 и 2). Именно, имеет место, например, Теорема 3*. Пусть-. 1) функции/(х) и g(x) определены в промежутке [с, + »], где с>0, 2) lim /(х) = 0, lim g(x) = 0, 3) существуют в проме- х-*+°° жутке [с, +~] конечные производные f'(x) и g'(x), причем g'(x)^0, и, наконец, 4) существует {конечный или нет) предел Тогда и г f (*) tz hm ~- = К. x- - •S’W
150] § 4. РАСКРЫТИЕ НЕОПРЕДЕЛЕННОСТЕЙ 319 Доказательство. Преобразуем переменную х по формуле х=|, t = . Тогда, если х-> + то Z-0, и обратно. Ввиду 2), имеем lim = 0, lim g j = 0, /-+о {‘J -+o а в силу 4), zn Г - lim —= K. -v(l) К функциям и от новой переменной t можно приме- нить теорему 3, что даст нам lira —= lim-Му у = limТП = К '-+’’Й '-+,<) Н) '"О а тогда и lim ~ = К, х-.+„ g{x) ч. и тр. д. Замечание. Иногда при раскрытии неопределенностей рас- сматриваемого вида можно обойтись формально без применения указанных выше теорем, используя разложения функций по формуле Тейлора [124-125]. Пусть х-»0 (к этому случаю всегда можно свести дело). Если с помощью известных разложений удается выде- лить из числителя и знаменателя главные члены: f(x) = axn + о(хп), g(x) = bxm+ о(хт), <z fix) а то становится сразу ясен предел дроби : он равен нулю, g или ± смотря по тому, будет ли п больше, равно или меньше пг**). [Ср. 62, 63.] Так, в примере 1) имеем, заменяя функции ех, е~х и In (е - х) - 1 = =ln 11 - н несколькими первыми членами их разложений: *) Функции j и g | уj мы дифференцируем по t как сложные функции. **) В последнем случае знак бесконечности нетрудно сообразить по знакам а и Ь, а также (в случае нечетности разности т - и) по знаку х.
320 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [151 Аналогично в примере 4): ( X3 Г+3+ • hm---;-- т 3 о = пт -=------= 2. .. ,........, + I 6 ; 6 Предлагается, в виде упражнения, тем же методом решить примеры 3) и 5). 151. Неопределенность вида . Обратимся к рассмотрению не- определенных выражений вида £, т. е. исследуем вопрос о пределе отношения двух функций f(x) и g(x), стремящихся к + ~ (при х-*а). Покажем, что в этом случае применимо то же правило Л о пи- тал я: следующая теорема есть простая перефразировка теоремы 3. Теорема 4. Пусть: 1) функции f(x) ug{x) определены в промежутке (а, Ь], 2) lim /(х) = + ~, limg(x) = + ~, 3) существуют в промежутке х~*а х—а (а, Ь] конечные производные f'(x) и g'(x), причем g'(x)#0, и, наконец, 4) существует {конечный или нет) предел lim^ = K. Тогда и lim^ = Ar. Доказательство. Рассмотрим сначала случай конечного К. Так как производная g'(x) не обращается в нуль, то по теореме Дарбу [110] она сохраняет знак, и функция g(x) изменяется мо- нотонно [132]. Из 2) тогда ясно, что g'(x)<0 и g(x) с убыванием х монотонно возрастая стремится к +~. Можно считать, что всегда g(x)>0. Задавшись произвольным числом (е=-0, в силу условия 4), найдем такое г/ ' 0, что при а-= х «= а + будет Г(х) к g\x) 2 ’ Положим для краткости а+^ = х0 и возьмем х между а и х0. К проме- жутку [х, х0] применим формулу Коши*): f{x) -f{x0) _ f’{c) g)x)-g{x0) g'{c) ’ *) В этом - существенное отличие от доказательства теоремы 3: здесь нельзя применить формулу Коши к промежутку [а, х], ибо, как бы ни определять функции f(x) и g(x) в точке а, ввиду 2), из них не получить функций, непрерывных в этой точке.
151) § 4. Раскрытие неопределенностей 321 где х-~с<х0, следовательно, I/(x)-/(xq) I е_ ,п I glx)-g(*J ЛП2- к ' Напишем теперь тождество (которое легко непосредственно про- верить): /to /CU-K-gfa) г g(x0)1 г/(х)-/(х0) „1 g(x) g(x) +[ #(*)] [ g(x)-g(x0) J’ откуда I /to _ % U l/tol-^-gto) I । 1/(х)-/(хр) I I g(x) || g(x) | l^to-^o) I' Второе слагаемое справа для x<x0=a+ij будет меньше р в силу (1). Ввиду того же, что g(x)— + ~ при х-*а, первое слагаемое при этом стремится к нулю, и найдется такое Й>0 (можно считать <5-=??), что для я<х<я+6 первое слагаемое тоже станет меньше Для указанных значений х будем иметь тогда что и доказывает требуемое утверждение*). В том случае, когда К= + ~ [и заведомо /'(%)# 0, по крайней мере, вблизи а], имеем, меняя ролями f и g, lim =0» так что 11 1*т = О, f to х-а /to откуда, наконец, так как (по крайней мере вблизи а), очевидно, и /(х)>0 и g(x)>0**). Отметим, что доказательство без существенных изменений рас- пространяется и на случай а = -°°. Точно так же теорема могла бы быть доказана и для промежутка [b, а) (b^d) как при конечном а, так и при а= + Таким образом, на случай бесконечного предела аргумента теорема 4 распространяется автоматически. В виде примера легко получить уже известные нам пределы: 1 In X X 1 7) lim ----= lim -------= lim ---= 0 (если fi => 0). х--+~ А*' х— + ~ flX>* 1 Х- + "» [ХХР *) Подчеркнем, что в нашем рассуждении мы фактически не пользовались предположением, что lim/(x)= + ~ [ср. доказательство теоремы Штольца в 33]. **) Случай К= — при предположениях теоремы невозможен. 21 Г. М. Фихтенгольц, т. I
322 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [152 х/‘ их.и~г 8) lim —= lim ------- (а=»1, д=-0). ах х-+~ах-1па Если fi>l, то справа снова имеем неопределенность того же типа — ; но, продолжая этот процесс и повторно применяя теорему 4, в конце концов получим в числителе степень с отрицательным (или нулевым) показателем. Поэтому, во всяком случае, х.“ lim — = 0. х-+-» ах Сделаем общее замечание относительно теорем 3 (3*) и 4. В них устанавливается предел отношения функций в предположении, что существует предел отношения производных. Но обращение этих теорем недопустимо, и первый предел может существовать при от- сутствии второго. Например, существует предел .. x+sinx sin х) , hm --------= hm 1 +------ = 1, X x-* + ™ \ X ) хотя отношение производных, равное 1 + cos х, предела при х -* + ~ не имеет. 152. Другие виды неопределенностей. Предыдущие теоремы отно- 0 ОО сились к неопределенностям вида д- и — . Если имеем неопределенность вида 0-~, то ее можно привести 0 00 тт к виду -Q или — и тогда воспользоваться правилом Лопиталя. Пусть lim /(х) = 0, lim g(x) = ь ~. х-*а х~*а Тогда имеем g(x) /(х) Второе из этих выражений представляет при х-»а неопределенность 0 со вида Q, третье - неопределенность вида —. Пример. 1 9) lim (хю1пх)= lim -----= lim --------= lim ----= 0 Х-+0 X- + 0 X у- Х- + 0 -дх И 1 х-+0 -д (мы считаем д=»0).
152] § 4. РАСКРЫТИЕ НЕОПРЕДЕЛЕННОСТЕЙ 323 К виду q или — всегда можно привести и неопределенности вида ~ Пусть имеем выражение Дх) -g(x), причем lim Дх) = + ~, lim g(x) = + ~. х—а х-*а Тогда можно произвести, например, следующее преобразование, сво- 0 дящее это выражение к неопределенности вида : 1 1 /(х) -g(x) = . Дх) Дх) ДД'Дх) Часто, впрочем, того же удается достигнуть проще. Пример. х-о t х2) х-о x2-sin2x но х2 • cos2 х - sin2 х x-cosx + sinx x-cosx-sinx x2 sin2 x x x • sin2 x предел первого множителя находится элементарно: x-cosx+sinx ( sin х) lim------------------------------= lim cos x 4--= 2, x-o x x—о v x J а ко второму применяем теорему 3: x-cosx-sinx -x-sinx -1 1 lim-------------- lim-----------------= lim -----------=---. 1.-» x-sin2x x—о sin2 x + 2x • sin x • cos x x-o sin x 3 ----1-2 cos x 2 Таким образом, искомый предел равен В случае неопределенных выражений вида 1“, 0°, ~° рекомендуется эти выражения предварительно прологарифмировать. Пусть у = [Дх)]®<х); тогда lny = g(x) • 1пДх). Предел In у пред- ставляет собой неопределенность уже изученного типа 0«~. Допу- стим, что одним из указанных выше приемов удается найти lim In у, х—а который оказывается равным конечному числу к, + ~ или - Тогда lim у, соответственно, будет ек, + ~ или 0. х—а Примеры. 11) Пусть /sin х) 1-cosx Требуется найти limy при х-0 (неопределенность вида: 21*
324 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [153 Если считать х-0 (этим предположением, ввиду четности функции у, можно ограничиться), то In sin х - In х In у =-----------. 1 - cos x Применяя теорему 3 (и используя уже найденный в предыдущем примере резуль- тат), получим: cos х 1 sinx х х cos х-sinx 1 lim In у = lim-----= lim------------=----, x-o x-o sin x x-o x-sin2x 3 откуда t limy = e 3=—. x—0 e 12) . При x - + ~ это выражение представляет неопределенность вида 0°. Имеем По правилу Л о п и т а л я: 1 1 я 1 +х2 --arctgх 2 lim In у = lim ------------------ X— + «• X— +“ 1 X 1-х2 1 так что lim у = — . х-+~ е 1+х2 (1 + х2)2 1-х2 lim ----------= lim ---------= lim ----л х—+ » я X—1 X—+“ 1 Ч' Х“ arctg х- ----— 2 1+х2 § 5. Приближенное решение уравнений 153. Вводные замечания. Займемся теперь задачей о нахождения корней данной функции /(х), т. е. корней уравнения /00=0. (1) Впрочем, решать эту задачу мы будем в предположении, что интересующий нас корень £ изолирован, т. е. что найден содержащий его промежуток [а, />]: а-={-=6, в котором других корней нет. Если, сверх того, на концах промежутка функция /(х) имеет значения f(d) и f(b') разных знаков, то, как это было разъяснено в п° 81, в связи с применением 1-й теоремы Больцано - Коши, последовательно деля на части промежу- ток, содержащий корень, и определяя знак функции Дх) в точках деления, можно произвольно сужать этот промежуток и тем осуществлять приближенное вычисле-
154] § 5. ПРИБЛИЖЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ 325 ние корня. Однако, этот прием, несмотря на его принципиальную простоту, на практике часто оказывается непригодным, ибо требует слишком большого коли- чества вычислений. В настоящем параграфе читатель познакомится с простейшими приемами приближенного вычисления (изолированного) корня уравнения (1), которые более систематически и более быстро ведут к цели. При этом мы снова будем иметь случай использовать основные понятия и методы дифференциаль- ного исчисления. Мы будем всегда предполагать выполнение следующих условий: 1) функция f(x) в промежутке [а, 6] непрерывна вместе со своими производ- ными f'(x) и f"(xy, 2) значения f(a) и f(b) функции на концах промежутка имеют разные знаки'. f(a)-f(b)^0'. 3) обе производные f'(x) и f"(.x) сохраняют каждая определенный знак во всем промежутке [а, 6]. Из непрерывности функции f (х) и условия 2) следует, что между а и Ь содер- жится корень £ уравнения (1) [80]. Так как производная f'(x) сохраняет знак [3)], то f (х) в промежутке [а, Ь] возрастает или убывает и, следовательно, обращается в 0 лишь однажды: корень £ изолирован. Условие 3) геометрически означает, что кривая у = f(x) не только идет в одном направлении, - все время вверх или все время вниз, смотря по знаку f(x) [132], но к тому же (строго) выпукла вниз или вверх, смотря по знаку /"(х) [143]. На рис. 82 изображены четыре возможных случая, отвечающих различным комбина- циям знаков f\x) и /"(х). В алгебре устанавливается, что при вычислении (вещественных) корней а л- гебраических уравнений всегда может быть создано такое положение вещей, при котором выполняются условия 1), 2), 3), так что эти условия принци- пиально не ограничивают приложимости излагаемых ниже приемов. Этого нельзя сказать по отношению к трансцендентным (т. е. неалгебраическим) уравнениям. Однако на практике поставленные ограничения мало стеснительны, так как в большинстве случаев высказанные условия выполняются. 154. Правило пропорциональных частей (метод хорд). Если промежуток [а, Ь] достаточно мал, то с известным приближением можно считать, что - при изме- нении х в его пределах - приращение функции Дх) пропорционально приращению аргумента. Обозначая через S корень функции, имеем, в частности, Де)-Да) S-a f(b)—f(a) b-a’ откуда, с учетом того, что /(f) = 0, . (б-а)-Да) £ — а-----------. f(.b)~f(a) Таким образом, за приближенное значение корня здесь принимается число (b-a)-f(a) = а------------. f(b)-f(a) Это выражение, очевидно, можно представить и в такой форме t (b-a) -f(b) x,=-b-----------------------------------------. f(b)-f(a) Изложенное правило получения приближенного значения корня и называется правилом пропорциональности частей*). Оно допускает простое геометрическое (2) (2*) *) В старину его называли «правилом ложного положения» (regula falsi), ибо оно основано на предположении, которое, строго говоря, не отвечает действи- тельности.
326 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [154 истолкование. Заменим дугу ММ' кривой (рис. 82) - хордой ММ'. Уравнение последней может быть написано, например, в виде y-f(a) = f(b)—f(a) b-a (x-a). (3) Наше правило, по существу, сводится к тому, что вместо точки А пересечения кривой с осью х определяется точка D пересечения с осью х этой хорды. Действительно, полагая в (3) у = 0, для абсциссы xt точки D получаем именно выражение (2). В связи с этим правило пропорциональных частей называют также методом хорд. Обратимся теперь к исследованию вопроса о положении точки xt по отноше- нию к корню £. Непосредственно ясно, что точка хт лежит между а и Ь, но с какой стороны от 4? Так как в случаях I и II (III и IV) мы имеем дело с выпуклой вниз (вверх) функ- цией, то кривая ММ' лежит под (над) хордой ММ', т. е. f(b)-f(a) f(x)^f(a)+-----------(x-a) (a^x^b). (=-) b-a (4) Полагая здесь x = xlt непосредственно получаем /(xO-0, (>) так что f(xj) всегда имеет знак, противоположный знаку f"(x). Отсюда, наконец, заключаем, что в случаях I и IV значение Xj лежит между а и в случаях же II и III - между tub.
154] § 5. ПРИБЛИЖЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ 327 Ограничиваясь случаями I и IV, применим снова наше правило, на этот раз к промежутку [х,, корня , ft]; заменяя в (2) а на.хь получим новое приближенное значение (b-x,).f(xj Хп ' * содержащееся, по доказанному, между и £. Этот процесс можно продолжать неопределенно и построить последовательность все возрастающих при- ближенных значений Х1^Х2^ • • ’ хп'хп +1^ • • "=£. При этом любые два последовательных значения хп и xri+l связаны формулой, аналогичной (2), (b-Xn)-f(Xn) ХП +1 - ХП ---7Г. Г— f(b) -f(xn) (5) Покажем, что, с возрастанием и, хп -£. В самом деле, щая, но ограниченная (например, числом f) переменная к некоторому конечному пределу Если перейти к пределу в равенстве (5), используя при этом непрерывность функции fix'), то получим, что (Z>-g)./(g) /(«-/(а) “ ’ откуда /(а) = 0. Так как других корней уравнения (1), кроме 4, в промежутке [a, Z>] нет, то а=£*). Рис. 83 иллюстрирует посте- пенное приближение точек Z>1, D2, ... пересечения последовательных хорд с осью х к искомой точке А. Легко понять, что в случаях II или III повторное применение правила приведет к последовательности чений монотонно возрастаю- хп должна стремиться М' X Рис. 83. убывающих приближенных зна- стремящихся к корню S справа. Таким образом, во всех случаях, применив достаточное число раз указанное выше правило, можно вычислить корень (с любой степенью точности. При этом, впрочем, остается открытым вопрос, как оценить точность уже вычисленного приближенного значения хп. Для решения его применим к разности f(xn) - f(£) формулу конечных прираще- ний [112]: f(.Xn) f(xn) -/(й = (хп -|) • /'(с) (f > С § хп). Отсюда *) Сходимость процесса можно установить и без предположения, относящегося ко второй производной, но тогда не исключена возможность того, что точки хп переходят с одной стороны от корня на другую.
328 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [155 если обозначить через т наименьшее значение | /'(х) | в рассматриваемом проме- жутке (которое можно раз навсегда вычислить наперед), то получим оценку: . 1Л*п)| ------ т (6) Так по самой величине/(хп) оказывается возможным судить о близости хп к корню! Рассмотрим пример. Уравнение х2-2х2-4х - 7 = 0 имеет корень между 3 и 4, ибо, если через f(x) обозначить левую его часть /(3)=-10-=0, /(4) = 9-0. Поставим себе задачей вычислить этот корень с точностью до 0,01. В промежутке [3, 4] обе производные f'(x) = Зх2 - 4х - 4 и /"(х) = 6х - 4 сохраняют знак плюс (случай I); наименьшее значение первой из них будет т = 11. Имеем: /(3) 10 х, = 3---—--— = 3+— = 3+0,52...; /(4)-/(3) 19 округляя, положим Х! = 3,52. Так как /(3,52)= -2,246592, то, по неравенству (6), требуемой точности еще нет. Продолжаем: 0,48-/(3,52) 1,07836416 х, = 3,52 - —-— = 3,52 + ---------------= 3,52 + 0,09... /(4)-/(3,52) 11,246592 или, округляя, х2=3,61. Вычислив /(3,61)= -0,458319 и пользуясь неравенством (6), снова видим, что цель еще не достигнута. Наконец, 0,39 -/(3,61) 0,17874441 х3= 3,61 - --- = 3,61 +------------ 3,61+0,0188... /(4)-/(3,61) 9,458319 Округляя, положим х3 = 3,63. Так как мы округлили «в сторону корня», то могли и перескочить через него; что этого не произошло, видно по знаку числа /(3,63) = = -0,041653. На этот раз, по неравенству (6), , 0,041... |*з-?| =f-x3-=-——----=0,004. Таким образом, 3,630-+-3,634, т. е. <5 = 3,63-1-0,003. Этим примером мы ограничимся, так как метод хорд все же мало эф- фективен; ему следует предпочесть метод касательных, к которому мы и переходим. 155. Правило Ньютона (метод касательных). Вернемся к прежним предполо- жениям относительно функции /(х) [153]; искомый корень <5 этой функции изоли- рован в промежутке [a, Z»]: а <Ь. Отправляясь от какого-нибудь из концов этого промежутка, например, от Ь, напишем формулу Тейлора с дополнительным членом в форме Лагранжа: 0=/G)=/(Z>)+/'(6)-(f-6) + |/"(c)-(f-Z>)2 (f-c-=Z>). (7)
155] § 5. ПРИБЛИЖЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ 329 Отбрасывая дополнительный член, приближенно можно положить f(b) + f'(b) • (£-/>)- О, откуда л ь f(h) t = и----. Г(Ь) Таким путем мы приходим к приближенному значению корня f: ' А xt = о-----. f'(b) (8) Получение этого значения можно наглядно истолковать и геометрически. Рассмотрим касательную к кривой y=f(x) в точке Мс абсциссой Ь. Ее уравнение имеет вид (9) y-/(W=/'(i)-(x-Z>). Полагая здесь у = 0, найдем абсциссу точки Т' пересечения касательной с осью х; она в точности совпадает с (8). Значит, суть дела в приближенной замене дуги кривой ММ’ - касательной к ней в одном из ее концов (см. рис. 82). Это правило, посящее имя Ньютона, называется также методом каса- тельных. Встает, однако, вопрос, где лежит значение хъ получаемое по формуле (8). Ведь тот же рис. 82 показывает, что точка пересечения касательной с осью х может лежать даже вне рассматриваемого помежутка! Мы докажем, что, если значение f(b) - одного знака с f"(x) (т. е. в случаях I и IV), х( лежит между £ и Ь. Действительно, так как f(b) и f'(b) - одного знака, то из (8) непосредственно ясно, что х{ -= b. С другой стороны, из (7) и (8) следует: -----------------(£-о). fib) 2 f'(b) Но f"(x) в рассматриваемых случаях имеет одинаковый знак с f'(x), следовательно, f *= Хх. Окончательно: f -= xt -- b. Аналогично, если исходить из точки а, и касательную к кривой провести в конце М (с абсциссой а), то, взамен (8), получим приближенное значение , f(a} Xl = a~~7^\ f (fl} Относительно вычисленного по этой формуле значения можно установить, как и выше: если значение f(a) - одного знака с /"(х) (т. е. в случаях II и III), х[ лежит между а и %. Таким образом, для каждого из четырех возможных случаев указано, с какого конца гарантирована успешность приближения к корню по правилу Ньютона. Повторное применение его дает в случаях I и IV последовательность убываю- щих значений: (8*) а в случаях II и III - последовательность возрастающих значений: причем вычисление последующего значения по предыдущему всегда производится по формуле , _ , f(xn) х п+1 — Хп — f\*n} (Ю)
330 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [155 И здесь легко доказать, что хп-^. Монотонная и ограниченная переменная хп имеет конечный предел (1; переходя же к пределу в (10), с учетом непрерывности обеих функций f(x) и f'(x), найдем: = 0, откуда = 0 и $ = f (Р) Т2, Рис. 84 иллюстрирует приближение к точке А со стороны точек пересечения последовательных касательных с осью х. Таким образом, и правило Ньютона, повторно примененное, позволяет вычислить корень S с любой степенью точности. При этом точность уже вычисленного приближенного значения оценивается, как и выше, по формуле (6). Чтобы охарактеризовать скорость убывания разностей хп вернемся к фор- муле (9); заменим в ней b через хп, а хг - через хп+1: *п+1 -f -—7- (Хп -f)2. 2 /'(хп) Обозначая через М наибольшее значение |/"(х)| в заданном промежутке [а, />] (и сохраняя за m его прежнее значение), отсюда легко получить теперь: , М , |xn+1-f|^—(11) 2m Поскольку справа стоит квадрат, этим обеспечено весьма быстрое прибли- жение хп к ( (по крайней мере, начиная с некоторого места), что и делает метод касательных одним из самых эффективных методов приближенного вычисления корня. Неравенство (И) выполняет еще одну функцию. Если точность вычисленного значения хп уже оценена, например, с помощью неравенства (6), то неравенство (11) позволяет наперед оценить точность еще невычисленного значения xn+i. Это может оказаться полезным при решении вопроса о том, на каком знаке целесообразно его округлить. Обратимся к примерам. Их решение, разумеется, предполагает использова- ние всех вспомогательных средств вычисления, какие имеются под рукой, как-то: таблиц степеней и корней, таблиц умножения, арифмометра, логарифмических и логарифмотригонометрических таблиц, натуральных таблиц тригонометри- ческих величин, таблиц для перевода градусной меры углов в радианную, и т, п,
156] § 5. ПРИБЛИЖЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ 331 156. Примеры и упражнения. В этом п° мы будем пользоваться исключительно методом касательных. 1) Вычислить с точностью до 0,01 корень уравнения х3- 2х2-4х- 7 = 0, зная, что он содержится в промежутке (3, 4) [ср. 154]. Имеем: Лх) = х3 - 2х2 - 4х - 7, /(3) = -10 < 0, /'(х) = Зх2 - 4х-4 - 0, /"(х) = 6х-4-0 /(4) = + 9-0, (при 3=sx=s4) (случай 1); наименьшее значение |/(х)| есть т = 11. Отправляемся от того из концов заданного промежутка 6 = 4, для которого знак функции f(xj совпадает со знаком /"(х). По формуле (8) / /(4) 9 Х1 = 4-----= 4-----= 4-0,32...; Л(4) 28 округляя, положим х1 = 4-О,3 = 3,7. Так как /(х2) = /(3,7) = 1,473, то, по неравен- / 1,473 ству (6), Xj-f-=-------=0,14, т. е. достигнутая точность недостаточна. Далее, , /(3,7) 1,473 х2 = ЗД - —— = 3,7--------------= 3,7 - 0,066. /'(3,7) 22,27 положим, х2 = 3,7-0,066 = 3,634. На этот раз /(х2) =/(3,634) = 0,042..., так что, , 0,042 в силу (6), x2-f< ——<0,004. Поэтому 3,630 <£<3,634 и £ = 3,63 с требуемой точ- ностью. (Получение этого же результата в 154 по методу хорд потребовало трех шагов.) 2) Для второго примера предложим себе решить уравнение x-logx=l. Воспользуемся этим случаем, чтобы пояснить читателю, как графическое изображение функций может слу- жить для предварительной ориентировки в расположении корней уравнения. Значение х, удовлетворяющее уравнению log X = — , X очевидно, представляет абсциссу точки пересечения кривых 1 y = logx и у = —. X Даже грубое их изображение (рис. 85) сразу показывает, что искомый корень лежит между 2 и 3. Это легко теперь проверить и вычислением, ибо, полагая /(х) = = x-logx-l, имеем /(2) = -0,39793...-= 0, /(3)-0,43136...-0. Вычислим упомянутый корень с точностью до 0,0001.
332 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [156 Очевидно, при 2«х=еЗ f'(x) = log х+log е О, loge (случай I); можно положить т = 0,7. Так как именно /(3) имеет тот же знак, что и /"(х), то, по формуле (8), , „ /(3) 0,43136... хх = 3------= 3—----------= 3-0,473...; /'(3) 0,91141... положим xj= 3-0,47 = 2,53. Имеем /(х^)=/(2,53) = О,019894..., так что Xi-S- 0,0199 -«-----«0,03. Далее, 0,7 , /(2,53) 0,019894... х2 = 2,53 - —---= 2,53 — ----------= 2,53 - 0,02375...; /'(2,53) 0,83741... возьмем хг = 2,53 - 0,0237 = 2,5063. Оценим, по неравенству (6), погрешность: /(2,5063) = 0,000096..., , * 0,000096... х2 = £ «----------« 0,0002, 0,7 т. е. 2,5061 «£«2,5063. В таком случае имеем, с уже тре- буемой точностью, £ = 2,5062+о,oooi. [На деле 2,5062 является избыточным приближенным зна- чением для £, ибо /(2,5062) =- 0.] 3) Вернемся к уравнению 2х=4х, о котором уже была речь в 81. Мы видели там, что между 0 и 0,5 заключен корень этого уравнения. Это обстоятель- ство также легко было бы заметить с помощью графиков функций у=2х и у=4х; на рис. 86 ясно видно, что эти кри- вые, кроме точки с абсциссой 4, пересекаются еще в неко- торой точке с абсциссой £ между 0 и 0,5. Предложим себе вычислить этот корень с точностью до 0,00001. Имеем для 0=sx=e0,5, /(х) = 2х-4х, /'(х) = 2х-1п2-4«0, /"(х) = 2х • In2 2 =-0 _ М (случай II). Здесь т = 4- /2In2 =-3, Af=21n2 2«0,7, —= 2m «0,12. Так как /(0)=1 имеет одинаковый знак с /"(х), то начинаем с а = 0. В силу (6), погрешность этого при- ближенного значения «у, а тогда, в силу (И), можно наперед оценить погреш- ность: £-х^«0,12-у«0,014.
156] § 5. ПРИБЛИЖЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ 333 Поэтому вычисленное по формуле (8*) значение , 1 1 = 0,30... In 2 - 4 3,306852... округляем на втором знаке: хг = 0,30. Пользуясь значением /(0,30) = 0,031144..., но неравенству (6), точнее оцениваем погрешность: , 0,031144 £-xj-= ---------=0,011 3 а тогда, по (И), £ - х2 -= 0,12 0,000121 «= 0,000015, так что приближаемся к требуемой точности. Следующее приближение: , 0,031144... 0,031144... х2 = 0,30---------------= 0,30 + ----------= 0,309897... 0,8533643...-4 3,1466356... округляем на пятом знаке «в сторону корня» х2 = 0,30990. Так как /(0,30990) = = 0,000021... >0, то это значение все же меньше корня. Погрешность же его, в силу (6), на деле оказывается , 0,000022 ---------------------=0,00001, так что, окончательно, £ = 0,30990 ±о,оооо1 • 4) Уравнение tgx = x имеет бесчисленное множество кор- ней. Это можно сразу усмотреть из рис. 87 - по бесчисленному множеству точек пересечения гра- фика тангенса y = tgx с прямой у = х. Предложим себе вычислить наименьший положитель- ный корень этого уравнения, кото- Зл и — . 2 5л 7 бесконечность, то предложенное рый содержится между Зл Так как при х~~^ уравнение удобнее представить в виде/(х) = sin х-х • cos х-0. Имеем: тангенс обращается в -О, f'(x) = х-sinx<0, /и =>2,7;/"(х) = sin х+х cos х-= 0 (случай IV). Начинаем с Ь = Зл = — = 4,7123889 •..; получим , Зл 2 Xi =------=4,7123889... -0,2122066... 2 Зл Здесь мы сталкиваемся со следующим обстоятельством: в таблицах тригоно- метрических величин (и их логарифмов) углы указываются в градусах, минутах
ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ 1156 и секундах; поэтому округление поправки 0,2122066... нам удобнее делать именно в этих единицах. Мы возьмем 12°10', что отвечает несколько большему числу 0,21223484... (округление в «сторону корня»), так что xj = 4,5000406... (257°50'). Далее, /Сц) = -cos 12°10'+4,5000406... -sin 12°10' = -0,0291274..., , , 0,03 f'(xr) = -4,398962...; +i=f-= ~~~=0,012. Продолжаем: , 0,0291274... х2 = 4,5000406... - ---------= 4,5000406... - 0,0066214...; 4,398962... округляем поправку до 0,0066177... (22'45") и берем х2 = 4,4934229... (257°27'15"). Так как f(x'2)= -0,000059..., то , 0,00006 ------— 2,7 = 0,0000223. Таким образом и можно положить 4,4934006... 4,4934229..., £ = 4,4934+о,ооооз. Ньютона особенно проявляется, когда промежуток, 5) Сила метода содержащий корень, достаточно сужен. Вычислим в заключение с большой точ- 1 ностью, скажем, до^^, корень уравнения х2-2х-5 = 0, исходя из промежутка (2; 2,1), в котором он содержится. Здесь: /(х) = хэ-2х-5, /(2)=-1-=0, /(2,1) = 0,061=- 0, /'(х) = Зх2-2=-0, /"(х) = 6х=-0 (при 2«=.№=2,1). (случай I). Легко подсчитать, что т= 10, М-= 12,6, так что М —-=0,63. 2т т „ 0,061 Начинаем с 6 = 2,1. По формуле (6): о-£-=—^- = 0,0061. Теперь, пользуясь неравенством (11), мы заранее подсчитаем, какой точности можно ждать от х[: +;Ч-= 0,63-0,00612-=0,000024. Поэтому число , „ /(2,1) 0,061 х{ = 2,1— =2,1—-----------= 2,1-0,00543... /'(2,1) 11,23 округляем «в сторону корня» на пятом знаке: х{ = 2,1-0,00544 = 2,09456. Так как /W) =/(2,09456) = 0,000095078690816, то теперь, по формуле (6), можно точнее оценить погрешность: 0,000095... £ Л------------0,00001. 10
1571 § 5. ПРИБЛИЖЁННОЕ РЕШЕНИЕ УРАВНЕНИЙ 355 Переходя к х'2 и снова прибегнув к (11), подсчитаем наперед: Поэтому число х'г - J -= 0,63 • 0,00001’=0,000000000063. xl = 2,09456- 0,000095078690816 11,1615447808 = 2,09456 - 0,000008518416..., округленное на одиннадцатом знаке: х2 = 2,09456 - 0,00000851841 = 2,09455148159, все же отличается от искомого корня меньше, чем на 0,00000000007. Итак, 2,09455148152-=£-=2,09455148159, т. е. £ = 2,0945514815 + — . ’ 10™ 157. Комбинированный метод. Этот метод состоит в одновременном использо- вании как метода касательных, так и метода хорд. Для определенности предположим, что мы имеем дело со случаем I. Прибли- женные значения xt и х[ вычислим, как и выше, пользуясь формулами (2) и (8): (Ь-а)-Да) , t ДЬ) х,=а------------, х; = о------; ДЬ)-Да) Д(Ь)’ тогда, по доказанному, a^x^i-^xl^b. При следующем же шаге мы попросту заменяем в этих формулах а и Ь через Xj и х{: W ~ *1)-/(xi) , , /(х{) х« = х.------------, х» = х!-----. г Дх{)-Дхй /'«) Этот процесс может быть продолжен неопределенно; имея два приближенных значения хп и х'п, между которыми содержится корень £, мы переходим к следую- щей паре приближенных значений по формулам: (хп-хп)-Дхп) , , Дх'п) Xn+^Xn~7^)-f(xn) ’ ХП+1^ХП~Ш)- Вторая из них тождественна с (10); первая же существенно отличается от (5) тем, что точка Ь заменяется здесь точкой хп, все более и более близкой к Если неравенство (4) - для рассматриваемого случая - переписать в виде х-а Ь-а Дх)-Да)" ДЬ)-Да) и положить в нем д = хл и х=хл, то легко усмотреть, что упомянутая замена Ь на х'п способствует лишь более быстрому приближению хп к искомому корню (геометри- чески это очевидно!). Таким образом, при комбинированном методе мы получаем одновременно недостаточные и избыточные приближенные значения корня, которые стремятся к нему с разных сторон. В случаях I и IV хп стремится к £ слева, a xh - справа; в случаях же II и III, очевидно, будет наоборот. Величина | х'п - хп | непосред- ственно позволяет судить о качестве достигнутого приближения - в этом удобство комбинированного метода. Применение его осветим примерами.
336 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [158 158. Примеры и упражнения. Здесь предполагается пользование лишь ком- бинированным методом. 1) Найти три вещественных корня уравнения /(х) = 2х3-х2-7х+5 = 0 с точностью до 0,001. Грубый график функции у-f(x) помогает найти промежутки, в которых содержатся эти корни: -2^-1, 0<^1, 1<£3<2; проверить это легко по изменению знака функции. (а) В промежутке [-2, -1] /'(х) = 6х2-2х-7=-0, /"(х)=12х-2-=0 случай (III). Так как /(-2) = -1 -= 0, /(-1) = 9 =-0, то правило Ньютона над- лежит применять к левым концам промежутков. Имеем: /'(- 2) = 21 и х(= -2-—= -1,952..., 21 Округляя значение х[ в сторону уменьшения, получим число -1,96^^. Если же округлить его в сторону увеличения, т. е. в сторону корня, то получим число -1,95; но /(-1,95) = 0,01775=-0, т. е. в этом случае мы перескочили через корень. Это обстоятельство выгодно для нас, ибо дает возможность сузить промежуток, содержащий корень, и, отбросив прежнее значение хх, положить х(=-1,96, Х!=-1,95. Далее, имеем: /(-1,96)= -0,180672, /'(- 1,96) = 19,9696, 0,180672 -1,96+———= -1,96 + 0,00904...= -1,95095..., 19,9696 0,01 -0,01775 х2 = - 1,95------------------= -1,95 - 0,00089... = -1,95089... 0,01775 + 0,180672 Поскольку £х должно быть заключено между этими границами, то ясно, что fi = - l,95O9±o,ooi (так что требуемая точность превзойдена!). (б) В промежутке [0, 1] первая производная /'(х) сохраняет знак минус, но вторая производная /"(х) меняет знак, обращаясь в нуль в точке х=-~. Это об- 6 стоятельство заставляет предварительно еще сузить промежуток. Испытывая значения х=0,5, получаем: /(0,5)= 1,5=>0; так как /(1)= -1<0, то содержится внутри промежутка [0,5, 1], где /"(х) сохраняет знак плюс (случай П). И здесь правило Ньютона применяем к левым концам. Имеем: 1,5 0,5 х[ = 0,5+—— = 0,7307 = 0,74, хх = 1 -—=0,80. 6,5 2,5 Округление х[ в сторону корня не привело к перескакиванию через корень, ибо /(0,74) = 0,082848 ^0. Наконец, 0,082848 „ х'г = 0,74+ -------- 0,755.... 5,1944 0,01296 л , х, = 0,80-------= 0,756..., 0,298848
158] § 5. ПРИБЛИЖЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ 337 так, что 0,755.. 0,756..., и можно положить £2 = 0,756 ±о,ом. (в) В промежутке [1, 2] вторая производная сохраняет знак плюс, но первая производная меняет знак, обращаясь в 0 при Испытываем 1,5: /(1,5)= -1, в то время как /(2) = 3, так что 1,52; f'(x) в этом промежутке имеет знак плюс (случай I). Имеем: 1 3 х1=1,5+-=1,6, х[ = 2--------= 1,7; 8 13 через корень и здесь не перескочили, ибо /(1,7) = 0,036. Наконец, 0,0568 х2 = 1,6+----=1,6+0,094... = 1,694..., 0,604 , 0,036 х£=1,7- — =1,7 - 0,005... = 1,694..., 6,94 так что и f3= l,694+o,ooi. Замечание. Так как сумма корней, по известной теореме алгебры, должна равняться 0,5, то этим можно воспользоваться для проверки. 2) Уравнение /(х) = х1 - Зх2+75х - 10 000 = 0 имеет два вещественных корня: один между - 11 и - 10, а другой - между 9 и 10. Вычислить их с точностью до 0,00001. (а) В промежутке [-11, —10] /'(х) = 4х3 - 6х + 75 с 0, /"(х) = 12х2 -6=0 (случай И). Получаем: 3453 х[ = - 114- =-10,33...--. -10,3, 5183 1050 х2=—10 — =-10,23... = -10,2; 4503 в первом случае мы округлили в сторону корня, по через него не перескочили. Далее, 164,3181 л4 = - 10,3+ —-----= - 10,262... = - 10,262, 4234,108 25,27984 х.,= - 10,2-------= - 10,260... + - 10,260 417,1165 (то же замечание). Наконец, 4,334569118736 х, = -10,262+ --------------= - 10,262+ 0,0010354... = -10,2609645..., 4186,137218912 0,00807038048 х3= - 10,260- —-------------= - 10,260 - 0,0009642... = - 10,2609642..., 8,369759358736 так что £! = - 10,260964-о,ооооо1 (даже с большей точностью, чем требовалось). 22 Г. М. Фихтенгольц, т. I
338 ГЛ. IV. ИССЛЕДОВАНИЕ ФУНКЦИИ С ПОМОЩЬЮ ПРОИЗВОДНЫХ [158 (б) В промежутке [9, 10] /'(х)=>0 и/"(х)>0 (случай I). Здесь: 3007 %i = 9H----= 9 + 0,869...+9,87 (в сторону корня!). 3457 450 xj = 10-----= 10-0,112. ..+9,89; 4015 1,2389658878 х2 = 9,87+-----------=9,87+0,01599... =9,88599..., 77,4689008 , 15,52060641 4 = 9,89-------------= 9,89 - 0,003993... = 9,886006... 3885,106676 так что, очевидно, £2 = 9,88600±о,оооо1. 3) Рассмотрим уравнение /(х) = х • sin х - 0,5 = 0. 0,5 Построив графики функций j>=sinx и у=— (рис. 88), видим, что они пере- X секаются в бесчисленном множестве точек, так что наше уравнение имеет бесчис- ленное множество корней. По графику видно также, что наименьший положи- тельный корень £ близок к 0,7; поставим себе задачей вычислить его с точностью до 0,000001. [Здесь следует иметь в виду замечание об округлении в долях градуса, которое было сделано по поводу задачи 4) в 156.] Подставляя в функцию f(x) значения 0 = 0,6981317... (40°) и 6 = 0,7853982... (45°), получаем в первом случае отрицательный результат, а во втором - положитель- ный, значит, <?-=£-= 6. Обе производные f'(x), f"(x) в этом промежутке имеют знак плюс (случай I). Схема вычислений: Xi = 0,6981317... +0,0419512..., х[ = 0,7853982... -0,0438510...; первую поправку «округляем» до 0,0418879... (2°24'), а вторую - до 0,0439231... (2°31'), так что окончательно Х| = 0,7400196... (42°24'), х( = 0,7414741... (42°29z).
158] § 5. ПРИБЛИЖЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ 339 Далее, хг = 0,7400196... + 0,0008211... = 0,7408407..., х'2 = 0,7414741... - 0,0006329... = 0,7408412..., откуда и получаем с требуемой точностью: £ = 0,740841 ±о,оооооо5. 4) В заключение вернемся к уравнению f(x) = x*-x- 1 = 0. Мы видели в 81, что оно имеет корень { между а = 1,22 и 6 = 1,23. Установить, какую точность в определении этого корня дает всего лишь двукратное приме- нение комбинированного метода. Схема вычислений (случай I): 0,0000466544 %! = 1,22+—--------------- 1,22073... = 1,2207, 0,06353115 0,05886641 х; = 1,23-----------= 1,22086... =1,2209; 6,443468 0,00000005533760598398 х, = 1,2207+ -------------------------- 1,22074407..., 2 0,001255538012096 0,0009788499821761 х'2 = 1,2209 - ---------------= 1,2207441... 6,279478581316 Таким образом, £ = 1,2207441 ±0,0000001 .
ГЛАВА ПЯТАЯ ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ § 1. Основные понятия 159. Функциональная зависимость между переменными. Примеры. До сих пор мы изучали совместное изменение двух переменных, из которых одна зависела от другой: значением независи- мой переменной уже вполне определялось значение зависимой переменной или функции. В науке и в жизни нередки, однако, случаи, когда независимых переменных оказывается несколько, и для определения значения функции необходимо предварительно установить значения, совместно принимаемые всеми этими незави- симыми переменными. 1) Так, например, объем V кругового цилиндра есть функция от радиуса R его основания и от высоты Я; зависимость между этими переменными выражается формулой 7=тгЛ2Я, которая дает возможность, зная значения независимых пере- менных R и Н, установить соответствующее значение V. Объем V усеченного конуса, очевидно, является функцией от т р е х независимых переменных - радиусов R и г обоих его оснований и высоты Н, по формуле V=^(R2 I Rr г2). 2) По закону Ома, напряжение V в цепи электрического тока связано с сопротивлением R цепи и с силой тока I зависимостью V =RI. Если V и R считать данными, то отсюда определится I как функция от К и Л 3) Пусть температура массы газа, находящегося под поршнем цилиндра, не постоянна; тогда объем V и давление р одного моля газа связаны с ее (абсолютной) температурой Т, так называемой, формулой Клапейрона: pV = RT (7? = const).
1601 § 1. ОСНОВНЫЕ ПОНЯТИЯ 341 Отсюда, считая, например, V и Т независимыми перемен- н ы м и, функцию р можно выразить через них так: RT Р = -у- 4) Изучая физическое состояние какого-нибудь тела, часто при- ходится наблюдать изменение его свойств от точки к точке. Таковы: плотность, температура, электрический потенциал и т. п. Все эти величины суть «функции точки» или, если угодно, функции от коор- динат х, у, z точки. Если физическое состояние тела меняется во времени, то к этим независимым переменным присоединяется еще и время, г. В этом случае мы имеем дело с функциями от четырех независимых переменных. Число подобных примеров читатель и сам может произвольно увеличить. Уточнение понятия функции в случае нескольких независимых переменных начнем с простейшего случая, когда этих переменных две. 160. Функции двух переменных и области их определения. Говоря об изменении двух независимых переменных х и у, мы должны всякий раз указывать, какие пары значений (х, у) они могут принимать совместно; множество этих пар и будет областью изменения переменных х, у. Самое определение понятия функции дается в тех же выра- жениях, что и для случая одной независимой переменной: Переменная z (с областью изменения %) называется функцией независимых переменных х,у в множестве если каждой паре (х, у) их значений из — по некоторому правилу или закону - ставится в соответствие одно определенное значение z (из 2?). Здесь имеется в виду однозначная функция; легко распро- странить это определение и на случай многозначной функции. Множество о котором выше шла речь, и есть область определения функции. Сами переменные х, у, - по отношению к их функции z - называются ее аргументами. Функциональная зависимость между z и х, у обозначается, аналогично случаю одной независимой переменной, так: z = Дх, у), z=<p(x, у), z = z(x, у) и т. п. Если пара (х0, у0) взята из то Дх0, у0) означает то частное (числовое) значение функции Дх, у), которое она принимает, когда х = х0, у=у0. Приведем несколько примеров функций, заданных аналитически - ф о р- мулами, с указанием их областей определения. Формулы: 1) z = xy и 2) z = x2+y2
342 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [160 определяют функции для всех пар (х, у) без исключения. Формулы: ,,------- 1 3) z= V1 -х2-у2, 4) z =— /1 -х2-у2 годятся (если мы хотим иметь дело с конечными вещественными значениями z) лишь для тех пар (х, у), которые удовлетворяют, соответственно, неравенству x24-y2=sl или х2+у2^ 1. Формулой: х у 5) z = arcsin—f-arcsin— а b функция определена для тех значений х и у, которые порознь удовлетворяют неравенствам - a^sx^sa, - b=^yssb. Во всех этих случаях мы указывали наиболее широкую - естествен- ную [46, 2°] - область применения формулы. Рассмотрим теперь такой пример. 6) Пусть стороны треугольника произвольно изменяются, с тем лишь огра- ничением, что периметр его сохраняет постоянную величину 2р. Если две сто- роны его обозначить через х и у, то третья сторона будет 2р-х-у, так что тре- угольник вполне определяется сторонами х и у. Как зависит от них площадь z треугольника? По формуле Г е р о н а эта площадь выразится так: z = Ур(р - х) (р - у) (х+у-р). Что же касается области определения этой функции, то она обу- словливается, на этот раз, тем конкретным вопросом, который привел к рас- смотрению функции. Так как длина каждой стороны треугольника есть поло- жительное число, меньшее полупериметра, то должны выполняться неравенства 0-=х-=р, 0-=у-=р, х+у<р; они и характеризуют область е^*). Таким образом, в то время как для функции одной переменной стандартной областью изменения аргумента являлся (конечный или бесконечный) промежуток, в случае функции двух переменных мы уже сталкиваемся с большим разнообразием и сложностью воз- можных (и естественных) областей изменения аргументов. Рассмотрение этих областей значительно облегчается их геоме- трической интерпретацией. Если взять на плоскости две взаимно перпендикулярные оси и обычным образом откладывать на них зна- чения х и у, то, как известно, каждой парой (х, у) однозначно опре- деляется точка на плоскости, имеющая эти значения своими ко- ординатами, и обратно. Тогда для характеристики тех пар (х, у), для которых опреде- лена функция, проще всего указать, какая фигура на плоскости ху заполняется соответствующими точками. *) Несмотря на то, что полученная формула сама по себе сохраняет смысл и в более широкой области, например, для х>р«у>р.
160] § 1. ОСНОВНЫЕ понятия 343 Так, говорят, что функции 1) и 2) определены во всей плоскости, функции 3) и 4) - в круге, соответственно, замкнутом (т. е. включающем окружность) или открытом (без окружности) (рис. 89); функция 5) определена в прямоугольнике (рис. 90); наконец, функция 6) рассматривается в от- крытом треугольнике (рис. 91). Рис. 89. Рис. 90. Рис. 91. Эта геометрическая интерпретация настолько удобна, что обычно самые пары чисел (х, у) называют «точками», а множество таких «точек», отвечающее тем или иным геометрическим образам, назы- вают по имени этих образов. Так, множество «точек» или пар (х, у), для которых выполняются неравенства a^sx^sb, c=^y=sd, есть «прямоугольник», измерения которого равны b-а и d-c; его будем обозначать символом [a, b; с, d], сходным с обозначением промежутка. Множество «точек» или пар (х, у), удовлетворяющих неравенству (x-a)2 + (y-/J)2=sr2, есть «круг» радиуса г, с центром в «точке» (a, Р>), и т. п. Наподобие того, как функция y=f(x) геометрически иллюстри- ровалась своим графиком [47], можно геометрически истолковать и уравнение z = f(x, у). Возьмем и пространстве прямоугольную систему координатных осей х, у, z; изобразим на плоскости ху область изменения переменных х и у, наконец, в каждой точке М(х, у) этой области восставим перпендикуляр к плоскости ху и отложим на нем значение z=f(x, у). Геометрическое место полученных таким образом точек и явится своего рода пространственным графиком нашей функции. Это будет, вообще говоря, некоторая поверхность; в свою очередь, равенство z = /(х, у) называется урав- нением поверхности. Для примера на рис. 92, 93 и 94 изображены геометрические образы функций: z = xy, z = x2+y2, z = yi-x2-y2.
344 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [160 Первый из них представляет собой гиперболический пара- болоид, второй - параболоид вращения, а третий - полусферу. Рис. 92. В заключение упомянем, что иногда приходится рассматривать переменную хт’п, значения которой занумерованы двумя натураль- ными значками т и п (каждый из которых, независимо от другого, Рис. 93. Рис. 94. пробегает натуральный ряд чисел). Такая переменная представляет собой, в некотором смысле, обобщение варианты хп. Можно положить, например, _ 1 0+1) •« хт,п mini > хт,п тг+п2 > хт,п т.(п+1) И т. п.
161] § 1. ОСНОВНЫЕ ПОНЯТИЯ 345 По сути дела, значки т и п следует рассматривать как независи- мые переменные, а переменную хт п ~ как функцию от них. Область изменения независимых переменных в данном случае геометрически иллюстрируется своеобразной точечной квадратной сеткой в первом координатном угле. 161. Арифметическое п-мерное пространство. Переходя к функ- циям от п независимых переменных (при и>3), мы сначала остано- вимся на системах совместных значений этих переменных. В случае п = 3 такая система из трех чисел (х, у, z), как ясно чита- телю, еще может быть геометрически истолкована как точка пространства, а множество таких троек - как часть простран- ства или геометрическое тело. Но при п > 3 возможности непосред- ственной геометрической интерпретации уже нет, ввиду отсутствия у нас интуиции пространства с числом измерений, большим трех. Тем не менее, желая распространить геометрические методы (ока- завшиеся плодотворными для функций двух и трех переменных) и на теорию функций большего числа переменных, в анализе вводят поня- тие и-мерного «пространства» и при /г=>3. Назовем (и-мерной) «точкой» систему из п вещественных чисел: M(x,l, х2, ..., хп)*); сами числа хт, х2, ..хп являются коорди- натами этой «точки» М. Множество всех мыслимых и-мерных «точек» составляет л-м ерное «пространство» (которое иног- да называют арифметическим). Целесообразно ввести понятие «расстояния» ММ' между двумя («-мерными) «точками» M(xt, х2, ..., хп) и М'(х^, х2, ..., х'п). Подражая известной из аналитической геометрии формуле, полагают ММ’ = М’М= I/ 2(x'i - х,)2 = У(х'1 -х1)2 + (х2-х2)2+ ... + (х'п - хп)2', (1) ' i=i при п = 2 или 3 это «расстояние» совпадает с обычным расстоянием между двумя соответственными геометрическими точками. Если взять еще одну «точку» М"(Х1, х2, х'п'), *) Имея дело с неопределенным числом переменных, представляется удоб- ным обозначать их не различными буквами, но одной и той же буквой лишь с различными номерами. Таким образом, х, означает (вразрез с прежней практи- кой) не г-е значение некоей переменной, а самое i-ю переменную, которая сама по себе принимает различные значения.
346 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [161 то, как можно доказать, для «расстояний» ММ', М'М" и ММ" вы- полняется неравенство ММ’^ММ7+М'М", (2) напоминающее известную теорему геометрии: «сторона треугольника не превосходит суммы двух других сторон». Действительно, для любого набора вещественных чисел а1г а^, ..ап и b1}b2, ..Ьп имеет место неравенство *) i=i 1 i=i I i=i Если положить здесь a^x't-Xj, bi = x"-x\, так что сц+Ь^х”-xif (i=l, 2,.... n), то получим что равносильно (2). Таким образом, существенное свойство рас- стояния оказывается налицо и в нашем «пространстве». В n-мерном «пространстве» можно рассматривать и непрерывные «кривые». Известно [106], что уравнения х=??(/), у=у)(О, *) Это неравенство есть не что иное как частный случай уже встретившегося нам неравенства Минковского [133 (7)] при к = 2. Если возвести обе части его в квадрат и опустить в обеих частях равные члены, то оно сведется к тоже известному неравенству Коши [133 (5а)]. Приведем совершенно элементарное доказательство этого последнего неравенства, а вместе с тем - и неравенства в тексте. Квадратный трехчлен п п п п ^(aix+bi)2 = ^a* -х2+2 /=1 /=1 1=1 i=i очевидно, не принимает отрицательных значений. В таком случае он не может иметь двух различных вещественных корней, и выражение 1=1 1=1 G=i ) должно быть неотрицательным, а это равносильно неравенству Коши.
161] § 1. ОСНОВНЫЕ ПОНЯТИЯ 347 где '•?(() и ф(t) суть функции от параметра t, непрерывные в некотором промежутке [f, Г], — выражают на плоскости непре- рывную кривую. Аналогично, но лишь с помощью трёх непрерывных функций: х = ф(0> j = *=х(0 выражается непрерывная кривая в (обыкновенном) пространстве. Подражая этому, рассмотрим теперь п непрерывных функций or t = х3 = ®2(0, ... , xn = <fn(t) (t'^i^t"). Тогда множество «точек» (?!«> ?2(0...... получаемых при различных значениях параметра t, и составляет непрерывную «кривую» в л-мерном «пространстве». Положив Xj = <f>, (f), . .. , Хп = (t’)‘, Xt = (t ), . . . , Xn = (/ ), можно сказать, что эта «кривая» соединяет «точки» ЛГ(х]....х'п) и ЛГ(х,.........х’п). В том случае, когда все функции ср,, ... , оказываются ли- нейными, «кривая» переходит в «прямую»: ... , хп = ^ + ₽»; здесь коэффициенты а„ ... , ая предполагаются необращзющимися зараз в 0, a t изменяется от — оо до -ф- оо. Будем считать «точки» её следующими одна за другой в порядке возрастания параметра; если t' то из соответствующих «точек» М', М, М" именно «точка» М лежит между двумя другими, так как следует за М' и предшествует М”. При этих условиях, как легко показать, рас- стояния между ними удовлетворяют соотношению: М'М’ = М'М-^ММ", что является характерным для прямой в обычном пространстве. Уравнения «прямой», проходящей через две заданные «точки» М (Х|, ... , Хп) и М’ (Xi, .... х'п), очевидно, могут быть написаны в виде: Х1=х;4-г;(х;' —х]), ..., хя=х;ц-/(х^—xi) (---------------ОО t<^ -ф- со), причём сами «точки» М и М’ получаются отсюда при t—О и 1. Если же изменять t только от 0 до 1, то получится «прямолиней- ный отрезок», соединяющий эти «точки». «Кривая», состоящая из конечного числа «прямолинейных отрез- ков», называется «ломаной».
348 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [162 162. Примеры областей в n-мерном пространстве. Обратимся теперь к рассмотрению некоторых примеров «тел» и «областей» в «-мерном «пространстве». 1) Множество «точек» М(х}, х2,..., х„) координаты которых независимо одна от другой удовлетворяют неравенствам -V] Ьь а^^х^^Ь* ..., ап^хп^ Ьп, называется (л-мерным) «прямоугольным параллелепипедом» и обозна- чается так: [ab bi, аъ, Z>2; ...; ап, Ьп]. При л = 2 отсюда, в частности, получается тот «прямоуголь- ник», о котором уже была речь в п° 160; трехмерному «паралле- лепипеду» отвечает в пространстве обыкновенный прямоугольный параллелепипед. Если в написанных соотношениях исключить равенство: ai<Zxi<Zbi, a2<Xj<^2,..., ап<^хп<^Ьп, то этим определится открытый «прямоугольный параллелепипед» (а1; by, a* h;...; ап, Ьп), в отличие от которого рассмотренный выше называется з а м'к нут ы'М *). Разности bi — аь b3— а%,..., bn — ап называют измерениями обоих параллелепипедов, а точку [ ai + а2 Ь.2 + Ьп\ 2 ’ 2 ’ ’ 2 J — их центром. Окрестностью «точки» 7l40(xJ, х2,..., xh) называется лю- бой открытый «параллелепипед»: jQS,; а4-В2, 44-8,;...; хХ-8„, ^Ц-8„) (3) (81; В2,..., 8„ ~^> 0) с центром в точке 7H0; чаще всего это будет «куб»: (x°i — В, х?4-8; х'‘~- В, х£ + 8;...; х’’ —В, х£-|-8) В 0), все измерения которого равны (28) 2) Рассмотрим множество «точек» М (х1; х%,..., хп), координаты которых удовлетворяют неравенствам Xi - 0, х2 0,..., хп - 0, Xi -|- х2 ...-|-хп h (h^>0). При и = 2 соответствующим этому множеству геометрическим обра- зом будет равнобедренный прямоугольный треугольник, а при *) Можно рассматривать также и бесконечный «параллелепипед», для которого определяющие его промежутки (или некоторые из них) оказываются бесконечными. Говоря об n-мерном «параллелепипеде», если не сделано оговорок, мы всегда будем иметь в виду конечный «параллелепипед».
162] § 1. ОСНОВНЫЕ ПОНЯТИЯ 349 тетраэдр (рис. 95). В общем случае его называют симплексом*) (именно - замкнутым, в отличие от открытого, который получится, если в написанных соотношениях исключить равенство). 3) Наконец, множество «точек» М(х1, х2, ..., хп), определяемое неравенством (xi-x?)2 + (x2-4)2+ • • +(хп-х“)2^г2 (или <г2), если М0(х°, х%, ..., х°) есть постоянная «точка», а г - постоянное положительное число, образует n-мерную «сферу» радиуса г, с центром в «точке» Мо. Иными словами «сфера» есть множество «точек» М, «рас- стояние» которых от неко- торой постоянной «точки» Мо не превосходит (или меньше) г. Само собой ясно, что этой «сфере» при н = 2 отвечает круг [ср. 150], а при п = 3 - обыкновенная сфера. Открытую «сферу» лю- бого радиуса г=-0 с цен- тром в точке М0(х%, ..., х°) н о с т ь этой точки; замкнутую (или открытую) можно также рассматривать как окрест- в отличие от той («параллелепипедальной») окрестности, которую мы ввели раньше, эту окрестность будем назы- вать «сферической». Полезно раз навсегда дать себе отчет в том, что если «точка» Мо окружена окрестностью одного из указанных двух типов, то ее можно окружить и окрестностью второго типа так, чтобы эта окрестность содержалась в первой. Пусть сначала задан «параллелепипед» (3) с центром в «точке» Мо. Достаточно взять открытую «сферу» с тем же центром и радиусом г, меньшим всех <3, (г = 1, 2, ..., и), чтобы эта сфера уже содержалась в названном «параллелепипеде». Действительно, для любой «точки» М(х}, х.,, ..хп) этой «сферы» будем иметь (при каждом i = 1,2, ..., п): .о Дхк-^=ММ.<г Л = 1 или так что эта точка принадлежит заданному «параллелепипеду». *) По-латыни simplex означает «простой»: симплекс представляет собой, действительно, простейшее многогранное «тело», с наименьшим возможным для данного пространства числом граней.
350 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ (163 Обратно, если задана «сфера» радиуса г с центром в Мо, то «паралле- лепипед» (3) в ней содержится, например, при = = . = Зп=— . у» Это следует из того, что любая «точка» М(хг, х2, . . . , хп) этого «парал- лелепипеда» отстоит от «точки» Мо на «расстояние» ММ0= 2{хк-х^2 к=1 и, следовательно, принадлежит заданной «сфере». 163. Общее определение открытой и замкнутой области. Назовем «точку» М'{х[,х'2,...,х'п) внутренней «точкой» множества (в «-мерном «пространстве»), если она принадлежит множеству вместе с некоторой достаточно малой ее окрестностью. Из утверждения, доказанного в конце предыдущего п°, следует с очевидностью, что безразлично, какого типа окрестности здесь иметь в виду - «параллелепипедальные» или «сферические». Для открытого «прямоугольного параллелепипеда» ...;ап,Ьп) (4) каждая его «точка» является внутренней. Действительно, если al-^x'1<bl, ...,ап^х'п^Ъп, то легко найти такое <3>0, чтобы было + S-=bi, ..., ап<х'п-+ д<Ъп. Аналогично, в случае открытой «сферы» радиуса г с центром в «точке» Мо, каждая принадлежащая ей «точка» М' также является для нее внутренней. Если взять о так, что - О^о^г-М'Мо, и описать вокруг М' «сферу» этим радиусом <?, то она целиком будет содержаться в исходной «сфере»: лишь только тотчас же [160, (2)] ___________________________ MM0=sMM' + M'M0-cq I так что «точка» М принадлежит исходной «сфере». Такое же заключение можно сделать и об открытом сим- плексе: ..., xn>Q, xr+...+xn<h (Л>0). Подобного рода множество, целиком состоящее из внутрен- них точек», будем называть открытой «областью». Таким образом, открытый «прямоугольный параллелепипед», от- крытая «сфера», открытый симплекс - служат примерами открытых «областей».
163] § 1. ОСНОВНЫЕ ПОНЯТИЯ 351 Обобщим теперь понятие точки сгущения [52] на случай множе- ства в n-мерном «пространстве». «Точка» Мо называется точкой сгущения» множества если в каждой ее окрестности (и сно- ва - безразлично, какого типа) содержится хоть одна точка» мно- жества отличная от Мо. «Точки сгущения» для открытой «области», не принадлежащей ей, называются пограничными «точками» этой «области». Погра- ничные «точки» в их совокупности образуют «границу области». От- крытая «область» вместе с «границей» ее называется замкнутой «областью». Нетрудно видеть, что для открытого «параллелепипеда» (4) погра- ничными будут «точки» М(ху, ..., хп), для которых а^^х^^б^9 ••*, an=sxn^bn, причем хоть в одном случае имеет место именно равенство. Точно так же, для рассмотренной выше открытой «сферы» погра- ничными будут «точки» М, для которых в точности ММ0 = г. Наконец, для открытого симплекса (5) пограничными являются «точки» М(х}, ..., хп), удовлетворяющие соотношениям: х^О, ..., хлэ=0, хг + ... +xn^h, причем хоть однажды осуществляется равенство. Таким образом, замкнутый «прямоугольный параллелепипед», зам- кнутая «сфера» и замкнутый симплекс дают примеры замкнутых «об- ластей». Впредь, говоря об «области», открытой или замкнутой, мы всегда будем иметь в виду «область» в указанном здесь специальном смысле. Установим теперь, что замкнутой «области» принадлежат уже все ее «точки» сгущения. Пусть даны замкнутая «область» ig) и «точка» Мо вне ее. Дока- жем, что тогда Мо не будет «точкой» сгущения для <gj. Замкнутая «область» 6jj получается из некоторой открытой «об- ласти» ® путем присоединения к ней ее «границы» £. Очевидно, Мо не является «точкой» сгущения для ®; следовательно, Мо можно окружить такой открытой «сферой», чтобы в ней вовсе не содержа- лось «точек» из ®. Но тогда в ней не может быть и «точек» из £: ведь, если бы какая-нибудь «точка М' из g в нее попала, то в ней содер- жалась бы целиком и некоторая окрестность «точки» М', и в этой окрестности не было бы ни одной точки из ®, вопреки определению «точки сгущения» и множества S как «границы». Итак, в упомянутой «сфере» нет «точек» из 6jj, что и доказывает наше утверждение. Вообще «точечное» множество а^, содержащее все свои «точки» сгущения, называют замкнутым. Таким образом, замкнутая «об- ласть» есть частный случай замкнутого множества.
352 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [164 Введем еще ряд терминов. Множество «точек» е-# называется ограниченным, если оно целиком содержится в некотором «прямоугольном параллелепипеде». «Область» называется связной, если любые ее две «точки» можно соединить «ломаной», лежащей всеми своими «точками» в «об Рис. 96. ласти». На рис. 96 представ- лено для иллюстрации не- сколько связных областей на плоскости. Ограниченная и связная «область» в и-мерном «про- странстве» (открытая или зам- кнутая) есть, в некотором смы- сле, аналог конечного проме- жутка (соответственно, откры- того или замкнутого). Чита- тель видит, однако, насколько усложняется картина при пере- ходе к и-мерным (при hs=2) об- разам. Простым и однотипным промежуткам, границей кото- рых служат всего лишь две точки, здесь противопоставляется огром- ное многообразие «областей» со сложными «границами». Все изложенное в последних пп° можно рассматривать как уста- новление лишь некоего геометрического языка; с этим не связано (при п =-3) никаких реальных геометрических представ- лений. Однако полезно подчеркнуть, что на деле и-мерное арифмети- ческое пространство является лишь первым шагом к тем в высшей степени плодотворным обобщениям понятия пространства, ко- торые лежат в основе многих более высоких частей современного ана- лиза *). 164. Функции п переменных. Пусть имеем п переменных х1; х2, ... совместные значения которых могут выбираться произвольно из некоторого множества точек и-мерного пространства: эти пере- менные называются независимыми. Определение функции и все сказанное по поводу него для случая двух независимых перемен- ных [160] непосредственно переносится и на рассматриваемый случай, так что нет надобности на этом останавливаться. Если точку (хг,х2, ...,хп) обозначить через М, то функцию и = =/(хх, х2, ..., хп) от этих переменных иногда называют функцией точки Ми обозначают тем же знаком: и = f(M). *) Мы помещали в кавычках все геометрические термины, которые употреб- лялись в смысле, отличном от обычного: «точка», «расстояние», «область», и т. п. Впредь мы этого делать уже не будем.
164] § 1. ОСНОВНЫЕ ПОНЯТИЯ 353 Предположим теперь, что в некотором множестве S’ точек т-мер- ного пространства (где т не связано с п) заданы п функций от т пере- менных tx, ?2, ..., tm: *2...tm),---, t2, ...,tm) (5) или, короче, Л'1=<р1(Р), ..., хп=9?„(Р), (5а) где Р означает точку (Z15 f2> '«-мерного пространства. Допу- стим, сверх того, что когда точка P(tt, t2, . . tm) изменяется в пре- делах множества S’, соответствующая ей «-мерная точка М, с коор- динатами (5) [или (5а)], не выходит за пределы «-мерного множества е^, где определена функция u-f(x1,x2, ..xn)=f(M). Тогда переменную и можно рассматривать как сложную фун- кцию от независимых переменных tlf t2, ..tm (в множестве S’) - через посредство переменных хх, ..., хп: u=f^4>lf<t1r ^2’ • <Рп(?1> t2, . . t^y, и является функцией от функций <рх, .. ,,<рп. [Ср. 51.] Самый процесс определения сложной функции по функциям <р±, ... .. ,,q>n и функции f называется (как в простейшем случае функций одной переменной) - суперпозицией. Класс функций нескольких переменных, с которыми непосред- ственно приходится иметь дело на первых порах, очень невелик. По существу, он строится с помощью суперпозиций на элементарных функциях одной переменной [48, 50] и на следующих функциях двух переменных: х z = x+y, z = xy, z=- и z = xy, т. е. на четырех арифметических операциях и на так называемой степенно-показательной функции. Арифметические операции, повторно примененные, исходя из не- зависимых переменных хх, х2, ..хп и постоянных, приводят прежде всего к целым многочленам*): Ж, *2> • • •, Xfi) — CVlt v,,..vnX])X2 . . . Xn Tl, Ъ, • I’ll (целая рациональная функция) и к частным двух таких много- членов /-1Л.. .. .. А . Vt,...,VnXiXt’. . .Хп Wu Х2, ...,Хп)- , „„ ••х2 • *‘хп (дробная рациональная функция). *) Мы знаем, что знак У, означает сумму однотипных слагаемых. Здесь мы имеем более сложный случай, когда слагаемые зависят от нескольких значков. 23 Г. М. Фихссшольц, т. I
354 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [165 Привлечение элементарных функций одной переменной приводит к таким, например, функциям: /(x,y,z) = 1“^±£>, y%2 + y2 + z2 (р(х, у, z,t)=sin ху + sin yz+sin zt+sin tx, и 14 n. Те замечания, которые были сделаны в 46 по поводу аналитиче- ского задания функций одной переменной, могут быть повторены и здесь. 165. Предел функции нескольких переменных. Предположим, что функция /(%!, . ..,хп) определена в некотором точечном множестве ©#, допускающем точку сгущения М0(ах, а2, ..., ап). Аналогично определению предела функции от одной переменной, говорят, что функция f(xl,...,xn) имеет пределом число А при стремлении переменных хх,...,хп, соответственно, к aY, ...,ап, если для каждого числа е=-0 найдется такое число <5>0, что \f(xx, ...,х„)-Л|<е, лишь только |хх-«х|<<5, ..., |x„-an|<<3. При этом точка (хх, ...,х„) предполагается взятой из еАИ и от- личной от (ах, . ..,а„). Итак, неравенство для функции должно вы- полняться во всех точках множества еМ, лежащих в достаточно малой окрестности (ах-д, ах + <5; ...; ап-д, ап + $) точки Мй, но исключая саму эту точку (если она принадлежит ©^). Обозначают предел функции так: А= lim/(хх, ...,х„). (6) х,—а, Хп~*~Оп В геометрических терминах, вводя для точек (хх, ..., х„) и (ах, ... ..., ап) обозначения М и Мо, можно было бы перефразировать при- веденное определение так: число А называется пределом функции f(M) при стремлении точки М к Мо (или - в точке Мй), если для каждого числа £>0 существует такое число г>0, что \f(M)-A\~e, лишь только расстояние МйМ< г. Как и выше, точка М предполагается взятой из но отличной от Мо. Таким образом, неравенство для функции должно выполняться
165] § 1. ОСНОВНЫЕ ПОНЯТИЯ 355 во всех точках множества аМ, лежащих в достаточно малой сфе- рической окрестности точки Мй, за исключением самой этой точки. Обозначение предела функции также можно приспособить к этому определению: А = lim ДМ). (6*) м-м. Из замечания п° 161 об окрестностях разных типов непосредственно ясна тождественность обоих приведенных определений. Аналогично устанавливается понятие о бесконечном пределе функ- ции. В случае А = + ~ или - неравенство |Дх1; . ,.,хп)-Л|<е лишь заменяется, соответственно, неравенством вида Дхг, ...,хл)=-Е или /(%!, ..., хл)< -Е, где Е есть произвольное наперед взятое положительное число. Упомянем в заключение о случае, когда некоторые из незави- симых переменных х15 ..хп стремятся к бесконечным пре- делам. Можно было бы распространить понятие точки сгущения Мй(аг, ..., ап) области и на тот случай, когда все координаты этой точки (или некоторые из них) бесконечны*). Например, точка (+~, ..., +~) является дляеА? точкой сгуще- ния, если в этой области найдутся точки со сколь угодно большими (положительными) координатами. В этом предположении, говорят, что функция f(xr, ..хп) имеет пределом число А при стремлении всех переменных хх, х2, ..., хп к ч- ~, если для каждого числа е>0 существует такое число J>0, что |Дх1;х2, . ..,хл)-Л|<е, лишь только хх>Д, х2>Д, ..., хп>А. В обозначениях: А = lim Дхп ..., хп). Хп-*+°° В частности, возвращаясь к переменной хт_ л, о которой была речь в конце п° 160, говорят, что эта переменная при безграничном *) В этом случае точка Л/о называется несобственной. 23*
356 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [166 возрастании обоих номеров тип имеет пределом А, если для каж- дого е=-0 найдется такой номер N, что при m=-N, n>N. Записывают это так: A- lim хтп или просто А=1т хт п. л-* + *> Легко понять, как трактуется случай, когда Л= + ~ или 166. Сведение к случаю варианты. Рассмотрим в и-мерном про- странстве последовательность точек {Мк(хр, ..., *<*>)} (к =1,2,...). Мы будем говорить, что эта последовательность сходится к пре- дельной точке , ..., ап), если, при к* + °°, расстояние (7) Вместо этого можно было бы потребовать, чтобы координаты точки Мк порознь стремились к соответствующим координатам точки Мо, т. е. чтобы было х<Р-*а1г (8) Равносильность обоих определений, собственно, вытекает из до- казанного в 161 утверждения об окрестностях двух типов. Действи- тельно, условие (7) означает, что, каково бы ни было число г >0, точка Мк при достаточно большом к удовлетворяет неравенству т. е. попадает в (открытую) сферу радиуса г с центром в точке Мо; требование же (8) имеет тот смысл, что, каково бы ни было число 6 =-0, названная точка - снова при достаточно большом к - удовле- творяет неравенствам т. е. содержится в (открытом) параллелепипеде (ах -6, ах + 5; ..., ап- 8, ап + 8) с центром в той же точке. Пусть теперь точка M0(ax, ..., ап) является точкой сгуще- ния некоторого множества в и-мерном пространстве. Тогда из всегда можно извлечь такую последовательность отличных от Мо точек: {М/£}, которая сходилась бы к Мо, как к предельной точке.
166] § 1. ОСНОВНЫЕ ПОНЯТИЯ 357 Для доказательства зададимся положительной вариантой rft-0. По определению точки сгущения [162], в каждой сферической окрестности точки Мо, радиуса гк, найдется (отличная от Мо) точка Мк множества Последовательность {Мк}, очевидно, и будет ис- комой. Теперь можно сформулировать такое условие, необходимое и до- статочное для существования предельного равенства (6) [или (6*)]: если извлечь из последовательность отличных от Мй точек, сходящуюся к Мо, то числовая последовательность состоя- щая из соответствующих значений функции, всегда сходится к А. Необходимость. Пусть имеет место (6*), и по заданному s -О найдено соответствующее ему г=-0, в согласии с определением предыдущего п°. Если последовательность точек {Mfc} сходится к Мо, то - для достаточно больших к - будет М0Мк^г, а это влечет за собой неравенство \f(Mk)-A\^e, которое и показывает, что /(М^—А. Достаточность. Предположим теперь, что выполняется вы- сказанное выше условие. Для того чтобы доказать наличие равен- ства (6*) в соответствии с определением предыдущего п°, допустим противное тому, что содержится в этом определении. Тогда для н е- которого числа е >0 уже не существует соответствующего г, т. е., какое бы число г>0 ни взять, всегда в найдется такая (отличная от Мо) точка М', что одновременно М0М' < г, но |/(Л/') - А | в=е. Взяв положительную варианту 0, станем за г поочередно брать числа гк; для каждого гк найдется, по сказанному, своя (отличная от Мо) точка Мк, для которой МйМк < гк, но | f(Mk) - А | >е. Построенная таким образом последовательность точек {Мк} сходится к Мо, и в то же время числовая последовательность {/(МД) не может иметь пределом А, вопреки условию. Это противоречие и доказы- вает наше утверждение. Читателю ясно, что высказанное условие дает другую форму (на «языке последовательностей») определения предела функции. Таким образом, и для функции нескольких переменных удается вопрос о пределе функции свести к вопросу о пределе варианты [ср. 53]. Этот результат легко распространить и на случай, когда числа А, ах, .. .,ап, или некоторые из них, бесконечны.
358 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [167 Указанное обстоятельство позволяет распространить на новый тип предела все основные понятия и предложения развитой в главе I тео- рии пределов - наподобие того, как это было сделано в 55 для пре- дела функции от одной независимой переменной. 167. Примеры. 1) Пользуясь теоремой о пределе произведения, прежде всего, легко показать, что lim Cxi1 ... х’" = Са[' ... avnn, Xi-Ox Хд-»-Оп где С, ау, ...,ап — любые вещественные, a vL, ...,vn - неотрица- тельные целые числа. Отсюда, если через Р(хг, ...,хп) обозначить целую рациональную функцию [163]: /’(х^, . . ., х„) = CVlt ....„„Х? ... х„, Г:,...,’’» по теореме о сумме, получается также lim Р(х1; ..., х„) = Р(а1, ап). Х1-О1 Хп“*Оп Аналогично для дробной рациональной функции [163] /э/ „ „ 1 ..... хл ZJ-lh) •> • • >Xn по теореме о пределе частного, lim 6(хп ..., xn) = Q(a1, ..., ап), xi-a, х,.-а» конечно, лишь при условии, что знаменатель в точке (ах, ..., ап) в О не обращается. 2) Рассмотрим степенно-показательную функцию ху при х>0 и произвольном у. Тогда, если а=-0 и Ъ - любое вещественное число, будем иметь lim ху = аь. х—а у-*Ь Действительно, если взять любые варианты х„ ->а и уп—Ь, то [ср. 78] ™ * I*1 — ($ а это - на «языке последовательностей» - и устанавливает требуемый результат.
167] § 1. ОСНОВНЫЕ понятия 359 3) Пусть о вариантах хп и уп известно, что они имеют пределы, соответственно, а и Ь, и ставится вопрос о пределе составленного из них выражения хп±Уп, хп-уп, или хУп. Для случая так называемых неопределённых выражений, условно характеризуемых символами: оо — оо, 0 • оо, -5-, —, 1°°, 0°, оо°, ’ 0 ’ оо ’ как мы знаем [31, 78], предел может вовсе не существовать, а если существует, то может — при тех же а и b — иметь различные зна- чения, в зависимости от частного закона изменения вариант хп и уп. Если вспомнить определение предела функции двух независи- мых переменных на «языке последовательностей», то станет ясно, что упомянутые типы «неопределённостей» связаны с фактом н е- существования следующих пределов: lim (х—у), lim х-у lim —, lim —, лг-»О х-*0 У У у -♦ -{-оо У —*0 у со lim ху, lim ху, lim ху. х -* I х -* 0 х -* -|-оо >-*±с© у -* 0 у—*0 4) Поставим вопрос о пределе: lim х-*о О’-О ху ха + У3' {Функция здесь определена на всей плоскости за исключением именно точки х = 0, у = 0.) Если взять две частичные последовательности точек {^(т’ у)} И {^(т’ у)}* очевидно, сходящиеся к точке (0, 0), то окажется, что при всех k / 1 1 \ 1 / /21X2 ^=4 = а = Отсюда уже следует, что упомянутого предела не существует. Предлагается аналогично убедиться в том, что не существует предела 5) Наоборот, существует предел Это сразу вытекает из неравенства
360 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ , [168 Точно так же доказывается, что и х3+у3 lim--- = 0. х-~0Х2+у2 у-.О 168. Повторные пределы. Кроме рассмотренного выше предела функции f(xr, х2, .. - ,хп) при одновременном стремлении всех аргументов к их пределам, приходится иметь дело и с пределами дру- гого рода, получаемыми в результате ряда последовательных предельных переходов по каждому аргументу в отдельности, в том или ином порядке. Первый предел называется и-к ратным (или двойным, тройным и т. д. - при п - 2, 3, ...), а последний - повторным. Ограничимся для простоты случаем функции двух переменных f(x, у). Допустим к тому же, что область изменения переменных х, у такова, что х (независимо от у) может принимать любое значение в некотором множестве Й7, для которого а служит точкой сгущения, но ему не принадлежит, и аналогично у (независимо от х) изменяется в множестве с не принадлежащей ему точкой сгу- щения Ь. Такую область можно было бы символически обозначить, как Например, (а, а + Н; Ъ, Ъ + К) = {а, а + Я) X (Ъ, Ъ + К). Если при любом фиксированном у из существует для функции f(x, у) (которая оказывается функцией лишь от х) предел при x-*iz, то этот предел, вообще говоря, будет зависеть от наперед фиксированного у: lim/(x, у)=<р(у). Затем можно поставить вопрос о пределе функции у(у) при у—Ь lim <р(у) = lim lim f(x, у) у—b y—b х—а — это и будет один из двух повторных пределов. Другой получится, если предельные переходы произвести в обратном порядке: lim lim/(x, у). x-a у-*Ь Не следует думать, что повторные пределы эти необходимо равны. Если, например, в области (0, + 0, + °=) положить х-у+х2+у2 1) /(х, у) = ——t---- х+у и взять а = b = 0, то получим: <р(у) = lim /(х, у) ~ у - 1, lim <р(у) = lim lim /(х, у) = - 1, х-*0 у-*0 х->0 в то время как у(х) -= lim f(x, у) = х+1, lim у(х) = lim lim f(x, у) = 1, у—0 x—0 x—0 у—0
168] § 1. ОСНОВНЫЕ ПОНЯТИЯ 361 Может случиться также, что один из повторных пределов существует, а дру- гой - нет. Так будет, например, для функций: 1 xsin—\-у х 1 2) f(x, у)=——— или 3) f(x, у) = x-sin —; х+Т у в обоих случаях здесь существует повторный предел lim lim/ но нет повторного у-0 предела lim lim/ (а в последнем примере - нет даже простого предела lim/). х—О у —о у-0 Эти простые примеры показывают, насколько осторожным нужно быть при перестановке двух предельных переходов по разным переменным: не раз ошибочные умозаключения проистекали именно от такой незаконной перестановки. В то же время многие важные вопросы анализа связаны именно с перестановкой предельных переходов, но, разумеется, всякий раз дозволительность перестановки должна быть особо обоснована. Один из путей к такому обоснованию открывает следующая тео- рема, которая в то же время устанавливает связь между двойными и повторными пределами: Теорема. Если 1) существует (конечный или нет) двойной пре- дел Л = 1пп/(х, у) х-*а у^Ь и 2) при любом у из существует (конечный) простой предел по X <p(y) = Yvmf(x,y), х-+а то существует повторный предел lim (р(у) = lim lim f(x, у) y—b y-—b х-*а и равен двойному. Докажем это для случая конечных А, а и Ь. Согласно определе- нию п° 163, по заданному е>0 найдется такое д >0, что |/(х,у)-Л|' (9) лишь только |х-а| -=<5 и (причем х берется из Д', а у из /)). Фиксируем теперь у так, чтобы выполнялось неравенство |у -£>| < <6, и перейдем в (9) к пределу, устремив х к а. Так как, ввиду 2), f(x, у) при этом стремится к пределу у (у), то получим |ф(у)-Л|^е.
362 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [169 Вспоминая, что у здесь есть любое число из % подчиненное лишь условию |y-Z>|<<5, приходим к заключению, что А = lim <р(у)=lim lim f(x, у), y-+b y-+b x~*a ч. и тр. д. Если, наряду с условиями 1) и 2), при любом х из Ж существует (конечный) простой предел по у y(x) = lim/(x, у), у^Ь то, как следует из уже доказанного, если х и у обменять ролями, - существует также и второй повторный предел lim yi(x) = lim lim f(x, у) х-*а х-*а у-*Ь и равен тому же числу А: в этом случае оба повторных предела равны. Из доказанной теоремы сразу ясно, что в примерах 1) и 2) двой- ной предел не существует (почему ?). В этом легко убедиться и не- посредственно. В примере 3), наоборот, двойной предел существует: из неравен- ства x-sin- 1x1 ?| 1 1 усматриваем, что он равен 0. Этот пример показывает, что условие 1) теоремы не влечет за собой условия 2). Не следует думать, однако, что существование двойного предела необходимо для равенства повторных: в примере 4) предыду- щего п° оба повторных предела существуют и равны 0, хотя двой- ного предела нет. § 2. Непрерывные функции 169. Непрерывность и разрывы функций нескольких переменных. Пусть функция /(хх, ..., х„) определена в некотором множестве ©4х точек и-мерного пространства, и М'(х{, . ..,х„) есть точка сгущения этого множества, принадлежащая самому множеству. Говорят, что функция /(х1; ...,хп) непрерывна в точке М'(х{, ..., Хп), если имеет место равенство lim/fo, ...,х„)=/(х;, ...,х'п); (1) * * ’ 7 Хп — Хп в противном же случае - функция терпит разрыв в точке М’.
169] § 2. НЕПРЕРЫВНЫЕ ФУНКЦИИ 363 На «языке £-5» непрерывность функции в точке М' выразится так [165]: по любому заданному £>0 должно найтись такое й=-0, что |/(%i, .. -,хп)-/(^, • • <е, (2) лишь только <3, ..., |хп-х'| <5; (3) или иначе: по £-0 должно найтись такое г-0, что лишь только расстояние При этом точка М(хг, .. ,,хп) предполагается принадлежащей мно- жеству в частности же, может совпасть и с точкой М'. Именно ввиду того, что предел функции в точке М' равен значению функции в этой точке, обычное требование, чтобы М была отлична от Мздесь становится ненужным. Рассматривая разности хх-х[, .. .,хп-х'п как приращения Лх[, ..Лх'п независимых переменных, а разность f{xx, ...,xn)-f(xi..х'п) - как приращение функции, можно сказать (как в случае функ- ций одной переменной), что функция непрерывна, если беско- нечно малым приращениям независимых переменных отвечает беско- нечно малое же приращение функции. Определенная выше непрерывность функции в точке М' есть, так сказать, непрерывность по всей совокупности перемен- ных х15 ..., хп. Если она имеет место, то одновременно и lim/(Xi, х2, х')=/(х[, А, ..., х^), Xl + xf lim/(х1; х2, Xg, ..., х') =/(х[, х'2, Xg, х„), х,— и т. п., ибо здесь мы осуществляем лишь частные законы при- ближения М к М'. Иными словами, функция оказывается непрерыв- ной в отдельности по каждой переменной х;, по каждой паре переменных х,, Xj, и т. д. С примерами непрерывных функций мы уже сталкивались. Так, в 166, 1) была установлена непрерывность целой и дробной рациональной функций от п аргументов во всех точках «-мер- ного пространства (для дробной функции - за исключением тех точек, которые обращают ее знаменатель в 0). Там же, в 2), была доказана непрерывность степенно-показательной функ- ции ху для всех точек правой полуплоскости (х=-0).
364 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [170 Если вновь рассмотреть функцию ху f(x, у) = ——- (для х2 + у2 > 0), х2+у2 определенную этой формулой во всей плоскости, кроме начальной точки, и поло- жить дополнительно: /(0, 0) = 0, то получим пример разрыва. Он имеет место именно в начальной точке, так как [167, 4)] при х-0, у-0 для функции предела не существует. Здесь мы сталкиваемся с таким интересным обстоятельством. Рассмотренная функция f(x, у), хотя и не является непрерывной в точке (0, 0) по обеим перемен- ным зараз, тем не менее будет непрерывна в этой точке как по х, так и по у в отдельности; это следует из того, что f(x, 0)=/(0, у) = 0. Впрочем, сказанное перестает быть удивительным, если сообразить, что, говоря о непре- рывности по х и по у в отдельности, мы учитываем лишь приближение к точке (0, 0) вдоль по оси х или по оси у, оставляя в стороне бесчисленное множество других законов приближения. Если для функции f(M) при стремлении М к М' вовсе не существует определенного конечного предела lim f(M), М~М' то говорят, что в точке М ’ функция имеет разрыв, даже в том случае, когда в самой точке М' функция не определена [ср. замечание в 66]. Точки разрыва функции могут быть не только изолированными, как в преды- дущем примере, но и заполнять собою линии, поверхности и т. п. Так, функции двух переменных х2+у2 1 х2-у2’ х2+у2-1 имеют разрывы: первая - вдоль прямых у = ± х, а вторая - вдоль окружности х2+у2--1. Для функций трех переменных x+y+z 1 xy-z ’ X2+y2-Z2 разрывы заполняют в первом случае гиперболический параболоид z-xy, а во втором - конус z2 = x2+y2. 170. Операции над непрерывными функциями. Легко сформули- ровать и доказать теорему о непрерывности суммы, разности, про- изведения, частного двух непрерывных функций [ср. 67]; предостав- ляем это читателю. Мы остановимся лишь на теореме о суперпозиции непре- рывных функций. Как и в п° 164, мы предположим, что кроме функ- ции и = /(%!, ..., х„), заданной в множестве и-мерных точек М(хх, ..., хп), нам даны еще п функций (4) в некотором множестве $ /и-мерных точек ..., Zm), причем точка М с координатами (4) не выходит за пределы упомянутого множе- ства
171] § 2. НЕПРЕРЫВНЫЕ ФУНКЦИИ 365 Теорема. Если функции <р,(Р) (1=1, .. .,п) все непрерывны в точке а функция f(M) непрерывна в соответствую- щей точке M'(x'i, ...,%„) с координатами xi ^(ti, • • •, С)> • • ,х'„ =<pn(ti, Q, то и сложная функция и =/(<Р1(4> • •, tm), , <Pn(tl, , tm)) , <Pn(P)) будет непрерывна в точке Р’. Действительно, сначала по г>0 определится число ё>0, такое, что из (3) следует (2) (ввиду непрерывности функции /). Затем по числу д (ввиду непрерывности функций (рг, ..., (рп) найдется число такое, что неравенства (5) влекут за собой неравенства 1 = |<F1(t1, • • •, *m)-<Pi('L • Ol <5, ..., 12Cn — Xn| = I <pn(t1, . . ., tm) •, d. Но тогда, при наличии (5), будет также |/(x1; ...,х„)-/(^, = = ’ • ’ ?т)> • <Pn(h. > • • • > ^m)) ~ , ...» Q, ..., <pn(ti, Q) I <e, что и доказывает наше утверждение. 171. Функции, непрерывные в области. Теоремы Больцано—Коши. Мы будем говорить, что функция f(xt, ..., хп) непрерывна в некото- ром множестве точек п-мерного пространства, если она непрерывна в каждой точке этого множества, которая является для него точ- кой сгущения. Впредь, как правило, мы ограничимся случаем, когда множество представляет собой открытую или замкнутую о б- л а с т ь [163], наподобие того, как непрерывные функции одной пере- менной мы рассматривали в промежутке. Обращаемся теперь к изучению свойств функции нескольких пере- менных, непрерывной в некоторой области «-мерного пространства. Они вполне аналогичны свойствам функции одной переменной, не- прерывной в промежутке (гл. II, § 5). При изложении мы лишь для краткости ограничимся случаем двух независимых переменных. Перенесение на общий случай производится непосредственно и не представляет труда. Впрочем, некоторые заме- чания по этому поводу будут сделаны попутно. Сформулируем теперь теорему, аналогичную 1-й теореме Б о л ь- цано-Коши для функции одной переменной [180].
366 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [171 Теорема. Пусть функция f(x, у) определена и непрерывна в неко- торой связной области <g). Если в двух точках М0(х0, у0) и М1(х1, уг) этой области функция принимает . значения разных знаков: Я*о>Уо)<о> Л* * * * * * * * * х1>У1)>0, то в этой области найдется и точка М'(х', у'), в которой функция обра- щается в нуль: f(x', у')=0. Доказательство мы по- строим на сведении к случаю функ- ции одной независимой переменной. Ввиду связности области <g), точ- Рис- 97 ки Мо и Мг можно соединить л о- маной, всеми точками лежащей в ® (рис. 97). Если последовательно перебирать вершины ломаной, то либо окажется, что в какой-либо из них функция обращается в 0 - и тогда теорема доказана, либо этого не будет. В последнем случае найдется такая сторона ло- маной, на концах которой функция принимает значения разных зна- ков. Изменив обозначения точек, будем считать, что Мо и М± как раз и являются концами этой стороны. Ее уравнения имеют вид [161]: x = x0 + r(x1-x0), J=J’o + fCFi-Jo)- (0-Г1) Если точка М(х, у) передвигается именно вдоль этой стороны, то наша первоначальная функция f(x,y) превращается в сложную функцию одной переменной t: ДО=/(*о + *(*1~*о)> Уо + *(У1-Уо)) (0=s^=sl), очевидно, непрерывную (по теореме предшествующего п°), ввиду не- прерывности как функции /(х, у), так и линейных функций от I, под- ставленных вместо ее аргументов. Но для F[f) имеем: ДО) =/(х0, Jo) < О, Д1) =/(хх, а) =- 0. Применяя к функции F(t) одной переменной уже доказанную в п° 80 теорему, заключаем, что F(t') = O при некотором значении t' между 0 и 1. Вспоминая определение функции F(t), имеем таким образом Дх0 + Z'(*i - *о), Уо +1 '(Ух -Уо)) = °- Точка М'(х', /'), где х' = х0 + z'(xx - х0), у'=/о + *'(У1~Уо) и является искомой. Отсюда вытекает, как и в 82, 2-я теорема Больцано-Коши, которая, впрочем, могла бы быть получена и сразу.
172] § 2. НЕПРЕРЫВНЫЕ ФУНКЦИИ 367 Читатель видит, что переход к пространству п измерений (при п > 2) не создает никаких затруднений, ибо в и-мерной связной области точки также могут быть соединены «ломаной» и вопрос сведется к рассмо- трению ее стороны, вдоль которой функция будет зависеть от одного параметра, и т. д. 172. Лемма Больцано—Вейерштрасса. Для дальнейшего изложения нам понадобится обобщение леммы Больцано-Вейерштрас- с а [41] на случай последовательности точек в пространстве любого числа измерений; как всегда, мы ограничимся «плоским» случаем. Лемма. Из любой ограниченной последовательности точек J’1)j ^2(*2> У})’ • • > Уп)> • • • всегда можно извлечь такую частичную последовательность МП1(ХП1, Уп^)> Mnfarii, Уп^)’ • •> Mnk(XnJc, Упк)> • • • > П4~+~), которая сходилась бы к предельной точке. 1-е доказательство мы проведем, перенеся на рассматри- ваемый случай рассуждение, которым мы пользовались в «линейном» случае [41]. Ввиду ограниченности данной последовательности точек, найдется такой (конечный) v прямоугольник [а, 6; с, d], ~ в котором она целиком со- держится. Разделим как про- межуток [a, Z>] значений х, так и промежуток [с, d] зна- чений у пополам: Комбинируя каждую из по- ловин первого промежутка с каждой из половин второго, мы получим четыре прямоугольника: (I) . С; c+rf] , (п) [а+5, ъ. с> c+d] , (Ш) k (IV) Ь; c-^,d], I хС X I I X Л I на которые разлагается основной прямоугольник [a, b; с, d] (рис. 98). Хоть в одной из этих частей будет содержаться бесконечное множество точек данной последовательности, ибо, в противном
368 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [172 случае, и во всем прямоугольнике их содержалось бы лишь конечное число, что невозможно. Пусть [а1; bk; с19 dj будет тот из прямоуголь- ников (I), (II), (HI), (IV), в котором содержится бесконечное множество точек нашей последовательности (или один из таких прямоугольников, если их несколько). Полученный прямоугольник снова разложим на четыре меньших прямоугольника и возьмем тот из них, в котором содержится бес- конечное множество точек данной последовательности; обо- значим его через [a,, b2; с2, ty. Этот процесс последовательного дробления прямоугольников мы представляем себе продолжающимся до бесконечности. На к-й стадии его мы выберем прямоугольник [ак, bk; ск, под условием, что в нем содержится бесконечное множество точек Мп. Измерения этого прямоугольника Ък-ак Ь-а “2^ d -е -d~C чк~ск--^- стремятся к 0 при /с — + ~. Применим теперь в отдельности к последовательности проме- жутков {[а/с, &fc]} значений х и к последовательности промежутков {[cft, dk]} значений у лемму о вложенных промежутках [38]. Из нее следует, что концы промежутков ак и Ьк, а также ск и dk, стремятся, соответственно, к общим пределам: lim afc = limZ>fc = x и lim cfc = lim dk=y. (6) Можно сказать, что последовательность прямоугольников {[afc, bk‘, ск, dk]} «стягивается» в точку М(х, у). Теперь, взяв в качестве МП1 любую точку нашей последователь- ности, попадающую в прямоугольник [а1( bx; clt dj, мы станем затем поочередно выделять точки ..., выбирая - в общем слу- чае - в качестве M„t(x„t, уП1) любую точку последовательности, сле- дующую за ранее выбранными и содержащуюся в к-м прямоугольнике [ак, bk, ск, dk]. Это сделать можно именно потому, что каждый из прямоугольников содержит бесконечное мно- жество точек Мп. Так как ак^хП1^Ьк и Ck^ynt^dk, то, ввиду (6), lim xni = x, lim ynjk=J, А-*+«» &-*+<*> так что выделенная частичная последовательность {Мп»} сходится к точке М(х,у), как к предельной [166]. П-е доказательство. Проще, однако, поступить иначе, ис- пользовав теорему, уже доказанную в 41 для случая линейной после-
173J § 2. НЕПРЕРЫВНЫЕ ФУНКЦИИ 369 довательносги. Если точки нашей последовательности содержатся в конечном прямоугольнике [a, b; с, d], то ц=зхл=з/>, c=syn*sd (для п = 1, 2, 3, . ..). Применив теорему п° 41 сначала к последовательности {хл}, вы- делим частичную последовательность {xni}, сходящуюся к некоторому пределу х. Таким образом, для частичной последовательности точек (хП1, уп), (хл„ уп), ..., (Хп^Уп), ... первые координаты уже имеют предел. Вторично применим упомя- нутую теорему к последовательности вторых координат {уП1} и вы- делим такую частичную последовательность {Упкт}, которая тоже стремится к некоторому пределу у. Тогда, очевидно, частичная после- довательность точек (Хпк1, Упк), (Хпкг, уПк), (Хпкт, У.nJ, . . . будет стремиться к предельной точке (х,у). Заметим и здесь, что оба рассуждения легко переносятся на слу- чай пространства п >2 измерений. В первом из них, например, из- меняется только число частей, на которые распадается заданная прямо- угольная область, если разделить пополам каждый из определяю- щих ее промежутков; в общем случае этих промежутков будет п, а частей - всего 2П. 173. Теоремы Вейерштрасса. С помощью доказанной теоремы прежде всего может быть установлена для функций двух переменных 1-я теорема Вейерштрасса: Теорема. Если функция f(x, у) определена и непрерывна в огра- ниченной замкнутой области <g) *), то функция ограничена, т. е. все ее значения содержатся между двумя конечными границами: m*sf(x, y)*sM. Доказательство (от противного) вполне аналогично рас- суждению п° 84. Пусть функция /(х, у) при изменении (х, у) в <5й ока- зывается неограниченной. Тогда для любого п найдется в <3J) такая точка Мп(хп,Уп), что |Лхл,ул)|>и. (7) По теореме п° 172, из ограниченной последовательности {Мл} можно извлечь частичную последовательность сходящуюся к предель- ной точке М(х, у). *) Которая, на этот раз, может быть и несвязной. 24 Г. М. Фихтенгольц, т. I
370 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [174 Отметим, что эта точка М необходимо принадлежит области <g). Действительно, в противном случае точки МПк все были бы от нее отличны, и точка М была бы точкой сгущения области ей не принадлежащей, что невозможно ввиду замкнутости области ® [см. 163]. Вследствие непрерывности функции в точке М должно быть =/(xni, ynjfc) V(M) =/(х, у), а это находится в противоречии с (7). 2-я теорема Вейерштрасса формулируется и доказывается (с ссылкой на предыдущую теорему) совершенно так же, как и в 85. Заметим, что без существенных изменений в рассуждениях - обе теоремы Вейерштрасса переносятся и на случай, когда функ- ция непрерывна в любом ограниченном замкну- том множестве erft (хотя бы и не представляющем собою обла- сти). Как и в случае функции одной переменной, для функции f(x,y), определенной и ограниченной в множестве разность между точными верхней и нижней границами значений функции в назы- вается ее колебанием в этом множестве. Еслиограничено и замкнуто (в частности, еслие^ есть ограниченная замкнутая область), и функция f в нем непрерывна, то колебание есть попросту разность между наибольшим и наименьшим ее значениями. 174. Равномерная непрерывность. Мы знаем, что непрерывность функции f(x, у) в определенной точке (х0, у0) множества е#, где функция задана, на «языке е-<5» выражается так: по любому е=-0 должно найтись такое <3 =-0, что неравенство |/(*. y)~f(x0, у0)| <£ выполняется для всякой точки (х, у) из е^, лишь только |х-х0|<<3, |у-у0|<<3. Пусть теперь функция Дх,у) непрерывна во всем множе- стве тогда возникает вопрос, можно ли по данному е >0, найти такое <5 >0, которое годилось бы - в указанном смысле - для всех точек (х0, у0) из одновременно. Если это возможно (при любом е), то говорят, что функция в равномерно непре- рывна. Теорема Кантора. Если функция f(x, у) непрерывна в ограни- ченной замкнутой области <g), то она будет и равномерно непрерывна в Доказательство поведем от противного. Допустим, что для некоторого числа е >0 не существует числа <5 >0, которое годилось бы одновременно для всех точек (х0,у0) области <g).
174) § 2. НЕПРЕРЫВНЫЕ ФУНКЦИИ 371 Возьмем последовательность стремящихся к 0 положительных чисел Так как ни одно из чисел дп не может годиться - в указанном смысле - одновременно для всех точек (х0,у0) области <g), то для каждого дп найдется в ® такая конкретная точка (хп, уп), для которой ёп не го- дится. Это значит, что существует в <5j) точка (х„, у'п), для которой | ~~ |*-^л» | Тп ~ Уп | *^Л » и тем не менее |/(^п,Тп)-/(^п,Тп)>е- (Ю Из ограниченной последовательности точек {(хп,уп)}, по теореме Больцано-Вейерштрасса, извлечем такую частичную по- следовательность {(хП1, Ул»)}> что xni-x, уП1с~у, причем предельная точка (х, у) необходимо принадлежит области ® (ввиду ее замкну- тости). Так как, далее, |^П1 ~ xni| -= дП1с, |j’nt -Тп*| < ^п/с и, при возрастании к, пк->~ + ^ и <3П1—0, то •^Пк ~~ Хпъ “* 0> Упк~ так что и Xnt-X, y'nt^y. Ввиду непрерывности функции /(х, у) в точке (х, у), принадлежа- щей области <g), мы должны иметь как /(хпж,уЛ1)-/(х, J), так и У)> откуда Дхл*> У nt) ~f(?Cnt > Упъ) О, что оказывается в противоречии с неравенством (8). Теорема дока- зана. Для формулировки вытекающего отсюда следствия нам понадо- бится понятие диаметра точечного множества: так называется точная верхняя граница расстояний между любыми двумя точками множества. Следствие. Если функция f(x, у) непрерывна в ограниченной замкну- той области ®, то по данному е=-0 найдется такое <3=-0, что, на какие бы частичные замкнутые оке области ..., с диаметрами, 24*
372 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ переменных [175 меньшими ё, ни разбить эту область *), колебание функции в каждой части в отдельности будет меньше е. Достаточно за д взять то число, о котором говорится в опреде- лении равномерной непрерывности. Если диаметр частичной области меньше д, то расстояние любых двух ее точек (х, у) и (х0, у0) меньше ё: /(х - х0)2 -I- (у -у0)2 < 5, Отсюда и подавно | х - х01 -= д и |у -у01 -= д, так что |/(х, y)-f(x0, Уо)|-=е. Если эти точки выбрать так, чтобы /(х, у) и /(х0, у0) были соответственно, наибольшим и наименьшим из значений функции в области ®,-, то и получим требуемое утвер- ждение. Легко видеть, что доказанная теорема без изменений переносится (подобно теоремам Вейерштрасса) на случай функции, не- прерывной в любом ограниченном замкнутом множестве 175. Лемма Бореля. Полезное предложение, доказанное в 88 может быть обобщено на многомерный случай. Пусть имеем систему открытых областей а на плоско- сти; если каждая точка множества содержится хоть в одной из этих областей а, то будем говорить, что система 2 покрывает множество Лемма Бореля. Если ограниченное замкнутое множество точек плоскости покрывается бесконечной системой = {о} откры- тых областей, то из нее всегда можно выделить конечную под- систему = с2> •••> ап}, которая также покрывает все множество Доказательство (от противного). Допустим, что множе- ство edit не может быть покрыто конечным числом областей а из Ввиду ограниченности множества &#, оно содержится в некотором прямоугольнике [a, b; с, d]. Разделив каждый из двух промежутков [а, Ь\ и [с, d] пополам, мы разложим этот прямоугольник, как и при доказательстве леммы Больцано - Вейерштрасса [172], на четыре прямоугольника. Вместе с тем и множество разложится на части, содержащиеся соответственно в этих частичных прямоуголь- никах; частей, впрочем, может оказаться и меньше четырех, если какой-либо прямоугольник не содержит вовсе точек множества Хоть одна из этих частей (скажем, в свою очередь, не может быть покрыта конечным числом областей а (ибо в противном случае все множество еМ, вопреки предположению, было бы покрыто конечным числом областей о). Тот из частичных прямоуголь- ников, который содержит именно часть множества е^, обозначим через [«х, 6Х; сх, d'J. *) Эти частичные области могут иметь общими лишь пограничные точки.
176] § 2. НЕПРЕРЫВНЫЕ ФУНКЦИИ 373 Этот прямоугольник снова разложим на четыре прямоугольника. Хотя бы один из них - обозначим его через [а2, й2; с2, - содер- жит часть множества &#, которая не может быть покрыта конеч- ным числом областей а. Продолжая этот процесс до бесконечности, на к-й стадии его мы придем к прямоугольнику [ак, bk; ск, dk], содержащему такую часть е^к множества &#, которая не может быть покрыта конечным числом областей а. Как и в 172, мы заключим отсюда, что прямоугольники [ак, Ьк; ск, d/J «стягиваются» в точку (х, у), так что lim ак = lim bk = х, lim c/£ =lim dk = y. Эта точка М(х, у) принадлежит множеству &#. Действительно, какую бы окрестность (х - й, х + д; у-д, у + 8) точки М ни взять, для достаточно больших к будет х —ё-^ак~=Ьк-^х+ й, у - b-^ck-zdk^y + д, так что в упомянутую окрестность попадает часть &^к множества (по самому выбору ее, наверное содержащая бесконечное множество точек). Следовательно, точка М является точкой сгущения для множества и должна ему принадлежать, ввиду его замкну- тости. В таком случае, точка М содержится в одной из областей а, ска- жем, в о0. Так как ст0 есть открытая область, то в нее входит и неко- торая окрестность (х - й, х + й, у - й, у + й) этой точки. Как и только что, легко показать, что в эту окрестность целиком попадет, при достаточно большом к, прямоугольник [ак, Ьк; Ск, dk], а с ним - и содержащаяся в нем часть е^к множества &#. Таким образом, все множество о/$к покрывается одной областью <т0, между тем как выбирали его мы так, чтобы оно не могло быть по- крыто никаким конечным числом областей с. Полученное про- тиворечие и доказывает лемму. В тех применениях леммы Б о р е л я, которые читатель найдет в следующем п° и в других частях курса, в качестве множества будет фигурировать обыкновенно замкнутая область. Но иной раз придется применять ее и к другим замкнутым множествам, напри- мер, к непрерывной кривой. 176. Новые доказательства основных теорем. 1° 1-я теорема Вейерштрасса. Функция /(х, у) предположена непрерывной в ограниченной замкнутой области Следовательно, каждую точку
374 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [176 (х', у') этой области можно окружить такой окрестностью а', что в ее пределах (если через е обозначено наперед взятое число) \f(x, у} —fix', у')| или fix', у') -e^f(x, у) -=f(x', у') +е. Таким образом, в области а' функция оказывается ограничен- ной. Применяя лемму Бореля к системе £ = {а'} этих окрестностей, можно выделить из ^конечное число окрестностей 0^, <т2, ..., оп, которые в совокупности покрывают всю область Если m^fix, y)^Mt в a, (i=l, 2, ..., и), то, взяв в качестве т наименьшее из т,, а в качестве М - наибольшее из Мь будем иметь в ® y)*sM, ч. и тр. д. 2° Теорема Кантора. Задавшись произвольным числом е>0, каждую точку (х', у') окружим такой окрестностью а' = (х'-д', х' + 8'; у'-8', у' + д’), что для любой принадлежащей ей точки (х, у) (из @) будет \fix,y)-f(x', у')|*=р Если (х0, у0) есть другая подобная же точка, так что и |Л*',У') -f(x0,y^\^, то в результате \f(x,y)-f(x0,y^\^e. (9) Заменим каждый прямоугольник а' вчетверо меньшим прямоуголь- ником, с тем же центром, , Ь' , <5' , <5' , <П О = |х х + 2; У ~2’ У +2р Система <2’ = {й'} этих открытых прямоугольников покрывает об- ласть По лемме Бореля, из нее выделяем конечную систе- му прямоугольников — ( <5f Й/ ф <5() °i=\Xi-2, Xi + ^’, yt-^, yi + ^ с тем же свойством. Наконец, обозначим через 6 наименьшее из всех б: чисел у. Пусть (х, у) и (х0, у0) - любые две точки области для которых |х-х0|-=<5, [у-у0|<^, (10)
177] § 3. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ 375 Точка (х0, у0) принадлежит одной из окрестностей а,, например, окрестности — ( $1» 8/, <5/,) ^,+у; к-у, у>-.+тЬ так что lxo-*d-=y> |Jo-Jz.l*y- Из (10), так как <5=sy, следует, что |х-х0|-=у и |у-у0|-=у. Отсюда -=А> и точки (х, у), (х0, у0) обе оказываются лежащими в одной из перво- начально определенных окрестностей (х,- -8,„ xi, + 8it; yit-8it, yit+8^, а тогда, по доказанному, для них выполняется (9). Итак, удалось по е>0 выбрать 6>0 независимо от поло- жения точки (х0, у0), чем и доказано, что функция /(х, у) равно- мерно непрерывна. § 3. Производные и дифференциалы функции нескольких переменных 177. Частные производные и частные дифференциалы. Для упроще- ния записи и изложения мы ограничимся случаем функций от трех переменных; все дальнейшее, однако, справедливо и для функций любого числа переменных. Итак, пусть в некоторой (открытой) области ® имеем функцию u=f(x, у, z); возьмем точку М0(х0, у0, z0) в этой области. Если мы припишем у и z постоянные значения у0 и z0 и будем изменять х, то и и будет функцией от одной переменной х (в окрестности х0); можно поставить вопрос о вычислении ее производной в точке х = х0. Про- дадим этому значению х0 приращение Дх, тогда функция получит приращение Дхм=Дх/(х0, у0, z0) =/(х0 + Лх,у0, z0) -/(х0, у0, z0), которое можно было бы назвать ее частным приращением (по х), поскольку оно вызвано изменением значения лишь одной переменной. По самому определению производной, она представляет собою предел lim =цт +Ах> Уо » ~ Л-*о > J'o ’ г<>) Их-0 Их-0 Эта производная называется частной производной функции f(x, у, z) по х в точке (х0, у0, z0).
376 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [177 Как видим, в этом определении не все координаты равноправны, так как у0 и z0 наперед фиксированы, а х меняется, стремясь к х0. Частную производную обозначают одним из символов: g; •). /;(Xoj Zq). Dxf(Xgt уо> Заметим, что буква х внизу в этих обозначениях лишь указывает, по какой из переменных берется производная, и не связана с тем, в какой точке (х0, у0, z0) мы производную вычисляем *) **). Аналогично, считая х и z постоянными, а у переменным, можно рассматривать предел lim -ljm ^х°’ У«+АУ< z<d-f(x0, Уо’ jy-o 4у ду_»о Ду Предел этот называется частной производной функции f(x, у, z) по у в точке (х0, у0, z0) и обозначается символами, аналогичными предыдущим: u^fy(x^y^Zo). Dyu, Dyf(x0,y0,zJ. Точно так же определяется и частная производная функции f(x, у, z) по z в точке (х0, у0, z0). Самое вычисление частной производной по существу не пред- ставляет ничего нового по сравнению с вычислением обыкновенной производной. Примеры. 1) Пусть и = хУ (х>0); частные производные этой функции будут: ди ди . — = у-хУ-1, — = хУ-1пх. Эх ду Первая из них вычисляется как производная степенной функции от х (при у=const), а вторая - как производная показательной функции от у (при х = const). X 2) Если и=arctg —, то У ди у ди х дх~ х2+у2 ’ ду~ ~ х2+у2 ’ *) Якоби (С. G. Jacobi) предложил пользоваться круглым д (вместо прямого d) в обозначении именно частной производной. **) И здесь цельные символы df дх ’ fi, Dxf можно рассматривать как функциональные обозначения для част- ной производной по х. Подобных примечаний впредь мы повторять уже не станем.
177] § 3. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ 377 3) Для и =--------имеем Х2+?2 + 22 ди y2+z2-x2 ди -2ху ди -2xz дх (x2+y2+z2)2’ ду (x2+y2+z2)2’ dz (x2+y2+z2)2 4) Пусть z=у -f(x2 - у2), где /(и) - произвольная функция (имеющая производную). Показать, что для z всегда выполняется соотношение: 1 dz 1 dz z х дх у ду у2 какова бы ни была функция f. По правилу дифференцирования сложной функции (означая штрихом про- изводную по и) имеем dz — = yf'(x2 - у2) 2х = 2ху -f'(x2 - у2), дх —=Rx2 - у2) -2y2’f (х2 - у2), ду и отсюда 1 dz 1 dz 1 z — —3-----—=2yf'(x2-}*)+—f(x2-y2)-2y-f'(x2-y2) = — . X дх у ду у У2 5) Сторона а треугольника определяется по двум другим сторонам Ь, с и за- ключенному между ними углу а так: а = У/»2+с2 - 2Ьс cos а. Тогда да 6-c-cosa 6-c-cosa да bc-sina db yz,2+c2-2Z,c-cosa а ’ да а ’ 6) Известная из физики формула Клапейрона pV=RT (где 7? = = const) выражает связь между объемом V, давлением р и абсолютной темпера- турой Т одного моля идеального газа и определяет одну из величин р, V, Т как функцию двух других. Если р, V - независимые переменные, а Г - функция от pV них: Г= —, то R дТ V дТ _р dp~R’ ~dV~R' Если роль независимых играют переменные р и Т, а V - функция от них: V- RT = —, то р dV__RT dV R др~~~?' ~дТ~7' RT Пусть, наконец, V и Т - независимые переменные, р - функция от них: р --; тогда V др __RT др R dV V2’ дТ~~У'
378 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [178 Отсюда, между прочим, получается важное в термодинамике соотношение др dV дТ RT R V RT j дУдт"др~ ~~V*"p"R~ ~~pV~ Заметим, что обозначения Якоби частных производных (с круглыми д) следует рассматривать только как цельные символы, а не как частные или дроби. Полученное только что соотношение с особенной ясностью подчеркивает это существенное различие в характере обозначений обыкновенных и частных производных: если бы выписанные в левой части производные были обыкновен- ными, то можно было бы их рассматривать как частные одних и тех же дифферен- циалов, и по сокращении мы получили бы 1, вместо -1; здесь же, как мы видим, этого делать нельзя. Произведение частной производной на произвольное прираще- дх ние Zlx называется частным дифференциалом по х функции и; его обо- значают символом , ди Л ахи = -г- • Zlx. х дх Если и здесь под дифференциалом dx независимой переменной х разуметь приращение Лх, то предыдущая формула напишется так: , ди , dxu = • dx. х дх Аналогично, , ди , j ди , dyU = d^‘dy’ d^d^'dz- Таким образом, мы видим, что можно было бы и частные произ- водные представить в виде дробей dxu dyu dzu dx ’ dy ’ dz ’ но при непременном условии указывать, по какой переменной берется дифференциал. 178. Полное приращение функции. Если, исходя из значений х=х0, у=у0, z = z0 независимых переменных, придать всем трем некоторые приращения Zlx, Лу, Лг, то функция и = f(x, у, z) получит приращение Ли=Лф(х0, у0, г0)=ф(х0 + Лх, у0 + Лу, г0+Лг)-f(x0, у0, z0), которое называется полным приращением функции. В случае функции у = /(х) от одной переменной, в предположении существования в точке х0 (конечной) производной /'(х0), для прира- щения функции имеет место формула [96 (2)] Лу=Zl/(x0) = /'(х0) • Лх + х • Zlx, где х зависит от Лх и а -«-О при Лх-*®.
178] § 3. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ 379 Мы имеем в виду установить аналогичную формулу для прираще- ния функции и = f(x, у, z): Jw=J/(x0, у0, z0) = =fx(x0, у0, z0)-Ax +fy(x0, Уо, Zg)• Ay + +//(xo> Jo> z0)-Zlz + a>Jx + /3-Zly + y-Zlz, (1) где a, /?, у зависят от Ax, Ay, Az и вместе с ними стремятся к нулю. Однако, на этот раз придется наложить на функцию более тяжелые ограничения. Теорема. Если частные производные f'(x, у, z), fy(x, у, z), f^(x, у, z) существуют не только в точке (х0, у0, z0), но и в некоторой ее окрест- ности, и кроме того непрерывны (как функции от х, у, z) в этой точке, то имеет место формула (1). Для доказательства представим полное приращение функ- ции Аи в виде: Jw=[/(x0+Jx,y0+Jy, Zo + Az)-f(xo, У0 + Ау, z0 + Az)] + + [/(*о> Уо+4у, z0 + Az)-f(x0, уд, z0 + Az)] + + If(x0, Уо, zo + dz)-f(xo, Уо, го)]- Каждая из этих разностей представляет частное приращение, функции лишь по одной переменной. Так как мы предположили суще- ствование частных производных в окрестности точки (х0, у0, z0), то - при достаточной малости Ах, Ay, Az - к этим разностям по отдель- ности можно применить формулу конечных приращений [112] *); мы получим Jn=/X'(xo +0Zlx, Уо+^У, z0+Az)-Ax + +fy(xo, Л + Mb z0 + Jz).Jy+/2'(x0, уд, z0+6zAz)’Az. Если положить здесь: /Х'(хо + 0/1 х> У о + ^У, z0 + Az) =f'(x0, у0, z0) + a, fy(xo, Уо + SyAy, z0 + Az)=f'(x0, y0, z0)+/3, fz'(xo, Уо, zo + 02Jz)=/2'(xo, Уо, z0) + y, то придем к выражению (1) для Аи. При Ax^Q, Ау—0, Az-О аргу- менты производных в левых частях этих равенств стремятся к х0, Уо, z0 (ибо в, 0г, в2 - правильные дроби), следовательно, сами произ- водные, ввиду предположенной непрерывности их для этих значений переменных, стремятся к производ- *) Если взять, например, первую разность, то ее можно рассматривать как приращение функции f(x, уа+Ду, z0+Az) от одной переменной х, отвечающее переходу от х = х0, к х = х0 = Ах. Производная по х от этой функции, т. е. fx(x, у0+Ду, z0+z1z), по предположению, существует для всех значений х в проме- жутке [xQ, х0+Лх], так дто формула конечных приращений применима, и т. д.
380 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [178 ным в правых частях, а величины а, /3, у - к нулю. Этим и завершается доказательство. Доказанная теорема дает возможность, между прочим, установить, что из существования и непрерывности в данной точке частных произ- водных вытекает непрерывность в этой точке самой функции', действи- тельно, если Zlx->0, Zly->0, Zlz->(), то, очевидно, и /1и-»0. Для того чтобы формулу (1) можно было написать в более ком- пактной форме, введем в рассмотрение выражение: q = j/zfx2 + Ду2 + Zlz2 - расстояние между точками (*о> Jo» го) и (х0+Ах, у0+Ау, z0+Az). Пользуясь им, можем написать: а• Ах + ft-Ay + y-Az = (а • ^ + /3 • -^ + у • • Q. Обозначив выражение, стоящее в скобках, через е, будем иметь а • Ах + /j‘Ay + y-Az=S‘(), где е зависит от Ах, Ay, Az и стремится к нулю, если Ах^О, Ау-*0, Zlz-»0 или, короче, если g-*0. Итак, формулу (1) можно теперь пере- писать в виде: Аи = А/(х0, у0, z„)=/x(*0, у0, Zo)’Ax+fy(xo, у0, z0)-Ay + +fz(x0, Уо, Zq)-Az i e-Q, (2) где e->0 при g—0. Величина e-q, очевидно, может быть записана, как o(q) (если распространить введенное в 60 обозначение и на случай функций нескольких переменных). Заметим, что в нашем рассуждении не был формально исключен случай, когда приращения Ах, Ay, Az порознь или даже все сразу равны 0. Таким образом, говоря о предельных соотношениях а—0, /3—0, у-*0, е-*0 при Ах—0, Ау—0, Az-*0, мы понимаем их в широком смысле и не исключаем для этих приращений возможности в процессе их измене- ния обращаться в нуль. (Ср. аналогичное замечание в 96.) При доказательстве предыдущей теоремы мы потребовали от функции не- скольких переменных больше, чем в случае функции одной переменной. Для того чтобы показать, что без соблюдения этих требований формула (1) или (2) здесь могла бы оказаться и неприложимой, рассмотрим, в заключение, следующий пример (где для простоты мы имеем дело всего лишь с двумя независимыми переменными). Определим функцию f(x, у) равенствами: f (х, у) =-— (если х2+у2 =- 0), /(0, 0)0. х2+у2
179] § 3. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ 381 Эта функция непрерывна на всей плоскости; для точки (0, 0) это следует из 167, (5). Далее, существуют частные производные по х и по у также на всей плоско- сти. При х2+у2>0, очевидно, . 2ху3 х2(х2-у2) А(х,У) = , fy(x,y) = -—-—. (х2+у2)2 (х2+уг)2 В начальной же точке имеем: /£(0, 0)=/у(0, 0) = 0; это непосредственно выте- кает, по самому определению частных производных, из того, что f(x, 0)=/(0, у) = = 0. Легко показать, что в точке (0, 0) непрерывность производных нарушается ( 1 ) для первой из них достаточно, например, положить у = х=—-01. I п J Формула вида (1) или (2) для нашей функции в точке (0, 0) не имеет места. В самом деле, если допустить противное, то было бы где е—0 при Лх - 0 и Лу - 0. Положив, в частности, Лу=Лх =- 0, имели бы 1 г- 1 — Лх = е-У2-Лх, откуда е-------, 2 2^2 и е не стремилось бы к нулю при Лх-0, что противоречит допущению. Аналогичную особенность в точке (0, 0) проявляет и функция f(.x, у)= У|ху|. Предоставляем читателю разобраться в этом. 179. Полный дифференциал. В случае функции y=f(x) одной пере- менной, мы рассматривали в 103 вопрос о представимости ее прира- щения =zf/(x0) =ftxo+^х) ~/(хо) в ввде Zlf (х0) = А • Zlx + o(zlx) (А = const). (3) Оказалось [104], что для возможности такого представления необ- ходимо и достаточно, чтобы существовала в точке х=х0 конечная производная f'(x0), причем написанное равенство осуще- ствляется именно при А =/'(х0). Линейную часть А •Ах=/'(х0)-Ах~Ух-А1х приращения функции мы и называли ее дифференциалом, dy. Переходя к функции нескольких, например, трех переменных: f(x, у, z), определенной в некоторой (скажем, открытой) области естественно поставить аналогичный вопрос о представимости прира- щения Jk=z1/(x0, у0, z0)=/(x0 + Zlx, y0 + zfy, z0 + z1z)-/(x0, у0, z0) в виде Af(x0, Уо, zo)=A -Ax + B-Ay + C-Az + o(g), (4) где А, В и С - постоянные, а д = ]/zlx2+zly2 + Zlz2.
382 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [179 Как и в 103, легко показать, что если имеет место разложение (4), то в точке (х0, у0, z0) существуют частные производные по каждой из переменных, причем fx(.X0> У 0 > zo)=y4> fy&O, Jo> Zo)=-®> Уо, Zo) = ^ Действительно, например, полагая в (4) Ay=Az = 0 и Zlx # 0, получим /(x+zfx0, л, zq)-/(x0, y0, z0)_ . o(|ztr|) zlx Л + ’ zU ' ’ откуда и следует, что существует , 'l-li™ /(x0 + zJx, y0, z0)-/(x0, y„, z0)_ . Jx\x0, Уо’ z0)~~llm ~aZ -Л. Zx-0 Таким образом, соотношение (4) всегда осуществляется только в виде 4f(xo» Jo> zo) = fx(xo, Jo> 2o) •Лх + +A'(*o> Jo> zo)-dy+f&o, Уо, z0)-Az+o(q) (5) или - в более короткой записи - Аи=их 'Ax + Uy-Ay + u'-Az + oCg). (5*) Однако, в то время как в случае функции одной переменной су- ществования производной у'=/'(хо) в рассматриваемой точке было уже и достаточно для наличия соотношения (3), в нашем случае суще- ствование частных производных ^х=Фх(х0, Уо, Zo)> Uy~fy(.xo, Уо, zo), uz~fz(xO’ Уо, Zo) еще не обеспечивает разложения (4). Для случая функции двух пере- менных мы это видели на примере в предыдущем п°. Там же, в теоре- ме, были указаны достаточные условия для выполнения со- отношения (4): это - существование частных производных в окре- стности точки (х0, у0, z0) и их непрерывность в этой точке. Впрочем, легко показать, что эти условия отнюдь не необходимы для формулы (5) или . (5*). Это, собственно говоря, следует уже из того, что для функции одной переменной (которую, если угодно, можно рассматривать и как функцию от любого числа переменных) подобные условия не необходимы. При наличии формулы (5) функция f(x, у, z) называется диффе- р е нцир у е м ой в точке (х0, у0, z0) и (только в этом случае!) выра- жение их • Ах + и'у Ay + u'z • Az — =fx(.xo, Jo> zo) • Ax +fy(x0, y0> zo) •ЛУ +fzixo, Jo, zo) • m. e. линейная часть приращения функции называется ее (полным) дифференциалом и обозначается символом du или df(x0, у0, z0).
1801 § 3. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ 383 В случае функции нескольких переменных утверждение: «функция дифференцируема» в данной точке, как видим, уже не равнозначаще с утверждением «функция имеет частные производные по всем пере- менным» в этой точке, но означает нечто большее. Впрочем, мы обычно будем предполагать существование и непрерывность частных производных, а это уже перекрывает дифференциру- емость. Под дифференциалами независимых переменных dx, dy, dz услав- ливаются разуметь произвольные приращения Zlx, Ay, Az *); поэтому можно написать: #(*о> Уо> z0)=A'(x0, у0, z0).Jx+/;(x0, у0, z^-dyyf2(x^ у0, z0)dz или du = их • dx + и'у • dy + uz • dz. Полный дифференциал оказывается равным сумме частных дифференциалов [177]. 180. Геометрическая интерпретация для случая функции двух пере- менных. Желая дать геометрическое истолкование сказанному выше, аналогичное геометрическому истолкованию производной и диф- ференциала функции одной переменной [91, 104], вернемся к понятию касательной № к кривой 3£ в данной на ней точке Мо. / Мы определили касательную М0Т (рис. МЛ 99) как предельное положение секущей // \ М0М при стремлении М0М к нулю [91]. // Очевидно, можно дать и такое, равно- Ат сильное этому, определение: Прямая М0Т называется касатель- ной к кривой ЗС в точке Мо на ней, если pjjC 99 расстояние МР переменной точки М кри- вой ЗС °т прямой М^Т, при стремлении расстояния М^М к нулю, является бесконечно малой высшего порядка, чем М^М (т. е. если отношение МР]'М0М при этом стремится к нулю **). *) Если отождествить дифференциал независимой переменной х с дифференциалом х, как функции от независимых переменных х, у, z, то, по общей формуле, можно написать dx = хх • Zlx+х'у • Ay+x'z • Az = 1 • zlx+0 • Ay+0 • Az = Zlx, тогда равенство dx = zlx оказывается доказанным. **) А это значит, что стремится к нулю sin у, а с ним и угол у между секущей М0М и прямой М0Т (см. рис.).
384 гл. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ (180 Рассмотрим теперь некоторую поверхность & и на ней точку Мй (рис. 100). Аналогично определению касательной прямой, дадим определение касательной плоскости: Плоскость М0К называется касательной плоскостью к поверхности & в точке Мо на ней, если расстояние МР переменной точки М поверхности <Sf от этой плоскости, при стремлении расстоя- ния М0М к нулю, является бесконечно малой высшего порядка, чем М0М (т. е. если отношение МР/М^М при этом стремится к нулю). Пусть [159] поверхность задана уравнением z=f(x, у) в прямо- угольных координатах. Возьмем на ней точку М0(х0, у0, z0) [где z0=f(x0, у0)] и исследуем, при каких условиях плоскость S’, проходящая через точку Мо и имею- щая уравнение Z - z0=А(Х - х^) + B(Y - У(), (6) удовлетворяет этому определению. Проведем ML параллельно оси z (см. рис. 100) и из Мо опустим на ML перпендикуляр M0N. Так как отрезок МК отличается от МР постоянным множителем (не равным нулю), то вместо отношения МР\ММ0, можно рассматривать отношение МК\ММ0. Покажем те- перь, что, не меняя по существу определения касательной плоскости, можно, наконец, заменить здесь расстояние г = ММ0 отрезком q = M^N.
180] § 3. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ 385 Если при М-*М0 стремится к нулю отношение MK/q, то это тем более верно для отношения МК/r, ибо г>о. Предположим теперь, что MK.fr стремится к нулю, и установим, что тогда стремится к нулю и MKfg. Для этого доста- точно доказать, что при М—Мй отношение остается ограниченным. Отрезок МК, с точностью до знака, равен выражению z-Z=z-zQ-A(x-x^-B(y-y^ или, если ввести обозначения х-ха = Ах, у-у0 = Ау, z-z0 = Az = Af(x0, у0), - выражению Az-{А Ах + ВАу). Ввиду сделанного предположения, по крайней мере для точек М, достаточно близких к Мо, будем иметь \Az - (А Ах+В Ау)\ -=~ г = ^УАх2 + Ay- + Az-, так что е 11 е 11 Q 2 у [е/ или (усиливая неравенство) \Az I ... . „, 1 /, I Az |А LT<MI + |jBi+2 Г Отсюда v 7 Ь^Ц2(|Л| + |Б|) + 1, а следовательно, Г 1/" [\ Az IA2 г1/1 + ( Q ) -2(И1 +1*1 + 1), что и требовалось доказать. Таким образом, плоскость (6) будет касательной к поверхности в том и только в том случае, если отношение Az-{А Ах+ВАу) е стремится к нулю вместе с г;, т. е. если имеет место разложение Az=Af(x0, у0)=А-Ах + В-Ay + о(р) [ср- (4)]. Мы приходим к окончательному заключению: для того, чтобы поверхность z=f(x, у) в точке М0(х0, у0, z0), где z0=f(x0, у0), имела касательную плоскость *), необходимо и достаточно, чтобы при х = х0, У = +о Функция f(x, у) была дифференцируема. *) Имеется ,в виду плоскость, не параллельная оси z. 25 Г. М. Фихтенгольц, т. I
386 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [181 Так как при выполнении этого условия коэффициенты А и В не- обходимо равны частным производным f'x(x0, у0) и f'y(x0, у0), то каса- тельная плоскость выразится уравнением z- zo =Л(*о> Уо) хо) + Л(%0> Уо) (У~Уо)- Обычно значков при х, у, z не пишут; тогда уравнение касательной плоскости принимает вид Z-z=f&, y)-(X-x)+fy(x, y)-(Y-y). (7) Нетрудно видеть, что если пересечь поверхность и касательную к ней плоскость любой плоскостью, параллельной оси z и проходящей через точку Мо, то в сечении с первой получается некоторая кривая, а в сечении со второй - касательная к ней прямая *). В частности, в сечении поверхности плоскостями Y=y0 и Х=х0 получатся кривые, угловые ко- эффициенты которых **) соот- ветственно равны: Г&о’Уо) и /у(хо’Уо)- На рис. 101 отрезки КУМУ, К2М2 и КМ представляют част- ные и полное приращения функ- ции, а отрезки KlN1, K2N2 и KN ~ частные и полный ее дифференциалы [ср. п° 104 и рис. 44]. 181. Производные от слож- ных функций. Пусть имеем функцию U=f(x, у, г), определенную в (открытой) об- ласти причем каждая из переменных х, у, z в свою очередь, является функцией от переменной t в некотором промежутке: х=<р(0, y=V>(0, z = %(0. Пусть, кроме того, при изменении t точки (х, у, z) не выходят за пределы области Подставив значения х, у и z в функцию /, получим сложную функ- цию: w=/(«p(0, у(0, х(0)- *) Ниже [234], будет рассмотрен более общий вопрос о касательных к любым кривым, проведенным по поверхности через данную точку. **) Легко сообразить, по отношению к каким координатным системам вы- числяются эти угловые коэффициенты.
181] § 3. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ 387 Предположим, что и имеет по х, у и z непрерывные частные произ- водные w', и'у, и'г *) и что x't, y't и z't существуют. Тогда можно доказать существование производной сложной функции и вместе с тем вы- числить ее. Действительно, придадим переменной t некоторое приращение At, тогда х, у и z получат соответственные приращения Ах, Ау и Az, функция же и получит приращение Аи. Представив приращение и в форме (1) (это мы можем сделать, так как предположили существование непрерывных частных производных и'х, и'у, и2), получим Аи = и'х Ах + и'у • Ay + u’z Az + а • Ах+fl • Ау + у • Az, где а, (j, у—О при Дх, Ay, Az—О. Разделив обе части равенства на At, будем иметь Аи , Ах i Ay , Az Ах п Ay Az -Г- = их + и V Д7 + иг • "77 + а ’ "77 + Р ’ Д7 + У ’ 17 • At х At у At z At At r At ' At Устремим теперь приращение At к нулю; тогда Ах, Ay, Az будут стремится к нулю, так как функции х, у и z от t непрерывны (мы пред- положили существование производных x't, y’t и z,), а потому а, у>, у также будут стремиться к нулю. В пределе получим: и] = и'х • x't + и'у • y't + и2 • zt. (8) Видим, что при сделанных предположениях производная сложной функции действительно существует. Если воспользоваться дифферен- циальным обозначением, то формулу (8) можно записать так: du _ди dx ди dy yjtu dz dt дх dt+ ду dt dz dt ' ' Теперь рассмотрим тот случай, когда х, у и z зависят не от одной переменной t, а от нескольких переменных; например, x=<p(t, v), у—ip(t, v), z = %(t,v). Кроме существования и непрерывности частных производных функ- ции f(x, у, z)*), мы предполагаем здесь существование производных от функций X, у, Z ПО t И V. После подстановки функций <р, ip и % в функцию f мы будем иметь некоторую функцию от двух переменных t и v, и возникает вопрос о существовании и вычислении частных производных u't и и'„. Но этот случай не отличается существенно от уже изученного, ибо при вы- числении частной производной функции от двух переменных мы одну из переменных фиксируем, и у нас остается функция только от одной *) Собственно говоря, достаточно предположить дифференцируемость функ- ции u=f(x, у, z). 25*
388 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [182 переменной. Следовательно, для этого случая формула (8) остается без изменения, а формулу (9) нужно переписать в виде: ди ди дх ди ду.ди dz dt~ дх' dt+ ду' dt+ dz' dt ‘ ' 182. Примеры. 1) Рассмотрим степенно-показательную функцию и = хУ. Положив x=q>(t), у = ч>(1) и продифференцировав по только что выведенному правилу дифференцирования сложной функции, получим известную уже нам фор- мулу Г. В. ЛейбницаиИ. Бернулли: и[ = у • хУ~х • x't+хУ • In х-yj. Раньше мы установили ее (в других обозначениях) с помощью искусственного приема [99, 23)]. 2) Пусть u=f(x, у, z) имеет непрерывные частные производные, и вместо х, у и z подставлено: х = »?-£, У = £-£, z=f-?7. Тогда ди ди ди ди ди ди ди ди ди di ду+dz’ дц дх dz’ дС дх+ду' 3) Если (при тех же предположениях относительно функции /), сохраняя х независимой переменной, положить У = у(х) и z=z(x), где функции у(х), z(x) дифференцируемы по х, то и, как сложная функция от х, будет иметь производную: du ди ди dy ди dz dx дх ду dx dz dx или —=fx(x, у(х), z(x))+fy(x, у(х), z(x))-y'(x)+fz(x, y(x), z(x))-z'(x). Здесь само x играет роль переменной t в формуле (8). 4) Если же обе переменные х, у оставить независимыми, а вместо z под- ставить функцию z = z(x, у), имеющую частные производные по х и по у, то для сложной функции u = f(x, у, z(x, у)) будем иметь: Эи — =/i(x, У’ z(x, у)) +Л(х, у, z(x, y))-z£(x, у), @Х ди — = fy(x, у, z(x, у)) + f'z (х, у, z(x, у)) • Zy(x, у). ду 5) В качестве дальнейшего примера применения формулы (9) рассмотрим вопрос о дифференцировании определителя ^11 Д12 ’ ‘ ’ ^1Л #21 # 22 • * ‘ ^2Л ^71 ^772 • • •
182J § 3. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ 389 в предположении, что элементы его ащ (/, к = 1, 2, ..п) суть функции от некото- dalk рого параметра t, для которых существуют производные по t: — . dt Вспоминая разложение определителя по элементам к-го столбца ^~^ik'aik+^2k' аж+------t-^ik'aik~f~ — +Апк- апк> где алгебраические дополнения Alk, , А,1к элемента не содержат, приходим к заключению, что ----— Aik- да1к В таком случае, по формуле (9), Z 7-----7-= Z Z Aik'~~- at л=1 i=t dalk at л=1 ,=i at Заметим, что сумма 2 Ац< •-----дает разложение определителя, отличающегося i=l dt от данного лишь тем, что элементы его к-го столбца заменены их производными по t. Отсюда правило: производная определителя А равна сумме п определителей, получающихся из Л заменой, поочередно, элементов его 1-го, 2-го, ..., п-го столбца производными. Формула (8) сходна с формулой u't = u'x-x't для случая функции и от одной переменной х. Подчеркнем, однако, снова разницу в условиях, при которых были выведены эти формулы. Если и зависит от одной переменной, то доста- точно было предположить существование производной их, в случае же нескольких переменных - мы вынуждены были предположить еще и непрерывность произ- водных и'х, иу, ... Следующие примеры показывают, что одного существо- вания этих производных для действительности формулы (8) вообще недоста- точно. 6) Определим функцию u=f(x, у), полагая: /(*, у) (при X2 + у2 > 0), /(0, 0) = 0. х2+у2 Эта функция, как мы видели, имеет частные производные во всех точках, не исклю- чая и начальной (0, 0), причем Л(0, 0) = 0, /$(0, 0) = 0; заметим, что именно в этой точке производные терпят разрыв. Если ввести новую переменную t, положив x=t и y=t, то получим сложную функцию от t. По формуле (8) производная этой функции при t = 0 была бы равна и' = их- x't + u'y y'i = 0. Но, с другой стороны, если на деле подставить значения х и у в данную функ- цию и = /(х, у), получим t2-t 1 и =------= -t. Z2 + Z2 2 , 1 Продифференцировав теперь непосредственно по t, будем иметь ut = ^ при любом значении t, значит и при t = 0.
390 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [183 Оказывается, что формула (8) в данном случае неприменима. 7) Поведение функции и =f(x> у) определяемой равенствами 5 Ж = jLjL (при %2+j>2 > 0), /(0, 0) = о, x24-^2 в точке (0, 0) вполне аналогично. Взяв здесь x=y = t, получим сложную функцию 1 1 и=-/3, которая при f = 0 имеет бесконечные односторонние производные. Если же положить: х = t, а 1 1 y=/3sm — при и у = 0 при / = 0, то сложная функция, определяемая равенствами: 1 t • sin - t и =--------- при Z^0, и = 0 при Г = 0, 2- 1 l + Z3-sm2- t при t-О никакой производной иметь не будет. 183. Формула конечных приращений. Пусть функция f(x, у, z) определена и непрерывна в замкнутой области ® и имеет не- прерывные частные производные f'y, f'z внутри этой области (т. е. во всякой внутренней ее точке). Рассмотрим две точки из ® -Ц)(*0 > Jo > zo) и Mi(*o + Jo + лJ> zo + -М которое можно соединить прямолинейным отрезком М0Му, целиком лежащим в области Тогда имеет место формула: 4/Uo , Jo > zo) = Л*о + Лх, Jo + JJ, zo + ^z) -/(x0, y0, z0) = =fx(xo + d/ix> Jo + 0/lJ, zo + 0Zlz)-Jx+/y(- • -)-^y+fz(- • -)-^z (10) (O<0-=1), вполне аналогичная известной формуле конечных прира- щений для функции одной переменной [112, (2)]. Для доказательства ее положим в функции f(x, у, z) x = x0 + t-Ax, y=y0 + t-Ay, z = z0 + t-dz (И) (при O=sZ=s=l), т. е. рассмотрим нашу функцию именно в точках прямо- линейного отрезка МОМХ. Сложная функция от t F(t) =Лхо rt-Ax,y0+t-Ду, z0 +1 dz)
184] § 3. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ 391 непрерывна во всем промежутке [0, 1] [170], а внутри него имеет производную, которая, по формуле (8), равна F'(t) =/x'(*o + t-Ax,y0 + t- Ay, z0 +1 • dz) • dx +fy{ ...)-Ay +f'z{ • • •) • ибо из (11) dx . dy . dz . -J- = dx, -j- = dУ, -T- = dz. dt dt dt Применим к функции F(t) в промежутке [0, 1] формулу (2) п° 112: F(1)-F(O) = F(0) (О-=0-=1). Если заметить, что, по определению функции F(t), Е(1) - F(O) =/(х0 + dx, у0 + dy, z0 + dz) -/(х0, у0, z0), и подставить вместо производной F'(9) только что найденное выра- жение (при t = 0), то и придем к формуле (10). В качестве простого примера приложения доказанной формулы упомянем следующее предложение: Если функция f(x,y,z), непрерывная в замкнутой и связной области внутри области имеет частные производные равные 0: а7=/;=//=о, то эта функция во всей области <g) сводится к постоянной: f = const. Пусть М0(х0, у0, z0) и М(х, у, z) будут любые две точки области Ввиду предположенной связности эти точки можно соединить ломаной, не выходящей за пределы Если М^Ху, уг, zt) есть следую- щая за Мо вершина ломаной, то, положив в (Г1) x0 + dx=x1, y0 + dy = =ylt z0+dz=z1, сразу получим /(xi,yi,Zj) =/(x0,y0,z0); переходя так последовательно от вершины к вершине, окончательно найдем: /(х, у, z)=/(x0,y0,z0), ч. и тр. д. 184. Производная по заданному направлению. Частные произ- водные функции f(M) = f(x, У, z) по х, по у, по z выражают «ско- рость изменения» функции по направлению координатных осей. Например, /х есть «скорость изменения» функции по х: точка пред- полагается перемещающейся лишь по параллели оси х. Между тем,
392 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [184 во многих физических вопросах может представить интерес также «скорость изменения» функции f(M) и по другим направлениям. Так будет, например, в случае, если дано поле температуры, т. е. если задана температура f{M) в каждой точке М рассматри- ваемого тела. Законы распределения и перемещения тепла суще- ственно зависят от скорости па- дения (или роста) температуры по всем направлениям. Уточним по- нятие «скорости изменения» или производной функции по любому заданному направлению. Здесь мы также будем иметь слу- чай применить формулу (9). Пусть функция f(M) опреде- лена в некоторой (открытой) об- ласти. Рассмотрим любую точку Л/0(х0', 3’0, z0) этой области и лю- бую направленную прямую (ось) I, проходящую через эту. точку (рис. 102). Пусть М(х, у, z) - какая-ни- будь другая точка этой оси, MQM - длина отрезка между Мо и М, взятая с надлежащим знаком, именно со знаком плюс, если направление М0М совпадает с направ- лением оси /, и со знаком минус - в противном случае. Пусть М неограниченно приближается к Мо. Предел lim м^м. НМУ-ДМ») мом называется производной от функции j\M) по направ- лению I (или вдоль оси /) и обозначается следующим образом: _ а/(%0, у„, z0) di Э1 Эта производная характеризует «скорость изменения» функции в точке Мо по направлению /. В частности, как упоминалось, и обычные частные производные df df df dx’ ду ’ dz тоже можно рассматривать как производные «по направ- лению». Предположим теперь, что функция f(x, у, z) имеет в рассматри- ваемой области непрерывные частные производные *). Пусть ось / образует с осями координат углы а, /3, у. Докажем, что при сде- *) См. сноску на стр. 387.
184] § 3. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ 393 данных предположениях производная по направлению I существует и выражается формулой d/(x0,y„,z0) df df D df ° —-=~ • cos a + • cos P + ~ • cos y. dl dx dy r dz ' (12) Для доказательства заметим, что если положить МйМ= t, то будем иметь х - х0 = 1 • cos a, y-y0 = t-cosfi, z-z0 = t-cosy. Таким образом, вдоль оси / координаты х, у, z можно рассматри- вать, как функции t: x = x0 + ?-cosa, у=у0 + t-cos ft, z = z0 +1 cosy, (13) а функцию /(М)=/(х, у, z) - как сложную функцию от I. При этом точке Мо соответствует значение t, равное нулю. Таким образом, имеем: di lim /-^F^) = lim?^)=m м-м, МОМ t~0 ‘ если только существует производная <р'(0). Но производная <p’(f) при сделанных предположениях существует и выражается по формуле (9) следующим образом: dx'dt^dy' dt dz' dt ' Используя формулы (13), получаем a f a f a г cos a + zd cos В + z- . cos y, r v 7 dx dy r dz ” откуда и следует наше утверждение. Зададимся теперь вопросом: ио какому направлению функция в данной точке будет всего быстрее возрастать? Конечно, этот вопрос имеет смысл лишь в том случае, если производные п _ df(x0, у0, z0) , _ df(x0, То', Zp) _df(x0, То, z0) ,. .. dx ’ ° dy ’ dz 1 ' не равны одновременно нулю (ибо иначе - производная по любому направлению была бы нулем). В этом предположении, прибегнем к преобразованию выражения (12): а cos a + b • cos ft + c • cos у = = Уа2 + Ь2 + с2-( cos a + -Д= • cos /? + —L= • cos у ly... y... y... z
394 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ (185 Дроби в скобках можно рассматривать, как направляющие косинусы некоторого направления g: а л b с ,__= cos А, , = COS и, -== = cos V, УТТ У?77 у... и тогда мы получим Уа2 + Ь2 + с2- (cos А • cos а + cos р cos + cos v cos у). Если, наконец, через (g, /) обозначить угол между направлениями g и /, то по известной формуле аналитической геометрии получим: ^=Уа2 + Ь2 +с2-cos (g,l). (15) Теперь ясно, что, если I отождествляется с g, эта производная достигнет наибольшего значения: 9g уа+о+с J • Вектор g, имеющий проекции (14) на оси координат, указывает направление наиболее быстрого возрастания функции, а его длина | g | дает величину соответствующей производной. Этот вектор называют градиентом функции f(M) = f(x, у, z). Переписав формулу (15) в виде -^=|g|-cos(g, /), легко усмотреть, что вектор, который получится если на направлении / отложить отрезок представляет собой попросту проекцию гра- диента на это направление. 185. Инвариантность формы (первого) дифференциала. Пусть функ- ция u=f(x, у, z) имеет непрерывные частные производные их, и'у, uz, причем х, у, z, в свою очередь, являются функциями от новых пере- менных t и v: х = <p(t, v), у=ip(t, v), z = %(t, v), также имеющими непрерывные же частные производные x't, х', y't, у', z'f, z„. Тогда [181] не только существуют производные от сложной функции и по t и v, но эти производные также непрерывны по t и v, как это легко усмотреть из (8). Если бы х, у и z были независимыми переменными, то, как мы знаем, (полный) дифференциал функции и был бы равен (/w = Ux • dx 4" Uy * dy 4' uz • dz.
185] § 3. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ 395 В данном же случае и зависит - через посредство х, у, z - от переменных t и v. Следовательно, по отношению к этим переменным, дифференциал напишется так: du = u'fdt + u'v-dv. Но, в силу (8), И/ = Ux • x't + Uy Уt + u'z-z't и, аналогично, < = Их-< + и'-у; + и'-а;. Подставив эти значения в выражение для du, будем иметь: du = (и' x't + и'у-yt + u2- zz') • dt + (и' • х'„ + и’уу'к + u2 z') • dv. Перегруппируем члены следующим образом: du = и’х (x't -dt + x'v- dv) + u'y (y't -dt + y'v- dv) + u'2 (z't -dt + z'v- dv). Нетрудно видеть, что выражения, стоящие в скобках, суть не что иное, как дифференциалы функций х, у, z (от и и р), так что мы можем написать: du = и'х-dx + и'у dy + и'2- dz. Мы пришли к той же самой форме дифференциала, что и в слу- чае, когда х, у, z были независимыми переменными (но смысл сим- волов dx, dy, dz здесь, конечно, уже другой). Итак, для функций нескольких переменных имеет место инва- риантность формы (первого) дифференциала, как и для функ- ций одной переменной *). Может случиться, что х, у и z будут зависеть от различных пере- менных, например, х = <p(t), у =ip(t, w), z = %(v, и>). В таком случае мы всегда можем считать, что X=lpy(t, v, w), у =ipr(t, v, w), z = %r(t, v, w), и все предыдущие рассуждения будут применимы и к этому случаю. Следствия. Для случая, когда х и у были функциями одной переменной, мы имели следующие формулы: d(cx) = с • dx, d(x±y)-dx±dy, d(xy)=y-dx + x-dy, ,(х\ у -dx-x-dy d - =------;----. У* *) Отметим, что то же заключение справедливо и при одном предположении дифференцируемости всех рассматриваемых функций. Чтобы убедиться в этом, достаточно показать, что результатом суперпозиции дифференцируемых функций будет также дифференцируемая функция.
396 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [186 Эти формулы верны и в том случае, когда х и у являются функциями любого числа перемен- ных, т. е. когда x=cp{t, v, ...), y=ip(t, v, ...). Докажем, например, последнюю формулу. Для этого примем сначала х и у за независимые переменные; тогда 1 , х , ydx-x-dy -dx—-,-dy = -------- у у2 у2 Видим, что при этом предположении дифференциал имеет тот же вид, что и для функций х и у одной переменной. На основании же инвариантности формы дифференциала можно утверждать, что эта формула справедлива и в том случае, когда х и у являются функ- циями любого числа переменных. Доказанное свойство полного дифференциала и следствия из него позволяют упрощать вычисление дифференциалов, например: х 1 Ax'] y-dx-x-dy 1) d arctg— ------d - =---------- , у lx\2 [yj х2+у2 2) d-------- x2+y2+z2 \.У ) (x2+y2 + z2) dx-x-d(x2+y2 + z2) (х-Чу-'+z2)-’ (y2 + z2-x2~) dx - 2xy dy - 2xz dz (x2+y2+z2)2 Так как коэффициентами при дифференциалах независимых переменных явля- ются соответствующие частные производные, то отсюда сразу же х Например, для и = arctg — имеем непо- У получаются и значения этих последних. средственно ди у дх х2+у2’ ди ду х ~ х2+у2’ а для и= -------- X2+y2 + z2 получим сразу [ср. 2) и 3) 177]. ди yi + z2-x2 Гх~(х2+у2+г2)2’ ди <Tz= ~ 0и = ду 2xz 2ху (x2+y2+z2)2 ’ (x2+y2+z2)2 186. Применение полного дифференциала в приближенных вычислениях. Анало- гично дифференциалу функции от одной переменной [108] и полный дифферен- циал функции от нескольких переменных с успехом применяется в приближенных вычислениях при оценке погрешностей. Пусть, например, мы имеем функцию u=-f(x, у), причем, определяя значения х и у, мы допускаем погрешности, скажем, Дх и Ду. Тогда и значение и, вычисленное по неточным значениям аргументов,
186] § 3. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ 397 также получится с погрешностью Ли=/(х+Лх, у+Лу)-/(х, у). Речь идет об оценке этой погрешности, если известны оценки погрешностей zlx и Лу. Заменяя (приближенно) приращение функции ее дифференциалом (что оправ- дано лишь при достаточно малых значениях Лх и Лу), получим ди ди Ли = —-Лх-1---Лу. (16) дх ду Здесь и погрешности Лх, Лу, и коэффициенты при них могут быть как положи- тельными, так и отрицательными; заменяя те и другие их абсолютными величи- нами, придем к неравенству |Ди|== ди дх • | Лх | + ди ду • |4И. Если через би, бх, бу обозначить максимальные абсолютные погрешно- сти (или границы для абсолютных погрешностей), то, можно, очевидно, принять би = ди дх • <5х + ди ду бу. (17) Приведем примеры. 1) Прежде всего, с помощью выведенных формул легко установить обыч- ные в практике приближенных вычислений правила. Пусть и = ху (где ,v»0, >>•0), так что du = y dx+x dy, заменяя дифференциалы приращениями, получим Ли=у • Лх+х Лу [см. (16)] или, переходя к границам погрешностей [см. (17)]: би = у • бх+х бу. Деля обе части этого равенства на и = ху, придем к окончательной формуле би бх бу ------—-~j-.— и X у выражающей такое правило: (максимальная) относительная погрешность произведения равна сумме (максимальных) относительных погрешностей сомно- жителей. Можно было бы поступить проще - сначала прологарифмировать формулу и = х • у, а затем продифференцировать: (18) du dx dy *) 1пи = 1пх + 1пу, — = —I-----и т. д. и х у х Если и = —, то по этому методу найдем У du dx dy In и— In x - In y, — -------; и x у переходя к абсолютным величинам и к максимальным погрешностям, мы полу- чим снова формулу (18). Таким образом (максимальная) относительная погреш- ность частного равна сумме (максимальных) относительных погрешностей делимого и делителя. 2) Частое применение находит исчисление погрешностей в топографии, главным образом при вычислении не измеренных непосредственно элементов треуголь- ника - по измеренным его элементам. Приведем примеры из этой области. *) Обращаем внимание читателя на то, что дифференциал In и мы вычисляем так, как если бы и была независимой переменной, хотя на деле она является функцией от х и у [175]. Это замечание следует иметь в виду и ниже.
398 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [186 Пусть в прямоугольном треугольнике АВС (рис. 103) катет АВ=Ь и приле- жащий угол <$ВАС=а измерены; второй же катет а вычисляется по формуле: а = b • tg а. Как отражаются на значении а погрешности при измерении 6 и а? Дифференцируя, получим b da = tga-dbi-------------------------------da, cos2 а так что и 6а = tg а • 6bA------ <5а. cos2 а Пусть, например, измерения привели к результатам: 6 = 121,56 л«±0,05 м, <а = 25°2Г40"± 12", так что а = 57,62 м. 12" Определяя по нашей формуле 6а, положим в ней 6Ь = 0,05, а 6а =---------— (ведь 206265 „ 60"-60-360 6а нужно выразить в радианах, а один радиан равен именно ------------------— = 2л = 206265"). Мы получим Ь tg а -6Ь = 0,0237, ——-<5а = 0,0087, cos2 а так что, округляя, можно считать 6а = 0,04. Итак, а = 57,62 м ± 0,04 м. 3) Найдем погрешность при определении стороны а косоугольного треуголь- ника АВС (рис. 104) по формуле а = уй2 + с2 - 26с • cos а. Пользуясь результатами примера 5) п° 177, можно по формуле (17) сразу написать: 6- с • cos а с-b- cos а 6с • sin ос 6а -----------.-- (5Z>-|-----. (5с-j-------6а. а а а Из чертежа же имеем непосредственно: 6-e-cosoc = a-cosy, e-6-cosa = a-cos/?, 6c-sina = a-ha, где ha есть высота треугольника, опущенная из вершины А. Таким образом оказы- вается, что 6а= cosy • <56+cos/3• 6c+ha • <5ос; по этой формуле легко судить о влиянии на 6а отдельных погпешностей 6Ь, 6с, 6а.
187] § 3. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ 399 187. Однородные функции. Как известно, однородными много- членами называются многочлены, состоящие из членов одного и того же измерения. Например, выражение Зх2 - 2ху + 5_и2 есть однородный многочлен второй степени. Если умножить здесь х и у на некоторый множитель t, то весь многочлен приобретет мно- житель t во второй степени. Подобное обстоятельство имеет место для любого однородного многочлена. Однако и функции' более сложной природы могут обладать таким же свойством; если взять, например, выражение x.E±Z.in£, х-у у то и оно приобретает множитель t2 при умножении обоих аргумен- тов х и у на t, уподобляясь в этом отношении однородному много- члену второй степени. Подобную функцию естественно также назвать однородной функцией второй степени. Дадим общее определение: Функция f(xr, ..., х„) от п аргументов, определенная в области 6£), называется однородной функцией т-й степени, если при умножении всех ее аргументов на множитель t функция приобре- тает этот же множитель в т-й степени, т. е. если тождественно вы- полняется равенство /(/%!, ..., tXn) = tm-f(xr, ..., хп~). (19) Для простоты мы ограничимся предположением, что хх, ...,хп и t здесь принимают лишь положительные значения. Область 6J), в которой мы рассматриваем функцию f, вместе с любой своей точ- кой М(хг, ..., хп) предполагается содержащей и все точки вида Mtttx^ ..., txn) при 1>0, т. е. весь луч, исходящий из начальной точки и проходящий через точку М. Степень однородности т может быть любым вещественным числом; так, например, функция x^-sin —+yJI-cos — у у является однородной функцией степени л от аргументов х и у. Постараемся теперь получить общее выражение однород- ной функции степени т. Пусть сперва /(хх, ..., хп) есть однородная функция нулевой степени; тогда /(ZXj, tx2, ..., txn)=f(.x1, х2, ..., хп). Положив t — —, получим /(х,,х2, ...,х„)=/(1,^, ...,|5) .
400 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [188 Если ввести функцию от и -1 аргументов: 99(и1; ..., ип-т) =Д1, щ, ..., «„-J, то окажется, что f(xi,x2, ...,хп)=<р№-, • Х1) Итак, всякая однородная функция нулевой степени представляется в виде функции отношений всех аргументов к одному из них. Обрат- ное, очевидно, также верно, так что предшествующее равенство дает общее выражение однородной функции нуле- вой степени. Если Дх,, х2, ..., хп) есть однородная функция m-й степени (и только в этом случае), отношение ее к xj1 будет однородной функцией нулевой степени, так что /(X1,X2, ...,Хп)= Xn'j хТ 4*1’ ' XJ ' Таким образом, мы получаем общий вид однородной функции степени т: Д*1,Х2, ...,Х„) = Х?-99^, . ..,^| . [Х1 Х1J Пример: х 188. Формула Эйлера. Предположим теперь, что однородная (степени пг) функция Дх, у, z) *) имеет в (открытой) области ® не- прерывные частные производные по всем аргументам. Фиксируя по произволу точку (x0,y0,z0) из g), в силу основного тождества (19), будем иметь для любого / -0: Я^о> (Уо> tzo) = tm-f(xo^yo’ zo)- Продифференцируем теперь это равенство по Г. левую часть ра- венства - по правилу дифференцирования сложной функции **), пра- вую - просто как степенную функцию. Получим Д(/Хо, ty0, tZ0~) Хо +fy(tX0, ty0, tZ0) y0 +f'z(tX0, ty0, tZg) z0 = = mtm~1-f(x0,y0,zn). *) Лишь для упрощения письма мы ограничиваемся здесь случаем трех пере- менных. **) Именно для того, чтобы иметь право применить это правило, мы и пред- положили непрерывность частных производных [181].
1881 § 3. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ 401 Если положить здесь 1=1, то придем к следующей формуле: fx(X0 ’ J’o > zo) ' *0 + /’ Уо ’ Zo) ’ Jo + f г(.х0 ’ Уо ’ Zo) ’ = ОТ -f(.x0, у0, z0). Таким образом, для любой точки (х, у, z) имеет место равенство А'(-*> у. ~) л- ' Д(х, у. z)-y [/'(х, у, z) z= т-Дх, у, z). (20) Это равенство носит название формулы Эйлера (L. Euler). Мы видели, что этому равенству удовлетворяет любая однород- ная функция степени т, имеющая непрерывные частные производные. Покажем теперь, что и обратно - каждая функция, непрерывная вместе со своими частными производными и удовлетворяющая равен- ству Эйлера (20), необходимо является однородной функцией сте- пени т. Действительно, пусть Дх, у, z) будет такой функцией. Фиксируя по произволу значения x0,y0,z0, рассмотрим следующую функцию от t (при t >0): Она определена и непрерывна при всех 1>0. Вычислив ее производ- ную <р'(1) по правилу дифференцирования дроби, получим также дробь, числитель которой равен [/х(^о> гУо’ tz0)-x0+f^txn, ty0,tz0)-y0 + ^f'z(tx0, ty0, tz^-z^-t-m-f(tx0, ty0, tzj. Заменив в формуле Эйлера (20) х, у, z на tx0, ty0, tz0, видим, что этот числитель обращается в нуль, так что = 0 и rp(t) = с = const (при t >0). Чтобы определить постоянную с, положим 1= 1 в равенстве, определяющем <р(1). Получим что С=Дх0,Уо> zo)- Итак, (p(O=^’-'^=/(x0,yo,zo) или /(Ао, 1Уо > А) =z m J\xo , Уо , zo)> ч. и тр. д. Можно сказать, что формула Эйлера в такой же мере харак- теризует однородную функцию степени т, как и основное равен- ство (19). 26 Г. М. Фихтенгольц, г. I
402 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [189 § 4. Производные и дифференциалы высших порядков 189. Производные высших порядков. Если функция u=f(x,y, z)*) имеет в некоторой (открытой) области 6J) частную производную по одной из переменных, то названная производная, сама являясь функцией от х, у, z, может в свою очередь в некоторой точке (х0, у0, z0) иметь частные производные по той же или по любой другой пере- менной. Для исходной функции и = f(x, у, z) эти последние произ- водные будут частными производными второго порядка (или вторыми частными производными). Если первая производная была взята, например, по х, то ее про- изводные по х, у, z обозначаются так: д2и^д2/(хо,Уо,го) д2и _ Э2/(х0, То, Zp) дх2 дх2 ’ дхду дхду ’ д2и _g2/(x0, То, z0) дх dz дх dz ИЛИ =/х‘(*о > Уо > Z0~)> ихУ = fxy(x0, Уо, Zo), u'xz=fxz(XO’y<,’Zo)**)- Аналогичным образом определяются производные 3-го, 4-го и т. д. порядков (третьи, четвертые, ... производные). Общее определение частной производной п-го порядка может быть дано индуктивно. Заметим, что частная производная высшего порядка, взятая по различным переменным, например, д2и д2и д1и дхду ’ дудх ’ дхду dz2 ’ называется смешанной частной производной. Примеры. 1) Пусть и - x‘y3z2; тогда: и£ = 4x8y8z2, «Sy = 12x3y2z2, Uy = 3x*y2Z2, Uyx = 12x3y2z2, u'z = Ix^Z, U& = &X3y3Z, u'xyz - 24x3y2z, Uxyzx = 72x2y2z, u'&x=36x2y2z2, ul^z - 72x2y2z, u'z'xy - 24x8y2z, «эд х = 72x2_p2z. *) Мы и здесь для простоты письма ограничиваемся случаем функции от трех переменных. **) Разумеется, дифференциальные обозначения следует рассматривать как цельные символы. Квадрат дх2 в знаменателе заменяет условно дх дх и указывает на дифференцирование дважды по х; точно так же значок х2 внизу заменяет хх. Это нужно иметь в виду и дальше.
189] § 4. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ 403 2) Мы имели уже [177] частные производные для функции и= arctg —: У ди у ди х дх х2+у2’ ду х2 + у2’ вычислим теперь дальнейшие производные: д2и д ( У | 2ху дх2 дх 1.x2+у2] (х2+)«)' д2и д । f У | х2-у2 дх ду ду । (х2+у2)2 ’ д2и а । ( X ) х2-^2 дудх дх 1 [ х2+у2) (X2 + j2)2 ’ д2и 1 х 1 2ху ду2 Эу* 1 Х2+у2) (х2+у2)2 ’ д3и а , ( 'I । бху2 - 2х3 дх2ду ду 1 (x2+y2)2j ' (х2+у2)3 д3и д ( х2-у2 'I бху2 - 2х3 ду дх2 дх Ux2+y2)J (х2+у2)3 и т. д. 1 _* 3) Для функции и= ........ = (x2+y2+z2) 2 имеем последовательно: ^x2 + y2 + z2 ди -? — = -X‘(x2+y2+Z2) 2, дх д2и -? -----= 3x2-(x2+y2+z2) 2-(x2+y2+z2) 2; дх2 д2и д2и аналогичные выражения получим и для — , Сложив их, убедимся, что функ- ция и удовлетворяет уравнению д2и д2и д2и -----1---1----0. дх2 ду2 dz2 4) Пусть y=f(x+af)+<p(x-at), где a = const, a.f(u), f(u) - две произволь- ные функции, имеющие первую и вторую производные. Показать, что у удовлет- д2у д2у воряет уравнению — = а2-----, каковы бы ни были фукнции f и д>. dt2 дх2 Пользуясь правилом дифференцирования сложной функции находим *): ду д2у — =f'(x+at)+<p'(x-af), ---=f"(x+at)+<p"(x-at), дх дх2 ду — =f'(x + at)-a+<p'(x-at)-(-a), dt д2у д2у —=f' (x + at)-a2-l-p"(x-at)-(-a)2 = a2-— , ч. и тр. д. dt‘ дх2 *) Штрихи в обозначениях <р', ... означают производные по аргументу и функций /(и), <р(и). 26*
404 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ (190 5) Доказать, что выражение /У|, ГН z = x-<p - +у) - , \х) \х) где <р и у означают произвольные функции (имеющие первую и вторую производные), удовлетворяет уравнению Имеем: d2z d2z , d2z ---Ь 2ху--------1-у2---= 0. дх2 дхду ду2 dz (у} у J-’’! у ,(у\ — - --‘Ф - -- •¥» - , дх \х; х \х) х! \х) d2z у2 /у) 2у (у) у2 [у\ Г +-ГИ- дх2 х3 \х) х3 \х) х* \х] d2z у /'у) 1 Гу) у (у\ дх ду х2 (х/ х2 \ xj х3 (х) d2z 1 Гу) 1 Гу) ----= _. g>' I - Н-w" - ; ду2 X (X/ X2 W умножая последние три производные, соответственно, на х2, 2ху, у2 и складывая, действительно получаем 0. 190. Теорема о смешанных производных. При рассмотрении при- меров 1) и 2) бросается в глаза совпадение смешанных производных, взятых по одним и тем же переменным, но в разном порядке. Нужно сразу же отметить, что это вовсе не вытекает с необходи- мостью из определения смешанных производных, так что су- ществуют случаи, когда упомянутого совпадения нет. Для примера рассмотрим функцию /(х, у) = ху ~— (при х2+у2=- 0), /(0, 0) = 0. Х2+у2 Имеем гх2-у2 4х2у2 1 fi(x, у) = у • —— + — - (при х> 4-у2 0), lx2+y2 (x2+y2)2J Л(0,0) = 0. Придав х частное значение, равное нулю, будем иметь при любом у (в том числе и при у = 0): /£(0, у) = -у. Продифференцировав эту функцию по у, получим у) = _ 1. Отсюда следует, в частности, что в точке (0, 0) будем иметь Лу(0, 0)=-1. Вычислив таким же образом fyx в точке (0, 0), получим /£(0,0) = 1. Итак, для рассматриваемой функции /*',(0, 0) # /£(0, 0). Тем не менее, подмеченное на примерах совпадение смешанных производных, отличающихся лишь порядком дифференцирований, не
190] § 4. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ 405 случайно: оно имеет место в широком классе случаев - при соблю- дении определенных условий. Начнем со следующей простой теоремы. Теорема. Предположим, что 1) f(x, у) определена в (открытой) области 2) в этой области существуют первые производные fx и f'y, а также вторые смешанные производные f"y и fyx и, наконец, 3) эти последние производные f'y и fyx, как функции х и у, непрерывны в некоторой точке (х0, у0) области 6J). Тогда в этой точке №0,y0)-f^(x0,y0). (1) Доказательство. Рассмотрим выражение w=/Uo+Л, у0+/с)-/(х0+Л, Уо)-/(хо, Уо+Л)+/(хо, То) hk где h, к отличны от нуля, например, положительны, и притом на- столько малы, что в ® содержится весь прямоугольник [х0, х0 + й; _у0, j’o + fc]; такими мы их фиксируем до конца рассуждения. Введем теперь вспомогательную функцию от х: f(x, y0 + k)-f(x, у0) к ’ которая в промежутке [х0, х0-; й], в силу 2), имеет производную ср'(х) - ^(х’Уо+ и, следовательно, непрерывна. С помощью этой функции выражение W, которое равно w= - Г^*"+А’ >’о+^)"/(хо+Л, у0) Уо+/с)-/(хо, у0)1 h [ к к J ’ ' ' можно переписать в виде: Л Так как для функции tp(x) в промежутке [х0, х0 + й] выполняются все условия теоремы Лагранжа [112], то мы можем, по фор- муле конечных приращений, преобразовать выражение W так: jy + ОД) _.fi(xn + eh, y„ + k)-fi(x0+efi,y0) (0-0-1). Пользуясь существованием второй производной /Х"(х, у), снова применим формулу конечных приращений, на этот раз - к функции от У- /Х(хо + 0й, у) в промежутке [у0, у0 + й]. Окончательно, получим w^y(x.+eh,y^o1k) (0<б, 0^1). (3)
406 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [190 Но выражение W содержит х и у, с одной стороны, и h и к, с другой, одинаковым образом. Поэтому можно обменять их роли и, введя вспомогательную функцию У(*о+л>у)~/(*о,т) , путем аналогичных рассуждений получить результат: w=fyX(x0+ад у0+е3к), (0 < е2, в3 < 1). (4) Из сопоставления (3) и (4), находим: fxy(x0 + Oh, у0 + вук) =f$x0 + B2h, + в3к). Устремив теперь h и к к нулю, перейдем в этом равенстве к пределу. Ввиду ограниченности множителей в, ву, в3, в3, аргументы и справа и слева стремятся, соответственно, к х0, у0. А тогда в силу 3) оконча- тельно и получим: /ъ(хо>Уо)=/Дхо>Уо)’ ч- и ТР- Д- Таким образом, непрерывные смешанные производные и всегда равны. В приведенном выше примере эти производные х2-у2 г 8х2у2 1 Л'у=ЛЙ=-ГГ-2 • Р + х2+у2 I (х2+у2)21 (х2+у2>0) не имеют вовсе предела при х-0, у-0 и, следовательно, в точке (0, 0) терпят разрыв: к этому случаю наша теорема естественно неприложима. Интересно поставить в связь вопрос о равенстве (1) с вопросом о повторных пределах, рассмотренным в п° 168. Если предположить существование первых производных, то, написав выражение W в виде (2), легко усмотреть, что lim (Л = const) (5) й-0 Л и, аналогично, lim W=f^x?’ то) (£ = const). (5*) л-о к Тогда, по самому определению производной, fyx(xo’ Уо) = Нт^Х°+h’~l~’ У~~ = lim 1>т (6) Л-0 " Л-0 Л-0 f"(x0, у о) = Пт °-’^±^~ли°’То) = нт Um W. (6*) 7 Л-0 к к~0 Л-0 Таким образом, вопрос о существовании и равенстве смешанных производных тождественен с вопросом о существовании и равенстве повторных пределов для выражения W (зависящего от h и к).
191] § 4. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ 407 Это замечание позволяет следующим образом усилить дока- занную теорему. Предположим, помимо существования первых производных, суще- ствование лишь одной из смешанных производных, например, f*y(x,y) в окрестности точки (х0, _у0) (исключая даже саму эту точку). Пусть, далее, существует конечный предел lim/"(x, у)=А. х-х, У-У. Отсюда уже вытекает существование в точке (хй, у0) обеих сме- шанных производных и равенство (1) *). Действительно, исходя из сделанных предположений, можно, как и выше, прийти к равенству (3), а затем, пользуясь существованием предела функции f^,(x,y) в точке (x0,j0), установить существование двойного предела при одновременном стремлении h и к к нулю: lim W=A. h-0 к-.О Но простые пределы (5) и (5*), по предположению, сущест- вуют: тогда по теореме п° 168, существуют также повторные пределы (6) и (6*) и равны двойному. А это и значит, что существуют и равны между собой производные/"(x0,j0) и^'(х0, j0). 191. Обобщение. Обратимся, наконец, к доказательству общей теоремы о смешанных производных: Теорема. Пусть функция u=f(Xy,x2, ...,хп) от п переменных определена в (открытой) п-мерной области ® и имеет в этой области всевозможные частные производные до (к - 1)-го порядка включительно и смешанные производные k-го порядка, причем все эти произ- водные непрерывны в При этих условиях значение любой k-й смешанной производ- ной не зависит от того порядка, в котором производятся последова- тельные дифференцирования. Доказательство. Для к = 2 теорема уже доказана, так что, например, Э2и _ д2и dxtdxj dxj dxt Действительно, чтобы свести этот случай к первой теореме, доста- точно заметить, что при вычислении этих производных можно всем прочим переменным (кроме xt и х7) приписать постоянные значения, причем названные производные, непрерывные по всей совокупности переменных, будут непрерывны и по переменным х( и ху, при фикси- ровании остальных. Пусть теперь к >-2. ') Это предложение принадлежит Шварцу (Н. A. Schwarz).
408 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ |192 Докажем сначала нашу теорему для того случая, когда при вы- числении производной к-го порядка произведена перестановка только между двумя последовательными дифференцированиями, т. е. докажем справедливость равенства __________дки_____________________дки_________ dxijjxi, ... dxih dxih+1 . dxit дх/, дх/, ... dxih ... dxik ' ' (Здесь 4, ia, ..., ih, ih+1, ..., ik есть некоторое размещение из и знаков 1,2, ..п по к, с возможными повторениями.) Произведя последовательно необходимые для вычисления этих производных дифференцирования, видим, что производные (Л - 1)-го порядка в обоих случаях одинаковы. Применив к ним уже доказан- ную для к = 2 теорему, получим, что и производные (Л+ 1)-го порядка равны. Дальше же в обоих случаях нужно производить одинаковые операции, которые и приведут к одинаковым результатам. Итак, равенство (7), действительно, справедливо, и теорема для этого случая доказана. Но так как всякая перестановка элементов может быть достигнута рядом перестановок двух последова- тельных элементов, то теорема доказана и в общем случае: при условии непрерывности соответствующих производных, всегда можно переставлять между собою дифференцирования по различным пере- менным. Непрерывность производных мы впредь всегда будем предпола- гать, так что для нас порядок последовательных дифференцирова- ний будет безразличен. Это дает нам право впредь при обозначении смешанной производной собирать вместе дифференцирования по од- ной и той же переменной. Если и есть функция от х±, х2, ..., хп, то мы будем писать такую производную в виде дки д^‘ дх?... дх? ’ где ах + а2 + ... + а„ = к‘, если же и есть функция от х, у, ..., z, то - в виде дки дх* ду° • • • dz? ’ где а +р+ ... +у = к. Отдельные «показатели» х1, а2, ..., ап или а, р, ..., у могут быть и нулями: наличие дифференциала с «показате- лем» 0 означает отсутствие на деле дифференцирования по соответствующей переменной. 192. Производные высших порядков от сложной функции, Пусть имеем функцию Д —J\Xj , X?, .... X?),
192] § 4. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ 409 где Ху,х2, . . ., хп, в свою очередь, суть функции от переменных , ^2 ’ • • • > (i=l, 2, ..п). Относительно функций f и предположим, что они имеют не- прерывные частные производные по всем переменным до k-го порядка включительно. Рассматривая и как сложную функцию от переменных h > ^2 > • • • > ’• и — F(t] > ^2 > • > ^1) =/(ф1 ’Фъг • • ч Уп), докажем, что сложная функция имеет также все производные до к-го порядка включительно, и притом непрерывные. Точнее говоря, мы будем доказывать следующее предложение: каждая производная k-с о порядка функции F су- ществует и составляется из производных функ- ции/ (по ее аргументам Ху,х2, ...,хп) и функций <рг (по их аргу- ментам ty, t2, ..., tm~), порядка не выше к-r о, путем умно- жений и сложений. Доказательство будем вести по методу математической индукции. Для к = 1 это утверждение справедливо; оно следует из выведенной ранее формулы для производной сложной функции [181]. Предположим, что теорема верна для производных всех порядков, низших, чем /с; докажем, что она верна и для производных к-ro поряд- ка. Каждая к-я производная получается из некоторой (к - 1)-й по- средством дифференцирования по одному из tj. Представим себе производную (к - 1)-го порядка. Она по предположению получается из производных функций / и <pi по переменным х и t порядков не выше к -1 путем умножений и сложений, т. е. представляет собой сумму произведений упомянутых производных. Дифференцируя по tj любое из этих произведений, мы должны по очереди дифференциро- вать каждый из множителей. Если этот множитель есть производная порядка не выше к - 1 от одной из функций ср, то в результате диффе- ренцирования его мы получим производную той же функции порядка не выше к. Если же это будет производная порядка не выше к-\ функции / то рассматривая эту производную как сложную функцию от переменных t и дифференцируя ее по tj, мы заменим ее известной суммой произведений *). В результате, для рассматриваемой производной к-ro порядка получится, очевидно, выражение как раз указанного вида, что и до- казывает наше утверждение. Непрерывность производных сложной функции F вытекает из самого способа составления их из производных / и <р(-, поскольку последние предположены непрерывными. *) Именно предположение о непрерывности всех производных функций f и обеспечивает право пользоваться известным нам правилом для вычисления производных от сложной функции J181).
410 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [193 193. Дифференциалы высших порядков. Пусть в области <§) задана некоторая функция и=/(хх, х2, ..х^), имеющая непрерывные част- ные производные первого порядка. Тогда, как мы знаем, (полным) дифференциалом du называется следующее выражение: , ди , ди, ди , dU^dX^W2dX^---+d^dX^ где dxt, ..., dxn - произвольные приращения независимых перемен- ных х1г ..., хп. Мы видим, что du также является некоторой функцией от х2,... ..., хп. Если предположить существование непрерывных частных производных второго порядка для и, то du будет иметь непрерывные частные производные первого порядка, и можно говорить о (полном) дифференциале от этого дифференциала du, d(du), который называется дифференциалом второго порядка (или вторым дифференциалом) от и; он обозначается символом d2u. Важно подчеркнуть, что приращения dxt,dx2, ...,dxn при этом рассматриваются как постоянные и остаются одними и теми же при переходе от одного дифференциала к следующему. Таким образом, если воспользоваться правилами дифференциро- вания из п° 185, будем иметь сРи = d(du) = d — dx^—dx^ ... +— dxn = Ь*, 1 дхг 2 д*п J = d(^-].dx1 + d(^-]-dx2+...+d(p-]>dx„ или, раскрывая, (&ги j d2u , d2u j ) j “Mvr dxl + ^—g— dx2 + ... —r— dxn \ -dx-,+ pXi 1 dx, dx, 2 dx, dxn J [ d2u , d2u , d2u , ) , ^dAd^ • • dx”) 'dx^+ ( d2u , d2u , , d2u , ) +[d^d^1dX1 + d^dxldx2+ +d^ndXn)' =£^i+£^l+ ••• +£<Zx" + ~ d2u j j o d2u , , +2 7.—dx, dx2 + 2 j—5— dx, dx, + ... + dx, dx2 1 2 dx, dx3 1 3 a d2u j j n d2u , , + 2дхГд^зdx<2 dXz + ' • + 2 dxn_xdxn dXn~1 dXn' Аналогично определяется дифференциал третьего по- рядка, d3u, и т. д. Вообще, если дифференциал (к - 1)-г о порядка, (Z*-1 и, уже определен, то дифференциал к-ro порядка dku
193] § 4. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ 411 определяется как (полный) дифференциал от дифференциала (к - 1)-го порядка *): dku = d(dk~1u). Если для функции и существуют непрерывные частные производ- ные всех порядков до к-го порядка включительно, то существование этого к-го дифференциала обеспечено. Но развернутые выражения последовательных дифференциалов становятся все более и более сложными. В целях упрощения их записи прибегают к следующему приему. Прежде всего, в выражении первого дифференциала условно «вынесем букву и за скобки»; тогда его символически можно будет записать следующим образом: j ( d д д j д j ) аи = Ь— dx. + -— ах~+ ... + т— ахп \ • и. (a.vi 1 дх2 “ дхп J Теперь замечаем, что если в выражении для второго дифферен- циала также «вынести и за скобки», то остающееся в скобках выра- жение формально представляет в раскрытом виде квадрат вы- ражения dx. + тД- dx2 + ... + dxn; дхг 1 Эх2 2 дхп поэтому второй дифференциал символически можно записать так: (а а а \2 — Л1 + —Л2+...+—.и. Аналогично можно записать третий дифференциал и т. д. Это правило - общее: при всяком к будем иметь символическое равенство dku= dx1 + ^~dx2+ ... + -Д- dxA -и, (8) 1 дхг 2 дхп ’ которое можно понимать так: сначала многочлен, стоящий в скоб- ках, формально возводится по правилам алгебры в степень, за- тем все полученные члены «умножаются» на и (которое дописывается в числителях при дк), и только после этого всем символам возвра- щается их значение как производных и дифференциалов. Мы видели, что это правило верно при к= 1, 2; поэтому доста- точно показать, что если оно верно для dku, то оно будет также верно и для dk+1u. Допустив, что этот закон для dku выполняется, будем иметь в раз- вернутом виде: dkU = Са, ‘ ^Х1 ^Х% ' ' ' ^Хп'‘> *) Легко установить понятие ио частных дифференциалах любого порядка; на этом останавливаться не будем,
412 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [193 где суммирование распространяется на всевозможные группы неотри- цательных целых чисел а15 а2, ..а„, удовлетворяющих условию <Х1 + 4* . . . + — к, а С —______________к' а‘’at!a2!...an! суть «полиномиальные» коэффициенты. В предположении, что существуют непрерывные производные (£ + 1)-го порядка, продифференцируем предыдущую формулу; мы получим d^u = 2 а......... an. dx^ dx? ... dx*n + + dx?dx?+i... dx*«d1 d2 dx„ + ... 4_____дк+1“_____,iYi, j % z7r“"+1l • • +dx^dx% ... dx^aX1 • • • dXn ] Очевидно, то же самое мы могли бы получить, формально перемножив символические выражения: 2 Са,, а,, ..., а„ dx% . . . dx„n X и потом приписав и. Но это «произведение» есть не что иное, как k— dx,4-.— dx2+ ... +^— dxn\ х [fat 1 дх2 2 дхп Ч X / — dx, + —— dxn 4-... 4- 77— dxn j = 1 дхг 2 дхп ) ( д , д , д , )*+* dXr + дх2 ^2 + • • • + дХп dxn j , так что U — j —— иХ^ + 7;— иХп -г . . . + -т— иХп I • W, |dxi 1 дхг 2 дхп J Ч. и Тр. Д. Из предыдущих рассуждений видим, что к-й дифференциал является однородным целым многочленом степени к, или, как говорят, является формой к-й степени относительно диф- ференциалов независимых переменных, коэффициентами при которых служат частные производные к-го порядка, умноженные на целочислен- ные постоянные («полиномиальные» коэффициенты).
194] § 4. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ 413 Например, если u=f(x, у), то 72 Л 2 , -1 ^2U л Л дги j 9 du=wdx + 2dTd~ydxdyydfdy'’ d'u = у“з ^х ' ! 3 dx~ +~ Да3 Эх2 ду , а ^Зи л л , <t3« , •> 1 3 s ах ау~ г т-т dy, дх ду2 J ду3 d'u = S + 4 д^'ду dx'dy 1 6 dS~dJ2 dx'-dy2 + + тЧ~з dx dy3 4 dy4, dx dy3 J dy* и т. д. Положив конкретно w = arctg |, будем иметь _ ydx - xdy _ 2xy(dy2 - dx2) + 2(x2 - y2) dx dy x2+y2 ’ (x2+y2)2 ’ ,3 _ (6x2T _ 2y3) dx3+(18x_p2 - 6л3) dx2 dy (бу3 - 18х2т) dx dy2+(2x3 - 6лу2) dy3 au (x2+y2)3 + (x2+_r2)3 И T. Д. Сложность выражения для дифференциала возрастает с увеличе- нием числа переменных. Если и =f(x, у, z), то, скажем, третий диф- ференциал d3u в развернутом виде таков: +Sdz3y3^Tydx2dyy^2dxdy2y + 3Srzdx2dZ + 3 дгЬ dX dz2 + 3 ^dz dy2 dZ + + 3 dy dz2 + 6 - dx dy dz. dy dz2 J dx dy dz J 194. Дифференциалы сложных функций. Пусть мы теперь имеем сложную функцию: и=/(х1;х3, ..., х„), где, в свою очередь, (1 = 1,2, В этом случае первый дифференциал может быть сохранен в преж- нем виде: , ди , ди , ди , du = ^— dx, + т— ахг+ ... + т— dx„ dxt 1 дх„ 2 дхп
414 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [195 [на основании инвариантности формы первого дифференциала, 185]. Но здесь уже dxr, ...,dxn являются дифференциалами не независи- мых переменных, а функций и, следовательно, сами будут функциями, и могут не быть постоянными, как в предыдущем случае. Вычислив теперь второй дифференциал нашей функции, будем иметь (если воспользоваться правилами дифференцирования п° 185]: d2u = d • dxr + d • dx2 + ... +d • dxn + + ™ • W+£- • d(dx2) +..+ — • d(dxn) = <JX} ox% ОХц ( д , Э , d J )2 'u+ +S-'d2x- OXi 0Х% 0Xn Мы видим, что для дифференциала порядка выше первого инва- риантность формы вообще не имеет места. Рассмотрим теперь частный случай, когда хг,х2,...,хп яв- ляются линейными функциями от /1; t2, ..., tm, т. е. когда X, = а^\ + а}%2 + ... + + fa (г = 1, 2, ..., и), где ар и fa - постоянные. В этом случае будем иметь dxi = oi.^dt1+ ... + a.<lm)dtm==aj1)At1 + ... +a|m)Jlm = Jx,-. Мы видим, что все первые дифференциалы функций xt, х2, .. .,хп в этом случае постоянны, не зависят от tx,t2, .. .,tm; следова- тельно, применимы без изменений выкладки п° 193. Отсюда вытекает, что в случае замены независимых переменных хг, х2, .. ,,хп линей- ными функциями от новых переменных tr,t2, .. .,tm, могут быть сохранены прежние выражения даже для дифференциалов высших порядков. В них дифференциалы dxx,dx2, ...,dxn совпадают с при- ращениями Ах1гЛх2, ...,Ахп, но эти приращения не произвольны, а обусловливаются приращениями Atr, At2, ..., Atm. Это простое и важное замечание (принадлежащее Коши) мы используем непосредственно в следующем п°. 195. Формула Тейлора. Мы уже знаем [126 (13)], что функция F(t), при условии существования ее п +1 первых производных, может быть следующим образом разложена по формуле Тейлора: ад = ад)+ Г(Г0) •(/-/„) + - г0)2 + ... +1 FM(to). {t _ to)n + +(^1Я ^(л+1)('о + W ~ • (t - t0Y+1 (0-0-1)
195] § 4. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ 415 (дополнительный член взят в форме Лагранжа). Эту формулу, положив t-t0 = At = dt, F(t)~ F(l0) = zlF(?0), можно переписать так: ддг0)=ед+^эд+... +^<т,)+ V+^n+Wo+6,JZ) При этом важно подчеркнуть, что величина dt, входящая в различных степенях в выражения дифференциалов справа, в точности равна тому приращению At, которое фигурирует в приращении функции слева. Именно в последней форме формула Тейлора распространяется и на случай функции от нескольких переменных. Для упрощения письма ограничимся функцией f(x,y) двух пере- менных. Предположим, что в окрестности некоторой определенной точки (хо>Уо) эта Функция имеет непрерывные производные всех порядков до (п + 1)-го включительно. Придадим х0 и у0 некоторые приращения Ах и Ау так, чтобы прямолинейный отрезок, соединяющий точки (х0,у0) и (хо + ^х> Уо+4v), не вышел за пределы рассматриваемой окрестности точки (х0, у0). Требуется доказать, что при сделанных предположениях относи- тельно функции f(x, у) справедливо следующее равенство: Af(xo,Уо)=Лхо + ^х> У о + 4?) ' Лхо , Уо) = = df(x0, у0) + i d2f(x0, у0) + ... + dnf(x0, у0) + + (0-0-1), (9) причем фигурирующие справа в различных степенях дифференциалы dx и dy равны именно тем приращениям Ах и Ау независимых пере- менных, которые породили приращение функции слева. Для доказательства [как и в п° 183] введем в рассмотрение новую независимую переменную t, положив х = х0+Г-4х, у=у0 + 1-Ду (O==r=sl). (10) Подставив эти значения х и у в функцию f(x, у), получим сложную функцию от одной переменной t: F{t)=f(x0+t-Ax, y0 + t-Ay). Мы уже знаем, что введенные нами в рассмотрение формулы (10) геометрически выражают прямолинейный отрезок, соединяющий точ- ки М0(х0,уо) и М^Хд + Ах^о + Ау). Теперь мы видим, что вместо приращения 4f(xo > Уо) =Лхо + ^х,Уо + ^У) -Ях0, Уо),
416 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [195 мы можем рассматривать приращение вспомогательной функции: ДД0) = Д1)-Д0), так как оба приращения равны. Но F(t) является функцией от одной переменной и имеет [192] п +1 непрерывных производных; следова- тельно, применив к ней уже выведенную ранее формулу Тейлора, получим Z1 ДО) = Д1) - ДО) = <7Д0) + d2 ДО) + ... ...+^ 4/пдо) + _1_^+1Д0) (О-=0-=1); (П) при этом дифференциал dt, входящий в различных степенях справа, равен zk= 1 -0 = 1. Теперь, пользуясь тем, что при линейной замене переменных свойство инвариантности формы имеет место и для высших диффе- ренциалов, можем написать, что <7Д0) =f'(x0, у0) • dx +fy(x0, у0) • dy = df(x0, у0), ДО) =/х"(*о > %) •dx2 + 2Ау(*о>То) *dx dy +fy>(x0, То) * dy2 = d2f(x0, y0), и т. д. Наконец, для (и + 1)-го дифференциала будем иметь dn+iд0) = </n+1/(x0 + + 0Jj). Важно отметить, что здесь дифференциалы dx и dy ничем не от- личаются от ранее взятых приращений Ах и Ау. Действительно, dx = Ах • dt = Ах, dy~Ay-dt=Ay. Подставив все это в разложение (11), мы и придем к требуемому разложению (9). Читатель должен дать себе отчет в том, что, хотя в дифферен- циальной форме формула Тейлора для случая функции несколь- ких переменных имеет такой же простой вид, как и для случая функ- ции одной переменной, - но в развернутом виде она гораздо сложнее. Вот как выглядят первые три ее члена даже для функции лишь двух переменных: f(xQ + Ах, у0 + Ay) -f(x0, у0) = = LA'(*O > То) • Ах +fy(x0, у0) • Ау] + +L/£(*o > То) • Лх2 + 2f"y(x0, у0) • АхАу +/Х'.'(хо, у0) • Ау2] + +Ji [/Ж, То) • Лх2 + 3/^(х0, у0) • Ах2Ау + + ЗА7(х0>То) • АхАу2 +/Дх0, у0) • Ау3] + ... Формула (9) имеет место и при и = 0; этот частный случай мы уже рассматривали в 183.
196] § 5. ЭКСТРЕМУМЫ, НАИБОЛЬШИЕ И НАИМЕНЬШИЕ ЗНАЧЕНИЯ 417 § 5. Экстремумы, наибольшие и наименьшие значения 196. Экстремумы функции нескольких переменных. Необходимые условия. Пусть функция « = /(х1( х2, .. ,,хп) определена в области ® и (х®, х2, ..., х°) будет внутренней точ- кой этой области. Говорят, что функция f(x1,x2, ..хп) в точке (х®, х%, ..х®) имеет максимум {мин и му м), если ее можно окружить такой окрест- ностью (х® -6, х? + й; х° - 6, х° + 5; ...; х® - Ь, х® + 8), чтобы для всех точек этой окрестности выполнялось неравенство /(х15 х2, ..., xn)*s(x?, xg, ..х®). (^) Если эту окрестность можно взять настолько малой, чтобы знак равенства был исключен, т. е. чтобы в каждой точке ее, кроме самой точки (х®, х2, ..., х®), выполнялось строгое неравенство то говорят, что в точке (х?, х®, ..., х°п) имеет место собственный максимум (минимум); в противном случае, максимум (минимум) на- зывается несобственным. Для обозначения максимума и минимума употребляется и общий термин - экстремум. Предположим, что наша функция в некоторой точке (х?, х®, ..., х®) имеет экстремум. Покажем, что если в этой точке существуют (конечные) частные производные: Д(х?, ..., х»), ..., Л„)х?, • • •, *°), то все эти частные производные равны нулю, так что обращение в нуль частных производных первого порядка является необходимым условием существования экстремума. С этой целью положим х2 = х®, ..., хп = х°, сохраняя хт перемен- ным; тогда у нас получится функция от одной переменной хх: «=/(хх,х§, ...,х®). Так как мы предположили, что в точке (xj, х®, ..., х°) существует экстремум (для определенности - пусть это будет максимум), то, 27 Г. М. Фихтенгольц, т. I
418 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [196 в частности, отсюда следует, что в некоторой окрестности (х®-6, х° + <5) точки хг = х® необходимо должно выполняться неравенство /(х15 х°2, ..., x®)=s/(xg, xg, ..., х®), так что упомянутая выше функция одной переменной в точке xr = xg будет иметь максимум, а отсюда по теореме Ферма [109] следует, что Д(х«,х«, ...,х«) = 0. Таким же образом можно показать, что в точке (х®, xg, ..., х®) и осталь- ные частные производные также равны нулю. Итак, «подозрительными» по экстремуму являются те точки, в ко- торых частные производные первого порядка все обращаются в нуль; их координаты можно найти, решив систему уравнений *) Д(*1,х3, .. .,х„)=0, K(*i,x2, ...,х„) = 0, Jxn(X1,X2, . ,.,хп) = 0. Как и в случае функции одной переменной, подобные точки назы- вают стационарными. Замечания. I. Необходимое условие существования экстремума в случае дифференцируемой функции кратко можно записать еще так: #(хх,х2, . ..,х„)=0, так как, если f'X1 =fX2 = ... = fXn = 0, то, каковы бы ни были dxr, dx2, ... ...,dxn, всегда #(х1;х2, ..., xn) —fx, * dx-y „гf• dx2 + . • • +fXn’dxn =0. И обратно: если в данной точке тождественно выполняется это усло- вие, то ввиду произвольности dx12 dx2, ..., dxn производ- ные .. .,fxn порознь равны нулю. II. Обычно рассматриваемая функция f(xr,x2, ...,хп) имеет (ко- нечные) частные производные во всей области, и тогда точки, до- ставляющие функции экстремумы, следует искать лишь среди ста- ционарных точек. Однако встречаются случаи, когда в от- дельных точках некоторые частные производные имеют бесконечные значения или вовсе не существуют (в то время как остальные рав- *) Для случая функции двух переменных z=f(x, у) - в предположении ее дифференцируемости - условия fx(x, у) = 0, fy(x, у) = 0 допускают простое геометрическое толкование: касательная плоскость [см. 180 (6)] к поверхности z-f{x, у) в ее точке, отвечающей экстремуму, должна быть параллельна плоскости ху.
197] § 5. ЭКСТРЕМУМЫ, НАИБОЛЬШИЕ И НАИМЕНЬШИЕ ЗНАЧЕНИЯ 419 ны 0). Подобные точки, собственно, тоже следует причислить к «подо- зрительным» по экстремуму, наряду со стационарными точками [см. ниже: 201, 6)]. 197. Достаточные условия (случай функции двух переменных). Как и в случае функции одной переменной, в стационарной точке во- все не обеспечено наличие экстремума. Если для примера взять про- стую функцию z = xy, то для нее z'=y и z'y = x обращаются одновре- менно в 0 в единственной - начальной точке (0,0), в которой 2 = 0. В то же время непосредственно ясно, что в любой окрестности этой точки функция принимает как положительные, так и отрицательные значения, и экстремума нет. На рис. 92 изображена поверхность (ги- перболический параболоид), выражаемая уравнением z = xy; вблизи начальной точки она имеет седлообразную форму, изгибаясь в одной вертикальной плоскости вверх, а в другой - вниз. Таким образом, встает вопрос об условиях, достаточных для существования (или отсутствия) экстремума в стационарной точке, то есть о том исследовании, которому эта точка должна быть дополнительно подвергнута. Мы рассмотрим сначала случай функции двух переменных f(x,y). Предположим, что эта функция определена, непрерывна и имеет не- прерывные частные производные первого и второго порядков в окрестности некоторой точки (х0, у0), которая является стационарной, т. е. удовлетворяет условиям f'x(x0,yo) = 0, f'y(xo,yo) = 0. (la) Чтобы установить, действительно ли наша функция имеет в точке (х0, Уо) экстремум или нет, естественно обратиться к рассмотрению разности Л =f(x, У) ~f(x0, Уо). Разложим ее по формуле Тейлора [195], ограничиваясь двумя членами. Впрочем, так как точка (х0,у0) предположена стационарной, то первый член исчезает, и мы будем иметь просто А = 1 {Л • Лх2 + 2/;;. • АхАу+/" . Лу2}. (2) При этом роль приращений Ах, Ау играют разности х-х0, у-у0 и производные все вычислены в некоторой точке (х0 + вАх, Уо + вАу) (0<6«=1). Введем в рассмотрение значения этих производных в самой испы- туемой точке: ~fxAXo ’ Уо)’ ®12 =Уху(-^О’ Уо)’ ®22 =У>!(-^0 ’ Уо) (3) и положим f"Ax0 + QAx, у0 + (/Ау) = апУап, fxy(--)=#12 + a12’ fy*(- -)=а22+а22’
420 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [197 так что, ввиду непрерывности вторых производных, все а-<-0 при zfx->-0, zfy->0. (4) Разность J напишется в виде: Л = | {anz1x2 I 2акЛхЛу : а22Ду2 + anZfx2 4- 2a12ZfxZfy + a^Zly2}. Как мы установим, поведение разности Л существенно зависит от знака выражения «цП22“а12- Для облегчения рассужде- ний введем «полярные коорди- наты», взяв за полюс исходную точку (л'0,у0) и проведя через нее полярную ось параллельно оси х (рис. 105). Пусть g = = /zfx24-z1j>2 есть расстояние между токами (х0,у0) и (*>У), а ср означает угол, составленный соединяющим их отрезком с по- лярной осью, так что zlx = q cos ср, /1у = д sin Ч>- Тогда интересующая нас разность Z1 напишется так: л2 Л = j {au cos2 <р + 2a12 cos ср sin ср + sin2 9? + + an cos2 ср + 2a12 cos cp sin cp + a22 sin2 cp}. 1° Пусть, сначала, аца^-а^^О. В этом случае «па22=-0, так что ап^0, и первый трехчлен в скобках {...} может быть представлен в виде: — • [(я,, cos ср + «12 sin ср)2 + 2 - «22) • sin2 ср]. (5) ап Отсюда ясно, что выражение в скобках [...] всегда положительно, так что упомянутый трехчлен при всех значениях ср, не обращаясь в нуль, сохраняет знак коэффи- циента ап. Его абсолютная величина, как непрерывная в проме- жутке [0, 2л] функция от ср, имеет (очевидно, положительное) наименьшее значение т [85]: | а1Г cos2 ср + 2a13 cos ср sin ср + a22 sin2 ср | г» т > 0. С другой стороны, если обратиться ко второму трехчлену в скоб- ках {...}, то, ввиду (4), [au cos2 ср + 2a12 cos <р sin ср 4 a22 sin2 гр J =s |an | +2|a12| 4- |a22|
197] § 5. ЭКСТРЕМУМЫ, НАИБОЛЬШИЕ И НАИМЕНЬШИЕ ЗНАЧЕНИЯ 421 сразу для всех д>, если только о (а с ним и Лх, Лу) достаточно мало. Но тогда все выражение в скобках {...}, а значит и разность Л, будет сохранять тот же знак, что и первый из трехчленов, т. е. знак ап. Итак, если дп=-0, то и Z1--0, т. е. функция в рассматриваемой точке (х0,у0) имеет минимум, а при аи<0 будет и Л<0, т. е. налицо максимум. 2° Предположим теперь, что Остановимся на случае, когда аи # 0, тогда можно и здесь исполь- зовать преобразование (5). При </>=^ = 0 выражение в скобках [...] будет положительно, ибо сведется к а^. Наоборот, если опре- делить <р = <р2 ИЗ условия а} г cos <р2 + «12 sin = 0 (sin <p2 0), то это выражение сведется к (с^а^ - af^) sin2 tp2 и будет отрица- тельно. При достаточно малом о второй трехчлен в скобках {...} как при ф=9д, так и при <p=q>2, будет сколь угодно мал, и знак Л определится знаком первого трехчлена. Таким образом, в лю- бой близости от рассматриваемой точки (х0,у0) - на лучах, опре- деляемых углами (р =(рг и (р=ср2, разность Л будет иметь значения про- тивоположных знаков. Следовательно, в этой точке экстремума быть не может. Если ап = 0, и первый трехчлен в скобках {...} сведется к 2aI2 cos <р sin <р + а.22 sin2 <р = sin д> • (2а12 cos <р + sin <р), то, пользуясь тем, что наверное «12 # 0, можно определить угол -л 0 так, что Ы I sin | 21ЙГ121 • I cos 9?! I. Тогда при (р=(рг м(р=<р2= -<р± упомянутый трехчлен будет иметь про- тивоположные знаки, и рассуждение завершается, как и выше. Итак, если а^а^-то в испытуемой стационарной точке (х0, у0) функция f(x, у) имеет экстремум, именно, собственный максимум при дц<0 и собственный минимум при яп="0. Если же ПцП.22 - а?г 0, то экстремума нет. В случае же аиа>2-а22 = 0 для решения вопроса приходится при- влекать высшие производные; этот «сомнительный» случай мы оста- вим в стороне. Примеры. 1) Исследуем на максимум и минимум функцию X'2 у2 Z —--1- 2р 2? Вычислим частные производные: / х р (д>0, <7^0).
422 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [198 Отсюда сразу видим, что единственной стационарной точкой является начало координат (0, 0). Вычислив ап, а12 и а22, получим 1 1 Дп---, а12 — 0, а22-- Р « отсюда a1ifl22 - а?2 > 0. Следовательно, в точке (0, 0) функции z имеет минимум; впрочем, это ясно и непосредственно. Геометрическим образом нашей функции будет эллиптический па- раболоид с вершиной в начальной точке (ср. рис. 93). Х1^ У2 2)z=-—— (р=-0, q>0)\ Ip 2q , х , у Zx Zy р <1 И здесь видим, что стационарной точкой является (0, 0). Вычисляем 1 1 ап > ai2— 0, а22 = ; Р 9 отсюда апа22 - а22 -= 0. Следовательно, экстремума нет. Геометрически мы здесь имеем дело с гиперболическим парабо- лоидом, вершина которого - в начале координат. 3) z=^+x* или z = y2+x3; в обоих случаях стационарной является точка (0, 0) и в ней aua22 - al2 = 0. Наш критерий не дает ответа; при этом, в первом случае, как непосредственно видно, налицо минимум, а во втором - экстремума вовсе нет. Замечание. Результаты настоящего п° впоследствии [236] ока- жутся тесно связанными с геометрическим вопросом о поведении кри- вой вблизи ее «особой» точки. 198. Достаточные условия (общий случай). Обратимся теперь к рассмотрению общего случая. Пусть функция /(х1гх2, ...,хп) опре- делена, непрерывна и имеет непрерывные производные первого и вто- рого порядков в окрестности некоторой стационарной точки (х®, х®, ..., х®). Разлагая разность zl=/(xi, х3, ..., х„)-/(х?, х§, ..., х®) по формуле Тейлора, получим, как и выше, Л = | {/" • Ах1 + . Ах2 + ... + /" . /1хп2 + + 2/Х1х • Ах^Ах2 + 2fXlXa‘ АхуАх3 + ... + If х„_хх„ • Axt!_yAx„} = = 2 2 f xiхк' AxjAxh, i,A = l где Axt^Xj-xf; производные все вычислены в некоторой точке (х? F ОАху, х° + 0Ах2, ..., х® г6Ах„) (О<0<1).
198] § 5. ЭКСТРЕМУМЫ, НАИБОЛЬШИЕ И НАИМЕНЬШИЕ ЗНАЧЕНИЯ 423 Введем и здесь значения = 0Л = 1,2, ...,«), (6) так что /"< «(*? + 0ЛХ1, ..., х® + 0Лх„) = aik + л1к *), и <z;fc-0 при zkj—0, ..zlxn-»0. (7) Теперь интересующее нас выражение Л можно написать в виде Л = Ц 2 aikdxtAxk + оцкЛхр1хк1. (8) (у, a=i z,*=i J На первом месте в скобках здесь стоит второй дифференциал функции f в рассматриваемой точке; он представляет собой одно- родный многочлен второй степени или, как говорят, квадратичную форму от переменных /Ьу, ..., Лхп **). От свойств этой ква- дратичной формы, как мы увидим, и зависит ре- шение интересующего нас вопроса. В высшей алгебре квадратичную форму 2 а^у.Ук (aik = aki) (9) I, А=1 от переменных у{, ..., уп называют определенной положительной {от- рицательной), если она имеет положительные (отрица- тельные) значения при всех значениях аргументов, не равных од- новременно нулю. Так, например, форма М + 5у| + 14у| + 4у1у2 - 8у2 у, - 2у2у3 будет определенной положительной. Это становится ясным, если пред- ставить ее в виде (2?1 - Зу3)2 + 2(у± + у2 + уз)2 + 3(у2 - уз)2. Мы не имеем возможности вдаваться здесь по этому поводу в подробности. Ограничимся упоминанием о принадлежащем Силь- вестру (J. J. Sylvester) необходимом и достаточном условии для *) Ясно, что aik = aki (и a/ft=aw). **) Вторая сумма имеет сходный вид, но в ней и коэффициенты сами суть функции от тех же переменных.
424 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ (198 того, чтобы форма (9) была определенной и положительной. Оно вы- ражается цепью неравенств: ди=-0, >о, «21 «22 °21 «31 fl12 ^22 °32 «13 «23 «33 ап а12 • • ат °21 й22 • • • °2n >0 * «Л1 &П2 • • • ^пп j >0, ..., Так как определенная отрицательная форма с изменением знака всех ее членов переходит в определенную положительную, и обратно, то отсюда легко найти и характеристику отрицательной формы: она дается цепью неравенств, которая получается из написанной выше изменением смысла неравенств через одно (начиная с первого). Пользуясь этими понятиями, сформулируем достаточные для суще- ствования экстремума условия: Если второй дифференциал, т. е. квадратичная форма 2 aikAxiAxk (Ю) со значениями (6) коэффициентов оказывается определенной положительной (отрицательной) формой, то в испы- туемой точке (х°, . ..,х°) будет собственный минимум (максимум). Для доказательства, введем расстояние е = УАх^+ ... +Ах„ между точками (х®, ..., х®) и (хх, ..., хп). Вынося в (8) за скобку q2 и полагая (i=l,2,..„ п), перепишем выражение для А в виде А = 2 ailMk + 2 J • 4 <л=2 i,k=l (П) *) Обращаем внимание на то, что член с у^у^ встречается в сумме (9) дважды, так что aik = a^t есть половина коэффициента при yiy^. Для нашего примера условие легко проверяется, если учесть, что #11— 6, #22 ~ 5» #33“ 14, #12“ #21 “ 2, #13“^Э1“ 4, #23"
199] § 5. ЭКСТРЕМУМЫ, НАИБОЛЬШИЕ И НАИМЕНЬШИЕ ЗНАЧЕНИЯ 425 Числа зараз не обращаются в нуль, поэтому, если форма (10) — положительная, первая сумма в скобках в формуле (11) имеет всегда положительный знак. Больше того, так как 2^ = 1, (12) <=1 то найдется такое постоянное положительное число т, что при всех возможных значениях будет 2 i,k=l Действительно, эта сумма представляет непрерывную функцию от аргументов во всем пространстве, в частности же - и в множе- стве тех точек (£х, ..., £л), которые удовлетворяют соотношению (12) («сферическая поверхность»). Но множество это, как нетрудно ви- деть, замкнуто, т. е. содержит все свои точки сгущения; а тогда, по теореме Вейерштрасса [173, см. замечание после ее доказа- тельства], названная сумма будет иметь в ed! и наименьшее зна- чение т, необходимо положительное (как и все ее значения в е^). С другой стороны, ввиду (7) вторая сумма в (11) для достаточно малых д, очевидно, будет по абсолютной величине уже меньше т, так что вся скобка окажется положительной. Итак, в доста- точно малой сфере, с центром в точке (х?, ..., х®), разность /1 будет положительна, откуда и явствует, что в названной точке функция /(х1; ..., хл) имеет собственный минимум. Аналогично исчерпывается и случай, когда форма (10) будет опре- деленной, но отрицательной. 199. Условия отсутствия экстремума. Квадратичная форма (9) называется неопределенной, если она способна принимать значения противоположных знаков. Такова, например, форма 6>’1 + yl + Уз + 8уху2 - 8jv3 - 2у3у3. Действительно, например, ее значение равно +6 при у1 = 1, У2=Уз = 0 и -1 при j1 = l, у2=-1, у3=0. Теперь мы можем дополнить доказанное в предыдущем п° пред- ложение следующим образом: Если квадратичная форма (10) будет неопределенной, то в испытуемой точке (х?, ..., х°) заведомо нет экстремума. Пусть при Дх, = й,- (/=1,2, . ,.,и) форма (10) принимает положи- тельное значение: 2 апМ1к>®, (13)
426 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [199 а при Axi = hi (i= 1, 2, ..., ri) - отрицательное: 2 aikhthk^O. i,k=l Положим сначала Axt = hit при (z'= 1, 2, ..., и), что отвечает передвижению вдоль по прямой, соединяющей точки (х?, ..., х£) и (х? + /гх, ..., xJJ + /zn). Тогда, вынося в (8) за скобки ?2, по- лучаем для этого случая /2 Г п п 1 2 aikhihk+ 2хи^М- [/,/£=1 i,k=l J Первая сумма в скобках есть определенное положитель- ное число, ввиду (13). Что же касается второй суммы, то ее коэф- фициенты стремятся к 0 при t -0, ибо при этом, очевидно, и все Jx(—0. Значит, при достаточно малом t, выражение в фигурных скобках (а с ним и вся разность А) становится положительным, т. е. в точках упомянутой выше прямой, достаточно близких к (х°, ..., х°), будет /(%!, • ..,хп)=-/(х?, ...,х°). С другой же стороны, если взять Axi^hjt при Z#0 (z = 1, 2, ..., и), т. е. передвигаться вдоль другой прямой, соединяющей точку (х°, ..., х°) с точкой (х° + hf, ..., х° + /zn), то в ее точках, достаточ- но близких к (х?, .. ,,х°) (т. е. отвечающих достаточно малому /), окажется f(xr, xn)~~f(x%, х°). Этим доказано, что в испытуемой точке не может быть ни мак- симума, ни минимума. Может случиться, что форма (9), не будучи способна принимать значения разных знаков, все же не является определенной, ибо обращается в 0 не только при нулевых значениях аргументов: в этом случае форму называют полуопределенной. Это относится, например, к форме: У1 + У1 + Уз + 2АУ2 + 2уху3 + 2у2у3 = (ух+у2 + у3)2; отрицательных значений она не принимает, но в 0 обращается всякий раз, когда А+Ь + ?з = 0, 1 , скажем, при У1=У2 = 2 и Л= “*-
200) § 5. ЭКСТРЕМУМЫ, НАИБОЛЬШИЕ И НАИМЕНЬШИЕ ЗНАЧЕНИЯ 427 Случай, когда форма (10) оказывается полуопределенно й, есть «сомнительный» случай. В зависимости от поведения высших производных, в этом случае может быть экстремум, может его и не быть. В частности, высшие производные должны быть привлечены и тогда, когда все производные второго порядка в испытуемой точке обращаются в 0. Исследованием «сомнительного» случая мы заниматься не будем. Замечание. Для функции f{x) одной переменной форма (10) сводится к одному члену /"(х0) • dx2, где х0 - испытуемая точка. Эта «форма», очевидно, является опре- деленной - положительной при f"{x0) >0 и отрицательной при f"{x0) < <0. Таким образом, признак п° 137 есть частный случай изложен- ного в 198. Переходя к случаю функции f{x,y) двух переменных, заметим, что и результат п° 197 также содержится в том, что было установлено в 198 и 199. Легко усмотреть, что попутно в 197 было доказано, что форма andx2 + 2ai2dx dy + a22dy2 в случае, если ааа22 - а22 >0, будет определенной (положитель- ной при ап=-0 и отрицательной при «и<0), в случае же, если апа^- -а%2<0,~ неопределенной. 200. Наибольшее и наименьшее значения функции. Примеры. Пусть функция и=/{х1,х2, ...,хп) определена и непрерывна в некоторой ограниченной замкнутой области ® и, за исключением, быть может, отдельных точек, имеет в этой области конечные част- ные производные. По теореме Вейерштрасса [173], в этой об- ласти найдется точка (x?,x!i, . ..,х°), в которой функция получает наибольшее (наименьшее) из всех значений. Если точка (х?, х°, ..., х°) лежит внутри области то в ней функция, оче- видно, имеет максимум (минимум), так что в этом случае интересую- щая нас точка наверное содержится среди «подозрительных» по экс- тремуму точек. Однако своего наибольшего (наименьшего) значения функция и может достигать и на границе области. Поэтому, для того чтобы найти наибольшее {наименьшее) значение функции u—f{x1, ... ..., хп) в области ® нужно найти все внутренние точки, «подозритель- ные» по экстремуму, вычислить значения функции в них и сравнить со значениями функции в пограничных точках области: наибольшее {наи- меньшее) из этих значений и будет наибольшим {наименьшим) значе- нием функции во всей области. Поясним сказанное примерами.
428 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [200 1) Пусть требуется найти наибольшее значение функции и = sin х+sin у - sin(x -I- у) в треугольнике, ограниченном осью х, осью у и прямою х+у=2л (рис. 106). Имеем и£ = cos х - cos (х+у), и'у = cos у - cos (х+у). Внутри области производные обращаются в нуль в единственной точке (2л 2л\ З/З У —, — , в которой «=----------. Так как на границе с (33/ 2 \ области, т. е. на прямых х = 0, у = 0 и х+у = 2л, наша функция равна 0, то, очевидно, найденная выше точка 2л 2л) — , — I и доставляет функции наибольшее значение. 2) Найти наибольшее и наименьшее значения функ- 7/////////////722к\ , ции 0 27 u = a2x2+b2y2+c2z2-(ax2+by2+cz2)2 Рис. 106. при условии, что переменные х, у, z связаны зависи- мостью x2+y2+z2=l (fta>b>c>0). Определив отсюда z2 и подставив его выражение в и, придем к функции и = (а2 - с2)х2 + (Ь2 - с2)у2 + с2 - [(а - с)х2 + (6 - с)у2 + с]2 от двух независимых переменных х, у в круге x2+y2=sl. Производные «х = 2х(а - с) {(а+с) - 2[(а - с)х2+(Ь - с)у2 + <?]} и'у = 2у(Ь - с) {(Ь + с) - 2[(а - с)х2 + (6 - с)у2+с]} одновременно обращаются в нуль в точках 1 ( 1 (1) х = у=0 (и=0), (2 х = 0, у=±— и = — (Ь-с)2 у2 V 4 1 I 1 (3) х= ± — , у = 0 и= —(а-с)2 ]/2 I 4 Теперь надлежит обратиться к границе области, т. е. к окружности х2+у2=1. Определяя отсюда у2 и подставляя его выражение в и, получим функцию одной переменной х и = (а2 - Ь2)х2+Ь2- [(а - Ь)х2+bl2 в промежутке [-1, 1]. Внутри этого промежутка производная и£=2(а-Ь)2х(1-2х2) обращается в нуль при 1 I 1 (4) х 0 (и = 0) и (5) х = + — и — (а - Ь)2 У2 V 4 Наконец, вспомним о концах рассматриваемого промежутка (6) х = ± 1 (и = 0). Итак, подлежат сравнению значения 1 1 1 и = 0; — (b-с)2-, -(а-с)2; —(а-Ь)2; 4 4 4
200] § 5. ЭКСТРЕМУМЫ, НАИБОЛЬШИЕ И НАИМЕНЬШИЕ ЗНАЧЕНИЯ 429 из них наименьшим будет 0, а наибольшим — (а-с)2. Это и будут искомые наи- 4 меньшее и наибольшее значения функции, которые достигаются, соответственно, в точках (0, 0, ±1), (0, +1,0), (±1,0,0) и ( 1 1 А + —, 0, + — . I. ('2 ]/2/ Вообще, в случае функции двух переменных и - f(x, у), область обычно оказы- вается ограниченной кривою (или несколькими кривыми). Вдоль этой кривой (или каждой из кривых, если их несколько) переменные х, у либо зависят одна от другой, либо обе зависят от одного параметра, так что на границе наша функция u = f(x, у) оказывается зависящей от одной переменной, и ее наи- большее (наименьшее) значение находится уже методами п° 139. Если, скажем, кривая задана параметрическими уравнениями: где t изменяется в промежутке [/0, Т], то на этой кривой наша функция будет (слож- ной) функцией от /: для которой наибольшее (наименьшее) значение найти мы умеем. 3) Найти наибольшее значение для произведения и = xyzt неотрицательных чисел х, у, z, t, при условии, что сумма их сохраняет постоян- ную величину: A' + y + z+/ = 4c. Покажем, что наибольшее для и значение получится, когда множители все равны: % = у :=z=-1 = с *). Определив t из данного условия: t-4с-х-y-z, подставим в и это выра- жение: и = xyz(4c -x-y-z). Мы имеем здесь функцию от трех независимых переменных х, у, z, в трех- мерной области, определяемой условиями хз^О, ys=0, z~=0, x + y+z==s4c. Геометрически эта область представляется в виде тетраедра, ограниченного плоскостями х = 0, у = 0, z=0, x+y+z=4c. Вычисляем производные и приравниваем их нулю: ди ди — = yz(4c - 2х - v - z) = 0, — = zx(4c - х - 2у - z) = 0, дх ду du — = ху(4с - х - у - 2z) = 0. dz Внутри области уравнения эти удовлетворяются лишь в точке x = y-z=c, в которой «=с4. Так как на границе области и = 0, то в найденной точке, действи- тельно, достигается для функции наибольшее значение. *) Мы лишь для определенности взяли число сомножителей равным четырем; результат будет тот же для любого числа сомножителей.
430 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [200 Утверждение наше доказано (ибо при x=y=z=c также и Г=с) *). Вообще, в случае функции трех переменных u=f(x, у, z) область ограничи- вается поверхностью (или рядом поверхностей). Вдоль такой поверхности пере- менные х, у, z зависят уже от двух параметров (ими могут служить и две из этих переменных, как, например, только что: z=4c-x-y). Тогда и функция и будет зависеть только от двух параметров, так что определение наибольшего (наименьшего) значения ее на границе является уже более простой задачей, о кото- рой шла речь выше. И т. д. Если функция и = /(л-j, х2, • • , хп) задана лишь в открытой (или неогра- ниченной) области то уже нельзя заранее утверждать, что она достигает в области своего наибольшего (наименьшего) значения. Тем не менее такое значе- ние в отдельных случаях может и существовать; мы поясним на примере, как в этом можно удостовериться. 4) Найти наименьшее значение для суммы u=x+y+z+t положительных чисел х, у, z, I, при условии, что произведение их сохраняет по- стоянную величину xyzt = с4. Покажем, что наименьшее значение для и получится, когда слагаемые все равны: x = y = z=t = c **). с4 Определим Г. t = — , подставим это выражение в и: xyz с1 u=x+y+z4------. xyz Нам нужно отыскать наименьшее значение для этой функции трех переменных х, у, z, в области, определяемой неравенствами х=-0, у>0, z=-0, т. е. в первом координатном октанте, открытом и безграничном. Попробуем применить прежний метод: если в области есть точка, где наша функция достигает наименьшего значения, то эта точка, как и прежде, должна быть в числе стационарных. Имеем ci tlx = 1--=0, Uy = 1------= 0, x2yz xy2z с* «4=1------ = 0; xyz2 отсюда х = у=z = с, чему отвечает t = с; при этом и = 4с. Как теперь проверить, что это значение, действительно, будет наимень- шим? Ясно, что при приближении к пограничным плоскостям х = 0, у=0, z = 0, равно как и при удалении в бесконечность, наша функция и бесконечно возрастает. Най- денную точку можно окружить кубом [t, Е; е, Е; е, Е], взяв Е=-0 настолько боль- шим, а е =- 0 настолько малым, чтобы вне этого куба и на его поверхности *) Из сказанного следует, что произведение положительных чисел xyzt, сумма которых равна 4с, не превосходит с4, так что ---- x+y+z+r Vxyzt*sc =--------, ' 4 т. е. среднее геометрическое не превосходит среднего арифметического. Этот результат, справедливый для любого количества рассматриваемых чисел, нам уже известен [133 (4а)]. **) И здесь число слагаемых может быть любым (ср. сноску на предыдущей странице).
201] § 5. ЭКСТРЕМУМЫ, НАИБОЛЬШИЕ И НАИМЕНЬШИЕ ЗНАЧЕНИЯ 431 было и=~4с. Но в кубе, как в замкнутой и ограниченной области, функция и должна иметь наименьшее значение; теперь уже ясно, что это значение достигается именно в найденной выше точке и что оно будет наименьшим и для всей первоначальной области, ч. и тр. д. Замечание. В примерах 1), 3), 4) внутри рассматриваемой области суще- ствовала одна лишь «подозрительная» точка. Можно было бы удостовериться, что в ней налицо максимум (или минимум). Однако - в отличие от того, что было отмечено для случая функции одной переменной [см. замечание в 139] - здесь из этого одного нельзя было бы сделать заключение, что мы имеем дело с наибольшим (наименьшим) значением функции в области. Следующий простой пример показывает, что подобное заключение в дей- ствительности может привести к неверному результату. Рассмотрим в прямо- угольнике [-5,5; -1,1] функцию и = х3 - 4х2 4- 2ху - у2. Ее производные и'х = Зл2 - 8х t 2у, и'у - 2х - 2у в пределах области обращаются в нуль лишь в точке (0, 0). Как легко убедиться с помощью критерия п° 197, в ней функция имеет максимум (равный 0). Однако, значение это не будет наибольшим в области, ибо, например, в точке (5, 0) функция и = 25. Вследствие этого, в случае функции нескольких _______ переменных, - при разыскании наибольшего или наи- меньшего значения функции в области - исследова- / / \\ ние на максимум и минимум оказывается практически / \ \ ненужным. \ \ 201. Задачи. Многие задачи — как из области i \ / математики, так и из других областей науки и тех- \ ники - приводят к вопросу о нахождении наиболь- \ ^7 шего или наименьшего значения некоторой функции. Решение задач 1)-4) связано с уже рассмотрен- ---- ными в предыдущем п° примерами. рис jq? 1) Среди всех вписанных в данный круг радиуса R треугольников найти тот, площадь которого наи- большая (рис. 107). Если через х, у, z обозначить центральные углы, опирающиеся на стороны треугольника, то они связаны зависимостью %4-у4-г=2л, откуда z = 2п - х - у. Площадь треугольника Р через них выражается так: 1111 Р = — R2 • sin х+ — R2 sin у 4— R2 • sin z = — R2 • [sin x 4- sin у - sm (x+y)]. 2 2 2 2 Область изменения переменных x и у здесь определяется условиями: лг»0, уг»0, х+у=^2л. Нужно найти те значения переменных, которые сообщают выражению в скобках наибольшую величину. 2л 2л Мы уже знаем [200, пример 1)], что это будут х = у= — , так что и z = —: получается равносторонний треугольник.
432 гл. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [201 2) Среди всех треугольников данного периметра 2р найти тот, площадь кото- рого Р наибольшая. Пусть х, у, z означают стороны треугольника; тогда по формуле Г е р о н а Р = УХр - х)(р - у)(р - Z). Можно было бы, подставив сюда z = 2p-x-y, преобразовать Р к виду УХр - х)(р - у)(х+у-^р) и искать наибольшее значение этой функции в треугольной области, о которой уже была речь в 160, 6). Мы поступим иначе: задача сводится к нахождению наибольшего значения для произведения положительных чисел u = (p-x)(p-y)(p-z) - при условии, что их сумма постоянна: (р ~ X) + (р - У) + (P - Z) = Зр - 2р = р. А мы уже знаем [200, пример 3)], что для этого все множители должны быть равны, 2р так что x = y=z=—. Снова получается равносторонний треугольник. 3) Среди вписанных в данный эллипсоид х2 у2 z2 — 4--1—— 1 а2 Ь2 с2 прямоугольных параллелепипедов (с ребрами, параллельными осям его) найти тот, который имеет наибольший объем. Если через х, у, z обозначить координаты той из вершин, которая лежит в первом координатном трехгранном угле, то объем v = 8xyz. Вместо v можно рас- смотреть величину v2 х2 у2 z2 и=-------=— -------, 64а2Ь2с2 а2 Ь2 с2 ибо они, очевидно, достигают своих наибольших значений при одних и тех же х, у, z. По отношению же к и вопрос снова приводится к примеру 3) предыдущего п°, Ответ: х2 у2 z2 1 а Ь с — = — = — = так что х = —, у = —, z= —. «2 ь2 с2 з’ уз уз уз 4) Предположим, что какой-нибудь газ (например, воздух) сжимается в п о р- шневом компрессоре от атмосферного давления ра до давления р>р0 Работа, затрачиваемая при этом на сжатие 1 моля газа, выразится так: 7-1 -1 у (Р\ V A = RTa-—— - -1 ; y-lLtpJ здесь R есть «газовая постоянная», Та - абсолютная температура газа до сжатия, а у есть некоторое число (=-1), зависящее от конструкции компрессора. Работа А, очевидно, тем меньше, чем меньше начальная температура То. При больших степенях сжатия, когда экономия в затрачиваемой работе представляет важность, разбивают весь процесс сжатия на несколько ступеней, в промежутках подвергая сжатый (и нагревающийся вместе с тем) газ - охлаждению.
201] § 5. ЭКСТРЕМУМЫ, НАИБОЛЬШИЕ И НАИМЕНЬШИЕ ЗНАЧЕНИЯ 433 Пусть, например, мы имеем трехступенчатый компрессор с двумя промежуточными холодильниками, в которых температура доводится снова до Т„. Если обозначить через Pi и р2 давления в конце первой и второй ступеней, то общая работа сжатия теперь будет у A^RT0.~-~ у-1 V- + Тогда возникает вопрос, как при заданных рп, р, То выбрать промежуточные давления ру и р2 с таким расчетом, чтобы величина затрачиваемой работы была наименьшей. Если отбросить постоянный множитель и постоянные слагаемые, которые не влияют на искомые величины р1и р,, то дело сведется к исследованию выра- жения у—1 у—1 у—1 Так как произведение у—.] у—1 у—1 у—1 сохраняет постоянную величину, то, воспользовавшись примером 4), 200, сразу видим, что сумма и достигает своего наименьшего значения тогда, когда все сла- гаемые равны: у—1 у-1 у—1 или А=Р_2;=£ Pf) Pl Р2 так что последовательные давления со- ставляют геометрическую прогрессию. Отсюда »_____ 8_____________ YpI-p, Р-:~ Уро ' Р2- 5) На плоскости дан треугольник со сторонами а, Ь, с (рис. 108); на нем можно построить бесчисленное множество пирамид с данной высо- той Л. Требуется из них найти ту, которая имеет наименьшую боковую поверх- ность 5. Вопрос сводится к нахождению проекции М вершины пирамиды. Положение ее определяется величинами трех перпендикуляров х, у, z, опущенных, соответ- ственно, на стороны а, Ь, с. Каждому перпендикуляру мы приписываем знак плюс если точка лежит с той же стороны, что и сам треугольник, и знак минус в против- ном случае. Величины х, у, z связаны соотношением (Р означает площадь тре- угольника) 2Р-ах-Ьу ax+by + cz=2P, откуда z^-------------. с 28 Г. М. Фихтенгольц, т. I
434 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [201 Интересующая нас боковая поверхность S выразится теперь так: 5= - Ух2+Л2+- /у’+йЧ- У^+Л2, 2 2 2 ' где z должно быть заменено найденным выражением; областью изменения н е- зависимых переменных х, у является вся плоскость ху. Имеем или У*2+Л2 Уг2+Л2 с , by cz b 2Sy = ------------ у>+л2 Ух2+Л2 с X у Z ——zzn ~ -----, откуда х = у ~ z. у*2+л2 У/+Л2 У^+Л2 Соответствующая точка М есть центр вписанного в треугольник круга. Что этим значениям х и у отвечает наименьшее значение для S, легко показать как в примере 4) предыдущего п°, опираясь на то, что - при безграничном возра- стании х или у - и 5 растет до бесконечности. 6) Пусть даны на плоскости три точки (alt bt), Мг (а2, Z>2), М3 (а3, Ь3), не лежащие на одной прямой. Требуется найти в этой плоскости такую точку, чтобы сумма ее расстояний до данных точек была наименьшей. Взяв любую точку М (х, у), положим Qi~ У(х-аг)2 + (у-ад2 (/ = 1, 2, 3). Тогда исследованию подлежит функция “ = 2 Qi = 2 У(л - а,)2+(у - bi)2. Для нее существуют - везде, кроме данных точек, - частные про- изводные ди -ST, X di -V’ — =2, -------= Z COS 0/, дх Qi ди у, у-bi -у . — “Z ------= Z sin 0(, Эу Qi где в/ означает угол прямой М,-М с осью х. «Подозрительными» по экстремуму точками являются, таким образом, прежде всего точки Мг, М2 и М3, в которых производных нет, а затем та точка Мо (мы увидим, что она не всегда существует), в которой производные зараз обращаются в 0. Так как при бесконечном возрастании х или у наша функция и, очевидно, также бесконечно растет, то наименьшего значения она достигает в одной из упомянутых точек. Чтобы разыскать стационарную точку Мо, приравняем нулю обе частные про- изводные; это даст нам условия: cos B2+cos 02+cos ©з = 0, sin Bj+sin 02+sin B3=0. Умножим первое на sin 02, а второе на cos B2 и вычтем; мы получим sin (01-02) = sin (В2-03), откуда 01- 02= 02-В3. Аналогично найдем, что 02 — 03= 03— 01.
201] § 5. ЭКСТРЕМУМЫ, НАИБОЛЬШИЕ И НАИМЕНЬШИЕ ЗНАЧЕНИЯ 435 Таким образом, углы между прямыми М1Ма, МгМ0, М3М0, взятыми попарно, все должны быть равны —, и точка М9 получается в пересечении дуг, построен- ных на сторонах треугольника MiM2M3 и вмещающих 2л Если в этом треугольнике нет 2л угла, большего или равного —, то 3 названные дуги, действительно, пересекаются внутри треугольника и определяют точку Мо, из которой 2л стороны его видны под углами, равными — (рис. 109). В этом случае надлежит сравнить значения, О х Рис. 109. которые и получает в названных четырех точках. Мы докажем, что значение и в стационарной точке М„ будет меньше других (а значит, и вообще наименьшим). Действительно, по «теореме косинусов» М^М* - МаМI + MaMl VMtMl М0М2 - АГ0АГ1 так что ______________________________________ 1_______ МгМ2 - МаМ2 + - МаМх. Аналогично --------------------------------------1________ MrAf3=-AfoM3+-A/oA/t, Складывая, получим АЛА/, 4" АЛ Af3 A/qA/j+A^gA/g 4- A/gA/g. т. e. Очевидно, точка М1 здесь может быть заменена точкой АЛ или М3, что и завершает доказательство. Иначе обстоит дело, если один из углов треугольника MiM2M3 2л равен или больше —. Тогда стационарной точки вовсе не существует и наименьшее значение функции и доставляется одной из данных точек М1г М2, М3 - именно той, которая служит вершиной тупого угла. Любопытной особенностью этой задачи является именно то, что в ней при- ходится, кроме стационарной точки, считаться и с точками, в которых производ- ных не существует [ср. 196, замечание II]. 7) Обобщим задачу 1): станем искать вписанный в данный круг (радиуса Л) («г 1/угольник с наибольшей площадью Р. Обозначим через Xj, х2, ..., хп, +i центральные углы, которые опираются на стороны многоугольника; тогда %i4-х2 4- • •. т Хц+Хп +i ~ 2л, откуда Хп +1 = 2л - (%! + Х2 +-h Хп). Площадь Р равна 1.1 1 1 Р = у л*.sin xi + ~ 7J2>sin л'г+ ... + -~Л2-sin хп+— К2 - sin xn+l; 28*
436 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [201 если подставить вместо Хл+i его выражение, то вопрос сведется к разысканию наибольшего значения для функции w = sin xj+sin х2+... +sin xn+sin [2л:- (х1+х2+ .. • +хл)], причем область ® изменения независимых переменных хх, .....хп определяется неравенством XjS=0, x2s=0, ..Хл=э=0, хх+х2+ ... + хл=е2л, т. е. представляет собой л-мерный симплекс [162]. По общему правилу вычисляем производные и приравниваем их нулю: COS Xj-COS (Xi + X2 + . • • + Хл)=0, cos xn - cos (xx+x2+ ... +хл) = 0; единственной внутренней точкой области, в которой выполняются эти условия, будет точка 2л ( 2л ) х1 = Хо— ... = хп =- тогда и хЛ4-1 =----- ; л+1 V л+1/ 2л ей отвечает и = (п+1) sin-. л+1 Для того чтобы доказать, что это, действительно, будет наибольшим значе- нием и, воспользуемся методом математической индукции. При л = 2 наше утвер- ждение уже установлено в примере 1) предыдущего п°. Допустим, что оно верно для случая л слагаемых синусов (так что для их суммы наибольшим значением - . 2л( будет л-sin — , и докажем верность его и для нашей суммы л+1 синусов. п) Согласно общим указаниям, сделанным выше, надлежит сравнить значение 2л (л +1) sin--со значениями, которые функция принимает на границе области л+1 Возьмем, например, «грань симплекса» хп = 0; на ней и будет функцией лишь от л -1 переменных: w^sin Xj+sin х2+ ... +sin x„_.i+sin [2л-(x, + x2+-l-xn_1)] 2л и, по допущению, наибольшим значением здесь будет л-sin —. То же можно л установить и для других «граней». Но так как 2л 2л л-sin—-=(n + l)-sin-*), л л+1 то наше утверждение доказано. Наибольшую площадь будет иметь правиль- ный многоугольник. 8) Рассмотрим электрическую питательную сеть с парал- лельным включением. На рис. ПО представлена схема сети причем А и В - за- жимы источника тока и Д, Рг, ..., Рп - приемники тока, потребляющие, соот- ветственно, токи i‘i, 12, ..., in. Требуется, при наперед заданном допустимом общем падении потенциала в цепи 2е, определить сечения проводов так, чтобы на всю магистраль пошло наименьшее количество меди. *) Это обстоятельство следует из того, что функция----монотонно убывает Z при возрастании z от 0 до л [см. 133, 1].
20Ц § 5. ЭКСТРЕМУМЫ, НАИБОЛЬШИЕ И НАИМЕНЬШИЕ ЗНАЧЕНИЯ 437 Очевидно, достаточно ограничиться рассмотрением одного из проводов, скажем ААп, так как другой провод находится в совершенно аналогичных условиях. Обозначим через /ц /2, ..., 1п длины частей AAL, А2А2, ..., Ап-гАп (в м), через Яг, Яг, • • , Яп - площади их поперечных сечений (в леи2). Тогда выражение “1 = 11Я1 + 4?2 + • • + 1пЯп как раз и представит объем всей затраченной меди (в см3); для него нам нужно добиться наименьшей величины, принимая во внимание, что общее падение по- тенциала в проводе ААп должно равняться е. Легко подсчитать, какие токи Jlt .... Jn будут протекать в отрезках ААЪ А,А2, ..., An-jAn цепи: /i = ;‘i + /2 + ... + z,i, J2 = • • • + in, • Jn~in- Если обозначить через q сопротивление медной проволоки длиной в I .и и с сече- нием в 1 мм2, то сопротивления этих отрезков будут qIi ql- oln 4 = , Г2 = —, ..., Г„ = , Яг Яг Яп так что соответствующие падения потенциала в этих отрезках, согласно закону Ома, выразятся так: (AiJi , olnJn -= --, вп ~ ?2у2 ~------- у • • ♦ , &П ~ ----- Я1 Яг Яп Чтобы избежать сложных выкладок, мы, вместо переменных qlt q2, Яп, введем именно эти величины et, е„, ..., вп, связанные простым условием ei + e2+ ... +еп-г+еп = е, откуда = е-- с2- ... -ед_1- Тогда, в свою очередь, (?4Л и QlnJn nlnJn Яп— — =---------------------- еп е — ei~ е2— • • * ~ 1 <?4^2 <72=------, , е2 in— 1^П — 1 inJn en~i e —e2—. - > — вп—г причем область изменения независимых переменных е1( е2, •, еП-1 опре- деляется неравенствами 0, Сп—• 4" < е (открытый симплекс).
438 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ (201 Приравнивания нулю производные и по всем переменным, получим систему уравнений ПЛ , № 0 е\ (е-в!- ... -еП-1)2 _ __ Q 4 (e-et-...-en-i)2 e%-i (e-gj-...-en-j)2 откуда (снова вводя еп") НЛ^ПЛ ef е* № Удобно обозначить общую величину всех этих отношений через — (Л =-0). Тогда = е2 = Я/2у/2, еп = Mn^Jn, причем л легко определяется из условия et+e2+ ... +еп ~ е: ~ь 4 У*^2“Ь • • • + Так как, при приближении точки (eit ег, ., «л-i) к границе области, и растет до бесконечности,то найденные значения е1г е2, . •en-i (еп) действительно достав- ляют функции и наименьшее значение. Наконец,возвращаясь к нашим основным переменным qlf q.,, ..., </л, находим е1Гг РцТ _ в1ГГ ?1“"гУЛ, ?2--гУ^2.....Чп - . \Jn, л Л л так что наивыгоднейшие сечения проводов оказываются пропорциональными корням квадратным из соответствующих сил тока. 9) Метод наименьших квадратов. Так называется очень распро- страненный метод обработки наблюдений, суть которого заключается в следу- ющем. Пусть требуется определить значения трех*) величин х, у, z, если для них уста- новлено п>3 линейных уравнений atx+bty+ciz=di (/=1, 2, ..., л), причем некоторые из коэффициентов a,, bi, ct, di получены опытным путем и из- вестны лишь по приближению. При этом мы предположим, что хоть какие-нибудь три из этих уравнений имеют определитель, отличный от нуля: например, пусть «1 а2 61 62 С1 С2 #0. (14) ^3 ^3 ) Мы ограничиваемся тремя величинами лишь для простоты письма.
201] S 5. ЭКСТРЕМУМЫ, НАИБОЛЬШИЕ И НАИМЕНЬШИЕ ЗНАЧЕНИЯ 439 Однако вычисленные из первых трех уравнений значения х, у, z, вообще говоря, не будут точно удовлетворять остальным (либо ввиду неизбежных погрешностей в коэффициентах уравнений, либо вследствие того, что сами равенства оказывают- ся лишь приближенными). Не имея оснований предпочесть одни уравнения другим и считаясь с неизбежностью погрешностей 8j = aix+bty + c(-z -di, какие бы ни брать значения х, у, z, стараются достичь лишь того, чтобы сумма квадратов этих погрешностей п п W =2% = 2j(aix+bty+CiZ-di)2 1=1 i=i была наименьшей (отсюда и название метода). Иными словами, наилучше согласующимися с результатами опыта считаются те значения х, у, z, которые доставляют наименьшую величину функции W= l^(x, у, z). По общему правилу, чтобы найти эти значения, приравниваем нулю произ- водные от W по х, у, г: п 2 2ai(atx~^ Ьу+ C[z - df) = 0, /==1 л 2 2bt(atx+bty+Ciz - di) = 0. n 2 2Ci(atx+bty+Ciz - di) = 0. Гаусс (C. F. Gauss) ввел другие обозначения сумм однотипных слагаемых, разнящихся лишь указателями; именно, он пишет л л [аа] вместо 2ai, [ад вместо 2aibi и т. п. (=1 В обозначениях Г а у с с а полученные для определения значений х, у, z урав- нения перепишутся так: [аа]х+ [aZ>]y+ [ac]z- [ad], [ba]x+[bb]y+[bc]z= [bd], [ca]x+ [cb]y+[cc]z= [c</]; их называют нормальными уравнениями. Для того чтобы быть уверенными, что этими уравнениями однозначно опре- делятся значения х, у, z, нужно установить, что определитель системы отличен от нуля. Но по известной теореме алгебры, квадрат этого определителя представ- ляется в виде 2 [аа] [ab] [ас] [*а] [ад [ад [са] [ад [сс] а/ bi ct 2 а) bi cj - <'./,0 ak bk ck
440 ГЛ. V. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [201 причем суммирование распространяется на всевозможные сочетания (j,J> к) из п значков 1, 2, ..п по три. Так как из всех определителей справа, по нашему предположению, хоть один отличен от нуля, то отсюда и следует, что определи- тель слева также не нуль. Остается еще убедиться в том, что определяемые из нормальных уравнений значения переменных действительно доставляют функции W наименьшее значе- ние. Для этого достаточно, например, установить, что вне сферы достаточно боль- шого радиуса W будет сколь угодно велико. С этой целью рассмо трим значения первых трех скобок в выражении W а^х+Ьуу+с^- dl = u1, a^x+b^y + c^z-d2 = u3, а3х+b3y + c3z-d3 = и3. Ввиду (14) через эти значения, в свою очередь, линейно выражаются, с вполне определенными постоянными коэффициентами, и х, у, z, так что, пока все три величины и1( и2, «з остаются ограниченными, ограниченными необходимо будут сами х, у, z. Отсюда уже ясно, что при бесконечном возрастании r2-x2+y2+z2 также растет до бесконечности и uf+u^+ui (а следовательно, и 1Г).
ГЛАВА ШЕСТАЯ ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ § 1. Формальные свойства функциональных определителей 202. Определение функциональных определителей (якобианов). В на- стоящей главе (равно как и в других частях курса) важным формаль- ным орудием исследования для нас явятся особого рода опреде- лители, составленные из частных производных. Изучим предвари- тельно основные их свойства. Пусть даны п функций от п переменных У|=/1(л'1> л-2, . ..,х„), yn=fn(x1, хг, ...,хп), которые определены в некоторой и-мерной области © и имеют в ней непрерывные частные производные по всем переменным. Составим из этих производных определитель dyi dyi дУ1 дхг дх2 дх-г дУг ду2 дУг dxt дх2 &хп дУп дуп дУп дх^ Эх2 дхп Этот определитель называется обычно функциональным определи- телем Якоби или якобианом системы (1) - по имени немецкого
442 ГЛ. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ (203 математика Якоби (С. G. J. Jacobi), впервые изучившего его свойства и применения *). Обозначают его для краткости символом Р(Т1,У2> •••, Уп) D(x,, х2, ..хп) ’ сходным с обозначением производной. Якобиан имеет ряд свойств, подобных свойствам обыкновенной производной. 203. Умножение якобианов. Кроме системы функций (1), возьмем систему функций x1=q>1(t1, t2, Q, Х2=<Р2(?1, Ч, tn), Xn=<Pn(t±, t2, • • •, in)> определенных и имеющих непрерывные частные производные в об- ласти S’. Пусть при изменении точки (г15 ?2, ..., tn) в $ соответствую- щая точка (хх, х2,..., хп) не выходит из области так что , у2, ..., уп можно рассматривать как сложные функции от t,, t2, ..., tn через по- средство хг, х2, ..., хп. Умножим теперь якобиан системы (1) на якобиан системы (2): дх. дх. дх, — — dh dt2 dtn дх2 дх2 дх2 Р — IW dh dt2 дхп дхп дхп dh д*г Эм Из теории определителей нам известна теорема об умножении опре- делителей, выражающаяся формулой а11а12 • • • ^21^22 • • • а2П @П1@П2 • • • &пп ^11^12 • • &1Л ^21^22 • • ^2п ЪщЬп2 • • • &пп сис12 • • с& ^21с22 • с2п СП1СП2 • • • спп *) В науку якобианы были введены одновременно с Якоби и М. В. Ос- троградским.
203J § I. ФОРМАЛЬНЫЕ СВОЙСТВА ФУНКЦИОНАЛЬНЫХ ОПРЕДЕЛИТЕЛЕЙ 443 где общий элемент последнего определителя такой: cik — )"••• “I’ ^in^nk (г, k = 1, 2, ..n) (умножение по правилу «строка на столбец»)- Применяя эту формулу к функциональным определителям, получим ЗлЭл Эл dxt дх2 дхГ1 dy2 ду2 ду, дху дх, дх>, дУп дуп дУп дх, дх, дхп dxt dx. dxt dtj dt>2 ' ' dtn dx2 dx. dx2 — 1. 1 I.. 1 dt, dt2 t)Xn &Xn dxn dtx dt2 dtn dXi . dyr dxn dy, dxt . dyi dxn "Г . . + . . f- . . -Г dxi dtL <)Xn dll &Xi dtfl dxn dtn dy2 dXj + + dy2 dxn dy2 dxi + + dy2 dxn ^Xti ()ti Btfl dxn dtn дУп dXi dyn dxn dyrt dx. dy'n dxn , H-- . a ДИ 1 1 МИ | , . -r dXi dtx дхц dti ()X1 dtn dxn dtn Замечая, что, по формуле для производной сложной функции, об- щий элемент этого определителя есть дх, ду/ дхп __ ду, дх, д?к дхп dtj, dtfc (г, к= 1, 2, . . ., и) мы можем последний определитель переписать в виде ду, дуг dti dt2 din ду2 ду2 ду2 дуп дуп дуп dt, dt2 ” ' dtn Доказанное только чго первое свойство якобиана в крат- ких обозначениях можно переписать так: Р(у„ Уг, Уп) Р(хи Х2, Хп) = Р(У1, у2, ,Уп) (3) Р(Л'!, Х3, . . ., Хп) Р(^1, t2 э • • • > tn) P(.tl, t2 , . . -, tn)
444 ГЛ. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ (204 Если бы имели одну функцию у от х, где х есть функция от t, то получили бы известную формулу для производной сложной функции: таким образом, выведенное свойство якобианов является обобщением формулы для производной сложной функции. Отметим особо тот случай, когда переменные tr, t2, ..., tn тожде- ственны с Ух, у2> • •> Уп, так что система функций (2) есть результат обращения системы (1)*). Тогда полученное соотношение све- дется к следующему: Р(.У1, у2, Уп) . х2, ., хп) _ J £>(%!, а-2, ..., хп) P(yt, уг, ..., уп) или Р(У1, Уг, •••, Уп) ____1______ Р(х1г хг..хп) Р(хъ х2, ...,хп)' ' ' Р(У1, У г, • • •> Уп) В этом виде оно напоминает формулу для производной обратной функции. 204. Умножение функциональных матриц (матриц Якоби). Пусть имеется т функций у2, ..., ут от п (п ^т) переменных х , , х2, ... . . ., Хп • У1 = fl(Xl, Х2> ’ Хп)> Уг х2> • > хп), Ут ~fm(xL, х2 ’ • • > хп), причем, в свою очередь, переменные хх, х2, ..., хп являются функ- циями от т переменных , t2, ..., tm: . x2 =IP2(^1> ^2> • • {m), xn—<Pn(tl> ?2’ • • •» ?т)- Предполагая в обоих случаях существование непрерывных част- ных производных, постараемся найти выражение для якобиана уг, у2, ... ..., ут как функций от tx, t2, .. .,tm. ♦) Самую возможность такого обращения мы здесь допускаем. См, Следующий параграф.
2041 § 1- ФОРМАЛЬНЫЕ СВОЙСТВА ФУНКЦИОНАЛЬНЫХ ОПРЕДЕЛИТЕЛЕЙ 445 В теории определителей устанавливается общая теорема об ум- ножении матриц (для которой использованная выше теорема об умножении определителей является частным случаем). Рассмотрим две матрицы (таблицы) • • • а1п' Я21 а22 • ^2П ^11 ^12 • • • Ьуп ^21 ^22 • • • ^2т Рп! &п2 • • Ьпт/ (п >т). \^т1 &m2 • • • ^тп) Их произведением является квадратная матрица <с11 С12 • • • clm ^21 ^22 • • • с2т > \cml ст2 • • стт / элементы которой вычисляются по формулам с1к = @11^111 + ^i2^2k + • • • + ^inbnk * (/, к — I, 2, . . т) Соответствующий этой матрице определитель равен сумме (/., it, ...» 6п) aUl а1>1 а1‘т а2>1 a2h • ^2>т &mlt Qmlt • ^mim Ь. b, b. ’/11 Ь(г2 - b(lm ’/11 Ь1г2 • bi,m ’/»11 Ь/т2 bjmm распространяющейся на всевозможные сочетания (ilt i2, . rm) из n значков 1, 2, ..n no m. Применив этот результат к функциональным матри- цам (или матрицам Якоби) 'byi 8yt dxi dx2 дУг дУг д дх. дУ1 ' дхп дуг дхп и 1 dXj Э/1 ()^2 дх2 &х2 дУт дут дут дхп дхп дхп *****м* дх. dty dt. dtm
446 ГЛ. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ [204 мы получим dy^dxi &У1 дхп 5%i dti ' ’ ’ дхп dh " ’ dxi dlm ’ ’ ’ + dxn dtm ЭТ2 , ^2 dy\ Э*! ду2 дхп дх, dli ’ ’ ‘ dxn dt,' ' ' dx, dtm ' ' ' dxn dtm dym dx, дУт dxn dym dxL dym dxn dx, dli dxn dli dXi dim dxn dtm 2 dyi dyi dyi dxt, dxt, dxt. dxit dxt, ’ dtm дУг ду2 дУг dxt, dxt, dxt, dxt, dxt, dxtm • dtm &Ут дУт dyrn dxtm dxt, dxt, ' dti dh dtm Если снова вспомнить формулу для производной сложной функции, то определитель в левой части этого равенства перепишется так: &У1 дУ1 dti dt2 dim 9УгдУг ду. dti dti dtm dy’m dym dym dti dis dim В кратких обозначениях полученный результат имеет вид Р(У1> Уг> • • •» Ут)_ у Д(Т1> Уг, • • •> Ут) D(xi,, Xt,, Xt„) ... D(ti, t2, • • •, tm) (it ,2 /in) D(xt,,Xt,, ..., Xim) D(ti, t2, • •, tm) где сумма распространяется на всевозможные сочетания из и значков 1, 2, ..., п по т. При т = 1 доказанная формула переходит в известную формулу для дифференцирования сложной функции (через посредство несколь- ких промежуточных переменных): dy_ у, dy _ dx, dt j dxi dt и, таким образом, является ее обобщением.
205] § 2. НЕЯВНЫЕ ФУНКЦИИ 447 Отметим частный случай нашей формулы, который получается при и = 3 и те = 2: Р<Ух, Уз) _ Р(У1, У г) . . т2) Р(У1, У2) . Р(х2, х3) Д(Т1, Та) # Р(*з, *1) PfJl, ^2) DtXl, X?) P(t\ , ^2) Р(х2, Х3) P(Ji, tz) Р(х3, X^j P(ti, ^2) Эта формула находит себе особенно частое применение. Мы установили ряд формальных свойств якобианов, аналогичных свойствам обыкновенных производных; к ним примыкает и формула, которую мы выведем в одном из ближайших п° [210, 8)]. Но более глубокая аналогия между производными и якобианами обнаружи- вается по той роли, которую они играют в теории неявных функ- ций (см. следующий §), и, особенно, в вопросе о замене пере- менных в двойных, тройных и, вообще, кратных интегралах (в третьем томе). § 2. Неявные функции 205. Понятие неявной функции от одной переменной. Предположим, что значения двух переменных х и у связаны между собой уравнением, которое, если все члены его перенести налево, в общем случае имеет вид Ж>’) = 0. (1) Здесь F(x, у) есть функция двух переменных, заданная в какой-либо области. Если для каждого значения х - в некотором промежутке - существует одно или несколько значений у, которые совместно с х удовлетворяют уравнению (1), то этим определяется, однозначная или многозначная, функция у = f(x), для которой равенство F{x, /(%)) = 0 (2) имеет место уже тождественно относительно х. Возьмем, например, уравнение у*2 <1а> оно, очевидно, определяет у как двузначную функцию от х в промежутке [ - а, а], именно , Ь о л у = ± - у а- - х. И, если вместо у подставить в уравнение (1а) эту функцию, то полу- чится тождество. Здесь удалось найти для у очень простое аналитическое выраже- ние через х, даже в элементарных функциях. Так обстоит дело далеко не всегда. Если взять уравнение _y-x-esin_y = 0 (0-=£<1),
448 ГЛ. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ [205 которое нам уже встречалось [при других лишь обозначениях пере- менных, 83], то мы знаем, что этим уравнением у определяется как однозначная функция от х, хотя в конечном виде она через элемен- тарные функции и не выражается. Функция у=f(x) называется неявной, если она задана при по- средстве неразрешенного (относительно у) уравнения (1); она становится явной, если рассматривается непосредственная зависимость у от х. Читателю ясно, что эти термины характеризуют лишь способ задания функции у = Дх) и не имеют отношения к ее природе. [Строго говоря, противопоставление неявного и яв- ного задания функции с полной четкостью возможно лишь, если под явным заданием разуметь явное аналитическое задание; если же, в качестве явного, допускать задание с помощью любого правила [45], то задание функции у от х с помощью уравнения (1) ни- чем не хуже всякого другого.] В простейшем случае, когда уравнение (1) - алгебраическое, т. е. когда функция F(x, у) есть целый относительно х и у многочлен, опре- деляемая им неявная функция у от х (вообще многозначная) на- зывается алгебраической. Если степень уравнения (относи- тельно у) не выше четырех, то алгебраическая функция допускает я в- н о е выражение в радикалах, при степени выше четырех такое вы- ражение возможно лишь в виде исключения. Сейчас нас будет интересовать лишь вопрос о существова- нии и однозначности «неявной» функции {равно как и о дру- гих ее свойствах), независимо от возможности представить ее в «яв- ном» виде аналитической формулой. Впрочем, в этой постановке во- прос для нас не нов; с частным случаем его мы имели дело, когда речь шла о существовании и о свойствах обратной функции, и урав- нением y-f(.x)=Q переменная х определялась как «неявная» функция от у. Поучительна геометрическая трактовка указанного вопроса. Урав- нение (1), при известных условиях, выражает кривую на плоскости [например, уравнение (1а), как известно, выражает эллипс (рис. 111)]; в этом случае оно называется неявным уравнением кривой. Вопрос заключается в том, может ли кривая (1) (или ее часть) быть выражена обычным уравнением вида у = Дх), с однозначной функцией справа; геометрически это означает, что кривая (или ее часть) пересекается прямой, параллельной оси у, лишь в одной точке. Если мы желаем иметь однозначную функцию, то как видно на примере того же эллипса, нужно ограничить не только область из- менения х, но и область изменения у. Мы будем говорить, для краткости, что в прямоугольнике {a, b; c,d) уравнение {!) определяет у как однозначную
206] § 2. НЕЯВНЫЕ ФУНКЦИИ 449 функцию от х, если при каждом значении х в промежутке (а, Ь) уравнение (1) имеет один, и только один, корень у в промежутке (с, d). Обычно нас будет интересовать опре- деленная точка (х0,у0), удовлетворяющая уравнению (1) (лежащая на кривой), и в роли упомянутого прямоугольника бу- дет фигурировать окрестность этой точки. Так, например, в случае эллипса (рис. 111), очевидно, можно утверждать, что уравнение (1а) определяет ординату у как однозначную функцию от абсциссы х в достаточно малой окрестности любой точки эллипса, кроме вершин его А, А' на большой оси. 206. Существование неявной функции. Теперь установим условия, обеспечивающие существование однозначной и непрерывной неявной функции. Теорема I. Предположим, что 1) функция F(x, у) определена и непрерывна в некотором прямо- угольнике ® = [х0-Д х0 + А; у0~А', у0 + А'] с центром в точке (х0,у0); 2) F(x, у) в этой точке обращается в нуль'. F(xfi, уо) = О; 3) при постоянном х функция F(x, у) монотонно возрастает (или монотонно убывает) с возрастанием у. Тогда а) в некоторой окрестности точки (х0, у0) уравнение (V) определяет у как однозначную функцию от х: y=f(x)', б) при х = х0 эта функция принимает значение у0: /(х0)=у0; наконец, в) функция f(x) непрерывна. Доказательство. Станем передвигаться вдоль верти- кали, проходящей через точку Af0(x0,y0) (рис. 112), т. е. фиксируем х = х0; тогда рассматриваемая функция F(x,y) сведется к функции Дхо>т) от одной переменной у. В силу 2), она при у=у0 обра- щается в 0. В то же время по условию 3) функция F(x0, у) возра- стает вместе с у, так что для у-= у0 ее значения меньше нуля, а для у-у0 ~ больше нуля. В частности, следовательно, она будет иметь значения разных знаков в точках А0(х0, у0-А') и В0(х0, у0 + А'), именно F(Aq) = Дхй, у0 - А’) -= 0, F(B0) = F(x0, у0 + Д') =- 0. Перейдем теперь к горизонтальным прямым, проходя- щим через эти точки Ао и Во, т. е. фиксируем на этот раз у=у0-А' 29 Г. М. Фихтенх ольи, т. I
450 ГЛ. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ [206 или у = уп + А’. Получатся две функции от одной переменной х: F(x, у0-А') и F(x, у0+А'), которые, как мы видели, при х-х0 имеют: первая - отрицательное значение, а вторая - положительное. Но по условию 1) эти функции непрерывны *), а потому найдется некото- рая окрестность (х0-й0, х0+й0) точки х0 (0<<50=szl), в которой обе функции сохраняют свой знак [80, лемма], так что при х0-<50-=х< х0 + й0 F(x, yo-zl')-=O, Дх,у0 + /Г>0. Иными словами, на нижнем и верхнем основаниях исходного прямо- угольника вдоль отрезков AtA2 и ВХВ2 длины 2<5О с центрами в точках Ао и Во заданная функция Дх, у) имеет отрицательные значения на первом и положительные - на втором. Фиксируем в промежутке (х0- <50, х0+ <50) любое значение х = х и рассмотрим вертикальный отрезок, соединяющий точки Л(х, У0~А') и В(х, у0 + /!') Вдоль него наша функция снова сведется к функции Дх, у) от одной переменной у. Так как она, в силу 1), не- прерывна *) и, как сказано, на концах промежутка [у0 -А', у0+А'] имеет значения разных знаков: ДЛ) = Дх,уо-21')<0, ДВ) = Дх,уо+г1')-0, то, по теореме Больцано-Коши [80], при некотором значении у=у, содержащемся между у0-А’ и у0 + А', эта функция F(x, у) обра- щается в нуль: Дх,у) = 0. *) Мы предположили непрерывность функции F(x, у) по совокупности пере- менных х, у; но в таком случае она будет непрерывна и по каждой переменной в отдельности.
207J § 2. НЕЯВНЫЕ ФУНКЦИИ 451 И здесь из условия 3) следует, что при у^у будем иметь, соответ- ственно, F(x, у) Eg 0, так что у есть единственное значение у в промежутке (у0-Д', у0 + Д'), которое совместно с х = х удовлетворяет уравнению (1). На каждом вертикальном отрезке АВ найдется толь- ко одна точка М(х, у), обращающая левую часть уравнения в нуль. Таким образом, в окрестности (л-о-^о, *о + <>о; Уо-^'> Уо + ^') точки (х0,у0) уравнение (1), действительно, опре- деляет у как однозначную функцию от х: y=f(x). В то же время предыдущее рассуждение, ввиду 2), показывает так- же, что /(х0)=у0. Именно, из того, что F(x0, }’о)=О, усматриваем, что у0 и есть то единственное значение у в промежутке (у0 - Д', у0 + Д'), которое совместно с х = х0 удовлетворяет уравнению (1). Остается лишь установить непрерывность функции у = f(x) в про- межутке (х0-<50, х0 + <50). Для точки х = х0 это получается непосредст- венно из предыдущего рассуждения, которое приложимо и к любому меньшему прямоугольнику с центром в точке М0(х0, у0). Заменив число Д' любым числом е-= Д', мы нашли бы, как и выше, такое <5я=й0, чтобы для любого х из промежутка (х0-8, х0 + 8) соответствующее ему единственное значение у, которое совместно с х удовле- творяет уравнению (1), оказалось именно между у0-е и у0+£. Таким образом, при |х-х0| -=<5 имели бы |Я*)-Уо| = что и доказывает непрерывность функции f(x) в точке х = х0. Доказательство для любой точки х = х аналогично доказатель- ству для х = х0. Точка М(х, у), где y=f(x), удовлетворяет таким же условиям, как и точка Af0(x0, у0), ибо F(x, у) = 0. Поэтому, как и выше, в окрестности точки М(х, у) уравнением (1) переменная у определя- ется как однозначная функция от х, непрерывная в точке х — х. Но, именно ввиду однозначности, эта функция совпадает с /(х), и тем устанавливается непрерывность /(х) при х = х. Мы доказали теорему существования неявной функции, не задаваясь вопросом о вычислении ее значений или об ее аналитическом представлении; этим мы займемся в главе ХП. Доказанная теорема, очевидно, является обобщением теоремы п° 83. 207. Дифференцируемость неявной функции. Теперь мы усилим предположения относительно функции F(x, у) и тогда получим воз- можность установить и существование производной для функции У =/(*)• 29*
452 ГЛ. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ [207 Теорема II. Предположим, что 1) функция F(x, у) определена и непрерывна в прямоугольнике ® = [х0-Д, х0 + Л; у0-Д', у0+Д'] с центром в точке (х0, у0); 2) частные производные F'x и F'y существуют и непрерывны в 3) F(x, у) в точке (х0, у0) обращается в нуль: F(x0, у0) = 0; наконец, 4) производная F'y{x0, у0) отлична от нуля. Тогда выполняются заключения а), б), в) теоремы Т и, кроме того, г) функция f(x) имеет непрерывную производную. Доказательство (рис. 113). Пусть, например, Fy(x0, у0)>0; так как производная Fy(x, у), в силу 2), непрерывна, то можно по- строить такой квадрат: [х0-3', х01-3', у0 — д', у0+<3'] (й'-=Д и /!')> чтобы для всех его точек было: Fy(x, у) > 0 *). Тогда для этого квад- рата выполнены все условия теоремы I: монотонность функции Рис. ИЗ. F{x, у) по у, при х = const, вытекает именно из того, что F'y>Q [132]. Следовательно, заключения а), б), в) можно считать оправданными. Переходя к доказательству утверждения г), будем под у разуметь именно ту неявную функцию y=f(x), которая определяется уравне- нием (1) и тождественно ему удовлетворяет. Придадим х приращение Лх; наращенному значению х + Лх будет соответствовать значение у + Лу =f(x + Дх), вместе с ним удовлетворяющее уравнению (1): F(x + Лх, у + Лу) = 0. Очевидно, и приращение ЛР(х, y) = F(x i Лх, у + Лу)-Р(х, у) = 0. *) Ибо и для функции нескольких переменных справедливо утверждение, ана- логичное лемме п° 80 для функций одной переменной.
208] § 2. неявные функции 453 Представив AF по формуле (1) п° 178, получим 0 = AF(x, у) = F'dx, у) • Ах 4- F'y(x, у) • Ау 4- хАх I [ЗАу, где а и р зависят от Ах, Ау и стремятся к нулю, когда Ах и Ау одно- временно стремятся к нулю. Отсюда 4т F£(x, у)+а Zlx Fy(x,y)+fi’ Устремим к нулю Ах; в силу установленной уже непрерывности функции у = f(x~) [см. в)], при этом Ау также стремится к нулю, а по- тому и а-*0, Так как то существует предел правой части, а следовательно, существует и производная у по х: /'W=K = lim#=-;^4. (3) х Jx-0 Fv(x, у) v ’ Подставляя Дх) вместо у, будем иметь у f(F\ - - F*(x’ ^х^ 7 w /Дх, /(x)) ’ так как в числителе и в знаменателе имеем непрерывные функции от непрерывных же функций, и знаменатель не обращается в нуль, то от- сюда ясно, что f’(x) - также непрерывная функция. Теорема доказана. Замечательно, что по свойствам функции F(x, у), которая нам дана непосредственно, мы можем судить о свойствах функции у = =Дх), для которой непосредственного задания мы не имеем. 208. Неявные функции от нескольких переменных. Аналогично уравнению (1) можно рассматривать и уравнение с большим числом переменных F(x1; х2, ..., х,„ у) = 0. (4) При известных условиях этим уравнением у определяется как «не- явная» функция от п переменных xt, х2, ..., хп: у=Дх15 х2, ..., х„), которая, вообще говоря, будет многозначной. Если подставить ее вместо у, то будем иметь ' F(xn х2, ..., х„, Дх1; х2, ..., х„)) = 0 уже тождественно относительно х1; х2, ..., хп. Мы будем говорить, что в (п + \)-мерном параллелепипеде (а19 Ьу; а%, Ь2; ...; ап, bn; с, d) уравнение(4) определяет у как однозначную функцию от хх, х2, ..., хп, если для любой точки (xL, х2, ..., х„), содержащейся в п-мерном парал- лелепипеде (д? Ьу; а2, Ь2, .afl,
454 ГЛ. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ [208 уравнение (4) имеет один, и только один, корень у в промежутке (с, d). В роли такого параллелепипеда обычно будет фигурировать окрестность интересующей нас точки (х®, х%, ..., х°). Сформулируем теперь относящуюся к уравнению (4) теорему. Теорема III. Предположим, что 1) функция F(x}, ..., хп, у) определена и непрерывна в (п + \)-мерном параллелепипеде ® = И — -^1 > Х1 + Дк > • • • 5 л — г •'•л + i У о ~ Л ’ Уо ’ Л ] с центром в точке (х?, ..., х°п, у0); 2) частные производные F'Xt, ..., F'Xn, Fy существуют и непрерывны в 3) функция F в точке (xj, ..., х°, у0) обращается в пулы, и, наконец, 4) производная Fy в этой точке не равна нулю. Тогда а) в некоторой окрестности точки (х®, ..., х°, у,) уравнение (4) определяет у как однозначную функцию отху, ..., хп: у = f(xy, ..., хп); б) при х1 = хх, ..., хп = х® эта функция принимает значение у0: f(£, ..., х°)=у0; в) функция f(xy, ..., хп) непрерывна по совокупности своих аргу- ментов и г) имеет непрерывные же частные производные fXi, .. На доказательстве мы останавливаться не будем, так как оно совершенно аналогично доказательству теорем I и II. Наконец, в самом общем случае может быть дана система из т уравнений с п + т переменными • ч %п, уу, • . •, Ут) ~ 0, 1 Т2(^1, • • ч хп', уу, ..., ут) = О, | Fti(Xj , . . ., Хп, уу, • • ч Ут) ~ J Здесь речь идет об определении этой системы т переменных у1} ..., ут как «неявных» функций от п переменных хх, х2, ..., хп: Ух==9?1(Х1, . . ., Хп), • • ч Ут = Тт^1’> • • ч *^л)’ так что при подстановке в (5) получаются тождества > • • ч Хп', <Р1(Х1> • • ч Л-л), • • ч -^п)) — • ч • • ч -^л)’ • • ч • • ч ^л)) —0, ч л'л’ ч ^п)> • • • • •> хпУ) 0.
208] § 2. НЕЯВНЫЕ ФУНКЦИИ 455 Говорят, что в (n-i т)-мерном параллелепипеде (й1, Ьу, ап, bn, су, dy, . , ст, dm) система (5) определяет у1} ..., ут как однозначные функции от ху,.. .,хп, если для каждой точки (хх,..., хп) в п-мерном параллелепипеде (alt bt; ...; ап, bn) система уравнений (5) имеет одну, и только одну, систему решений У1, Ут, принадлежащую т-мерному параллелепипеду (С|, dy, ..., ст, dm). Мы видели, что в вопросе о существовании однозначной неявной функции, определяемой одним уравнением (1) или (4), решающую роль играло требование, чтобы в рассматриваемой точке, удовлетво- ряющей уравнению, не обращалась в нуль производная F'y - именно по той переменной, которая подлежит определению как неявная функция. В вопросе же о существовании однозначных неявных функ- ций уг, ..., ут, определяемых системой уравнений (5), к которому мы сейчас переходим, аналогичную роль будет играть якобиан от функций, стоящих в левых частях, по переменным уг, ..., ут: dF дУ1 dF2 dF dy2 dF2 dFr dF2 дУт-i дУт dF2 dF2 Т D(.F,- D(ylt Fm)_ Ут) = дУ! ^Fm— дУ1 dFm дУ1 dy2 dFm-i ду2 dFm dy2 дУт—i дУт dFm—i dFm_i дУт-i дут dFm dFm_ dym-i dym (6) Теорема IV. Предположим, что 1) все функции Fy, ..., Fm определены и непрерывны в (п + т)-мерном прямоугольном параллелепипеде ® = [х?-Д, Xi + z1x; х„-Лп, х°п + Лп; У1-Л1, Ji+Л; • • •; }%-4п, у^+^1 с центром в точке (х£, ..., yj, ..., у®); 2) существуют и непрерывны в ® частные производные от этих функций по всем аргументам', 3) точка (х°, ..., у„) удовлетворяет системе (5); 4) якобиан J [см. (6)] в этой точке отличен от нуля.
456 ГЛ. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ [208 Тогда а) в некоторой окрестности точки (х°, ..у®) система уравнений (5) определяет уг, ..., ут как однозначные функции от хг, ..., хп: У1~/1(.Х1, • • •> Хп), • • •> Ут—1 — fm—1(^1, • • •> Хп), Ут =fm(Xl , • , Хп); б) при хх = х®, ..., хп = х% эти функции принимают, соответственно, значения у?, ..., у«_х, у® : • • •> Х°п)=У1, • • •> /т-1(*?, • • Л®)=у®_15 А»(*ъ ..., х°)=у«; в) функции fr, ..fm непрерывны и г) имеют непрерывные же частные производные по всем аргумен- там. Доказательство поведем по методу математической ин- дукции. При т = \, когда система сводится к одному уравнению, теорема верна (это - теорема III). Допустим теперь, что теорема верна для случая, когда система состоит из т -1 уравнений и речь идет об определении т -1 неявных функций, и докажем ее для систе- мы из т уравнений. Поскольку якобиан J в точке (х®, ..., у„) отличен от нуля, в по- следнем столбце его хоть один элемент в этой точке также не равен нулю; пусть, например, 9fm(xi, • •, Упд Q дУт В таком случае, по теореме III, последнее уравнение, си- стемы (5) - в некоторой окрестности точки (х?, • • •> Jm) _ определяет ут как однозначную функцию от осталь- ных аргументов: Ут=<р(*1, , хп; ух, ..., ym_i), (7) так что тождественно (относительно этих аргументов) имеем Fm(xx, ..., хп; у1г ..., уга_ь <р(хх, ..., yra_i)) = 0. (8) Эта функция <р непрерывна и имеет непрерывные частные производ- ные; кроме того <р($, , х°п; у[, ..., j£_i)=y°m. (9) Важно подчеркнуть, что, поскольку мы ограничива- емся впредь упомянутой окрестностью ®*, урав- нение Fm(xx, ..., хп; ух, ..., ут) = 0 равносильно уравнению (7): в пределах ®* ему удовлетворяют одни и те же системы значений Переменных хг, ..., хп; у1г ут.
208] § 2. НЕЯВНЫЕ ФУНКЦИИ 457 Заменяя последнее из уравнений (5) этим уравнением (7) и под- ставляя функцию (р вместо ут в остальные уравнения системы (5), мы получим новую систему уже из т - 1 уравнений с п + т - 1 пере- менными хп; ух, .л,_1) = 0, ' Ф2{х^ ..хп-, ym_i) = 0, Фщ —1(^1» • • •> Xni У1, . . ., Ут —1)=0, где для сокращения положено (при j = 1, 2, ..., т - 1) Ф](х±, ..хп; ylt .ym-i) = = Fj(Xj , . . Хп, Уу, . . Ут — 1, ^(л^, • • > Ут — 1))- (И) Если выходить за пределы окрестности ®*, то система (5) оказывается равносильной системе (10) с добавле- нием уравнения (7). Поэтому, если нам удастся доказать, что систе- мой (10) в достаточно малой окрестности d* точки (х°, ..., у®_х) т- 1 переменных ух, ..., ym_x определяются как однозначные функ- ции от хп: Л=А(Х1> • хп), , Ут—1~/т—1(.х1> Х„), (12) то в силу (7) и переменная ут определится как такая однозначная функция: Ут ~fm(.xl > • •, xrd ~ =<р(хг, ..хп; f^Xy, хп), fm-1^, хп)), (12а) и заключение а) будет полностью оправдано *). Обратимся же к системе (10) и покажем, что в окрестности точки (vi, • • •> Jm-i) для нее выполняются условия, аналогичные 1), 2), 3), 4). Справедливость первых двух непосредственно вытекает из свойств функций Fj и (р, ввиду (11). Точно так же условие 3), в связи с (11) и (9), дает нам (для j = 1, ..., т - 1) , y°m-i) = Fj(xi, у®_1; <р(х?, ..у°_г)) = =ЭД,..., у°_х, j4)=0- *) Поясним, что (п+т- 1)-мерный (открытый) параллелепипед d* предпола- гается настолько малым, чтобы определяющие его промежутки содержались в соответствующих промежутках, определяющих (л+/и)-мерный параллелепипед ®*. Та окрестность точки (х?, ..., ут), о которой упоминается в заключении а), и определится всеми промежутками, связанными с d*, с присоединением к ним последнего из промежутков, связанных с >3)*,
458 ГЛ. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ [208 Остается лишь рассмотреть якобиан (аналогичный J) •••. Фт-i) О(У1, , Ут-1) d9l d9i dФl dyi dy2 'dym-i dФг dФ2 dФ2 dyi dy2 dym-i d9m-i d&m_i dФm- dyi dy2 ' dym-i и убедиться в том, что он отличен от нуля в точке (х%, ..., Ут-i)- С этой целью преобразуем определитель J, прибавляя к элементам первых его tn -1 столбцов элементы /и-го столбца, умноженные со- dp dp ответственно на —-, ..., =—: дУ1 дУт-i dF1 dyi + dF, dym dp dyi . -^- + dym-i dF, dym dp dF, dym dym-i dF„ dF2 dp dF2 dF2 dp dF, dyi дУт dyi dym-i dym dym-i dym J= dFm_ dFm_1 dp dFm_, dym-i ' dFm_t dp dFm-i dyi dym dyi dym dym-i dym dFm + dFm dp dFm дУт-i dFm dp dFm dyi dym dyi dym dym-i дУт Если считать здесь ут=(р(.хк • • •» Ут-i), то все элементы, кроме на- ходящихся в последней строке и в последнем столбце, будут пред- ставлять собой частные производные от функций Ф7 (по у1г ..., ym-i)- Именно, ввиду (И), дифференцируя Ф7 как сложную функцию по Ун •••> Ут-i [пользуясь правилом п° 181], получим для j= 1, ... ..., т - 1 ЭФ] dFj dFj д<р дФр dFj dFj dtp dyi “ ЙТ1 ' dym dyi’ ' dym-i dym-i + dym dym-i С другой стороны, если продифференцировать по ух, уm-i тож- дество (8) *), то окажется, что dFm dFm dtp _ q dFm dFm dtp q dyi + dym dyi~ ’ " dym-i dym dym-i *) Ведь если (сложная) функция, стоящая в (8) слева, тождественно равна нулю, то и производные ее по любому аргументу - также нули.
208] § 2. НЕЯВНЫЕ ФУНКЦИИ 459 Таким образом, элементы в последней строке (кроме последнего) все равны нулю. Окончательно дФ! дФ1 дУт-1 дУт эф. дФг ЗЕ, дУг ’ дУт-1 дут J= дФт-у Ют-1 ^Fm_l дУ1 дУт-1 дУт 0 .. 0 dFm дУт Разложив этот определитель по элементам последней строки, придем к результату дУт Положим, наконец, здесь л'3=х°, тогда ут = =<р(х1,..., ym-i), в силу (9), обратится в . Так как в этом случае, по условию 4), J отлично от нуля, то не может быть нулем и J*, ч. и тр. д. Для системы (10), содержащей т -1 уравнений, наша теорема предположена верной. Следовательно, система эта в окрестности точки (х?, ..., y®_j) определяет однозначные функции (12), непре- рывные и имеющие непрерывные производные; кроме того, эти функ- ции удовлетворяют и требованию б): АО?, ..., х°)=у[, х»)=у®_1. (13) Отсюда следует, что т-я функция (12а) также непрерывна и имеет непрерывные производные, и, наконец, принимая во внимание (13) и (9): /т(х?, ..., х®)=^(х?, ..., х°п; f^xf, х°), .. ., /т_1(х?, ..., х°)) = =<р(х[, ..х°п; yl, ..Ут_1)=Ут- Теорема доказана. Замечание. Мы обращаем внимание читателя на локаль- ный характер всех теорем существования неявных функций: речь идет все время лишь о некоторой окрестности рассматриваемой точки. Но и в таком виде эти теоремы полезны; например, читатель увидит это в главе VII, где при изучении свойств геометриче- ского образа в данной его точке совершенно достаточно огра- ничиться непосредственной ее окрестностью.
460 ГЛ. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ 1209 (14) (15) 209. Вычисление производных неявных функций. Ход рассуждений, с помощью которых устанавливались теоремы существования неяв- ных функций, в общем случае не давал представления о самом спо- собе вычисления производных (первого порядка) от неявных функций. О производных высшего порядка и вовсе не было речи. Теперь на этих важных вопросах мы остановимся специально. Начнем с простейшего случая, когда дано уравнение (1). Будем считать выполненными, в окрестности рассматриваемой точки, усло- вия теоремы II; существенную роль в дальнейшем будет играть требование F^O. Покажем простой прием для вычисления производной у' (если существование ее наперед известно). Мы знаем, что если неявную функцию y=f(x) подставить в уравнение (1), то оно обратится в тождество [см. (2), 205]. Итак, если под у разуметь именно эту функцию от х, то левая часть равенства (1), F(x, у), представит собой сложную функцию от х, которая тождественно равна нулю. Тогда и производная ее по х также есть нуль. Если про- дифференцировать эту функцию по правилу п° 181, то получим F'x(x, у) + Fy(x, у) - X = 0 *), откуда (так как Fy^O) / Fj(x,y) }х Fy(x, у) ’ мы пришли к уже известной нам формуле [ср. (3) 206]. Теперь можем пойти дальше. Если функция F(x, у) имеет не- прерывные производные второго порядка, то выражение, стоя- щее в формуле (15) справа, может быть продифференцировано по х, следовательно существует и производная от у', т. е. вторая про- изводная у"г, от неявной функции у. Выполняя дифференцирование и подставляя всякий раз вместо у' ее выражение (15), найдем „ (Fxy + Fy* у'х) Fx - (Fx< + Fxy Ух) Fy _ Ух‘ - „'2 ty — ^Fx • Fy • Fxy — Fy2 • Fxs - Fx2 • Fy«. Fy3 отсюда же видим, что вторая производная будет непрерывной функ- цией от х. Если функция F(x, у) имеет непрерывные производные треть- его порядка, то, очевидно, существует и третья производная от неявной функции: y'yF, ее выражение снова может быть получено *) Собственно, такого же типа рассуждение мы уже проводили выше. Ср. сноску на стр. 458.
209] § 2. НЕЯВНЫЕ ФУНКЦИИ 461 непосредственным дифференцированием выражения для у",, и т. д. С помощью математической индукции легко доказать, что существо- вание непрерывных производных функции F(x, у) до k-го порядка (k > 1) включительно обеспечивает и существование (непрерывной) производ- ной k-го порядка от неявной функции. После того как, таким образом, самый факт существования по- следовательных производных от неявной функции установлен, вы- числение их проще производить путем повторного дифференцирова- ния тождества (14), с учетом того, что у есть функция от х. Например, первое же дифференцирование этого тождества даст нам Fx* (F'xy+ Ру‘-У'х)-Ух i ^-^ = 0, (16) откуда (ведь F(,^0!) „ F'^ + 2Fx'y-yx+ Fy‘-у'х . ух,~ , подставив вместо у'х его выражение (15), вернемся к уже найденному выражению для и т. д. Аналогично обстоит дело и в случае уравнения (4) с большим чис- лом переменных. Здесь предполагаем выполненными условия теоремы III. Если под у разуметь неявную функцию, определяемую уравнением (4), то (4) превращается в тождество. Фиксируя значения х2, ..хп и рассматривая у как функцию лишь от продифференцируем это тождество по , , , р' FXl',- Fv • УХ1 = °- откуда yXt = - -• J-; 1 У точно так же получим УХг = , Ухп = -и т. д. Fy " Fy Если нужны все производные первого, второго, ... порядка, то проще сразу вычислять dy, d2y, ... Продифференцируем же наше тождество полным образом, т. е. приравняем нулю полный дифференциал от его левой части [используя при этом инвари- антность формы первого дифференциала, 185]: dF , dF , dF , dF , „ „ — dx. dx„ ! ... — — dxn 4- dy = 0, 1 Эх2 - dxn ‘ dy так что 8F dF d>' OF dX'- дхп у _ Q F ax„ dy dy В то же время = dx". ‘ • dv , 1 dx>‘ • dxn
462 ГЛ. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ [209 Ввиду произвольности dx,, ..dxn, отсюда ясно, что dF dF ду _ дх, ду _ дхп дх, dF ’ " дхп dF ’ ду ду как мы и получили выше. Дифференцируя еще раз, получим ra2F , , , d2F , d2F , ] , dF „ _ и определим (Ру, что приведет нас к выражениям для д2у д2у д2у дх2 ’ дх, дхг’ дхг ’ ’ ' ' ’ и т. д. Мы видим, что во всех этих выкладках основную роль играет условие, что г;=|^0. у дУ Перейдем теперь к рассмотрению системы уравнений (5). Будем предполагать, что в окрестности взятой точки выполняются условия теоремы IV. Снова обращаем внимание на роль, которую будет играть требование J^O. Мы знаем, что неявные функции д, ..., ут имеют частные произ- водные по х,, ..., хп. Самое вычисление их производится диф- ференцированием тождеств, которые получаются из (5), если под У1> > Ут разуметь именно упомянутые неявные функции. Диффе- ренцирование по х„ например, дает ду( ц. 4. дУт п 1^+^д^+---+~д^~д^~^ dFm dFm дУ1 dFm дут __ q дх, ду, дх, ‘ ’ + дУт дх, ~ Это - система линейных уравнений относительно неизвестных , ..., , с отличным от нуля определителем OXi 0X1 D(F„..., Fm) D(y,...ут) ' Отсюда Д(Л, , Fm) D(F„..., Fm) дУ1_ _ D(x,, ..., Ут) дУт = _ Р(У1, •••, *i) дх, D(F„..., Fm)’ дх, D(F,..................Fm) ' О(У1....Ут) D(j„ ..., ут)
210] § 2. НЕЯВНЫЕ ФУНКЦИИ 463 Аналогичные выражения получаются и для производных от у±, у т по х2, ..., хп. Если функции Flf Fm имеют непрерывные частные произ- водные второго порядка, то правые части всех полученных фор- мул имеют (непрерывные) производные по всем аргументам, следо- вательно, существуют (непрерывные) вторые производные от не- явных функций. Вообще (как это легко доказать индуктивно) суще- ствование для функций Flf ..., Fm непрерывных производных до к-го порядка включительно влечет за собой существование и непрерывность всех производных k-го порядка и для неявных функций. Вычисление производных от неявных функций и в общем случае также производится либо дифференцированием тождеств (5) по тем или другим переменным, либо дифференцированием их полным образом. Получаемая для определения производных или дифференциалов система линейных уравнений своим опреде- лителем всегда имеет отличный от нуля якобиан J. Эти замечания станут более ясными на примерах. 210. Примеры. 1) Пусть у связано с х уравнением In Vx2+y2= arctg — . х Дифференцируя последовательно по х (причем у считаем функцией от х), получим затем х+уу' _ху'-у х2+у2 ” х~+у2 или х+уу'= ху’-у; 1+у'2+уу"--=ху''; и т. д. Из первого уравнения находим , х + У у =-----, Х-У из второго (если подставить найденное значение у') 1+У2 х2+у2 у ' =---= 2-------, Х-У (х-у)3 и т. д. 2) Дано уравнение F(x, у) = х2+у2- Заху = 0. Требуется найти экстремумы определяемой им неявной функции у от х. Имеем здесь Fi=3(x*-ay), Р$=3&-ах). Ввиду (15), для того чтобы было Ух = 0, должно выполняться равенство Т( = 0. Решая совместно уравнения F-0 и F^-O, найдем две пары соответственных значений х и у: з _ з _ х = 0, у^О и х = аЦ2, у=а^4.
464 ГЛ. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ [210 Но в первой точке обращается в нуль и Fy, так что мы не можем утверждать, что в ее окрестности наше уравнение определяет у как однозначную функцию от х; поэтому точку (0, 0) оставляем в стороне. з Во второй точке Fy = За2]/2^0, и к ней приложима теорема II. Чтобы убедиться z з _ в наличии экстремума, вычислим ух> при х = а проще всего исходить из (16), полагая там у'х = 0; „ F'i Ух!=_~г*)- Fy з_ Так как Fxs = 6х =-0 при х = а\1, то ух*<0, и налицо максимум. 3) Пусть неявная функция z от х, у определяется уравнением Имеем у2 р2 ~2 -+-+-=1. а2 Ь2 с2 последовательно так что х dx у dy zdz с2х . 1 1 = 0, dz = dx a2 b2 с2 a2z dz c2x dz c2y c2y dy, Затем dx a2z ’ dy b2z dx2 dy2 dz2 z d2z +—+ — + = 0, a2 b2 c2 c2 откуда (если воспользоваться известным уже выражением для dz) с1 Г(х2 z2\dx2 2ху , (у2 z2\dy2l d2z =----11----1—I-----1-----dx dy+1 —H—I — I, z3 L (a2 c2) a2 a2b2 (Z>2 c2) b2 J что дает нам c4 (x2 z2\ d2z caxy a2z3 (a2 c2) ’ dx dy asb2z3 ’ ca (y2 z2\ ---------1--- И T. Д. 62z3 \b2 c2) d2z дх2 d2Z ду2 4) Пусть z определяется, как функция от х и у, из уравнения z = x+y-tp(z). Предполагая l-y-g/(z)^O, доказать, что dz r dz —=®(z)---------------------------------------. ду дх Имеем dz дх l-y-p'(z)’ откуда и вытекает требуемое. 5) Пусть из уравнения dz <f(z) ду \-y<p'(z)' y=X95(z)+y(z) 1 *) Это - не общее выражение для ух~-; оно годится лишь в интересующей нас точке (а У 2, а У?) .
210] § 2. НЕЯВНЫЕ ФУНКЦИИ 465 переменная z определяется как неявная функция от х и у. Предполагая x-<p'(z)+ +y'(z)^0, установить, что эта функция удовлетворяет дифференциальному урав- нению d1 2z (dz\2 dz dz d2z d2z (dz}2 ---— -2----------------1----— =0 dx2 Цу/ dx dy dxdy dy2 Idx J ИЛИ где для краткости положено dz ~dy=q’ dz Dx Р’ г-q- - 2pq 5 + t-p2 = 0, d2z ----= r, dx2 d2z dy2 d2z ----= 5, dxdy Последовательно дифференцируя no x и по у, получим y(z) + [х - y'(z) +y'(z)J -p = 0, [x • y'(z) +y'(z)] • q = 1 и, далее, 2y'(z)-p+ [x-y"(z)+ y''(z)]-p2 + [x-y'(z) + y'(z)l- r = 0, у '(z) • q + [x • у "(z) + у "(z)] -pq + [x • у '(z) + у'(z)] • s = 0, - 2pq З2 [x-<p"(z) + y>"(z)]-q2+ [x-<p'(z)+y>'(z)]-1 = 0. P2 Сложив последние три равенства, предварительно умноженные на q2, -2pq, р2, и придем к требуемому соотношению. 6) Пусть дана система х+y+z+u = a, x2+y2+z2 + u2 = b2, х3+у3+г3+г^ = с3, определяющая у, z, и как функции от х. Имеем l+y'+z' + «' = 0, x+yy' + zz' + i«/ = 0, x2+y2y'+z2z' + u2u' = 0. Предполагая определитель 1 1 Z Z2 1 « = (z-y)(u-y)(u-z) u2 не равным нулю, имеем отсюда (z - x)(u - х) у =------------и т. д. (z-y)(M-y) 7) Пусть переменные х, у, z связаны с переменными г, 0, у соотношениями х-r-cos 0 cosy, у = г- sin 0 cosy, z=r-siny, л У где 0 <г 2 ’ 2 2 Якобиан D(x, y, z) D(r, 0, Ф) cos 0 cos у = sin 0 cos у siny - г sin 0 cos <р г cos 0 cos у 0 - r cos 0 sin у - r sin 0 sin у = r2 cos у =- 0. r cosy Упомянутые соотношения определяют г, 0, у как функции от х, у, z. Для вы- числения производных этих функций продифференцируем эти соотношения пол- ным образом: cos 0 cosy dr- г-sin 0 cosy d6 - r-cos 0 siny dp = dx, sin 0 cosy dr+ r-cos 0 cosy dti- r-sin 0 siny d<p = dyt siny dr + r-cosydy = dz. 30 Г. М. Фихтенгольц, т. I
466 ГЛ. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ (210 Отсюда определим dr, df) и dp-. r2-cos0cos2® r2sin0cosz® r2-sin®cos® </r=-----------------------dx+--------------dy+------—------ dz, rsin0 , r-cos0 , <Z0 ---J— ------J— r-cos 0 siny cos® r-sin 0 sin® cos® r r-cos2?> dtp ----——~------------dx------------------------dy H----— dz. J Этим, собственно, уже и найдены интересующие нас производные (если учесть указанное выше значение J): dr dr =sin 0 cos p, dr «sin <pt — = cos в cos®, • — dx dy dz df) sin 0 d9 cos 0 d9 n dx r-cos<p’ dy r*cosp8 9 dz u, dtp cos 0 sin p dp sin 0 sin p dp cos 9? dx r dy r 9 dz r Предложенные уравнения легко решить относительно г, 0, р: г = 16г2+у2+г2, 0 = arctg — , р = arctg—----. х )/х2+у2 Это дает возможность вычислить все эти производные и тем проверить найден- ные результаты. 8) В качестве заключительного примера на дифференцирование неявных функций выведем еще одну формулу, снова подчеркиваю- щую аналогию между якобианом системы функций и производной одной функции. Пусть дана система п уравнений с 2п переменными: Гг(х1; х2, ..., хп\ ylt у2, ..., уп) = 0 (/= 1, 2, ..., и). Предполагая якобиан DU\, F2,..., Fn) О(У1, у г..Уп) отличным от нуля, рассмотрим ylt у2, ..., уп как функции от хг,х2, . ..,хп, определяемые этой системой уравнений и, следователь- но, обращающие их в тождества. Дифференцируя эти тождества по каждому Xj, результаты можем представить в виде dFj _ dFj dyi dFj dy2 dF/ dyn dxj ду,. dxj dy2 dxj dyn dxj ' 2,...,п). Определитель, составленный из левых частей этих равенств, есть / _ 1 Ptfi > F2, • • •, Fn) . ' D(xlt х2, ..., хп) ’
211] § 3. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ ТЕОРИИ НЕЯВНЫХ ФУНКЦИЙ 467 определитель же, составленный из правых частей, очевидно, пред- ставляет собой произведение определителей Wi, F2, ..., Fn) и Dty’i, уг, ..., уп) Р(У1, у2, уп) D(xl, х», ..хп) [см. 203 (3)]. Отсюда получается формула ...Fn) D(y\, Уп)Ь{хг, хп) IKxi, . .7, х„) 4 ’ D(Flt , Fn) ’ D(yt, уп) являющаяся аналогом формулы (15). Если уравнения даны в виде, разрешенном относительно х,, х2, хп-. x^fPiiyt, Уч, •••, Уп) (1=1, 2, ..., и), то под рассмотренный случай это подойдет, если положить -ср,-х,-. Так как здесь ~- = -1 или 0, смотря по тому, будет ли i^j или 0Хj i j, то числитель сведется к -1 0 ... 0 0 -1 ... 0 = (-!)", 0 0 ... -1 и формула примет вид Р(У1, •••, Уп) _ 1 Z>(xj...Хп) О(%1, •хп) D(yt, ...,Уп) Этот результат нам уже знаком [203 (4)]. § 3. Некоторые приложения теории неявных функций 211. Относительные экстремумы. Рассмотрим вопрос об экстре- муме функции /(хп ..., хп+т) от п + т переменных в предположе- нии, что эти переменные подчинены еще т уравнениям связи Ф((хх, ..хп, хп+1, х„+т)=0 (1) (z = l, 2, ..., т). Мы уточним понятие о таком относительном экстрему- ме и укажем приемы для его разыскания. 30*
468 гл. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ [211 Говорят, что в точке М0(х%, ..х°+т), удовлетворяющей уравнениям связи, функция f(xr, ..., хп+т) имеет отно- сительный максимум (минимум), если неравенство J(xr, ..xn+ra)«s/(x?, ..., A'n+m) выполняется в некоторой окрестности точки Мо для всех ее точек (х1; ..., хп+т), удовлетворяющих уравнениям связи. Мы будем предполагать, что как функция f, так и функции Ф, имеют в окрестности рассматриваемой точки непрерывные частные производные по всем аргументам. Пусть, далее, в точке Мо отли- чен от нуля хоть один из определителей т-го порядка, составленных из матрицы частных производных *) ЭФг дФ1 дФг ЭФ1 $Xi dx^ 5-Vzi+m ЭФ.2 дФг дФ- '>Ф'- dxi дхп dxn^-i дхц^.^15 дФт дФт дФт дФт dxt ' ' ' дхп dxn+i ‘ ’ 'дхп +т например, определитель 2)(Хл-|-1» Хп^т) &хп+т ЭФ2 дФ2 дхп + \ дхп+т ЭФт дхп-\ -т Тогда, если ограничиться достаточно малой окрестностью точки Мо, по теореме IV система (1) равносильна системе вида ХЛ+1=<Р1(Х1, • • , хп), ..., Хп+т=срт(х1, ..., хп), (4) где tplt .,<рт суть неявные функции, определяемые системой (1). Иными словами, требование,-чтобы значения переменных х1г ..., хп, хп+г, ..., хп+т удовлетворяли уравнениям связи (1), можно заменить предположением, что переменные xn+i, ..., xn+m предста- вляют собой функции (4) отхх, ...,хп. Таким образом, вопрос об относительном экстремуме для функции f(xY, ..., xn+m) от п + т переменных в точке М0(х%, ..., х„, x„+i> •••> хп+т) сводится к вопросу об обыкновенном (абсолютном) экстремуме для !) В этом случае говорят, что матрица (2) имеет (в точке ЛГ0) ранг т.
211] S 3. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ ТЕОРИИ НЕЯВНЫХ ФУНКЦИЙ 469 сложной функции от п переменных /(лу, ..хп; хп), ..99от(л-1; ..х„)) (5) в точке Р0(л?, . л°). Эти соображения указывают и на реальный путь для нахождения точки, доставляющей относительный экстремум функции/(лу,..., xn+m): если мы умеем фактически разрешить уравнения связи, например, относительно переменных хл+1, ..., хп+т, и найти явные выраже- ния для функций (4), то дело сводится к нахождению абсолютного экстремума для сложной функции (5). Собственно говоря, мы так именно и поступали в ряде ранее решенных задач [200, 201], например, когда мы искали наименьшее значение для суммы x+y+z+t при условии xyzt = с4, и т. п. Укажем теперь другой путь для нахождения точки М0(х?, .. ., хл+т), не предполагая, что мы имеем явные выражения для (неявных) функций (4), хотя существованием этих функций мы будем пользоваться и здесь. Итак, пусть в точке Мо функция f(xr, ..., хп<т) имеет отно- сительный экстремум или - что то же - сложная функция (5) в точке Ро имеет экстремум абсолютный. Тогда, по замечанию I п° 196, в этой точке должен обращаться в нуль ее дифференциал и притом - тождественно относительно дифференциалов незави- симых переменных dxY, ..., dxn. По инвариантности формы пер- вого дифференциала [185], это условие можно записать так: где под dxn+i, ..., dx„+n разумеются дифференциалы функции (4) в точке Ро, в то время как частные производные вычислены в точке Мо, ибо (как явствует из теоремы IV) PiOt ..., х°) = х®+1, ..., фл,(х?, ..., х«)=х"+л1. (7) Из (6) нельзя, конечно, заключить о равенстве нулю коэффициентов при дифференциалах, так как не все эти дифференциалы произвольны. Для того чтобы свести дело к произвольно выбираемым дифферен- циалам, т. е. к дифференциалам dxy, ..., dxn независимых переменных, мы постараемся исключить отсюда дифференциалы <7х„+1, ..., <Zxn+m переменных зависимых. Это легко сделать, если продифференцировать полным образом уравнения связи (1), разумея под хл+1, ..., хл+ш функции (4) *): 2 0 = 1, 2, т). (8) ;=i °xi *) Точнее говоря, мы дифференцируем те тождества, которые получаются из уравнений (1), если вместо хп+1, • •., хГ1+т в них подставить неявные функции (4). Подобный способ речи мы будем применять и впредь.
470 ГЛ. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ 1212 Здесь, как и выше, ввиду (7), частные производные вычислены в точке Мо. Так как, по предположению, определитель (3) в этой точке - не нуль, то dxn+i, ..dxn+ni могут быть отсюда линейно выражены через dx1, ..., dxn. Если эти выражения подставить в (6), то получится равенство вида Аг dxr + ... +А„ dx„ = 0, где А}, ..., Ап означают п выражений, рациональных относительно частных производных функций Фу, и здесь взятых в точке Мо. Так как в этом равенстве фигурируют только дифференциалы dxr, ..., dxn независимых переменных, то в точке Мо имеем Д = 0, ..., Л„ = 0. Вместе с уравнениями связи это дает п + т уравнений для опреде- ления неизвестных ..., хл+т. Конечно, мы установили лишь необходимые условия для экстремальной точки М0(х%, ..., х°+т). Но и в таком виде условия могут быть полезны даже для разыскания наибольшего (или наи- меньшего) значения функции f при условиях (1), если по характеру вопроса наперед ясно, что внутри рассматриваемой области должна существовать точка, где это наибольшее (наименьшее) значение до- стигается, или если такое допущение сделано в порядке наведения, с тем чтобы найденную точку апробировать другими соображениями. Примеры приведены ниже, в 214. 212. Метод неопределенных множителей Лагранжа. В изложенном выше способе нарушается симметрия в отношении переменных: часть из них трактуется как независимые, часть - как зависимые, одни дифференциалы исключаются, другие сохраняются. Иногда это влечет за собой усложнение выкладок. Лагранж предложил метод, при котором все переменные сохраняют одинаковую роль. Умножим равенства (8), соответственно, на произвольные пока («неопределенные») множители 2,- (i = 1, 2, ..., т) и результаты почлен- но сложим с (6). Мы получим равенство ( д-Г Д- 7 , 1 J _ Q Д 1 (9) где по-прежнему dxn+i, ..., dxn+m означают дифференциалы неявных функций (4) (в рассуждении мы пока сохраняем неравноправие переменных); производные вычислены в точке Мп. Выберем теперь значения множителей (i = 1, ..., т) так, чтобы обращались в нуль именно коэффициенты при зависимых дифференциалах dxn+i, ..., dxn+m: <10) 0ХJ (/Xj (fXj (J=n + 1, ..., n + tri).
212] § 3. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ ТЕОРИИ НЕЯВНЫХ ФУНКЦИЙ 471 Это сделать можно, поскольку определитель (3) системы линейных уравнений, получающейся для определения Ах, /.т, отличен от нуля. При выбранных значениях множителей равенство (9) при- мет вид Здесь мы снова имеем дело лишь с дифференциалами независи- мых переменных, поэтому коэффициенты при них должны быть нулями, т. е. наряду с (10) имеем и , 30 №1 | | 30 №m . а (10*) 0 = 1, 2, Итак, для определения п + т неизвестных хх, ..., хп+т, да еще т множителей Ах, ..., Ят, имеем столько же уравнений, именно т урав- нений связи и п + т уравнений Э/ । з , дФт 0 dxj 1 dxj ’ ' ‘ т dxj (j= 1, 2, ..., п + т) [см. (10) и (10*)]. Для того чтобы облегчить выписывание этих уравнений, обыкно- венно вводят вспомогательную функцию F=f+^1<P1+ •. • + 2тФт; тогда упомянутые уравнения могут быть записаны в виде £ = 0 0=1, 2, •••> п+т). (11) 0Xj Они выглядят так же, как и условия обыкновенного экстремума для функции F. Это следует рассматривать лишь как указание, облег- чающее запоминание. И метод Лагранжа приводит к необходимым условиям. В остальном здесь может быть повторено то, что было сказано в конце предыдущего номера. Замечание. В изложенной теории существенную роль играло предположение о ранге матрицы (2), которым мы вос- пользовались трижды. При решении задач одним из указанных ме- тодов - для уверенности в том, что не пропущена ни одна точка, доставляющая функции относительный экстремум, - следовало бы предварительно установить, что упомянутое предположение выпол- няется на деле во всех точках рассматриваемой области, удовле- творяющих уравнениям связи. В простых случаях мы будем предо- ставлять это читателю.
472 ГЛ. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ [213 213. Достаточные для относительного экстремума условия. По этому поводу мы ограничимся немногими замечаниями. Предположим существование и непрерывность вторых производных для функ- ций /и Фу (у = 1, 2, т). Пусть теперь точка М0(х?, ..., х„+т), со- вместно с множителями Я®, . ..,Я®, удовлетворяет установленным выше необходимым условиям. Вопрос о наличии в этой точке (относительного) экстремума за- висит, как и в 198, от знака разности Xn+m) ~_/"(xJ, • • •> -*n+m)j с той лишь существенной оговоркой, что и точка (хх, ..., хп+т) удо- влетворяет уравнениям связи (1) или - что то же - (4). Легко понять, что для таких точек приращение функции f может быть заме- нено приращением функции F (где все множители Я,- мы считаем равными Я?): Л = /(%!, ..., хп+т)~ F(x?, ..., х°+т). Ввиду того, что в точке Мо выполняются условия (11), - в этом-то и состоит выгода перехода к функции F, - это приращение, по фор- муле Тейлора, может быть записано так [ср. 198, (8)]: = U Z AjkAxjAxk + ~Z <xjhAxjAxk], z />*=1 J где Лху = xj - Xy, Ajk = F^t(x?, ..., x»+m) (j, k=l, 2, ..., n + ni) и ayft->-0, если Лх1-*0, ..., Лхп-*0 (остальные приращения Axn+i, ... ..., Axn+m при этом сами собой будут бесконечно малыми по не- прерывности функций (4)). Если заменить здесь все приращения Axj соответствующими дифференциалами dxj, то по отношению к независимым пере- менным это вообще ничего не изменит; что же касается зависи- мых переменных, то произведенная замена вызовет лишь необхо- димость поставить вместо коэффициентов ay7f другие бесконечно малые ftjk- А = Ц Z AJk dxj dxk+ Z Pile dx, dxA. z (y,*=i 7,*=i J Переход к дифференциалам выгоден потому, что дифференциалы зависимых и независимых переменных связаны системой линей- ных соотношений (8). Так как определитель (3) в точке Мо, по пред- положению, - не нуль, то отсюда зависимые дифференциалы вы- разятся линейно через независимые. Подставив их выражения в А,
214] § 3. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ ТЕОРИИ НЕЯВНЫХ ФУНКЦИЙ 473 мы, вместо первой суммы, получим квадратичную форму относительно дифференциалов dx±, ...,dxn. А теперь, так же как и в 198 и 199, можно показать, что: если эта форма будет определенной и притом положительной (отрицательной), то в испытуемой точке будет относительный минимум (максимум): если же форма оказывается неопределен- ной, то относительного экстремума нет. Впрочем, практическое значение этого критерия невелико (ср. за- мечание в 200). Перейдем к примерам и задачам. 214. Примеры и задачи. 1) Пусть требуется найти экстремум функции f= x+y+z+t при условии Ф = хут/-с4=0; область изменения переменных опре- деляется неравенствами х=-0, у=-0, z>0, t>0. Мы уже решали эту задачу в 200, 4) фактически выражая t из последнего условия. Теперь, дифференцируя это ра- венство полным образом, найдем dx dy dz dt (dx dy dz\ ---1--i-1— = 0, откуда dt = -1 1-----1— . x у z t (x у z) Исключая dt из равенства df^dx + dy + dz+dt^O, придем к результату ( zi ( t} ( t\ I--<Zx + 1--dy+l 1-----dz-0, x J V У' v z) который, ввиду произвольности dx, dy и dz, распадается на три: t t t 1--= 0, 1------0, 1---=0, X у z так что x=y-z=t=c. Применяя к той же задаче метод Лагранжа, введем вспомогательную функцию F=x+y+z+t+/.xyzt *) и составим условия: Fx= 1 + 2yzZ = 0, ..., F(= 1 + Лхуг= 0, откуда yzt = xzt = xyt = xyz, так что x=y = z=t=c. Для того чтобы воспользоваться результатом предыдущего п°, вычислим , 1 Л=----и рассмотрим функцию с3 Ее второй дифференциал (в точке х = у = z = t = с) будет 2 d2F=----(dx dyidx dz+dx dt-\-dy dz \ dy dt + dz dt). c Дифференцируя уравнения связи (все в той же точке), получим dx+dy+dz+dt = O. *) Если вспомнить роль этой функции, то станет ясно, что постоянное слагае- мое в составе Ф здесь может быть опущено без вреда.
474 ГЛ. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ [214 Если определить отсюда dt и подставить в предыдущее выражение, то оконча- тельно найдем 2 , 1 -----[dx dy+dx dz+dy dz-(dx+dy+dz)2] = — [(dx+dy+dz)2+dx2+dy2+dz2[. c-----c Так как эта форма, очевидно, определенная и положительная, то в найденной точке будет относительный минимум. [Отсюда, однако, нельзя сделать заключение, что этот минимум будет и наи- меньшим значением функции f=x+y+z+t при указанной связи между значе- ниями ее аргументов; ср. 200, 4)]. 2) Станем вновь [ср. 200, 2)] искать наименьшее и наибольшее значения функции и = а2х2+Ь2у2+c2z2 - (ах2+by2 4- cz2)2 (a^Z>=-c=-0) при наличии связи: x2+y2+z2 = 1, т. е. на сферической поверхности, выраженной этим уравнением *). С этой целью, сначала найдем по методу Лагранжа все относительные экстремумы функции. Вспомогательная функция F = а2х2+b2y2+c2z2 - (ах2+by2+cz2)2+Я.(х2+у2+z2) приводит к условиям: х [(а2+Я) - 2а(ах2+by2 + cz2)] = О, у [(Ь2+Я) - 2b(ax2+by2+cz2)] = О, z[(c2+ Я) - 2с(ах2+by2+cz2)] = О, к которым надлежит присоединить еще уравнение связи. Отсюда (1) х=0, 7=0, z= ±1 (и = 0); (2) х=0, у= ±1, z=0 (и = 0); (3) х= ±1, у = 0, z=0 (и = 0); (4) х = 0, у= ± —, z= ±—^ (и = — (Ь-с)21; 72 72 4 ) 1 1 ( 1 ) (5) х = + — , у = 0, z = ± — и = — (а - с)2 ; 72 72 I 4 ) 1 1 ( 1 , 'I (6) х= + — , 7=± —, z=0 и = —(а-Ь)2 . 72 72 ’ 4 ) Выбирая из указанных в скобках значений и наименьшее и наибольшее, мы и при- дем к решению задачи [ср. 200, 2)]. 3) Вернемся к задаче о наивыгоднейших сечениях проводов в электрической сети с параллельным включением [201, 8)]. Сохраняя принятые там обозначения, будем искать экстремум функции №1, 42, •••> 4п) = 4?1 + 4?2+--- + ^1 при условии, что oinJn Ф(Я1, Ч2....?п) =------1---1-...+------= е; 41 ?2 Чп *) Ввиду того, что эта поверхность представляет замкнутое ограниченное множество, существование на ней точек, где функция принимает наименьшее и наибольшее значение, вытекает из теоремы Вейерштрасса [см. замечание в конце п° 173].
214] § 3. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ ТЕОРИИ НЕЯВНЫХ ФУНКЦИЙ 475 при этом мы не станем даже вводить, взамен qlt q2, • •, qn, другие переменные, как сделали это выше, ибо нашими новыми методами задача и так решается просто. Итак, дифференцируя полным образом уравнение Ф = 0, получим затем следующее выражение для дифференциала dqn: , , In-iJn—1 . I Оди - - ——- •! —— dqx + ... 4-----dqn-i }•. lnJn I <7? (7л—i J Подставляя его в равенство df--- J dqt + dq,:_\ I- ln dqn = 0, придем к результату: (. qn , (, qn ln-iJn~i\ , „ I <i-------- a?i+ • • • +1 In-1--------- dq,, .-! = 0. \ Jn qi J \ Jn qn-i J Так как dqlt ..., dqr-r уже произвольны, то коэффициенты при них порознь нули, откуда 2 2 2 2 _<?2 £7n-i qn Jn-l Jn и q! = ^Ji, q2 = /.yx, ..., qn = ^YJn- (12) Множитель пропорциональности ?. легко определить из уравнения связи: 2 е /=1 Если применить метод Лагранжа, то нужно построить вспомогательную функцию *) (4*^1 lnJn\ -----I- ... 4- <71 qn J и приравнять нулю ее производные: 1)F №1^ dF t WnJn „ --= 7,------=0, ..., ---=/n-----— = 0, dqi ql dqn qn откуда снова получаем (12), и т. д. 4) В качестве более сложного примера рассмотрим такую задачу: трехосный X2 у2 Z2 эллипсоид—I----1—=1 (а>Ь>с) пересечен плоскостью lx+my+nz = 0, прохо- а2 Ь2 с2 дящей через его центр; требуется определить полуоси получающегося в сечении эллипса. Иными словами, нужно найти экстремальные значения функции г2 = = x2+y2+z2, если переменные подчинены указанным выше двум уравне- ниям связи. Метод исключения зависимых дифференциалов [211] здесь приводит к слож- ным выкладкам; поэтому мы сразу прибегнем к методу Лагранжа. Для того чтобы убедиться, что ранг матрицы (х у z'' а2 Ь2 с2 I т nJ *) «Неопределенный множитель» мы для удобства берем в форме А2 и вклю- чаем в него постоянную о.
476 ГЛ. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ (214 равен 2 во всех точках пересечения эллипсоида с плоскостью *), допустим против- ное. Из обращения в 0 всех определителей второго порядка следует пропорцио- нальность элементов верхней и нижней строк; но тогда равенство lx+my+nz=0 X2 у2 Z2 влечет за собой —I--1— = 0, что невозможно. а2 б2 с2 Составив вспомогательную функцию у2 g2 \ — + 77+-Т + 2Д(/х+ту+nz\ а2 62 с2) приравняем нулю ее производные: (13) х+л- —-+fil=0, у+Я.^-+/ОИ = 0, z+2.'^-+fin = 0. а2 о2 С“ Умножая эти уравнения, соответственно, на х, у, z и складывая, получим (с учетом уравнений связи), что 2 = - г2. Если предположить, для определенности, что ни одно из чисел I, т, п не равно нулю, то из (13) можно усмотреть, что г не равно ни а, ни Ь, ни с. Тогда уравне- ния (13) перепишутся в виде: /а2 m/>2 /;с2 х= -и--------, у = -и--------, z= -и---------. а2 - г2 Ь2 - г2 с2 -- г2 Отсюда легко найти д, а с ним и х, у, z; но минуя это, можно, сложив эти ра- венства, предварительно умноженные на /, т, п, получить уравнение Ра2 т2Ь2 п2с2 ------[------1--------= О, а2 — г2 Ь2 — г2 с2 — г2 откуда непосредственно и определяются интересующие нас два экстремальные значения г2. Так как существование этих экстремальных значений наперед известно, то здесь, таким образом, получается полное решение вопроса. 5) Наконец, предложим себе найти наименьшее и наибольшее значения квадра- тичной формы Л /(Xi, Х2, • •, Хп) = aikxixk (.aik “ aki) i,k=l при условии у(Х1, х2, ..., Хп) =- xj+х2 + • • • + Хп = 1 **). (14) Составим функцию Лагранжа F(xlf х2, ..., хп) “/(xj, х2, . ., Хп)- 2(Х1 + хг+ +х„). Исключая Xj, х.>, .... хп из условий 1 i)F 1 — ---= ~ /.)• • • • + -- 0, 2 5хх 1 d'F ------•sa.,1.x1 + (an2-A).x.,+ • +а„гГп = 0, k 2 <Эх2 ' (15) — ---= dni ’ х2 + • х2 + • -I (п/ш ~ 2) • Хп — 0, 2 дхп *) См. замечание в 212. **) Здесь можно сделать замечание, аналогичное сноске на стр. 474.
215] § з. некоторые приложения теории неявных функций 477 придем к уравнению л-й степени а\Х ~ а2Х й22“/<’ — П 8гц 8'1* * * * П/7/7 относительно /I. Если /. есть один из его корней, то системе (15) линейных уравне- ний можно удовлетворить значениями xlt х2, , хп, не сплошь равными нулю; умножив их на надлежащий множитель, можно добиться и выполнения условия (14). Однако определение этих значений не представляет для нас интереса, ибо, как увидим, вопрос о наименьшем и наибольшем значениях функции f решается и без них. Действительно, умножая равенства (15), соответственно, на х,,х2, ...,хп и почленно складывая, придем к равенству /(х,, х2, . .., Хп)~Л(Х1+х1+ ..+*„) = О или, в силу (14), /(Х1,Х2, ..., Хп) = /.. Таким образом, если Я удовлетворяет уравнению (16), то значение функции f в соответствующей точке (xlt х2, ..., хп) и равно самому Я. Мы приходим к изящному результату: искомое наименьшее и наибольшее значения функции/, при соблюдении условия (14), совпадают с наименьшим и наи- большим из (вещественных) корней*) уравнения (16). 215. Понятие независимости функций. Рассмотрим систему функций JT =/1(*1>А2, Уг =/201 > *2> •>*„), ym=fm^l>X2, ...,ХП), определенных и непрерывных, вместе со своими частными производ- ными, в некоторой «-мерной открытой области g). Рассмотрим случай, когда значение одной из них, например, j;-, однозначно определяется совокупностью тех значений, которые принимают остальные функции (Ун .-^yj-nyj+i, Точнее говоря, если $0 есть множество таких (т - 1)-мерных точек, отвечающих всевозможным точкам (х1э ...,хп) в ®, то предпола- гается, что в $0 будет иметь место функциональная зависимость У}=<Р(У1> ^yj-^yj+n ,ут), (18) причем это равенство оказывается тождеством относительно х в <g), если вместо всех у, подставить функции (17) **). Тогда *) Впрочем, можно доказать, что все корни этого уравнения будут веще- ственными. **) Существенно, что функция <р в числе своих непосредственных аргументов не содержит х.
478 ГЛ. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ [215 говорят, что в области <g) функция yj зависит от ос- тальных. Впрочем, для того, чтобы иметь возможность применять дифференциальное исчисление, мы включим в определение еще тре- бование, чтобы функция <р была определена и непрерывна со своими частными производными в некоторой открытой области g (ти-1)- мерного пространства, содержащей множество g0. Если, в частности, одна из функций (17), yj, сводится к постоян- ной, то она явно будет зависеть от остальных: здесь можно просто положить <р = const. Функции у1г у2, ...,ут называются вообще за- висимыми в области если одна из них (все равно какая) зависит от остальных. Примеры. 1) Если положить yi = Xi+x2+ • -+хп, У2=х‘1 + ^+ ...+х„, Уз XjX, + *1*3+х’*з ’I-+ Хп - 1Хп , то нетрудно проверить, что во всем и-мерном пространстве будет выполняться тождество у2=У1-2у3. 2) Аналогично, для функций У1 = Х1Х2-Х3, < Уг = *1Хз+х2. Уз = (х1 +1) (*! + Хз) ~ (х{ - 1)х2х3 - хх{х} - х3)2 имеем тождественно (в трехмерном пространстве) УЗ = У1-У1У2 + У2- Все это - зависимые функции. Если ни в области ни в какой-либо частичной, в ней содержа- щейся, области не имеет место тождество вида (18), то функции у1гу2, • • •, Ут называют независимыми в области <g). Ответ на вопрос о независимости функций дает рассмотрение так называемой матрицы Якоби, составленной из частных про- изводных этих функций по всем независимым переменным: дУ1 дУ1 ду± г)х± дх2 ’ ’ ’ Эхп дУгдУг &У_2_ Эх! дх2 ' дхп (19) дУт дУт дУт дхг г)х2 ’ ’ ’ дхп Предполагая п=^т, прежде всего имеем такую теорему: Теорема 1. Если хоть один определитель т-го порядка, состав- ленный из элементов матрицы (19), отличен от нуля в области то в этой области функции у2, ..., ут независимы.
216] § 3. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ ТЕОРИИ НЕЯВНЫХ ФУНКЦИЙ 479 Доказательство. Пусть ду, ду, дх, дх2 $У1 дХт дУт дУт дУт дх, дх.. #0. (20) Если бы не равным нулю был не этот, а какой-нибудь другой определитель, то, изменив нумерацию переменных, можно было бы свести вопрос к случаю (20). Доказательство теоремы будем вести от противного. Предполо- жим, что одна из функций, например ут, выражается через остальные, так что Ут=<Р(У1> J’2> • • -,Ут-1), (21) хотя бы в некоторой части ®0 области Продифференцировав это тождество по каждой из переменных л; 0 = 1, ..., т), мы получим ряд тождеств (в @0) вида дУт = дУтдУ1 дУтдУг дут дУт-i дх, dyi SXj ду2 dxt "'+дУт~1 дх, 0=1, 2, ..., т). Мы видим, что элементы последней строки определителя (20) получаются путем сложения соответственных элементов первых т -1 строк, умноженных предварительно на множители ; . <04 иУт—1 Такой определитель, как известно, равен нулю. Это противоречит условию теоремы. Полученное противоречие доказывает невозмож- ность равенства (21). 216. Ранг матрицы Якоби. Переходя к общему случаю, введем следующее определение. Назовем рангом матрицы Якоби (19) (в области ®) наивысший из порядков определителей, образо- ванных из элементов этой матрицы и не обращающихся в нуль т о- ждественно в <g). Может, конечно, случиться, что все элементы матрицы (19) тождественно обращаются в нуль; тогда говорят, что ранг матрицы есть 0; но этот случай не представляет интереса, ибо здесь попросту все функции •,Ут сводятся к постоянным [183]. Если ранг матрицы (19) есть цэ=1, то существует хотя бы один определитель ц-ro порядка, составленный из элементов матрицы (это, конечно, предполагает т^/л и и не равный в 6J) тождественно нулю, в то время как все определители порядка выше ц (если таковы имеются) тождественно равны нулю. Говорят, что ранг ц дости- гается в некоторой точке области, если, упомянутый определи- тель ц-го порядка именно в этой точке отличен от нуля.
480 ГЛ. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ [216 Теорема II. Пусть ранг матрицы Якоби в области ® есть 1 и достигается он в точке М0<А,х1 этой области. Тогда в некоторой окрестности ®0 названной точки р функций из числа наших т (именно те, производные которых входят в определитель р-го порядка, не равный нулю в точке Л/о) будут неза- висимы, а остальные от них зависят. Доказательство. Без умаления общности можно предполо- жить, что в точке Мо отличен от нуля именно определитель О(У1, • О(%1, . У,д_ ,Х/д дуг dyt дхх дх2 дУг ду2 дхх дх.. dyi дХр дуг дхц == ад ал дхх дх2 dfz df2 dxt дх2 дХр ал а*д (22) ду? ду? дУц ал ал ал дх,. дх2 дхц dxt дх2 дхц Ввиду непрерывности частных производных, то же будет и в не- которой окрестности упомянутой точки, и, следовательно, по тео- реме I, функции ylt у2, .. - ,уц будут в этой окрестности независимы. Обозначим теперь через у°, у2, ...,fy значения этих функций в точке Мо. На основании теоремы IV п° 208 в некотором (и+д)-мерном параллелепипеде ^0-(х?-<\, х^ + д^ ...; х°-5п, х« + 5„; у?-Д,у? + 4; ...;у«-4„у« + 4) (23) первые д из уравнений (17) ..., х/, х^, ..., xJ-y^O, ' /2(х1г ...,х^; х^+1, ..., хп)-у2 = 0, Цх19 ...,х^ х„+1, ..., Хп)-уд = 0 определяют х15х2, . ..,х^ как однозначные функции от остальных переменных ух, ..., у^, х^х, ..., хп, фигурирующих в этих уравне- ниях *1=л0л • • . */<+!>•••> *п), ] ^2=%(л> • •>уд ^+1, ...,xn), I ^=^(Л. •••.УД ^+1, •••.*п)-
216) § 3. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ ТЕОРИИ НЕЯВНЫХ ФУНКЦИЙ 481 В упомянутой области системы уравнений (24) и (25) оказываются вполне равносильными, т. е. удо- влетворяются одними и теми же значениями переменных х1г ..хп, и Л > Уч > • • , Уп • Из самой теоремы, на которую мы опирались, следует, что, если вместо х1; х2, подставить в (24) функции (25), то получатся тождества относительно уг, ..., у„, x/l+1, ..., хп. Но для нас сейчас важно и другое: если вместо у,, ..., у„, подставить в (25) функции fx,f2, • • , то получатся тождества относи- тельно переменных хг, х2, ..., хп - по крайней мере в некоторой окрестности точки М0(х%, х2, . ..,х°). Именно, достаточно выбрать эту окрестность ®0 = (*1~ А 1 -di, х%-д2, хп2 1 <У2, . . х°п-д'п, х° + д'П) так, чтобы было и, кроме того, чтобы для ее точек значенияух,у2, .. ,,у^, определяемые из (24), т. е. значения f±,f2, .. .,фц, отличались от у?, у®, • • > У®, соот- ветственно, меньше, чем на Д1г Л2, ...,/4^*). Действительно, тогда точка (хг, х2, .. .,хп; у1,у2, .. .,уп) попадает в ®0, и одновременно с равенствами (24) должны выполняться и равенства (25). Возьмем теперь (если т-и) любую из остальных функций (17), например у//+1, и докажем, что она зависит от первых ц функций у15 у2, ..., у„. Если в равенство y,/+1=Z<+i(xi> • • •> *п) вместо хг, ..х„ подставить функции (25), то у„+1 представится в виде (сложной) функции оту1; ..уд x/i+1, ..хп: ’ • - У/’ л'л+1’ • ->хп), • • •,> ,Уц; х,-<+1, ,Хп); х^+1, • • •,*п)- = , • • ,yti;, ,хп). (26) На основании сделанного выше замечания, если в это равенство вместо yj, у2, • , у„, Уд+j подставить, соответственно, функции фг, fl, -lfnlfu+И то оно удовлетворится тождественно относи- тельно х-ов в области ®0. Для того, чтобы убедиться в зависимости функции у„+1 от функций ух, у2, ..., у,,, остается лишь доказать, что функция в (27) на деле аргументов х +1, хп не содержит. С этой целью достаточно установить, что - тождественно относительно у; х„+1, ..., хп - будет: ^^/'4-1 Q f) /2+1 _ Q _ Q *) Это можно осуществить ввиду непрерывности функций fx, f.2i ..прини- мающих в точке MQ значения у§, .. 31 Г. М, Фпхгснголыг, т. I
482 ГЛ. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ [216 [ср. п° 183]. Остановимся для примера на первом равенстве; осталь- ные доказываются аналогично. Продифференцируем по хя+1 уравнения (24), считая х1, ...,хц функциями (25) от у1г ..., х^+1, ..., хп; мы получим равенства: ал аУ1 , ! ал <хрц | аЛ ... 0 ' Эха дх^ ах^4-2 ал ау>1 । । ал ау^ ал _ q ах! ах^+1 '" дх^ Dxp+i дх^ ’ у, ал ayi । j ал эу^ । ал _ q дхг ахд+1 дхц ax^+i ахд+1 ’, линейные относительно величин , ..., . «хд+1 дх^+х Из этих р линейных равенств, как следствие, вытекает (д + 1)-е линейное равенство dfn+i ayi + + а л 4-i d<P(i + ал+i _ q (27*) ах3 ^Хд4~1 дх,, ах^4-4 ах^-1-i потому что определитель (ц + 1)-го порядка, составленный из коэф- фициентов при упомянутых величинах и из свободных членов во всех р + 1 равенствах (27) и (27*), т. е. определитель: ал ал ал axt ахд ал ал ал axj ахл ал ал ал ах] дх^ tVp+i ал+i ал-ы ax-j ах;, нулю (ведь ранг матрицы (19) есть тождественно равен д’). Но левая часть равенства (27*), по самому определению (26) функ- ции F +1, представляет производную . Таким образом, ввиду (27*), эта производная действительно равна нулю. Итак, в функции F/i+1 аргументы х^+1, ...,хп могут быть опу- щены: уд+1 зависит лишь от у1} ..., уц, ч. и тр. д. В примере 1), 215, матрица Якоби имеет вид 1 .х» + х3+ . 1 ... 1 ' 2хг • • 2.x,, + хп Х1 + Ха+... + Хп ... Х1 + Х2+• . •+Хп_1,
217] § 4. ЗАМЕНА ПЕРЕМЕННЫХ 483 Если к элементами третьей строки прибавить, соответственно, элементы второй, 1 умноженные на —, то получится строка, состоящая (подобно первой) из равных элементов. Отсюда ясно уже, что все определители третьего порядка - нули. Ранг матрицы равен двум, и действительно - две функции из трех незави- симы, а третья зависит от этих двух. Аналогично сказанное применяется и к примеру 2), 215. В заключение заметим, что возможны случаи, когда в одной части рассматри- ваемой области имеет место одна зависимость между функциями, а в другой осуществляется другая зависимость, или же функции оказываются независимыми и т. п. 3) Пусть, например, функции yj и уг от двух независимых переменных xL, х2 определяются на плоскости х^2 следующими равенствами: {а?л| , если л-jS-O, =(х1х1, если л2й»0, О, если х^-'О, Уг I 0, если х2<0. Легко проверить, что эти функции непрерывны вместе со своими производными на всей плоскости. В данном случае ранг матрицы Якоби равен двум для первого коорди- натного угла, единице - для второго и четвертого углов и, наконец, нулю - для третьего. Лишь в первом координатном угле функции независимы. § 4. Замена переменных 217. Функции одной переменной. Цель этого параграфа — дать представление о формальном процессе замены переменных. Поэтому мы не будем здесь отвлекать внимание выяснением всех условий, при которых производимые манипуляции законны (что к тому же и не представляет никаких трудностей). Значительная часть содержания настоящего параграфа могла бы быть изло- жена и раньше; однако нам казалось целесообразным сосредоточить весь мате- риал, связанный с заменой переменных, в одном месте. Пусть дано некоторое выражение JV=F(x,y, yi,y'x‘, •••). содержащее независимую переменную х, функцию от нее у и ряд производных от у по х до некоторого порядка. Иной раз требуется перейти в подобном выра- жении к новым переменным - независимой t и функции от нее и, с которыми старые переменные х и у связаны определенными соотношениями (носящими название формул преобразования). Точнее говоря, требуется представить W в функ- ции от t, и и производных от и по t. Такая замена переменных обычно мотивируется либо особым инте- ресом, который представляют в рассматриваемом вопросе переменные t и и, либо тем упрощением, которое эта замена вносит в само выражение W. Остановимся сначала на случае, когда заменяется лишь независимая пере- менная и дана формула преобразования, непосредственно связывающая х с новой независимой переменной t. Предположим, что эта формула преобразования разрешена относительно х: х-?(/). (1) Если у есть функция от х, то через посредство х она является и функцией от t. 31*
484 гл. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ [217 Мы имели уже в 121 формулы, выражающие производные от у по х через произ- водные от х и у по t: , У1 ,, xty'ti-xt‘yt у.—, X't x't3 x't(xty'p' - х'р'уЪ - Зхр(х}у'/> - x'py't) (2) x’t3 Так как x't, х'р, х'р , ... можно считать известными функциями от t [они полу- чаются из (1) дифференцированием], то остается лишь подставить в W вместо Ух, у”*, ... эти выражения их через t, y't, ур, ... Если формула преобразования дана в неразрешенном относительно х виде: Ф(х, z) = 0, (3) то задача по существу решается так же, лишь производные xj, х'р, ... вычисляются по правилам дифференцирования неявных функций *). Переходя к общему случаю, когда заменяются обе переменные, предположим, что формулы преобразования разрешены относительно старых переменных: x^<p(t, и), y=y>(f, и). (4) Если у связано функциональной зависимостью с х, то отсюда и будет связано зависимостью с t, а тогда в силу (4) х и у окажутся сложными функциями от t. По правилу дифференцирования сложных функций будем иметь x't^^t+vuu'i, y't^v't+’p'uu't; Xt'^<p'p + 2^f'cu't+p!pupy<PuUt', Уг=Ч>р + +v!1u't<-; . Обращаем внимание читателя на то, что через x't, yj и т. п. мы обозначаем «полные» производные от х и у по t, т. е. с учетом и зависимости и от t; наоборот, <p't, ip't, ... означают производные по t лишь постольку, поскольку t входит в функ- ции (р, у>, ... в качестве одного из двух аргументов. Подставив эти выражения в формулы (2), найдем выражения производных от у по х через t, ин производные от и по t, и т. д. Если формулы преобразования не разрешены относительно х и у: Ф(х, у, t, и) = 0, ¥г(х, у, t, и) = О, (5) то производные x't, yi, х'р, y't', вычисляются отсюда по правилам дифференци- рования неявных функций. Например, дифференцируя (5) по t (причем не только х и у, но и и считается функцией от t), получим уравнения Ф(х]+Ф'уу-'t + Ф] + Ф„и; = 0, ’FJxH- f'yy't + ¥7 + V'iu't = о, из которых найдутся x't, y't, В том частном случае, тельно новых переменных: и т. д. когда формулы преобразования разрешены относи- t~a(x, у), и = {3(х, у), (6) *) Впрочем, при этом может оказаться, что в окончательном выражении W еще останется х; его придется исключать при помощи (3).
218] § 4. ЗАМЕНА ПЕРЕМЕННЫХ 485 можно, прежде всего, пользоваться изложенным только что общим методом. Например, дифференцируя формулы (6) по t (причем х, у, и считаем функциями от /), получим Яуу'/, U/ = fiixj-t-fi!yi, откуда fiy-ayu} X/ ---------------------------------, УI —----------- a-xfiy-a-vfix a-xfiy-a-yfix и, наконец, Ух~-^—~ Ру — ЛуЩ Проше, однако, в этом случае поступить так, как если бы проделывали о б- ратный переход от переменных /, и к переменным х, у. Продифференциро- вав формулы (6) по х (считая у функцией от х), получим = ai 4- а'уу'х, и’х - fi£+fi'vyi, так что _ =fi'^+fi^ (7) ti а'х~а-'ууС откуда для у£ получается то же выражение, что и выше. И здесь мы различаем производные lx, и'х,а.'х, fi'x-. первые означают «полные» производные по х, с учетом и зависимости у от х, а вторые считаются с х лишь как с одним из двух аргументов функций a, fi. Заметим, что переход от переменных х, у к переменным /, и по формулам (6) может быть истолкован геометрически как некоторое точечное пре- образование плоскости (или ее части): если х, у рассматривать как координаты некоторой точки М плоскости, a t, и - как координаты некоторой точки Р, то преобразование переводит точку М в точку Р. Возьмем затем какую- либо кривую Зь на плоскости, с уравнением у=Дх); этой функциональной зависи- мости между х и у отвечает некоторая зависимость между t и и: u=g(t), которая также определяет на плоскости некоторую кривую £. Итак, в рассматриваемом преобразовании кривая переходит в кривую же £. Если в точке М первой кривой провести касательную с угловым коэффициентом у), то в соответствующей точке Р вторая кривая будет иметь касательную с угловым коэффициентом u't, который определяется по формуле (7). Таким образом, по координатам точки М на кривой и угловому коэффициенту касательной в М однозначно определяются как координаты соответствующей точки Р на преобразованной кривой £, так и угловой коэффициент касательной в Р. Поэтому, если через точку М провести две кривые, касающиеся в этой точке, то преобразованные кривые будут также касаться в соответствующей точке Р. Рассматриваемое точечное преобразование плоскости сохраняет касание [ср. ниже пример 5)]. 218. Примеры. 1) Пусть дано уравнение х2у'^+ху'х+у=0; преобразовать его, полагая x = efi По формулам (2) имеем ух!- e -‘lt-(y'ti-yt), и уравнение примет более простой вид: уц+у-О. 2) Преобразовать выражение ... yi«~yi(l+y£)2 rr -------------, полагая х = t-у. О +Х)’
486 ГЛ. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ [218 Под общую схему это преобразование подойдет, если написать х = t - и, у = и. По формулам (2) x'tytl-xtiyt-y'{xt+yf)': W=------------------------ (x't+yt)3 С другой стороны, формула преобразования дает xjl-yj; подставляя, найдем окончательно 1Р=у[*-у[. 3) Перестановка ролей переменных. Предположим, что неза- висимая переменная х и функция от нее у обмениваются ролями; под общую схему это преобразование подойдет, если положить х=и, y=t. Поставим себе задачей выразить производные от у по х через производные от х по у. Снова при- бегаем к формулам (2), заменяя t через у. Если учесть, что у у = 1 (и у(1 = у у! = ... = 0), то сразу получим 1 *У „ ху' =-------7. Ху3 Зх(»2 - ХуХу! У*' =-------7.-----’ •• Уу6 Например, выражение W = у'хУ7 - -Зух»2, если применить к нему это Ху! преобразование, получит вид W=-----. хр 4) Переход к полярным координатам. Если х, у рассмат- ривать как прямоугольные координаты точки, то уравнение у=Дх) выразит кри- полезно перейти к полярным координатам г, 0, полярным уравнением г=ДО). Тогда, естественно, вую. Часто бывает выражая кривую ее представляется необходимость, исходя из выражений различных геометрических элементов кривой через х, у, у*, y-xi, , получить соответствующие выражения их через 0, г, Гд, г"*, . Формулы преобразования в этом случае, как известно, имеют вид x=rcos0, y=rsin0. Дифференцируя их по 0 (причем учитываем, что г есть функция от 0), получим Хд = Гд COS 0- Г sin в, Уе= Гд sin 0 + rcos 0; Хдг - r'gt COS 0 - 2r'g sin 0 - r cos 0, y'g' = r’gi sin 0 + 2r' cos 0 — г sin 0, ... Отсюда, по формулам (2), найдем (подставляя 0 вместо I): Гд sin 0 + Г COS 0 Г2 + 2г'д‘ - rr’gi Ух = ————————— } Ух2 = ——— * ... Гд cos 0 - г sin 0 (г’д COS 0 - г sin 0)3 Таким образом, например, угловой коэффициент касательной будет Гд Sin 0 + Г COS 0 tg а = у 4 =----------; Гд cos 0 - г sm 0 тангенс угла со, образованного касательной с продолженным радиусом-вектором (рис. 114), ху'х-у tg a - tg 0 tgco = tg(a-0) = —---—- = —----7» l + tga-tg0 х+УУх
218] § 4. ЗАМЕНА ПЕРЕМЕННЫХ 487 теперь выразится простой формулой г tgcu = —, Гц в связи с чем при полярном задании кривой положение касательной предпочитают определять именно углом ш. Рассмотрим еще выражение D (1+ХО2 Л -------- , Ух' представляющее, как увидим ниже [в п° 251], важный геометрический элемент кривой («радиус кривизны»). Если подставить сюда найденные выше выражения для Ух и , то после упрощений получим Tv —- . • г2 + 2ф-гг'О1 5) Преобразование Лежандра. Поставленную в предыдущем п° задачу замены переменных можно обобщить, допустив присутствие про- изводных уже в формулах преобразования. Мы ограничимся одним примером этого рода: t=y'x, u=x-yi-y, это преобразование называется преобразованием Лежандра. Продифференцируем вторую формулу преобразования по х, рассматривая слева и как функцию от х через посредство t (зависимость t от х дается первой формулой): u't Ух' = У'х+х у$ - уi~x -у.(' Отсюда (в предположении, что Ух' * 0) и uf = V. Таким образом, если учесть и обе формулы преобразования, имеем X‘U'i, y-t-uj-u, чем выявляется взаимность преобразования: t, и, ui выражаются через х, у, Ух совершенно так же, как эти последние величины выражаются через первые. Дифференцируя подобным же образом по х формулу u't = х, получим 1 -у'х! = 1, откуда = —. «/ Дальнейшее дифференцирование дает , u'i' ^’''"Ух^+ир-у^ = 0, так что у'х' =---, Up3 и т. д. Заметим, что если преобразование Лежандра истолковать геометри- чески как преобразование плоскости, то оно отнюдь не будет точечным пре- образованием. Для определения координат t, и точки Р недостаточно знать ко- ординаты х, у точки М, но нужен и угловой коэффициент у’х касательной в этой точке к рассматриваемой кривой y=f(x). Тем не менее, кривая преобразуется здесь снова в кривую, и касание сохраняется*). *) Подобные преобразования, сохраняющие касание, играют важную роль в различных областях геометрии и анализа. Они носят название касатель- ных преобразований, или преобразований прикоснове- ния. Точечные преобразования и преобразования Лежандра являются лишь частными примерами их.
488 ГЛ. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ [219 219. Функции нескольких переменных. Замена независимых переменных. Перей- дем теперь к задаче о преобразовании выражения W F | л, у, dz dz ’ Z’ dx’ dy’ d2Z d2z dx2 ’ dx dy’ содержащего, кроме независимых переменных х, у, ..., и функции от них z, также частные производные z по ее аргументам, до определенного порядка. По тем же мотивам, что и в простейшем случае, рассмотренном выше, и здесь может понадобиться перейти к новым переменным, которые со старыми связаны с помощью формул преобразования. Если обозначить новые независимые переменные через t, и, ..., а функцию от них — через v, то задача состоит в том, чтобы выразить W через t, и, ..., » и через производные от v по ее аргументам. Очевидно, достаточно научиться делать это по отношению к старым произ- dz dz d2z d2z водным — , — ,...,-----, ----, •. • Для простоты письма мы будем предполагать, dx dy dx2 dx dy что независимых переменных всего две: старые х и у, а новые t и и. Начнем и здесь с того случая, когда заменяются лишь независимые перемен- ные, и формулы преобразования непосредственно связывают старые переменные х, у с новыми t, и. Предположим, что формулы преобразования разрешены относительно старых переменных: x = <p(t,u), y=tp(t,u). (8) Рассматривая z как сложную функцию от t и и через посредство х и у, по правилу дифференцирования сложных функций получим: dz dx dz dy dz dz dx dz dy dz dt dt dx dt dy’ du du dx± du dy „ , dz dz 1 аким образом, для определения старых производных — и — мы имеем систему dx dy линейных уравнений; отсюда старые производные линейно выразятся через новые dz dz dz dz dz dz —=A— + B—, — = C---------l-Z> —. (10) dx dt du dy dt du При этом важно отметить, что коэффициенты А, В, С, В составляются из произ- водных функций (р, ip, фигурирующих в формулах (8), но вовсе не зависят 0 т 5- dz dz Это замечание позволяет применить формулы (10) к производным — , — d2z дх ду (вместо z). Таким путем, например, для-получится выражение dx2 d2z d (dz} , d (dz} d {dz} dx2 dx [dx) dt [dx] du (Эх) IM „ d2z dA dz dB dz} ( , d2z d2z dA dz dB dz} ( dt2 dt du dt dt dt du) ( dt du du2 du dt du du) Применяя (10) к производным второго порядка (вместо z), можно получить выра- жения для производных третьего порядка, и т. д. Ерли формулы преобразования разрешены относительно новых переменных; 1 = а(х, у), и = £(х, у),
220] § 4. ЗАМЕНА ПЕРЕМЕННЫХ 489 то удобнее прибегнуть к обратному методу, т. е. рассматривать z как сложную функцию от х, у через посредство t, и, и дифференцировать ее по старым переменным. Это сразу приведет нас к формулам типа (10): dz dt dz du dz dx dx dt + dx du ’ dz dt dz du dz — ------1--- dy dy dt dy du (И) На этот раз коэффициенты будут функциями от х, у, но также не зависят от z. Применяя повторно формулы (И), можно и здесь получить выражения даль- нейших производных. Например, d2z d ( dz dz) dA dz dB dz d (dz\ d (dz\ dx2 dx ( dt du) dx dt dx du dx (dr) dx [du) dA dz dB dz ( d2z d2z ) I d2z d2z\ . dx dt dx du ( dr2 dr du) dr du du2) Наконец, в общем случае, при произвольных формулах преобразования Ф(х, у, t, и) 0, Ч'{х, у, I, и) 0, (12) можно пользоваться как прямым, так и обратным методом, вычисляя частные производные dx dx dy dy dt du dt du или dr dr du du dx ' dy ’ dx ’ dy по правилам дифференцирования неявных функций. 220. Метод вычисления дифференциалов. Укажем теперь и другой метод для выражения старых производных через новые, особенно удобный, если в W входят не отдельные производные, но все производные данного порядка. Это - метод вычисления полных дифференциалов. Он также может быть представлен в двух формах, в зависимости от того, считаются ли Г и и или х и у независимыми переменными. Пусть сначала независимыми будут Гии, все дифференциалы берутся именно по этим переменным (прямой метод). Дифференцируя полным образом фор- мулы преобразования (12), можно выразить dx и dy линейно через dt и du: dx -j. dt+p du, dy - у dt-У 8 du; (13) затем, дифференцируя эти формулы, представим d2x и d2y в виде однородных многочленов второй степени относительно dt и du: d2x = e dt2-C dt du-t-Ti du2, d2y=ddl2-; i dt du+x du2. (14) и т. д. Коэффициенты a, P, ..t, x суть известные функции от х, у, г и и. *) Здесь уместно сделать замечание, аналогичное замечанию на стр. 484. Так как выражения старых производных через новые содержат х, у, то после подста- новки этих выражений в W может оказаться необходимым еще исключать х, у с помощью формул преобразования. Читатель легко заметит и в дальнейшем случаи, сходные с этим.
490 ГЛ. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ [220 Представим теперь dz двояко (пользуясь инвариантностью формы дифферен- циала); , dz dz dz dz dz= — dx-\--dy-l— dt-j— du. (15) dx dy dt du Если вместо dx и dy подставить их выражения (13) и приравнять коэффициенты при dt и du в обеих частях равенства *), то получатся линейные уравнения dz dz dz . dz dz a.--hy— = — и p ho — - —, dx dy dt dx dy du dz dz из которых определятся производные — и — . dx dy Аналогично, можно представить двояко d2z (помня о том, что независимыми "₽ременными являются не х и у, a t и и): d2z d2z d2z dz dz d2z=--dx2+2--------dx dy-l----dy2-]— d2x~)— d2y= dx2 dx dy dy2 dx dy d2z d2z d2z = 12dti+2---- dt du+——du2. dt2 dt du du2 (16) Подставив вместо dx, dy, d2x и сРу их выражения (13) и (14), .приравняем коэффи- циенты при dt2, dt du и du2 в обеих частях равенства **). Это дает нам систему трех d2z d2z d2z f dz линейных уравнений для определения производных —-, -——, —- так как —•, qz \ dx2 dx dy dy2 I dx — уже известны ; и т. д. dy J Более простым в осуществлении является обратный метод, при кото- ром независимыми переменными считаются х и у, так что все дифференциалы берутся на этот раз по этим переменным. Последовательным дифференцированием из формул преобразования (12) мы получаем здесь dt = adx+bdy, du^cdx+ddy: (17) d2t=e dx2+fdx dy+gdy1, d2u = hdx2+idxdy+j dy2 (18) и т. д. И здесь коэффициенты a, b, ..., i, j суть известные функции от х, у, t и и. Если в (15) вместо dt и du подставить их выражения (17) и приравнять коэффи- циенты при dx и dy в обеих частях равенства, то непосредственно по- лучим dz dz dz dz , dz dz = U-h c — , — = b —Id — • dx dt du dy dt du Взамен (16) в настоящем случае будем иметь , d2z d2z d2z d2z d2z d2z dz dz „ d2z = -— dx2+2-------dxdy-i-----dy2 = — dt2+2--------dt du-\---du2-]— cPt+ — d2u.. dx2 dx dy dy2 dt2 dt du du2 dt du *) Напомним, что равенство Adt+Bdu=A'dt+B'du может иметь место для произвольных dtn du лишь в том случае, если А = А' и В=В'. s **) Равенство Adt2+Bdtdu+Cdu2=A'dt2+B'dtdu+C'du2 может иметь места для произвольных dtn du лишь при А-А', В=В', С=С'.
221] § 4. ЗАМЕНА ПЕРЕМЕННЫХ 491 Подстановка выражений (17), (18) и приравнивание коэффициентов при dx2, dx dy и dy2 в обеих частях равенства непосредственно приведут к вычислению d2z d2z d2z производных ---, -----, ---; и т. д. дх2 дхду dy2 221. Общий случай замены переменных. Обратимся, наконец, к общему случаю, когда заменяются и независимые переменные, и функция. Пусть формулы пре- образования разрешены относительно старых переменных: x = tp(t, и, v), y=y(t,u,v), z=x(t,u,v). (19) Если z есть функция от х и у: z=fix, у), то подставляя сюда вместо х, у и z их выражения через t, и, v, получим зависимость между последними переменными, так что v будет функцией от t и и. Считая независимыми переменными t и и (прямой метод), az- функ- цией от них через посредство х и у, как и выше, получим равенства (9), а из них дх dz (10). Но здесь под —, .— разумеются «полные» частные производные от dt du х, у, z по t или и, получаемые из (19) с учетом того обстоятельства, что v сама зависит от г и и: dx d<p d>p dv dz d% d% dv dt dt dv dt' 'du du + dv du dv dv Коэффициенты А, В, C, D содержат не только t, и, v, но и производные —, — ; dt du последние входят рациональным образом. Последовательное приме- нение формул (10) и здесь приведет к выражениям для вторых производных, и т. д. Если формулы преобразования разрешены относительно новых переменных: t = а(х, у, z), и = /?(х, у, z), v = у(х, у, z), (20) то обычно прибегают к обратному методу, т. е. считают независимыми переменными х и у. Имеем dv dv dt dv du dv dv dt dv du dx dt dx^dudx’ dy dt dy du dy „ dt dv Вместо —, ..., — сюда нужно подставить их выражения, получаемые дифферен- dx dy цированием по х и по у формул (20), с учетом того, что z есть функция от х и у. dt da da dz dv dy dy dz dx dx ' dzdx’ ’ dy dy +dz dy' т „ dz dz I аким путем получаются линейные относительно — и — уравнения, из кото- dv dv рых эти производные легко выражаются через х, у, г, — и — . dt du Вычисление дальнейших производных проще всего выполнить так: диффе- ( dz\ ренцируем полученное для — или — выражение снова по х (по у), рассматривая dv dv &х V &У) производные — и — как функции от х и у через посредство t и и, и т. д. dt du
492 ГЛ. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ (221 В случае формул преобразования общего вида А (д', у, z, 1, и, v) = 0, В(х, у, z, 1, и, v) = О, Г(х, у, z, t, и, v) = О (21) можно пользоваться любым из этих методов с применением правил дифферен- цирования неявных функций. Для решения рассматриваемой общей задачи замены переменных применим и метод вычисления полных дифференциалов. Мы ограни- чимся изложением той его формы, которая связана с предположением, что неза- висимыми являются старые переменные х и у (обратный метод), так что по этим переменным и берутся все дифференциалы. Последовательным дифференцированием, исходя из формул (21), можно найти выражения dt =at dx+a2 dy+a3 dz, du = b, dx+b2 dy + Z>3 dz, • dv = Cj dxA- e2 dy+ c3 dz;. d2t = di dx2 + d3dx dy + d3dy2 + dtdx dz + + 05 dy dz+ t)c dz2 + a3 d2z, d'iu = e-l dx2+ . . . +e6 dz2 + b3 d2z, d2v = ftdx2+...+fedz2 + csd2z; Если в равенство dv dv dv= — dt-\— du dt du подставить вместо dt, du и dv их выражения (22), то получим dv dv c} dx + c2 dy+c3 dz = — (flj dx+a, dy + a3 dz)A— (bt dx+b2 dy + b3dz), dt ' du откуда dz = A dx 4- В dy, dv где А, В рациональным образом содержат производные — dt Сопоставляя это с формулой (22) (23) (24) dv dz = — dx -I--dy, dx dy видим, что —=A, dx — = 5. dy Возьмем теперь равенство (t и и не являются независимыми перемен- ными) d2v d2v d2v dv dv d2v= — dt2+2 dt du+ — du2+ — d2t+ — d2u dt2 dt du du2 dt du и подставим сюда вместо dt, du, d2t, d2u, d2v их выражения (22) и (23), а затем и dz, заменим его выражением (24). Из полученного равенства определится d2z; d2z = С dx2+2D dxdy+E dy2,
2221 § 4. ЗАМЕНА ПЕРЕМЕННЫХ 493 где С, D, Е рациональным образом Э2г> d-v d2v — ---- — _ Сопоставляя с формулой dt* dt ди Эи* dv до содержат производные — , — , d*z= -— dx2+2 дхг d*Z л ------ ах дх ду , J"2 Л 2 dy + ^-dy^ приходим к результату ^D, —~~ = Е, дх2 дх ду ду2 и т. д. Задаче преобразования переменных и здесь можно придать геометрический смысл. Если переменные (х, у, z) и (f, и, ») рассматривать как координаты точек МиР пространства, то формулы преобразования, например, в форме (20), относят каждой точке М некоторую точку Р, т. е. характеризуют точечное преоб- разование пространства (или его части). Зависимости между х, у и z отвечает зависимость между t, и и v, так что каждая поверхность § преобразуется при этом в некоторую поверхность оГ. dz dz Мы видели, что значениями х, у, г, — и — однозначно определяются значе- dv dv dx dy ния t, и, v, — и — . Вспоминая уравнение касательной плоскости [180 (6)]: dt du dz dz Z-z= — {X-x) + —(Y-у), dx dy отсюда легко заключить, что двум касающимся в точке М поверхностям и отвечают в рассматриваемом преобразовании две поверхности сГ, и S) 2, также касающиеся в точке Р. Точечное преобразование пространства сохраняет касание [ср. ниже пример 7)]. 222. Примеры. 1) Переход к полярным координатам. Пусть z есть функция точки на плоскости z=f(M). Обыкновенно положение точки определяется ее прямоугольными координатами (х, у), так что z является функцией от переменных х и у. Часто, однако, оказывается более удобным харак- теризовать положение точки полярными координатами г, 9, и тогда возникает необходимость преобразования к новым переменным. Проделаем этот переход различными методами. Прямой метод: независимыми переменными считаются г, 9. Исходя из формул преобразования х = г cos 9, y=rsin9, по образцу формул (10) имеем dz dz — = cos9----и sin dr дх в — ду dz дВ - г sin 9---Hr cos 9 — , дх ду откуда dz dz sin 9 dz — = cos 9-------------, dx dr r dB dz . — =sm dy dz cos 9 9 —+ dr r dz de’ (25)
494 ГЛ. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ [222 sin 0 cos 0 так что выражения cos 0,-------, sin 0, --играют здесь роль коэффициентов г г А, В, С, D. Затем, d2z d ( dz sin 0 dz\ sin в d [ dz sin 0 = cos 0 — cos 0 — cos 0-= dx2-----------------------------------------------art dr-r de) r de { dr-r de) d2z 2 sin 0 cos 0 d2z sin2 0 d2z 2 sin 0 cos 0 dz sin2 0 dz = COS2 0---------------------h----------1--------------1—------• dr2 r dr de r2 de2 r2 de r dr Аналогично находим d2z . d2z 2 sin 0 cos 0 d2z cos2 0 d2z 2 sin 0 cos 0 dz cos2 0 dz ----= sin2 0--1 -------[------------------------1--------- dy2 dr2 r dr de r2 dd2 r2 de r dr и Т. Д. Обратный метод: независимыми переменными считаются х, у. Для dr того чтобы воспользоваться формулами (И), нужно знать производные —, de dr de „ — , —, — . Их можно наити, разрешив предварительно уравнения, связываю- dx dy dy щие старые переменные с новыми, относительно последних. Но можно восполь- зоваться методами дифференцирования неявных функций, не разрешая уравнений. Если продифференцировать формулы преобразования по х и по у, считая г и 0 функциями от х и у, то получим dr dB „ dr de 1 = cos 0---rsin 0 — , 0 = sin 0---hr cos 0 — dx dx dx dx „ dr . de . dr de 0 = cos 0---rsin 0 — , 1 = sin 0 —hr cos 0 — . dy dy dy dy Отсюда dr dS sin 0 dr dB cos 0 — = cos 0, —• =-------, — = sin 0, — =--------- dx dx r dy dy r и по формулам (11) - мы возвращаемся к выражению (25), и т. д. Метод вычисления дифференциалов. Пусть, как и только что, независимыми переменными будут х, у. Дифференцируем полным образом формулы преобразования dx = cos 0 dr- rsin 0 de, dy = sin 0 dr+r cos 0 de; отсюда -sin 0 <7x+cos 0 dy dr - cos 0 ax+sin 0 dy, dB =---------------- r так что л <)z J dz-— dr + dr dz sin 0 dz' cos 0-------------- dr r dB, ' dz cos 0 dz' sin 0----1--------- dr r de. dy, что снова приводит к выражениям (25).
222] § 4. ЗАМЕНА ПЕРЕМЕННЫХ 495 Вторичное дифференцирование формул для dr и М дает: sin2 0 dx2- 2 sin 0 cos 0 dx i/y+cos2 0 dy2 d2r = - sin 0 dB dx+cos 0 dB dy =-------------------------------- r - r(cos В dx+sin 0 dy) dB- (cos 6 dy- sin 0 dx) dr r2 2 sin 0 cos 0 dx2 - 2(cos2 0 - sin2 0) dxdy-2 sin 0 cos 0 dy2 ~ 7 ' ’ Тогда для d-z будем иметь: d2z d2z d2z dz dz d2z = -r- dr2+2------ drdB-\---dB2-\—d2r i-----d26 = dr2 dr dB dB2 dr dB ( d2z 2 sin 0 cos 0 d2z sin2 0 d2z sin2 0 dz = cos2 0----- I. dr2 dr dB г2 ЭВ2 г dr 2 sin 0 cos 0 dz I , , ----72-----— \dx2 + 2{...)dxdy-y{...)dyi, d2Z откуда для вторых производных--- дх2 Рассмотрим, для примера, выражения .. получатся те же выражения, что и выше. d2z d2z FFo “-----1----. дх2 ду2 С помощью найденных формул они преобразуются так: (dz\2 1 (dz)2 = — +- — , r2[dBj d2z 1 d2z 1 dz dr2+7de2+7dr' 2) Переход к сферическим координатам. В пространстве роль, аналогичную полярным координатам на плоскости, играют так называе- мые сферические координаты q, <р, В, с которыми прямоугольные координаты х, у, z связаны с помощью формул х-о sin 99 cos 0, у = о sin <р sin 0, z=gcosg>. Пусть требуется преобразовать к переменным о, <р, 0 выражения (du)2 (du)2 (du)2 d2u d2u d2u W Ы Ы ' dx2 dy2 dz2 где и есть некоторая функция точки в пространстве. Если преобразование произвести в два приема, полагая сначала x=rcos 0, j=rsin 0 (и оставляя z неизменным), а затем z=q cos99, r=gsin?> (оставляя 0 не- изменным), то можно будет воспользоваться результатами примера 1). Например, для второго выражения имеем d2u d2u_d2u 1 d2u 1 du Dx2'dy2 dr2 r2 dB2^~ r dr’ (d2u d2u) 1 d2u 1 du — I---1----1 4----4-----. \dz2 dr2) r2 dB2 r dr
496 ГЛ. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ [222 Выражение в скобках, на основании того же примера 1), перепишется так: д2и 1 д2и 1 ди д^+е2 д<р2^е де ’ наконец, ди ди cos <р ди — = sin <р-1---------. дг де е д<р Подставляя все это, окончательно найдем д2и 1 д2и 1 д2и 1 ди ctg® ди ~----------------------1—--------1--------h“-----1------• де2 о2 д<р2 e2sin2?> д&2 е де е2 д<р Аналогично, (ди\2 1 !ди\2 1 (ди)2 = I *—' I “I--I — I 3— I — I • ^sin2^ e2V#?7 3) Показать, что выражения и W2 сохраняют свою форму при любом преобразовании прямоугольных координат в прямоугольные же x' = a1x4-6iy4-c1z, у' = a2x+b2y+c2z, z' = a3x+b3y+c3z, где коэффициенты а, Ь, с удовлетворяют известным соотношениям ataj + bibj+ac^^ \=J: (26) Метод вычисления дифференциалов. Считая х, у, z независи- мыми переменными, имеем dx' = dx+bt dy 4- с, dz, d2x' = 0, dy' = a2dx+b2dy+c2dz, d2y'=-0, dz' = a3dx+b3 dy 4- c3 dz, d2z' = 0. Тогда du = (a, dx + b\ dyi-cs dz):-(a2 dx + b., dy + c2 dz) + —i (a3 dx+b3 dy+c3 dz), dx’ dy dz откуда ди ди ди ди ди , ди ди , ди — = а, \-а2 — + а3 —, 61 — : Ь2 ——- дх дх: ду dz' дУ дх' ду dz du du du du — = <?i-----1- Co----h Co —; dz dx' ~dy' dz' возводя в квадрат и складывая, в силу (26), получим ( ди}2 (ди}2 (ди}2 — I — I 4-1 —-1 4-1 —— I - J W J \dz) Затем, d2u = — (a, dx + bYdy + cL dz)2+2 & - («j dx + bLdy+dz)(a,dx+b2dy+c,dz) + ... dx'2 dx dy Выражение W2 есть сумма коэффициентов при dx2, dy2 и dz2; с помощью (26) не- трудно установить, что д2и д2и д2и ----+----+----- ’ дх’2 ду'2 dz'2
222] § 4. ЗАМЕНА ПЕРЕМЕННЫХ 497 Отсюда 4) Преобразовать уравнение d2w d2w d2w d2w d2w d2w x2------------Fy2----Hz2-----\-yz----\-zx - + xy — = 0 dx2 dy2 dz2 dy dz dz dx dx dy к новым переменным t, и, v по формулам х = uv, у = vt, z = tu. Пр ямой метод. Считая независимыми переменными t, и, v, будем иметь dw dw dw dw dw dw dw dw dw — = —-------u, — = —«Н----1, — =— «4 t. dt dy dz du dx dz dv dx dy dw 1 dw 1 dw 1 dw X — = t-----h- и----h- v—, dx 2 dt 2 du 2 dv dw 1 dw 1 dw 1 dw У --- = — t-U----1-- V--, dy 2 dt 2 du 2 dv dw 1 dw 1 dw 1 dw z — = — t--1-U-------V--. dz 2 dt 2 du 2 dv Далее, d2w d ( 1 dw I dw 1 dw — 1 1—и-----------1 V----w dx [ 2 dt 2 du 2 dv , 1 d2w 1 1 d2W 1 a2M> = — t2---1 И2-----1 02---1—uv -------- 4 dt2 4 du2 4 dv2 2 dudv 1 d2w 1 d2w 3 dw 1 dw 1 dw -----vt------tu------!— t — --и-------v —, 2 dvdt 2 dtdu 4 dt 4 du 4 dv d2w d ( dwi d (I dw 1 dw 1 ЗиЛ dydz dz[ dy) dz (2 dt 2 du 2 dv) 1 d2w 1 d2w 1 d2w 1 d2w 1 dw 1 dw 1 dw ~ — t2------u2---— v2----1—uv — 4—t-----------и------v—. 4 dt2 4 du2 4 dv2 2 dudv 4 dt 4 du 4 dv и т. д. Сложив все подобные выражения (и отбросив числовой множитель), получим преобразованное уравнение в виде d2w d2w d2w t2----Ии2----1----= 0. dt2 du2 dv2 До сих пор заменялись лишь независимые переменные; приведем примеры, где замене подвергается и функция. dz dz 5) Преобразовать уравнение х2-Ну2 — = z2, полагая dx dy t t x = t, y=.---, z=--------. 14-tu 14-tv Прямой метод. Независимые переменные: t, и. Дифференцируем третью из формул преобразования по t и по и, рассматривая переменные z и v как функции от t, и (первую - через посредство х, у): dv 1-t2— dz dz 1 dt dz -t2 C dv dx dy (l + tu)2 (l + tv)2 ’ dy (l-tu)2 (1 + tv)2 du 32 Г. M. Фихтенгольц, т. I
498 ГЛ. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ [222 Отсюда dz 1 ( dv dv 1 dz (1 + ta)2 dv — —--------- 1 -t2-------, — =-------------. dx (1+Iv)2 I dt du) dy (1 + tv)2 du Преобразованное уравнение после сокращения будет иметь вид: Решим ту же задачу иначе. Обратный метод. Выразим из формул преобразования новые перемен- ные через старые: 11 11 t = X, и =---, v= —----- ух Z X и будем считать независимыми переменными х, у. Дифференцируя третью формулу по х и по у (v зависит от них через посредство t, и), найдем: 1 dz 1 dv dv 1 1 dz dv 1 z2 dx x2 dt du x2 ’ z2 dy du y2 или dz f 1 dv 1 dv A dz z2 dv — = z2----------------, — =-----и T. f dx [x2 dt x2 du) dy y2 du 6) Выражение d2z d2z d2z 1P=----2-------1--- dx2 dx dy dy2 z 1 dv =---dx-]— dz. X2 X У z преобразовать к переменным /=х+у, « = —, « = —. X X Метод вычисления дифференциалов. Независимые переменные: х, у. Дифференцируем формулы преобразования: У 1 dt = dx+dy, du =-----dx-]— dy, x2 x Если v рассматривать, как функцию от х, у через посредство t, и, то дифференциал dv напишется так: dv dv dv dv ( у 11 dv =— dt-]----du = — (dx+dy)-]------dx-]—dy . dt du dt du [ x2 x J Сопоставляя два выражения для dv, находим z dv dv ( у A dz = — dx+x — (dx+dy)-]---I----dx+dy\ . x dt du V x ) Составим теперь вторые дифференциалы от новых переменных: 2у 2 d2u = — dx2---dx dy, x3 x2 2 2z 1 d2v ----dx dz-]— dx2-]— d2z. x2 x3 x d2t = 0, С другой стороны, d2v d2v , d2v dv dv d2v----dt2+2-------dt du-]--du2-]— d2t-\---d2u = dt2 dt du du2 dt du d2v d2v ( У 11 =TT (dx+dyF+Z „ (dx+ dy)\-~; dx+— dy + dt2 dt du I, x2 x ) d2v ( У 1 A2 dv (2y -I-----I---dx-]— dy -I-----I — du2 ( x2 x ) du 1.x8 2 1 — dx dyi . Y2 I
222] § 4. ЗАМЕНА ПЕРЕМЕННЫХ 499 Приравнивая оба выражения для d2v и заменяя dz полученным выше его выра- жением, придем к равенству, из которого определится rf2z: dx Г z , dv dv ( у А1 2z d2z=2 — — dx+x — (dx+dy)-]------------dx+dy II-----dx2+ x Lx dt du V x J J x2 rd2v d2v ( у 1 4 + x — (dx + dy)2+2 (dx+dy) dx]— dy + I dt2 dt du lx2 x ) d2v du2 1 A2 dv (2y 2 dx]— dy\ +— I — dx2----dx dy X ) du tv2 A2 Л d2Z d2Z d2z Отсюда можно определить производные как коэффи- циенты при dx2, 2dxdy, dy2. Но нужный нам результат можно получить проще, заметив, что d-z переходит в W, если взять dx= 1, dy= - 1. Таким путем находим: (х+у)2 d2v (1 + и)3 d2v FF --------------------- •-. х3 du2 t du2 7) Преобразование Лежандра. Наподобие 5), 218 мы и здесь приведем преобразование Лежандра как пример более общего преобра- зования, когда уже формулы, связывающие старые и новые переменные, содержат производные. Положим dz t= —, dx u = — dy dz dz dz v = x—-+y--z. dx dy Разумея под z некоторую определенную функцию от х и у: z=f(x, у), будем предполагать ее такой, что D(t, и) d2z d2z ( d2z )2 ---------------------- #0. (27) D(x, у) dx2 dy2 Дифференцируя третью из формул преобразования по х и по у (причем v рас- сматриваем как функцию от х, у через посредство t, и), получим dv d2z dv d2z _ d2z d2z dt dxi +du dxdy dx2^y dxdy’ dv d2z dv d2z _ d2z d2Z dt dxdy +du dy2 dxdy ' У dy2/ откуда dv dv dv dv x = — , у = —, так что и z = t-------Lu-----v, (28) dt du dt du t. e. преобразование имеет взаимный характер. Дифференцируя первые две из полученных формул (28) сначала по х, а затем по у, придем к уравнениям d2v d2z d2v d2z d2v d2z d2v d2z --------1_------— - , 0 =-----------1--- dt2 dx2 dt du dxdy dt du dx2 du2 dxdy d2v d2z d2v d2z d2v d2z d2v d2z dt2 dxdy + dt du dy2 ’ dt du dxdy + du2 dy2 32»
500 ГЛ. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ (222 Так как [203 (4)] Э2® d2v ( Э2® V D(x,y) 1 I —--------I-----I =-------= — # 0 dt2 ди2 du) D(t,u) J то из этих уравнений d2v d2y d2v d2z difi d2z _ dtTu d2z _ dt2 d^~~I ’ dxdy / ’ dy2~ 1 Если x, у, z и t, и, v трактовать как координаты некоторых точек пространства, то преобразование Лежандра можно рассматривать как преобразование пространства (но не точечное). Поверхность, характеризуемая зависимостью между z и х, у, переходит при этом в поверхность, определяемую зависимостью dv dv dz dz между v и t, и. Так как t, и, v, —, — зависят только от х, у, z, —, — , то пре- dt du dx ду образование Лежандра сохраняет касание*), 8) Легко обобщить преобразование Лежандра на случай пространства любого числа измерений. Пусть, скажем, z есть функция от хх, х2, ..., хп. Положим dz лгг dz ti=— (/=1,2,...,») и ®=-2, Xi-----z; dx, дх. здесь v есть новая функция от новых переменных I), г., ..., tn. Будем предполагать и здесь определитель d2z d2Z d2z dx2 dxt dx2 &Xn d2Z d2z d2z дх„ dx! dxi dx2 dxn d2z d2z d2z dxn dx2 dx2n отличным от нуля. Продифференцируем формулу, определяющую v, по х/с (рассматривая при этом v как функцию от Хц ..., хп через посредство Zj, ..., tny. У dv d*z У d*z i=l dt, dxidx/, (=i dxidxk Ввиду JV-0, отсюда следует — = Xi dtj (i=l, ..., и). Таким образом, и dv z= 2 ti— dti - v, так что в общем случае преобразование также имеет взаимный характер. *) Сюда также относится сноска на стр. 487.
222] § 4. ЗАМЕНА ПЕРЕМЕННЫХ 501 9) Наконец, рассмотрим еще один пример преобразования, представляющий некоторое своеобразие. Пусть 9>(«i, ..., ип; xlt .хп) будет функция от 2п переменных, однородная 2-й степени относи- тельно переменных х1г хп. Предполагая определитель d2y d2<p д-<р dx2 dxt dx., dx1 дхп д2<р d2y д2<р dx., dx\ dx2 dxn э2<р д2<р а2<? dxn dx1 дхп дх2 dxn отличным от нуля, положим _ d<P (id^ и введем tlt ..., tn в качестве новых независимых переменных вместо х,, ..., хП. Тогда функция <р преобразуется в некоторую функцию v(«i, ..., un; tlt ..., tn). Доказать, что (а) dv ~dt~i (б) dv du. dv du. G’=l. ; П). Дифференцируя tp-V по Xi,, рассматривая v как функцию от х,, ..., xn через посредство ti, ..., tn: dy _ dv d2V dxh i^idti dxtdxk d<P С другой стороны, производная ----будет однородной функцией пер- dxk вой степени относительно переменных ., хп • Тогда по формуле Э fi- ne р а [188] d<P V гь . ---= 7, ------ X; (к = 1 dxp i^idxpdxi ; П). Сопоставляя полученные два разложения для —, ввиду fix 0, заключаем о dxk справедливости соотношений (а).
502 ГЛ. VI. ФУНКЦИОНАЛЬНЫЕ ОПРЕДЕЛИТЕЛИ; ИХ ПРИЛОЖЕНИЯ [222 Дифференцируя же по щ получим ди, ди, k=ldtk дхкдщ' д<р Но----, очевидно, однородная функция второй степени отно- си, сительно xt, ..., хп. Снова применяя формулу Эйлера, видим, что последняя сумма дает нам 4т # (д<р} д<Р 7, --- --1Хк = 2--. к=1дхк\дщ) ди. Отсюда и следуют соотношения (б).
ГЛАВА СЕДЬМАЯ ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ К ГЕОМЕТРИИ § 1. Аналитическое представление кривых и поверхностей 223. Кривые на плоскости (в прямоугольных координатах). В на- стоящей главе мы остановимся на некоторых приложениях изучен- ных понятий, фактов и методов дифференциального исчисления к геометрии. [С немногими из них мы сталкивались уже выше п° 91, 141, 143, 145,148, 180.] Мы считаем полезным предварительно напомнить читателю раз- личные способы аналитического представления кривых и поверхно- стей; этому посвящен § 1. Оговорим наперед, что функции, о кото- рых будет идти речь в этой главе, как правило, предполагаются н е- прерывными и имеющими непрерывные же про- изводные по своим аргументам; в случае надобности, мы будем требовать существования и непрерывности и дальнейших производных. Начнем с плоских кривых, причем в основу положим неко- торую прямоугольную систему координат Оху. Выше мы не раз рассматривали уравнение вида y=f(x) или x=g(y) (1) и изучали соответствующую ему кривую [47, 91, 146 и след.]. Такого рода задание кривой, когда одна из текущих координат ее точки представляется в виде (однозначной) явной функции от другой координаты, мы будем называть явным заданием (или представ- лением) кривой. Оно обладает простотой и наглядностью; как уви- дим, всякое другое задание - в некотором смысле - может быть сведено к этому. В связи с теорией неявных функций нам приходилось также го- ворить о неявном задании кривой, т. е. о представлении кривой уравнением вида Дх, у)=0, (2) неразрешенным ни относительно х, ни относительно у [205 и след.]. Такое уравнение носит название неявного уравнения кривой.
504 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [223 Из теорем о существовании неявной функции [205, 206] следует, что если в точке (х0, у0) кривой выполнено условие F'x(x0 > Л>) 0 или F'(x0 > Уо) * °. то, по крайней мере, в некоторой окрестности этой точки кривая может быть представлена явным уравнением (1) того или другого вида (причем фигурирующая в нем функция f или g непрерывна вместе со своей производной). Таким образом, только точки (х0, у0) кривой, для которых вы- полняются сразу оба условия F’x(x0, у0) = 0, Fy{xQ, у0) = 0, (3) могут иметь ту особенность, что в их окрестности кривая не представима явным уравнением (ни того, ни другого вида). Точки кривой, удовлетворяющие уравнениям (3), и называют особыми. Ниже [236] мы займемся вопросом о поведении кривой (2) вблизи особой точки. Но, как правило, особые точки будут исключаться из рассмотрения, и мы будем изучать кривую лишь в окрестности ее обыкновенной (т. е. неособой) точки. Наконец, в предыдущем изложении не раз упоминалось о том, что уравнения вида x=q>(t), y=y(t), (4) устанавливающие зависимость текущих координат точки от некото- рого параметра t, также определяют кривую на плоскости [см., например, 106]. Подобные уравнения называют параметриче- скими; они дают параметрическое представление кривой. Рассмотрим точку (х0, у0), определяемую значением t = t0 пара- метра, и предположим, что при t = t0 будет cp'(t0) # 0. Тогда и вблизи этого значения t производная x't=(p'(t) - по непрерывности - будет сохранять тот же знак; функция x=rp(t) оказывается монотон- ной [132]. При этих условиях, в силу 83 и 94, можно t рассматривать как однозначную функцию от х: 1 = 6(х), непрерывную и имеющую непрерывную же производную. Подставив эту функцию вместо I в выражение для у, установим непосредственную зависимость у от х y=y(6(x))=f(x), где — снова - функция/непрерывна вместе со своею производной; таким образом, мы выразим явным уравнением, по крайней мере, участок кривой, примыкающий к взятой точке. Аналогичное заклю- чение можно сделать, если даже г//(/о) = О, но ^'(Z0)#0, с той един- ственной разницей, что получится явное уравнение другого вида: x=g(y). Лишь в том случае, когда одновременно x't = = 0 и y't = y/(Z0) = 0, (5)
224] § 1. АНАЛИТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ КРИВЫХ 505 кривая в окрестности рассматриваемой точки может оказаться не представимой явным уравнением; такую точку будем называть особой. В 237 мы остановимся вкратце на виде кривой (4) вблизи особой точки, но, как правило, и здесь мы будем изучать лишь обыкно- венные точки. Важно теперь оговориться, что все сказанное выше об обыкно- венной точке (х0, у0), т. е. такой, для которой не выполняются усло- вия (5), предполагает еще, что эта точка получается только при одном значении параметра t = t0, (т. е., как говорят, является простой точкой). Если бы, наоборот, точка (х0, у0) была кратной и отвечала, например, двум различным значениям пара- метра t=t0 и t=tlf то в ней, вообще говоря, пересекались бы два участка кривой: один, определяемый значениями t, близкими к t0, а другой - значениями t, близкими к Z1. В этом случае всю кривую в окрестности данной точки опять-таки нельзя было бы представить явным уравнением. Таким образом, кратные точки также по су- ществу следует относить к особым*). Подведем итоги сказанному. Мы не пытались дать геометриче- скую характеристику понятия кривой: для нас кривая есть геометри- ческое место точек, удовлетворяющих аналитическому соотношению вида (1), (2) или (4), - в предположении непрерывности встречающих- ся в них функций и их производных. Правда, геометрические образы, определяемые этими различными способами, в целом могут зна- чительно разниться по своему облику, но в малом, в окрестности обыкновенной (а в случае параметрического задания и про- стой) точки, все они уподобляются тем простейшим образам, кото- рые задаются уравнениями вида (1). 224. Примеры. Сделаем обзор наичаще встречающихся кривых (многие из них, впрочем, уже знакомы читателю из аналитической геометрии). 1) Цепная линия (рис. 41). Ее уравнение а / — — — \ х у = —\еа+е a’ = ach —. 2 а По такой линии устанавливается в равновесии гибкая и нерастяжимая тяжелая нить (цепь, провод и т. п.), подвешенная за оба конца. Форма кривой вблизи вершины А (см. рис. 41) напоминает параболу, но при удалении от вершины кривая круче устремляется в бесконечность. Отрезок О А = а определяет точнее ее форму - чем а меньше, тем кривая круче. То расположение кривой, которое изображено на чертеже, вовсе необязательно, но оно позволяет придать уравнению кривой наиболее простой вид. *) Есть, впрочем, один случай, когда точку, получающуюся дважды все же не считают кратной: это будет тогда, когда точка отвечает двум крайним значе- ниям параметра и в ней кривая замыкается. В примере окружности x = a-cos9, y = a-sin в (О=г0=е2л) это будет точка, определяемая значениями 9-0 и 9 = 2л.
506 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [224 2) Эллипс, отнесенный к осям симметрии, имеет уравнение х2 у2 — +— = 1. а2 Ь2 Поскольку сумма квадратов величин — и — должна равняться единице, естест- а b венно принять их, соответственно, за косинус и синус некоторого угла t. Это при- водит к обычному параметрическому представлению эллипса, x = acost, у = bsmt; при изменении t от 0 до 2л эллипс описывается против часовой стрелки начиная от конца А (а, 0) большой оси. Можно было бы, разумеется, использовать и какие-либо другие выражения, сумма квадратов которых равна единице, и положить, например, 1 - и2 2« х = а------, у = Ь ------- , 1 + и2 1 + и2 где и изменяется от - ~ до + Так как при и - ± ~ имеем х — - а, у — 0, то можно считать условно, что точка А' (-а, 0) получается при и= ±~. Аналогично для случая гиперболы х2 у2 — — = 1, а2 Ь2 вспоминая известное соотношение, связывающее г и- перболические косинус и синус, можно поло- жить x=achf, y = bsht Другое представление той же кривой: ( — °0 Читателю рекомендуется во всех случаях дать себе отчет в передвижении точки по кривой при измене- нии параметра. 3) Полукубическая парабола (рис. 115) у2 — сх3 = 0 (с =- 0) Здесь особой точкой служит начало (0, 0). Если решить уравнение относительно у, то получим явные уравнения двух симметричных ветвей кривой у = ± "|/cx3= + Усх2. Так как у' = 0 при х = 0 для обеих ветвей, то в начале они обе касаются оси х, и налицо острие [точка возврата, см. 236]. 4) Астроида (рис. 116) 1 2 ?. х3+у3=о3 (а=-0). Это уравнение, собственно говоря, не подходит под тот тип, которым мы условились ограничиться: в каждой из точек (±а, 0) и (0, ±а) одна из частных производных левой части уравнения обращается в Впрочем нетрудно, освобо-
224] § 1. АНАЛИТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ КРИВЫХ 507 див уравнение кривой от иррациональностей, представить его в виде ((х3+у2) - а2)3+27а2х2у2 = 0. При этом представлении указанные точки как раз и будут особыми. Из уравнения кривой видно, что кривая лежит в круге х2+у2 = а2 и симметрична относительно обеих осей; ограничимся поэтому первым квадрантом. Разрешая уравнение относительно у: (2_ 2\3 а3 -х3)3 и дифференцируя: (?. 3\1. _1 а3 -х3)2 -х 3 , видим, что при х = 0 касательная вертикальна, а при х = а - горизонтальна. Отсюда следует, что во всех четырех особых точках будут острия (точки возврата). Желая получить параметрическое предста- вление астроиды, используем то, что - в силу уравнения кривой - сумма квадратов выражений х)8 (у\3 — и — должна равняться единице. Положив их равными cos t и sin t, придем а) (а/ Чтобы убедип ся в этом, разделим к таким параметрическим уравнениям: x = acos3r, y=asin3/ (0=s/==2n). Так как производные x't = -За cos21 sin t, y't = За sin2t cos t обе обращаются в 0 при (2л), Z,’ л Зл —, л, — , то этим значениям пара- метра отвечают особые точки - те же, что и выше. 5) Декартов лист (рис. 117) х3+у3-За ху = 0 *) (а=-0). Особой точкой служит начало координат (0, 0): в нем кривая сама себя пересекает. Кривая имеет асимп- тоту х+у+а = 0 как при х-+~, так и при х-» - уравнение почленно на х3: у 1 За- —-----1. х х Отсюда, прежде всего, можно заключить, что, скажем, при | х | =- За, — остается *) См. пример 2), 210. Точка а[о\[2, а1/^), отвечающая максимуму у как функ- ции от х, отмечена на чертеже.
508 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [225 ограниченным, а тогда уже ясно, что при х- + ~ отношение —- -1. С другой X стороны, уравнение дает нам За-— Заху х х2-ху+у2 у ру’ х (х } так что при х — ±~ будет у 1-х- - а. Этим наше утверждение и оправдано [148]. Вводя в качестве параметра отношение t = — и подставляя в уравнение кривой х у = tx, легко получить параметрическое представление: При t — ± ~ обе координаты стремятся к 0; можно считать, что начальная точка (0, 0) получается как при 1 = 0, так и при t= ± <=<=. При изменении t от - ~ до - 1, точка (х, у), исходя из начала, вдоль правой ветви удаляется в бесконечность. При изменении Тот - 1 до 0 наша точка из бесконечности вдоль левой ветви возвращает- ся к началу. Наконец, при возрастании t от 0 до +“> точка описывает (против часовой стрелки) петлю. 225. Кривые механического происхождения. Продолжая перечень примеров, рассмотрим еще некоторые кривые механического происхождения, полученные путем качения одних кривых по другим. 6) Циклоида. Вообразим, что по прямой Ох (рис. 118) слева направо катится без скольжения круг радиуса а с центром в А. Кривая, описы- ваемая при этом любой точкой окружности, и называется циклоидой. Про- следим, например, путь точки О за время одного оборота круга. Рассмотрим катящийся круг в новом положении. Точкой касания служит уже другая точка N; таким образом, по прямой точка касания переместилась на расстояние ON. В то же время точка О переместилась в положение М, пройдя по окружности круга путь NM. Так как качение происходит без скольжения, то эти пути равны: ___, NM= ON. Если выбрать теперь в качестве параметра, определяющего положение точки, угол t= -QNDM на который успел повернуться радиус, имевший в начале качения вертикальное положение АО, то координаты х и у точки М выразятся следующим образом: х = OF= ON-FN-NM-MG = at -a sin t, y = FM= NG = ND-GD = a-a cos, t.
225] § 1. АНАЛИТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ КРИВЫХ 509 Итак параметрические уравнения циклоиды имеют вид х = <z(7-sin z), y = a(l-cosl) (0=е/=Е2я). При изменении t от - ~ до + ~ получится кривая, состоящая из бесчисленного множества таких ветвей, какая изображена на рис. 118. Так как производные х/ = а(1 -cos t), y't = a sin/ одновременно обращаются в 0 при t = kn (к = 0, ±1, ±2, ...), то этим значениям отвечают особые точки кривой. Но [106, (10)] , Л xt sin t t ~ctg —, 1 - cos t 2 так что, например, при t - ± 0 (или при х - ± 0) производная у'х будет стремиться к ± ясно, что в начальной точке (равно как и в других особых точках) касатель- ная вертикальна: здесь налицо острие [точка возврата, 237]. 7) Эпи- и гипоциклоида. Если один круг без скольжения катится извне по другому кругу, то кривая, описываемая произвольной точкой окруж- ности подвижного круга, называется эпициклоидой. В случае же качения изнутри мы имеем дело с гипоцик- лоидой. Остановимся на выводе уравнений первой из этих кривых. Возьмем начало координат в центре О неподвижного круга, а ось х проведем через то положение А интересующей нас точки, в котором она является точкой касания обоих кругов (рис. 119). Когда подвижный круг перейдет в новое положение, указанное на чертеже, точка А перейдет в М. Геометри- ческое место точек М нам и надлежит опре- делить. Обозначим через а радиус неподвиж- ного круга, а через та — радиус катящегося круга. Выберем за параметр здесь угол t = = <$МСВ между радиусом СМ, соединяющим центр катящегося круга с интересующей нас точкой на его окружности, и радиусом СВ, проведенным в точку касания. В начале дви- жения пусть этот угол равен 0. Прежде всего, посмотрим, в чем здесь ж е н и я. Дуга АВ, пройденная точкой должна равняться дуге МВ, пройденной проявляется отсутствие сколь- касания по неподвижной окружности, точкой касания по катящейся окруж- ности: a-<1АОВ = та-S[MCB = mat, откуда <3AOB=mt. Выразим теперь координаты х и у точки М через t. Имеем x=OG= ОЕ+FMMa+ma) cos mt + та sin <$FCM; но < FCM= < BCM - < ОСЕ и < OCE= - mt, так что < FCM = (1 + ni)t - и sin < FCM= - cos (1 + m)t.
510 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [225 Окончательно х = а[(1 + т) cos mt - т cos (1 + ni)t]. Подобным же образом найдем у = а[(1 + m) sin mt - т sin (1 + m)l]. Эти уравнения дают параметрическое представление эпициклоиды. Когда катящийся круг снова придет в соприкосновение с неподвижным кругом в той же своей точке, что и в начале движения (т. е. при t = 2л), точка М закончит одну ветвь кривой. При дальнейшем качении она будет описывать следующую ветвь, подобную первой, и т. д. Производные x't = - т(т+1 )a[sin mt - sin (1 4- ти)1], yj ~~ m(/?/:l)a[cos mt-cos (1 + zn)Z] обращаются одновременно в 0 при 1=--2кл (где 7с = О, ±1, + 2, ...), т. е. всякий раз, когда рассматриваемая на подвижном круге точка становится точкой касания. Соответствующие точки кривой будут особыми (точки возврата). Рис. 120. В случае гипоциклоиды подобным же образом получаются такие параметрические уравнения: х = а[(1 - т) cos mt + m cos (1 - т) 7], y = <z[-(l-m)sin mZ + msin (l-m)/]. Здесь m также означает отношение радиуса катящегося круга к радиусу непо- движного. Легко заметить, что эти уравнения получаются из уравнений эпициклоиды заменой т на - т.
226] § 1. АНАЛИТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ КРИВЫХ 511 В последней читатель узнает астро- На рис. 120 изображены эпициклоиды, соответствующие т-1, 2, —, и гипо- 1 1 3 циклоиды, соответствующие т = — и — . 3 4 иду*). 8) Эвольвента круга. Пре, из центра О радиусом а, навернута по часовой стрелке нить; пусть конец нити приходится в точке А. Станем нить развертывать (против часовой стрелки), сматывая с круга и все время натягивая ее за конец. Кривая, опи- сываемая при этом концом нити, назы- вается эвольвентой круга [ср. ниже 254, 246]. Возьмем начало координат в цент- ре О (рис. 121) и проведем ось х через точку А. Когда будет смотана часть АВ нити, она займет положение ВМ, располагаясь по касательной к кругу, а точка А перейдет в М. Итак, АВ = ВМ. В качестве параметра введем угол t = -<$АОВ между радиусами О А и ОВ. Координаты х, у точки М выразятся следующим образом: х=DC-DO=BF-DO= Рис. 121. = ВМ sin <$ВМС- О В cos <$DOB-, но ВМ=AB = at, а углы < ВМС и < DOB равны л-t, так что х = at sin (л -t) - a cos (л - t) = a(t sin t + cos /). Далее, y = CM= CF ' FM: DB+FM = OB sin DOB+BM cos 4BMC = a(sin t-1 cos t). Таким образом, наша кривая представляется следующими параметрическими уравнениями: x = a(Zsin r+cosf), y = a(sinf-Zcost). Единственная особая точка отвечает значению t = 0, при котором обра- щаются в 0 обе производные x't = at cos t, y't = at sin t. Предлагаем читателю убедиться в том, что та же кривая получится, если катить прямую (без скольжения) по кругу и рассмотреть траекторию какой- либо точки прямой. 226. Кривые на плоскости (в полярных координатах). Примеры. Во многих случаях оказывается проще представлять кривые их по- лярными уравнениями, устанавливающими зависимость *) Если в уравнениях гипоциклоиды положить т = — и заменить t на -4/, 4 то и получатся уравнения, приведенные в 4).
512 ГЛ. VH. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [226 между текущими полярными координатами г, О' точек кривой. Поляр- ный угол 0 мы отсчитываем от полярной оси, считая его положитель- ным против часовой стрелки. Полярный радиус-вектор г мы будем брать как положительным, так и отрицательным; в первом случае его откладывают в направлении, определяемом углом 0, а во втором - в противоположном направлении. Как в случае прямоугольных координат, и здесь зависимость между г и 0 может быть задана в явной, неявной или параметрической форме. Мы ограничимся, преимущественно, простейшим случаем, когда кри- вая представляется явным уравнением вида r = f(O). Если перейти к прямоугольным координатам, взяв, как обычно, полюс за начало, а полярную ось - за ось х, то уравнения х = г cos 0 = /(0) cos 0, у = г sin 0 = /(0) sin 0 дадут параметрическое представление нашей кривой, при- чем роль параметра здесь будет играть полярный угол 0. [Полученные здесь функции от 0, вместе с f непрерывны и имеют непрерывные производные.] Формулы Хд = г'д cos 0 - г sin 0, y's = г'в sin 0 + г cos 0 показывают, что особая точка (в смысле п° 223) может встре- титься лишь в том случае, если г = г'а = 0. Обратимся к примерам. 1) Архимедова спираль: г=ав (рис. 122). Кривую можно рассматривать как траекторию точки, равномерно движу- щейся по лучу, исходящему из полюса, в то время как этот луч равномерно вращается вокруг полюса.
2261 § 1. АНАЛИТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ КРИВЫХ 513 Для построения ряда точек А, В, С, D,... кривой отложим по вертикали л ОА = а—, а затем возьмем ОВ=2ОА, ОС=ЗОА, ОВ = 4ОА и т. д., ибо им отве- 2 чают углы 2 —, 3 —, 4 — ит. д. Изменяя угол 0 от 0 до °=, получим бесконечное 2 2 2 множество витков кривой OABCD, DEFGH,...; расстояния соседних витков, считая по лучу, равны 2ла. Можно углу 0 придавать и отрицательные значения, от 0 до - Тогда полу- чится вторая часть кривой OAB'CD'..., намеченная пунктиром; она симметрична с первой. Заметим, что уравнение г=аО+b также выражает архимедову спи- b р а л ь: если повернуть полярную ось на угол а =-, то это уравнение приведется к виду г = ав. а а 2) Гиперболическая спираль: г= — (рис. 123). 0 При возрастании угла 0 до бесконечности радиус-вектор стремится к нулю, а точка кривой стремится к совпадению с полюсом (никогда его не достигая); в этих условиях полюс называется асимптотической точкой кривой. Кривая бесчисленное множество раз заворачивается вокруг полюса. л 4а 1 1 Если на луче 0= — отложить отрезок ОА = — и взять АВ = —ОА, ОС=— ОВ, 1 ОД = — ОС, ..., то точки Л, В, С, D, ..., очевидно, лежат на кривой. Угол 0 может принимать и отрицательные значения. При изменении 0 от О до - оо, как и в случае архимедовой спирали, получается вторая часть кривой А'ВС'1У симметричная с первой; она и здесь намечена пунктиром. Для уточнения формы кривой в бесконечности рассмотрим вертикальное sin 0 расстояние точки кривой до полярной оси y = rsin 0 = а—— . При г - ± ~ или - 0 что то же - при 0—±0 имеем limу=а. Таким образом, прямая, проведенная параллельно полярной оси на расстоянии а от нее, служит для кривой асимп- тотой. 33 Г. М. Фихтенгольц, т. I
514 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [226 3) Логарифмическая спираль: г=ает9 (рис. 124). Если угол 0 возрастает (или убывает) в арифметической прогрессии, то г воз- растает (убывает) в геометрической прогрессии. Отложим на полярной оси отре- зок О А = а, а на вертикали к ней - отрезок ОВ=ае *; обе точки А, В принадле- жат нашей кривой. Если построить теперь прямоугольную ломаную ABCDE..., Рис. 124. то из подобия треугольников нетрудно заключить, что отрезки ОА, ОВ, ОС, OD, т ~ ОЕ, ... образуют геометрическую прогрессию со знаменателем е 2; так как соответствующие углы суть 0, —, 2-—, 3-— и т. д., то, очевидно, все точки С, D, Е, ... также лежат на рассматриваемой спирали. Когда угол 0 растет от 0 до +~, точка делает бесчисленное множество обо- ротов вокруг полюса, быстро удаляясь от него в бесконечность; расстояния между витками уже не равны. Угол 0 может принимать и отрицательные значения; когда 0 стремится к — то радиус-вектор г стремится к 0. Кривая бесконечное множество раз заворачивается вокруг полюса, безгранично к нему приближаясь (но никогда не достигая, см. часть AB'C'D'E'... на рис. 124); полюс является асимптотической точкой кривой. Отметим, наконец, что, поворачивая полярную ось вокруг полюса, можно добиться уничтожения множителя а и привести уравнение логарифмической спи- рали к простейшему виду: 4) Улитки: г-a cos 0+Z> (рис. 125). Происхождение этих кривых можно себе представить так. Возьмем окруж- ность диаметра а. Если выбрать полюс О лежащим на самой окружности, а поляр- ную ось провести через центр С, то для любой точки М окружности, очевидно, будет r=a cos в. Это и есть полярное уравнение окружности. Если изменять здесь угол 0 от 0 до 2л, то переменная точка дважды опишет окружность (против часовой стрелки). Если удлинить теперь все радиусы-векторы ОМ' окружности на постоянный отрезок M'M=b (Z>=*0), то из построенных таким путем точек М составится новая кривая, которая и носит общее название улитки. Ее полярное уравнение, оче- видно, будет г = a cos 0+b. Проще всего обстоит дело, если Ь=-а, ибо тогда радиус-вектор всегда поло- жителен и кривая окружает полюс со всех сторон (рис. 125а). При b-^а кривая проходит через полюс и, сама себя пересекая, образует внутреннюю петлю, как
2261 § 1. АНАЛИТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ КРИВЫХ 515 на рис. 125 б. Для определения углов 0, при которых переменная точка проходит через полюс, полагаем г=0 в уравнении кривой. Мы получаем уравнение cos 0 = b -----, которое имеет решение именно потому, что Ь^а. а Особенно интересен промежуточный тип кривой, отвечающий случаю, когда Ъ = а. Здесь полюс лежит на кривой (0= л), но петли нет; кривая изображена на рис. 125 в. Сразу бросается в глаза тождество этой кривой с кардиоидой, рассмотренной выше, как частный случай эпициклоиды (рис. 120). Пред- ставляем читателю убедиться в этом. М'М = Ъ<а Рис. 125. 5) Лемниската Бернулли: г2 = 2а2cos20 (рис. 126). Эту кривую можно определить как геометрическое место точек М, для кото- рых произведение их расстояний р = FM и р' = F'M до двух данных точек F и F', отстоящих одна от другой на расстояние 2а, есть постоянная величина а2 *). *) При указанном соотношении между расстоянием FF' и постоянной величи- ной произведения оо\ очевидно, середина О отрезка FF' принадлежит кривой (р = р' = а). Иначе обстоит дело, если рр' = Z»3, где b # а, тогда получаются так назы- ваемые овалы Кассини. 33»
516 ГЛ, VH. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [227 При обозначениях рис. 126 из треугольников OMF и OMF' имеем гг+а2 + 2аг cos 0, g'2 = r2 + a2-2ar cos 0, так что, по определению, о2(?'2 = (г2+д2)2 - 4а2/-2 cos2 0 = а4, откуда после элементарных преобразований получим г2 = 2а2 cos 20. Это и есть полярное уравнение лемнискаты. Так как левая, а с ней и правая часть этого уравнения не может принимать отрицательных значений, то угол 0 может изменяться лишь в таких промежутках, для которых cos 20э=О. Это будут промежутки Вся кривая расположится в двух вертикальных углах между прямыми SS л Зя и ТТ, проведенными под углами — и — к полярной оси (см. рисунок). Она сама 4 4 п Зл 5л 7л себя пересекает в полюсе, которому отвечают 0 = —, — , — , — . 4 4 4 4 Если обычным образом перейти к прямоугольным координатам, то легко; получить такое (неявное) уравнение лемнискаты: (х2+у2)2 = 2а2(х2 - у2). 227. Поверхности и кривые в пространстве. Мы не предполагаем здесь углубляться в приложения дифференциального исчисления к гео- метрии в пространстве, оставляя эти вопросы для специального курса дифференциальной геометрии. Поэтому в отношении пространствен- ных образов мы ограничимся лишь тем, что необходимо для даль- нейших частей самого курса анализа. Как и выше (напомним это еще раз), все рассматриваемые функ- ции будем предполагать непрерывными и имеющими не- прерывные производные по своим аргументам.
227] § 1. АНАЛИТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ КРИВЫХ 517 Будем исходить из прямоугольной системы координатных осей Oxyz. Нам приходилось уже говорить о том, что поверхность в про- странстве может быть выражена уравнением между текущими коор- динатами вида z=f(x,y) (6) [см., например, 160]. Такое уравнение, равно как и аналогичные ему x=g(y, z) и у = h(z, х), мы будем называть явным уравнением по- верхности. К этому простейшему случаю, в известном смысле, сводятся и дру- гие способы задания поверхности. Часто случается, что поверхность выражается уравнением вида F(x,y,z)^, (7) не разрешенным относительно той или иной координаты (неявное задание). Если в точке (x0,y0,z0), ему удовлетворяющей, хоть одна из частных производных F'x(xQ, у0, z0), F'y(x0, у0, z0), F'(x0, у0, z0) от- лична от 0, то в окрестности этой точки поверхность представима я в- н ы м уравнением того или иного типа. Действительно, если, напри- мер F'(x0, у0, zo)^O, то по теореме III п° 208, по крайней мере в ок- рестности рассматриваемой точки, уравнение определяет z, как одно- значную функцию от х и у: z = f(x, у) (и притом - непрерывную вместе со своими производными по обоим аргументам). Таким образом, исключение может представиться лишь в осо- бой точке поверхности, удовлетворяющей сразу трем условиям: F>0, f; = o, Г2' = 0. Уравнение F(x,y) = G, (8) не содержащее вовсе одной из координат, также может быть истол- ковано как уравнение поверхности. Именно, на плоскости ху оно выражает кривую; если на ней, как на направляющей, по- строить цилиндрическую поверхность с образующими, па- раллельными оси z, то все точки этой поверхности, и только они, будут удовлетворять рассматриваемому уравнению (поскольку z в него не входит и ничем не стеснено). Аналогично истолковываются уравнения вида G(y, z) = 0 или H(z, х) = 0. Обратимся теперь к кривым в пространстве. Простей- шим способом задания кривой в пространстве является тот, когда две текущие координаты, например, у и z, задаются в виде функций от третьей, х: у = fix'), z=g(x). (9) Подобный способ есть естественный аналог явного задания кри- вой на плоскости. И здесь уравнения указанного типа можно было бы называть явными уравнениями кривой.
518 ГЛ, VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [228 Как и в случае плоской кривой, к явному заданию в основном, сво- дятся и другие аналитические представления пространственной кривой. Каждое из уравнений (9) может быть истолковано либо как урав- нение проекции нашей кривой на координатную плоскость, соответ- ственно, ху или xz, либо как уравнение проектирующего ци- линдра [см. (8)] с образующими, параллельными, соответственно, оси z или оси у. Более общий способ задания пространственной кривой состоит в том, чтобы рассматривать ее как пересечение двух поверхностей вообще. Если эти поверхности выражаются каждая одним из ниже- следующих уравнений F(x, у, z) = 0, G(x, у, z) = 0, (10) то совокупность обоих уравнений дает аналитическое представление кривой пересечения. Уравнения (10) называют неявными урав- нениями кривой. Составим матрицу из частных производных от функций F и G Ру /цч 1(7' G'y G'J' Пусть какой-нибудь из определителей этой матрицы, например, г; F' Gy G'z отличен от 0 в рассматриваемой точке. Тогда на основании теоремы IV п° 208 в окрестности этой точки уравнения (10) могут быть заме- нены уравнениями типа (9) (причем фигурирующие в этих уравне- ниях функции снова оказываются непрерывными вместе со своими производными). Таким образом, возможность сведения к простейшему способу задания перестает быть обеспеченной лишь в окрестности такой точки кривой (ее называют особой), где все три определителя матрицы (11) одновременно обращаются в нуль. 228. Параметрическое представление. Перейдем, наконец, к па- раметрическому заданию поверхностей и кривых в пространстве, при- чем на этот раз начнем с кривых. Подобно тому как мы это делали на плоскости, координаты переменной точки простран- ственной кривой можно задать в функции от некоторой вспо- могательной переменной - параметра - f. z = %(f), (12) с тем чтобы при изменении параметра t точка, координаты которой даются этими уравнениями, описывала рассматриваемую кривую (в случае явного задания (9) роль параметра играло само х).
228] § 1. АНАЛИТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ КРИВЫХ 519 Если для взятой точки кривой хоть одна из производных x't, y’t, z't отлична от 0, то - как и в случае плоской кривой - легко в окрест- ности этой точки перейти от параметрического к явному зада- нию. Лишь в окрестности особой точки, где все эти производ- ные — нули, нельзя гарантировать такую возможность. Как и в случае плоской кривой, к числу особых следует от- нести и так называемые кратные точки, т. е. точки, получаемые при двух или большем числе значений параметра*). Обратимся к параметрическому представлению п о- верхностей. На этот раз определение положения точки на поверхности потре- бует двух параметров (в случае явного задания (6) роль этих пара- метров играли две из координат: х и у). Пусть имеем уравнения х =<р(ц, v), у =у>(и, v), z = %(и, V), (13) где (и, v) изменяется в замкнутой области J. Составим матрицу '<Ра % Zu SPv y>'v (14) и предположим, что для и = и0 и v = v0 отличен от 0 хоть один из опре- делителей этой матрицы; например, пусть <Ри Чи (p'v У® #0. Тогда, переписав первые два из уравнений (13) в виде (р(и, V) — х = 0, у)(и, v)-y = 0, на основании теоремы IV п° 208 можем утверждать, что этой систе- мой двух уравнений с четырьмя переменными и, v, х, у (если огра- ничиться значениями их, близкими к интересующим нас) переменные и, v определяются, как однозначные функции от х, у: u=g(x,y), v = h(x,y), непрерывные со своими производными. Наконец, подставляя эти вы- ражения и и v в третье из уравнений (13), придем к обычному пред- ставлению поверхности явным уравнением г = %(g(x, у), h(x, у)) =/(х, у), где и функция f непрерывна и имеет непрерывные производные. Лишь в том случае, если все три определителя матрицы (14) одно- временно обращаются в 0 (соответствующая точка поверхности будет особой), такое представление может оказаться неосуществимым, *) См. сноску на Стр. 505.
520 ГЛ. VH. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [229 Читателю ясно, что в связи с параметрическим представлением поверхности так же может быть установлено понятие о простой и кратной точках поверхности: первая получается лишь при одной системе значений (и, v) параметров, а вторая, по меньшей мере, - при двух*). Возвращаясь к параметрическим уравнениям (13) поверхности, фиксируем в них значение одного из параметров, например, поло- жим и = и0. Тогда получатся, очевидно, уравнения некоторой кривой x=<p(u0,v), y = ip(u0,v), z=%(u0,v), всеми точками лежащей на поверхности. Изменяя значение w0, полу- чим целое семейство таких «кривых (и)». Аналогично, фиксируя значение v = vQ, получим также кривую на нашей поверхности х=<р(и, v0), у =у(и, 1’0), z = %(и, v0); из таких «кривых (г?)» также составляется целое семейство. Так как значения uav можно рассматривать как координаты точек на поверхности, то эти линии называют координатными линиями поверхности. Если точка поверхности простая, т. е. по- лучается лишь при одной системе значений {и, v) параметров, то через нее проходит по одной координатной линии из каждого семейства. Обозревая различные способы аналитического представления по- верхностей [см. (6), (7) и (13)] и пространственных кривых [(9), (10) и (12)], мы могли бы повто- рить сказанное в конце п° 223. В окрестности обыкновен- ной (и простой) точки дело сводится к наглядному случаю явного задания. 229. Примеры. 1) Кривая В и в и а н и. Так называется кри- вая пересечения поверхностей сфе- ры и прямого цилиндра, для кото- рого направляющей служит ок- ружность, построенная на ра- диусе сферы, как на диаметре (рис. 12Т)- Пусть радиус сферы есть R; если расположить оси, как указано на рисунке, то уравнения сферы и цилиндра, соответственно, будут x2+y2+z2= R2, х2+у2 = Rx. Совокупность их и определяет нашу кривую. *) Отметим, что в случае замкнутой поверхности (т. е. поверхности, не имеющей контура, например, сферической), ее точки заведомо не могут быть поставлены в взаимно однозначное соответствие точкам плоской области Л на плоскости uv. В этом случае наличие кратных точек неизбежно при любом пара- метрическом задании.
229] § 1. АНАЛИТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ КРИВЫХ 521 Кривая имеет вид изогнутой восьмерки; в точке (R, 0, 0) она сама себя пере- секает, так что эта точка - наверное особая. Это подтверждается и вычисле- нием. Матрица ( 2х 2у 2z\ 1.2х-Л 2у Oj имеет определители 2у 2у 2z о =“4j’2’ 2z 2х 0 2х-R = 4xz—2Rz, 2х 2у 2x-R 2у = 2Ry, которые все вместе обращаются в 0 именно в этой точке. Кривую В и в и а и и можно представить и параметрически, например, так: х = R sin21, у = R sin t cos t, z = R cos t. Действительно, нетрудно проверить, что эти выражения тождественно удовлет- воряют неявным уравнениям кривой и что при изменении параметра t, скажем, от 0 до 2л, полностью описывается вся кривая. Точка (R, 0, 0) получается дважды - при л Зл t=— и / — , т. е. является кратной, 2 2 как и следовало ожидать. 2) Есть случаи, когда параметрическое представление естественно вытекает из са- мого происхождения кривой. Рассмотрим, в виде примера, винтовую линию. Про- исхождение ее можно себе представить сле- дующим образом. Пусть некоторая точка М, находившаяся первоначально в А (рис. 128), вращается равномерно вокруг оси z (ска- жем, по часовой стрелке) и одновременно участвует в равномерном же поступатель- ном движении параллельно этой оси (допу- стим, в положительном направлении). Тра- ектория точки М и называется винто- вой линией. За параметр, определяю- щий положение точки М, можно принять угол t, составляемый с осью х проекцией ОР отрезка ОМ. Координаты х и у точки М будут те же, что и у точки Р, так что ^ис- 128. х = a cos t и у = a sin t, где а есть радиус описы- ваемой точкой Р окружности. Что же касается вертикального перемещения z, то оно растет пропорционально углу поворота t (ибо поступательное и вращательное движения оба происходят равномерно), т. е. z=ct. Окончательно параметрические уравнения винтовой линии будут x = acosl, y = asin/, z=ct. (15) Полученная винтовая линия называется левой; при правой системе коор- динатных осей те же уравнения выражали бы правую винтовую линию. Легко исключить из уравнений (15) параметр t и перейти к явному заданию; например, найдя t из последнего уравнения и подставив его выражение в первые два, получим Z Z х = a cos —, у = a sin —. с с 3) Рассмотрим сферическую поверхность радиуса R с центром в начале (рис. 129). Ее неявное уравнение будет, как известно, x2+y2+zz^Rs.
522 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [229 Желая получить ее обычное параметрическое представление, про- ведем «экваториальное» сечение АКА', а через «полюсы» Р, Р' и рассматриваемую точку М - «меридиан» РМКР'. Положение точки М на сфере может быть опре- делено углами гр = < РОМ и 0 = <$АОК. Имеем z=NM=R cosy. Затем ON= J? siny, а через ON координаты x и у (те же для М, что и для N) выразятся так: х = ON cos 0, y=(Wsin0. Собирая все эти резуль- Рис. 129. каково бы ни было значение Р(Р'). таты, окончательно параметрические уравнения поверхности сферы получим в виде: х = R sin у cos 0, у - R sin у sin 0, z=Я cosy, причем угол у достаточно изменять от О до я, а угол 0 - от 0 до 2л. Однако, соответствие между точ- ками сферической поверхности и точ- ками прямоугольника [0, я; 0, 2л] на плоскости у0 не будет взаимно одно- значным *): значения 0 = 0 и 0 = 2л при- водят к одним и тем же точкам поверх- ности и, кроме того, при у = 0 (у=л) 0, получается одна лишь точка - полюс 5Т Если у заменить углом /.=-—<р, изменяющимся от-до —, а 0 менять 2 2 2 между -лил, то мы придем к обычным географическим координа- там: широте и долготе. Для матрицы частных производных (7? cos у cos 0 R cosy sin 0 -J? siny! - J? sin у sin 0 J? sin у cos 0 0 J все определители J?2 sin2 у cos 0, R2 sin2 у sin в, R2 sin у cos у обращаются вместе в нуль при у = 0 и у=л. Однако очевидно, что оба «полюса» представляют особенность только применительно к этому аналитическому представлению сферы. Легко видеть, что одно семейство координатных линий на сфере составится из меридианов (0 = const), а другое - из параллельных кругов (у = const). 4) Можно обобщить предыдущий пример следующим образом. Пусть в плоско- сти xz задана кривая (образующая) своими параметрическими уравнениями х=у(м), z=ip(ll), (16) причем у(и)э=0. Станем вращать ее, как твердое тело, вокруг оси z (рис. 130). Если через v обозначить угол поворота, то уравнения получаемой поверхности вращения напишутся в виде х=<р(й) cos v, y=y(u)sinv, z=y(n) (0=ец=в2л). Если в плоскости xz взять полуокружность x = _Rsin«, z=Rcosu ') Ср. сноску на стр. 520,
230] S 2. КАСАТЕЛЬНАЯ И КАСАТЕЛЬНАЯ ПЛОСКОСТЬ 523 и ее вращать вокруг оси z, то параметрическое представление образуемой таким путем сферической поверхности мы получим (с точностью до обозначений) в преж- нем виде. Предоставляем читателю убедиться в том, что особыми точками для поверх- ности вращения могут быть лишь точки на оси вращения, либо же точки, полу- ченные при вращении из особых точек обра- зующей. Координатными линиями и здесь служат различные положения образующей (меридианы) и параллельные круги. 5) Если к вращательному движению кривой (16) присоединить еще поступатель- ное - параллельно оси вращения, то (пред- полагая оба движения происходящими равно- мерно) получим общую винтовую по- верхность х=<р(и) cos v, у=<р(и) sin v, z=y(u) + cv. Возьмем, в частности, в качестве образую- щей положительную часть оси х: х = и, z = 0 («э»0). Подвергнув ее винтовому движению, придем к обыкновенной винтовой поверх- Рис. 130. ности Х= И COS 17, y = «sin y, z=cv. Для общей винтовой поверхности одно семейство координатных линий со- стоит из различных положений образующей (v=const), а другое - из винтовых линий (и = const). § 2. Касательная и касательная плоскость 230. Касательная к плоской кривой в прямоугольных координатах. Понятие касательной нам уже встречалось не раз [см. напри- мер, 91]. Кривая, заданная явным уравнением У=Лх), где f - непрерывная функция с непрерывной производной, в каждой своей точке (х, у) имеет касательную, угловой коэффициент которой tga выражается формулой tgx=y>/W Таким образом, уравнение касательной имеет вид Y-y=y'£X-x). (1) Здесь (как и ниже) X, Y означают текущие координаты, а х, у - коор- динаты точки касания. Легко получить и уравнения нормали, т. е. прямой, проходя- щей через точку касания перпендикулярно к касательной: Y-y= -Д-(Х-х) или X-x+y'x(Y-y) = 0, (2)
524 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ (230 В связи с касательной и нормалью рассматривают некоторые от- резки - именно отрезки ТМ и MN и их проекции ТР и PN на ось х (рис. 131). Последние называются, соответственно, подкасатель- ной и поднормалью и обозначаются через sbt (subtangens) и sbn (subnormal). Полагая в уравнениях (1) и (2) У=0, легко вычи- слить, что sbt-TP= ~, , sbn = PN=yy'x. (3) Ух Тогда из треугольников МРТ и MPN определятся и длины отрез- ков касательной и нормали t = TM--- 4/1+у|, n = MN=\yl/T+y2\- (4) В случае неявного задания кривой F(x, у)=0 в окрестности ее обыкновенной точки М(х, у) можно пред- ставить себе кривую выраженной явным уравнением. Если в точке М, например, F'y(x,y)^0, то кри- вая выразится уравнением вида y=f(x), где функция f непре- рывна и имеет непрерывную про- изводную. Отсюда ясно, что для кривой существует в точке М касательная, и ее уравнение мо- жет быть представлено в форме (1). Но мы знаем [209 (15)], что в этом случае ,= F&x, у). Ух Ffa, у) ’ подставляя, после простых пре- образований получим вполне симметричное относительно х и у урав- нение касательной F'x(x, у)(Х-х) + F$x, y\Y-у) = 0. (5) К тому же результату придем и'в случае, если F'y = 0 в точке М, но Fx^0. Лишь в особой точке это уравнение теряет смысл, и относительно касательной, без дополнительного исследования [236], здесь ничего сказать нельзя. Уравнение нормали для рассматриваемого случая, очевидно, будет таково: F'y(x, у)(Х-х) - F'x(x, y)(Y-y)=0. Наконец, предположим, что кривая задана параметрически; .Т=<р(г), J’=V’O).
231] § 2. КАСАТЕЛЬНАЯ И КАСАТЕЛЬНАЯ ПЛОСКОСТЬ 525 Мы видели, что если <p'(t)^Q, касательная к кривой существует и имеет угловой коэффициент tg« = p- (6) [106 (11)]. Уравнение касательной может быть написано так: У-у=^(Х-х) или Xt 4 Xt y't В последней форме уравнение годится и для случая, когда x't = 0, но Лишь в особой точке, где и x't = Q и у'/=0, уравне- ние теряет смысл, и вопрос Иногда удобно, умножив оба знаменателя на множи- тель dt, писать уравнение касательной в виде (7) dx dy 231. Примеры. 1) Пара- бола: у2 = 2рх. Дифференци- руя это равенство (считая у функцией от х), получим уу'х=р. Таким образом [см. (3)], под- нормаль параболы есть постоянная величина. Отсюда вытекает простой спо- соб построения нормали (а с ней и касательной) к пара- боле. По формуле (4), для отрезка нормали к параболе имеем выражение 2) Эллипс: касательной: X2 у2 &+lf- л = Уу2+Р2. (рис. 132). По формуле (5) имеем такое уравнение ±(Х-х)+^(Г-у) = 0. dr о2 Учитывая само уравнение эллипса, можно последнее уравнение переписать в более простом виде ^=1. а2 Ь2 *) При этом, как всегда уславливаются в аналитической геометрии, если в пропорции Х-х Y-y а b один из последующих членов есть 0, то это означает просто, что равен 0 и соответ- ствующий предыдущий член.
526 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [231 а2 Полагая здесь У=0, найдем Х=—. Таким образом, точка Т пересечения х касательной с осью х не зависит ни от д', ни от Ь. Касательные к различным эллипсам, отвечающим различным значениям Ь, в их точках, имеющих абсциссу х, все проходят через одну и ту же точку Г на оси х. Так как при Ь = а получается окружность, для которой касательная строится просто, то точка Т сразу определя- ется, и это приводит к простому способу построения касательной к эллипсу, ясному из рис. 132 *). Легко определить длину отрезка нормали для эллипса: ' I Ь4х2 + а4у2 у2 Такое же выражение получается и в случае гиперболы------------=1. а2 Ь2 К L L 3) Астроида: х3 + у3 = а* (рис. 116). Уравнение касательной i _£ х 3(Х-х)+у 3(Y-y) = 0 с помощью самого уравнения кривой может быть преобразовано к виду х3 у3 а3х3 а3 у3 Последнее уравнение есть «уравнение в отрезках». Следовательно, касательная 11 1 1 отсекает на осях отрезки а3х3 и а3у3. Отсюда легко получить одно интересное свойство астроиды. Обозначив через т длину отрезка касательной между о с я- м и, имеем £ 1 £ £ т2 = о3 х3 + а3 у3 = а2 и т = а = const. Таким образом, оси симметрии астроиды на всех касатель- ных отсекают равные отрезки. 4) Циклоида: x = a(f-sinl), y = a(l-cost) (рис. 118). t Мы имели уже [в 225, 6)] равенство yx^ctg —, т. е. tga = ctgy = tg - л t и можно принять а -----. *) Это свойство касательных к эллипсу непосредственно связано с тем фактом, что эллипс может быть рассматриваем как ортогональная проекция некоего круга (радиуса а), лежащего в наклонной плоскости.
231] § 2. КАСАТЕЛЬНАЯ И КАСАТЕЛЬНАЯ ПЛОСКОСТЬ 527 t Вспомним (рис. 118), что t= <$MDN, так что <$MEN=—. Если продолжить л t прямую ЕМ до пересечения в Т с осью х, то <$ЕТх = — - — = а. Следовательно, прямая ME, соединяющая точку циклоиды с высшей точкой катящегося круга (в соответствующем положении), и будет касательной. Отсюда ясно, что прямая MN будет нормалью. Впоследствии нам полезно будет выражение для отрезка п нормали, которое легко получить из прямоугольного треугольника &MEN. Именно, t п = MN-= 2а sin —, 2 5) Эпициклоида: х = 4(1 + ni) cos mt-m cos (1 + m)t ], y = a[(l+m)sin mt-msin (1 + ni)t] (рис. 119). Написав выражения для производных x't и y't в виде z ( п x't = 2am(X + m) sin —cos lm+y 1t, t ( П y't = 2am(l + ni) sin — sin lm+—jt, найдем, что У/ ( П tga = — = tg lm + — I Z. x[ k 2) ( U Отсюда a = lm-t— I Z. k 2/ Если соединить (рис. 119) точку D с М, то эта прямая составит с осью х как раз такой угол: t <lxTD = <ZDOT+ < ODT= mt+— . 2 Следовательно, DT есть касательная в точке М, а МВ будет нормалью. 6) Эвольвента круга: x = a(/sin Z+cosZ), y = a(sinZ-ZcosZ) (рис. 121). Здесь y't tg a = — = tg t, откуда a = t. x’t Таким образом, касательная MT параллельна радиусу ОВ, и ВМ есть нормаль к нашей кривой. Замечание. Результаты примеров 4), 5), 6) можно было бы получить без всяких выкладок, исходя из кинематических соображений. При каче- нии одной кривой по другой точка касания служит всякий раз мгновенным центром для движущейся фигуры, так что нормаль к траектории любой ее точки проходит через эту точку касания.
528 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [232 232. Касательная в полярных координатах. Если кривая задана полярным уравнением г = то, переходя обычным образом к прямо- угольным координатам, получаем параметрическое представление кривой в виде х = г cos 0 = /(0) cos О, у - г sin 0 =/(0) sin 0, причем роль параметра здесь играет 0. В таком случае, по общей формуле (6), . у'и r'№ sin 0 + г cos 0 tg а = — ~ . ° хе T0cos0-rsm0 Однако, если кривая исследуется в полярных координатах, обычно положение касательной определяют не углом а с полярной осью, Рис. 133. а углом т с продолженным ра- диусом-вектором (рис. 114 и 133). Мы имели уже [218, 4)] простую формулу tg® = -£. (8) го Точно так же вместо отрез- ков t, п, sbt, sbn, о которых была речь в 230, здесь рассматривают другие отрезки. Проведя через полюс О ось, перпендикулярную к радиусу-вектору (эта ось вра- щается при перемещении точки), продолжают касательную и нор- маль до пересечения с ней, соот- ветственно, в точках Т nN. Тогда отрезки ТМ и MN называются полярными отрезками ка- сательной и нормали, а их про- екции ТО п ON на упомянутую ось - полярными подка- сательной и поднормалью. Обозначать их будем, как и прежде, но помещая внизу в виде значка букву р. Легко получить, используя фор- мулу (8): sbt„ = ТО = г tg со = , р г0 sbnp = ON= г ctg со = ге', а отсюда уже np = MN=V7*+r'*.
233] § 2. КАСАТЕЛЬНАЯ И КАСАТЕЛЬНАЯ ПЛОСКОСТЬ 529 233. Примеры. 1) Архимедова спираль: г = а8 (рис. 122). Так как г'в = а, то sbnp=a = const. Это позволяет сразу устанавливать положение точки N, а с ней - нормали и касательной. Заметим, что tg ш = 0, так что при 0 - ~ и tg а> ->• т. е. угол ю стремится к прямому. а 2) Гиперболическая спираль: /• = — (рис. 123). а На этот раз = - — , sbtp - -а = const, что также облегчает очевидным обра- зом построение касательной. 3) Логарифмическая спираль: г = ает!> (рис. 134). 1 Имеем Г(, = maemli, так что tg со = — = const, и сам угол ш - const. Таким обра- ти зом, логарифмическая спираль обладает тем замечательным свойством, что угол между радиусом-вектором и касательной сохраняет постоянную величину. Иными словами, логарифмическая спираль пересекает все свои радиусы- векторы под постоянным углом. Этим свойством она напоминает окружность, которая также пересекает радиусы-векторы, исходя- щие из центра, под постоянным (именно под прямым) углом. [Впрочем, и окруж- ность можно рассматривать как частный случай логарифмической спирали, отве- чающий т = 0.] 4) Улитки: r=acos8+b (рис. 135). Отметим, что sbnp = г'а= - a sin 0 оказывается не зависящей от Ь. Таким обра- зом, если взять лежащие на одном луче (из полюса) точки различных улиток, отвечающих различным значениям Ь, то для всех этих точек полярная поднормаль будет общая, т. е. точка N - одна и та же. Но при b = 0 получается окружность, для которой построение нормали очевидно; тогда легко построить нормаль и для любой из улиток (рис. 135). Из треугольника &.MON вычисляется полярная нормаль: Др = Уаг+2аЬ cos 0+Z>2. 34 Г. М. Фихтенгольц, т. I
530 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [234 Особенно просто выражение полярной нормали для кардиоиды*) (h = a): 0 пв = 2а cos—. 2 5) Лемниската: r2 = 2а2cos20 (рис. 126). Дифференцируем это равенство, считая г функцией от 0; получим г г'а = - 2а2 sin 20. Разделив почленно эти два равенства, ввиду (8), найдем tg си = — = - ctg 20, Гд л откуда со = 20 -I— . Обозначая через а и углы наклона касательной и нормали, имеем 2 л. л в-а.--, а = со + 0 = 30Ч—, 2 2 следовательно, /3 = 30: угол наклона нормали к лемнискате ра- вен утроенному полярному углу точки касания. Это дает простой прием построения нормали. 234. Касательная к пространственной кривой. Касательная плоскость к поверхности. 1° В случае пространственной кривой, определение касательной остается буквально то же, что и для плоской кривой [91]. Ограничимся здесь предположением, что кривая задана параметри- чески: х=<р(0, у=^(0, z = %(/). Возьмем определенное значение t и, тем самым, определенную точку М(х, у, z) на кривой; пусть это будет обыкновенная и простая точка [223]. Придадим t приращение At, тогда нара- щенному значению t + At параметра будет отвечать другая точка Mr(x + Ax, у— Ay, z + Az). Уравнения секущей ММГ будут иметь вид Х-х _Y-y _Z—z Лх Лу Лг ’ где X, Y, Z - текущие координаты. Геометрический смысл этих уравнений не изменится, если мы все знаменатели разделим на At: Х-х Y-y _Z-z Лх Лу Лг ~Zt Л1 ~Л1 Если эти уравнения в пределе, при At-*O, сохраняют определен- ный смысл, то этим будет установлено существование п р е д е л ь- *) Именно этот частный случай и изображен на рис. 135.
234] § 2. КАСАТЕЛЬНАЯ И КАСАТЕЛЬНАЯ ПЛОСКОСТЬ 531 ного положения секущей, т. е. касательной. Но в пре- деле мы получаем Х-х _Y-y _Z-z x't ~ y't ~ Ft ’ v и эти уравнения, действительно, выражают прямую, поскольку не все знаменатели - нули. Таким образом, в каждой обыкновенной точке кривой касательная существует и выражается этими уравне- ниями. Для особой точки вопрос о касательной остается откры- тым. Замечание. Мы переходили к пределу в уравнениях секущей при At -*0; покажем, что это равносильно предположению, что ММ^О. Ввиду непрерывности функций <р, ip, %, из At->0 следует, что и ММГ = /Зх2 4- Ay* + Az* — 0. Для доказательства обратного заключения зададимся произвольным числом е=-0. Так как ММ1 есть непрерывная функция от At, то при |zh|s»s эта функция имеет наименьшее значение <5, очевидно, поло- жительное (так как взятая точка предположена простой, т. е. не получается ни при каком значении параметра, отличном от Z). В та- ком случае при ММ^д необходимо \At\ <g, ч. и тр. д. Иногда уравнения (9) удобно писать в виде Х-х _Y-y _Z-z dx dy dz ’ который получается из (9) умножением всех знаменателей на dt. Если через а, /3, у обозначать углы, составленные касательной с осями координат, то направляющие косинусы cos a, cos/3, cosy вы- разятся так: cos а = —r х‘ , cos /3 = —--- У'1 - —, ± ’{x'p+y'p+z'p ± Ух/24-Д24-г<2 има У —--е . ... ± Ух?+э?+г? Выбор определенного знака перед радикалом отвечает выбору опре- деленного направления касательной. Вопрос о касательной к кривой, заданной неявными уравнениями F(x, у, z) = 0 и G(x, у, z) = 0, мы рассмотрим ниже, в 3°. 2° Пусть поверхность задана явным уравнением z=f(x,y). Мы в 180 дали определение касательной плоскости и, 34*
532 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [234 в предположении дифференцируемости функции f(x, у) *), нашли урав- нение этой плоскости [180 (6)]: Z - z =/'(х, у\Х-х) +f'y(x, y)(Y-y). Обыкновенно обозначают ^Л(х,У)=Р, Yy=fy(x,y)^q и пишут уравнение касательной плоскости так: Z — z=p(X-x) + q(Y—y). (10) Если cos 2, cos [i, cos г суть направляющие косинусы нормали к поверхности (так называют перпендикуляр к касательной плоско- сти в точке касания), то для них имеем выражения - ~р —Q COS А = , cos и =---—" = , ± У1 + р- + q2 ± yi 1 cos V =-• ±У1 +p2+q2 двойной знак перед радикалом отвечает двум противоположным на- правлениям нормали. Проведем теперь по поверхности через рассматриваемую точку произвольную кривую x=q>(f), y=v(t), z = так что тождественно относительно t будет V(0)- Дифференцируем это тождество по t [181]: Z'(O=P?’'(O + ?V’'(O- Возьмем касательную к кривой в рассматриваемой неособой точ- ке в форме (9). Если, наконец, в предыдущем равенстве заменить производные (р, у', %' пропорциональными им, в силу (9), разностями Х-х, Y-y, Z-z, то придем к (10). Таким образом, касательная (9) всеми точками лежит в касательной плоскости (10). Мы можем, сле- довательно, теперь определить касательную плоскость к поверхности в заданной на ней точке, как такую плоскость, в которой лежат ка- сательные ко всем кривым, проведенным по поверхности через эту точку **). Если поверхность задана неявным уравнением F(x, у, z) = 0, то, предполагая Fz'#0 в рассматриваемой точке, в окрестности ее *) Мы здесь предполагаем существование и непрерывность частных произ- водных, следовательно, дифференцируемость налицо [179]. **) Частично об этом уже была речь в 180.
234] S 2. КАСАТЕЛЬНАЯ И КАСАТЕЛЬНАЯ ПЛОСКОСТЬ 533 можно выразить поверхность и явным уравнением z = f(x, у), так что существование касательной плоскости обеспечено. Так как в этом случае р дх f; ’ q ду F'z ’ то, подставляя эти значения р и q в уравнение (10), легко преобра- зуем его к виду F'x(x, у, z)(X-x) + Щх, у, z)(Y-y) + F'(x, у, z)(Z - z) = 0. (12) Очевидно, в таком же виде представится уравнение касательной пло- скости и в случае, если Г/ = 0, но какая-нибудь из двух других произ- водных F', Fy отлична от 0. Лишь в особой точке это урав- нение теряет смысл (и вопрос о касательной плоскости остается открытым). 3° Теперь легко сообразить, как найти касательную к кривой, за- данной двумя неявными уравнениями: F(x, у, z) = 0, G(x, у, z) = 0, т. е. представляющей пересечение двух соответствующих поверхно- стей. Если рассматриваемая на кривой точка - обыкновенная, то в ее окрестности кривая может быть выражена и явными уравнениями [227], так что существование касательной обеспечено. Эта касатель- ная, очевидно, лежит в пересечении касательных плоскостей к упомя- нутым двум поверхностям и, следовательно, выражается уравнениями F'x(X-x)+F'^Y-y) + F'(Z-z^0, | Gx(X-x) + G'y(Y-y) + G'z(Z-z-) = Q. J [Так как в обыкновенной точке для матрицы коэффициентов хоть один из определителей отличен от 0, то этими уравнениями, действи- тельно, определится прямая.] 4° Возвращаясь к поверхности, перейдем, наконец, к случаю, когда она выражается параметрическими уравнениями: Х = Гр(и, V), у = у>(и, v), z = %(u,v). Снова ограничиваемся обыкновенной (и простой) точкой; так как [228] в ее окрестности поверхность может быть выражена и явным уравнением, то существование касательной плоскости обе- спечено. Уравнение ее может быть написано в виде A(X-x) + B(Y-y) + C(Z-z) = Q, (14) где коэффициенты А, В, С еще подлежат определению. Если в уравнениях поверхности закрепить за v значение, отвеча- ющее выбранной точке, то получатся уравнения координатной линии
534 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [235 [«кривой (у)»], проходящей через эту точку. Касательная к этой кривой в указанной точке выразится уравнениями [см. (9)] Х-х Y-y Z-z хи Уи zu Аналогично, фиксируя и, получим координатную линию другого се- мейства, проходящую через данную точку [«кривую (w)»] и имеющую в ней касательную Х-х Y-yZ-z y'v zv Так как обе эти касательные должны лежать в касательной пло- скости (14), то выполняются условия Лх'+ By' + Сг'= О, Ах'„ + By’v + Cz’v = 0. В таком случае коэффициенты А, В, С должны быть пропорциональны определителям матрицы (*и у и zA lx y'v Обыкновенно полагают их равными этим определителям: Уи у'„ (15) Теперь уравнение касательной плоскости проще всего написать с по- мощью определителя: Х-х Хи x'v Y-y Уи Уи Z-z 4 (16) в обыкновенной точке оно, действительно выражает плоскость. Направляющие косинусы нормали будут , А В } COS Z =-- — , COS H =------====: , + ]/л2+в2+С2 ±ул2+в2+с2- с 1 cos v = —г .... — . ±ул2+В2+С2 J 235. Примеры. 1) Рассмотрим винтовую линию (рис. 128) x = acosZ, y = asinz, z=cZ. В этом случае x't = - a sin t, y't = a cos t, z't = c, и уравнения касательной имеют вид Х-х Y-y Z-z -asinz a cost с
236] § 2. КАСАТЕЛЬНАЯ И КАСАТЕЛЬНАЯ ПЛОСКОСТЬ 535 Направляющие косинусы касательной a sin г a cos t с cos а = —------, cos р = — ., cos у - — - . Уа2+с2 Уа2+с2 ]/а2 + с2 Отметим, что cos у = const, следовательно, и у = const. Если представить себе винтовую линию навернутой на прямой круглый цилиндр, то можно сказать, что винтовая линия пересекает все образующие этого цилиндра под постоянным углом *). д;2 у2 ^2 2) Эллипсоид: —+— +—=1. а2 о2 с2 Касательная плоскость получается по формуле (12), с учетом самого уравнения эллипсоида: хХ yY zZ — +—+— =1. а2 Ь2 с2 X2 у2 Z2 3) Конус (второго порядка): —|------------= 0. а2 62 с2 Касательная плоскость: хХ Yy zZ —+ —------=0. а2 Ь2 с2 В вершине (0, 0, 0) конуса, которая является особой точкой, это уравнение теряет смысл, и касательной плоскости нет. 4) Кривая Вивиани (рис. 127): x2+y2+z2 = R2, х2+у2 = Rx. Касательная выражается уравнениями [см. (13)] xX+yY+zZ=R2, (2x-R)X+2yY=Rx. Эти уравнения перестают выражать прямую лишь в особой точке (R, 0, 0). 5) Винтовая поверхность: x^ucosv, y = usinv, z=cv. По формуле (16) уравнение касательной плоскости будет Х~х cos V Y-y sin v Z-z 0 = 0 - и sin v и cos V с С учетом уравнений поверхности это уравнение может быть упрощено так: и sin у-Л'-cos v-Y+ — Z= uv. с 236. Особые точки плоских кривых. Здесь мы остановимся подроб- нее на поведении кривой, заданной неявным уравнением Г(х,у) = 0, вблизи ее особой точки (х0, у0). Не имея в виду исчерпать этот вопрос, мы хотим лишь познакомить читателя с главными типами *) Если поверхность цилиндра разрезать по образующей и развернуть, то винтовая линия превратится в прямую, которая все вертикали, естественно, пере- секает под одним и тем же углом. Это соображение делает предыдущий результат совершенно очевидным.
536 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [236 особых точек. При этом функцию F мы предполагаем непрерывной и имеющей непрерывные производные первых двух порядков. Без умаления общности, можно считать хо = 0, уо=0; это отвечает просто переносу начала координат в испытуемую точку. Итак, имеем ДО, 0)=0, Д (0, 0) = 0, F'y(0, 0) = 0. Введем обозначения Оц = Д»(0,0), о12 = Д/О, 0), а22= Д*(0, 0). Предполагая, что из чисел ап, а12, хоть одно - не нуль, мы станем классифицировать представляющиеся возможности в зависимости от знака выражения а^а^-а^. Исследования настоящего п° теснейшим образом примыкают к исследова- ниям п° 197 1° aua22-ai2=-0. В этом случае, как мы знаем, функция Дх, у) имеет в начальной точке экстремум. Значит, в достаточно малой окрестности этой точки F^Q или F^Q (исключая самую начальную точку, где функция об- ращается в 0). Иначе говоря, в упомянутой окрестности нет ни одной точки нашей кривой, кроме начальной: эта последняя оказывается изолированной точкой кривой. Примеры, иллюстрирующие рассматриваемый случай: х2+у2 = 0 или (х2+у2)(х+у-1) = 0. Начальная точка принадлежит обеим кривым и для обеих является изолированной. Но, в то время как первая вся состоит из одной точки, вторая, кроме нее, содержит еще прямую х+у = 1, не проходящую через начало. 2° ana22-ah-=0. Как и в 197, в окрестности начальной точки можно представить Дх, у) в следующем виде: Дх, у) Ц {aux2 + la^xy + a^y2 + aux2 + 2a12xy + a^y2}, где все a—0 при х-*-0, у-^0, или, если ввести полярные координаты р, <р: о2 Дх, у) = у {au cos2 ср + 2a12 cos ср sin ср + sin2 ср + + au cos2 <р + 2a12 cos ср sin ср + sin2 ср}. В рассматриваемом случае, если предположить еще о^О, трех- член au + 2a12t + «22г2 имеет различные вещественные корни /2 и разлагается на множители a^t - tx)(t - /2). Положим, сру = arctg , д>2 = arctg t2, так что t1 = tg<p1, t2 = tg<p2. Теперь легко преобразовать первый трехчлен в скобках {...} к виду cos2 ср + 2а12 cos ср sin ср + sin2 ср = а22 cos2 <p(tg 7- - tg (tg ср - tg ^2). (18)
236] § 2. КАСАТЕЛЬНАЯ И КАСАТЕЛЬНАЯ ПЛОСКОСТЬ 537 Отсюда становится ясным, что прямые, проведенные через начало под углами и <р2 к оси х, - будем для краткости называть их пря- мыми (фх) и (ф2) - делят плоскость на две угловых области, в одной из которых упомянутый трехчлен сохраняет знак плюс, а в другой знак минус*) (рис. 136). Заключим теперь прямые (gsj и (ф2) внутрь двух сколь угодно узких угловых областей - двух пар вертикальных углов, содержа- щихся, соответственно, между прямыми (%-г) и (q^+e) или (<р2-е) и (<р2+е) (эти углы на рис. 132 заштрихованы). Взяв круг доста- точно малого радиуса ге вокруг начала, можно утверждать, что - по выделении упомянутых уг- лов - он разобьется на две угло- вых области, в каждой из кото- рых уже сама функция F(x, у) со- храняет определенный знак: в од- ной плюс, а в другой минус (см. рис.). Действительно, так как при изменении угла вне промежутков <рг +е) и (<р2-е, <р2+е) трех- член (18) не обращается в 0, то Рис. 136. он остается по абсолютной вели- чине большим некоторого положительного числа те. С другой сто- роны, при достаточно малом q выражение au cos2 <р + 2а12 cos <р sin <р + + 0^22 sin2 <р по абсолютной величине будет меньше те. Отсюда и сле- дует наше утверждение (ср. рассуждение в 197, 1°). Рассмотрим теперь два заштрихованных вертикально расположен- ных сектора круга, например, те, которые ограничены прямыми (%-£) и (q^ + e). Так как на этих прямых функция имеет противопо- ложные знаки, то на каждой вертикали, пересекаю- щей упомянутые секторы, найдется точка, в кото- рой Дх,у) обращается вО, т. е. точка нашей кривой. Это следует из известного свойства непрерывной функции [80], если при- менить его к функции Дх, у) от у (при фиксированном х) **). Таким образом, внутри каждой пары заштрихованных секторов расположена ветвь кривой, проходящая через начало, в то время как вне их, в пределах круга, точек кривой нет. Ввиду произвольности е ясно, что в начале эти ветви касаются, соответственно, прямых (с/^) и (%). Правда, остался открытым еще вопрос, единственна ли та точка на упомянутой вертикали, в которой Дх, у) = 0. Если бы их нашлось *) Этим мы несколько углубляем сказанное в 197, 2°: там нам достаточно было констатировать наличие двух прямых, на которых трехчлен имеет разные знаки. ** ) Ср. доказательство теоремы I п° 206 о существовании неявной функции.
538 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [236 две, то, по теореме Ролля [111], между ними на той же вертикали нашлась бы точка, в которой было бы Fy(x,y) = 0. Итак, единствен- ность будет установлена, если мы докажем, что, по крайней мере, в достаточной близости к началу такое равенство невозможно. Допустим противное. Тогда будем иметь Fy(xn,yn) = 0 для неко- торой последовательности точек {(х„, уп)}, где 0 и tg<p1=l]. Хп Применим к функции F'y(x, у) формулу конечных приращений [183, (Ю)]: 0 = F'(xn,yn)-F'(0,0) = ~ пУп) ' + Fyi(0пХп , ^пУп)*Уп (О-^^я*^!) ИЛИ F"y(finXn, Gr,yn) + Fyl(Onxn, 0пуп} • “Г = о. J Хп Переходя здесь к пределу, получим окончательно tz12 + a22r1 = O или tx - что неверно: такое значение могло бы иметь лишь в том #22 случае, если бы корни трехчлена an+2av,t+ аг2[2 были равными. Из сказанного попутно вытекает, что, в достаточной близости к началу, ни одна точка упомянутых двух ветвей, кроме самой началь- ной, уже не будет особой. Аналогично исчерпывается и случай, когда а^ = 0, но йц^О или «и = «22 = 0, но «12^0; отметим, лишь, что в последнем случае роль прямых (<Pi) и (<р2) играют оси координат. Итак, при сделанном предположении а^а^-а^^О точка (0,0) оказывается двойной точкой кривой: в ней пересекаются две ветви кривой, каждая из которых в этой точке имеет свою касательную. Угловые коэффициенты этих касательных определяются всегда из уравнения a11 + 2a12t + a22t2=0; лишь если а22 = 0, следует считать, что, кроме конечного корня, оно имеет корнем и бесконечность. Примерами могут служить уже знакомые нам кривые (х2уу2)2 + 2а2(у2-х2) = 0 [лемниската, рис. 126], х3+У3-Заху — 0 [декартов лист, рис. 117], для которых начало и будет двойной точкой. В первом случае имеем «и= -4а2, «12 = 0, «22 = 4а2, /i = l, z2= -1, так что касательными в на- чале служат биссектрисы координатных углов. Во втором: «и = а,п = 0, «12= - За, /1 = 0, /2 = ~, и касательными служат оси координат.
236] § 2. КАСАТЕЛЬНАЯ И КАСАТЕЛЬНАЯ ПЛОСКОСТЬ ;39 3° а11а22-а?2 = 0. Допустим и здесь, что a^-sO. Квадратный трехчлен а11 + 2а121 + + a2St2 в этом случае имеет двойной корень Z±= -а^/а^. По- лагая, как и выше, = arctg tx, проведем через начало прямую под Рис. 137. этим углом <р± и оси х. Заключим ее в угловую область между пря- мыми и (<рх+ е) (на рис. 137 она заштрихована). С помощью со- ображений, сходных с примененны- ми выше, можно установить, что вне заштрихованной области, но в до- статочной близости к началу, функ- ция F(x, у) сохраняет опреде- ленный знак, один и тот же с обеих сторон: плюс или минус, в зависимости от того, будет ли fl22:s 0 или я22-гО. Теперь на пря- мых («Рх ±е) функция имеет одина- ковые знаки, и применять теоре- му Коши нельзя. Мы не будем углубляться в ис- следование этого случая, требую- щего более сложных рассуждений, с привлечением высших производ- ных. Ограничимся указанием на основные возможности, которые здесь представляются. а) Вблизи начальной точки, кроме нее самой, нет точек кривой: изолированная точка (как в случае 1°). Примеры: х4+у2 = 0 или (х4+у2)(х + у-1) = 0. Для обеих «кривых» начало является изолированной точкой. б) В обоих заштрихованных вертикальных углах (в достаточной близости к началу) на каждой вертикали лежат по две точки нашей кривой, через начало проходят две ветви кривой, имеющие в ней об- щую касательную (tpj: двойная точка (как и в случае 2°). Пример: х4-у2 = 0, т. е. у=±х2 две параболы, в начальной точке касающиеся оси х. в) В одном из заштрихованных углов вовсе нет точек кривой, а в другом - две ветви, которые как бы заканчиваются в начальной точке, имея в ней общую касательную (q^). Здесь мы имеем дело с новым типом особой точки — с точкой возврата (или точкой за- острения). В зависимости от того, лежат ли обе встречающиеся в ней ветви по разные стороны от общей касательной или по одну сторону, различают точки возврата первого и второго рода.
540 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [237 Примером кривой, имеющей в начале точку возврата первого рода, может служить кривая у2 - х3 = 0 (полукубическая парабола, рис. 115). Более редкий случай точки возврата второго рода проиллюстрируем таким примером: х5 -(у-х2)2 = 0 или У = Х2±Х2Ух (x=s=0). Обе ветви в начальной точке касаются оси х, располагаясь (по край- ней мере, вблизи начала) над нею (рис. 138). Если а11 = а12 = а22 = 0, то приходится рассма- тривать производные высших порядков. В этом случае возможны и более сложные типы особых точек (тройные или, вообще, п-кратные точки, и т. д.). 237. Случай параметрического задания кри- вой. Скажем еще несколько слов об особых точках плоских кривых, заданных параметричес- кими уравнениями х=<р(0, y=y(t}. Пусть при / = /0 имеем *о=<№) = 0 и Уо =У'('о) = °. НО ИЗ производных второго порядка х'о и у'о' пусть хоть одна, например х'о, отлична от нуля. Проведем секущую через точки (х0, >’о) и (х, у) кривой, отвечающие значениям t0 и t параметра. Ее уравнение может быть написано так: Х-ха Y-уь х-х0 у-у0 Но по формуле Тейлора [с дополнительным членом в форме Пеано, 124 (10а)], так как Хо=у'0=0, имеем х-хо = ^(хо+а)(Г-/0)2, У-Уо = 1(Уо н fiXt-to)2,
237] § 2. КАСАТЕЛЬНАЯ И КАСАТЕЛЬНАЯ ПЛОСКОСТЬ 541 где а и стремятся к 0 при t -► t0. Подставляя, перепишем уравнение секущей, после сокращения обоих знаменателей на |(г- /0)2, в сле- дующем виде: 2 Х-х0=У-у0 х'а' + <х УоУ0’ Здесь можно перейти к пределу при t—10 *), и таким путем полу- чается уравнение касательной: х~хо=_у~Уо хо Уо или Y-y0=f{X-x0). хо (19) Мы предположили х'о ^0; пусть, например, х'о' >0. Тогда функ- ция x=(p{t) при t = t0 имеет (собственный) минимум [137], т. е. х>х0 при значениях t, близких к t0 (как при t<t0, так и при /=-/0). Таким образом, в точке (xo,j’o) смыкаются две ветви кривой, отве- чающие t^t0 и t>t0; они имеют общую (наклонную или гори- зонтальную) касательную и обе расположены вправо от вер- тикали х-х0. Иными словами, налицо точка возврата (рис. 139). Это - основной случай особой точки для кривой, заданной пара- метрически. Легко пойти несколько дальше в этом исследовании, чтобы уста- новить, какого рода будет эта точка возврата. С этой целью привлечем третьи производные, и при- ращения х-х0 и у-у0 напишем в виде х - х0=i х'о {t - Zo)2 +1 {х'о + а)(/ - Zo)\ У - У о = J Уо (f - ?о)2 +1 (Уо' + Ш - ?о)3> где а и снова стремятся к 0 при Вычислим, пользуясь уравнением (19), ординату Y точки каса- тельной с абсциссой х; мы получим Y-Уо = £ (* - *о) =1уо а - Q2 + (х«" + 5)(/ “ 'о)3- ♦) См. замечание в 234, которое приложимо и здесь, если рассматриваемую точку считать простой.
542 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [238 Составим, наконец, разность ординат Y и у, отвечающих одной и той же абсциссе х: Y-у = i ~,х'0'у'п" + у ] (, _ 10)з, 6 1 х0 ' I и' где через у обозначена снова некоторая бесконечно малая при t — Го. Теперь если только х'о 'у'о' - х'о'у'о" # 0 (что обыкновенно и выпол- няется), ясно, что разность Y-y будет разных знаков при t^t0 и(>(0, т. е. для тех двух ветвей кривой, которые встречаются в точке (х0, Уо) (в предположении, конечно, что мы ограничиваемся значениями t, достаточно близкими к Zo). Ветви располагаются по разные стороны от касательной, и мы устанавливаем точку возврата первого рода. Примеры подобных особенностей встречались нам уже не раз: циклоида, эпи- или гипоциклоида, эвольвента круга - все имеют такие точки возврата (рис. 118-121). Может оказаться, в исключительном случае, что х'о''у'о' - х'о'уо" = 0; тогда разложение Y-y по степеням t — t0 начнется с четвертой или более высокой степени этого двучлена. Если степень эта четная, то рассматриваемая особая точка будет точкой возврата второго рода. § 3. Касание кривых между собой 238. Огибающая семейства кривых. Если две кривые имеют общую точку Мо и - в этой точке - общую касательную, то говорят, что кривые касаются в точке Мо. Настоящий параграф по- священ некоторым вопросам, связанным с касанием плоских кри- вых. Приступая к рассмотрению огибающей семейства кри- вых, остановимся сначала на самом понятии семейства кривых. Нам уже не раз приходилось встречаться с уравнениями кривых, в которые, кроме текущих координат х и у переменной точки, входит еще один или несколько параметров. В случае одного пара- метра, скажем а, уравнение имеет вид F(x, у, а) = 0. (1) Левая часть является функцией трех переменных, из которых пере- менную а мы иначе называем лишь потому, что она играет особую роль: для получения конкретной кривой значение параметра а дол- жно быть фиксировано. При изменении этого значения, обычно в пределах некоторого промежутка, будут получаться, вообще говоря, различные (по форме или расположению) кривые. Совокупность всех этих кривых и называют семейством кривых с одним параметром, а уравнение (1) - уравнением семейства.
238J § 3. КАСАНИЕ КРИВЫХ МЕЖДУ СОБОЙ 543 Иногда случается, что для подобного семейства кривых существует кривая, которая касается каждой кривой семейства в одной или не- скольких точках и притом вся состоит из этих точек касания (рис. 140). Такая кривая носит название огибающей данного семей- ства. Мы покажем сейчас, как установить, существует ли огибающая, и как найти ее в случае существования. С этой целью допустим сначала, что огибающая существует. Для простоты предположим, что речь идет об огибающей (точ- нее - ветви огибающей), которая каждой кривой семейства касается в одной точке. Тогда координаты этой точки касания однозначно определяются указанием кривой семейства, т. е. значением пара- метра а: х=<р(а), у=у>(а). (2) Поскольку огибающая вся состоит из точек касания, эти уравнения и дают параметрическое представление огибающей. Мы предполагаем существование и непрерывность частных производных функции F и производных функций tp и tp. Точка (2) лежит на кривой (1), определяемой тем же значением параметра а, так что имеет место такое тождество относи- тельно а: F(<p(a\ чр(а), а) = 0. (3) Продифференцировав его полным образом по а, получим [181, 185]*) F'xdx + F'y dy + Fada=0, (4) причем производные вычислены при указанных в (3) значениях аргу- ментов, a dx и dy означают дифференциалы функций (2). Теперь постараемся аналитически выразить тот факт, что огиба- ющая касается в точке (2) кривой (1). Касательная к кривой (1) [см. 230, (5)] да-х)+г;(г-у)=о (5) и к кривой (2) [230 (7)] Х-х _Y-y dx dy ♦) Здесь, между прочим, мы используем и непрерывность частных производ- ных функции F.
544 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [238 должны совпасть. Условие совпадения этих прямых можно написать в виде F'xdx + F’y dy = 0. (7) При этом, как и выше, под х и у мы разумеем их значения (2), а под dx и dy - дифференциалы функций (2). Заметим, что уравнения (5) и (6) действительно выражают каса- тельные к кривым лишь в предположении, что рассматриваемая точка не будет для них особой. Тем не менее, равенство (7) имеет место даже в том случае, если эта точка будет особой для той или другой кривой. Сопоставляя (7) с (4) и учитывая, что da - произвольное число, найдем, что F'a = G или в развернутом виде: %(й),'Да), а)=0. (8) Тождества (3) и (8) показывают, что функции (2), нам неизвест- ные, должны тождественно относительно а удовлетворять системе уравнений F{x, у, а) = 0, F'a(x, у, а)=0. (9) Итак, если огибающая существует, ее параметрические уравне- ния (2) получаются как решения относительно х и у системы (9). В том случае, когда эта система при переменном а вообще не до- пускает решений в виде функций от а, положение вещей ясно; оги- бающей вовсе нет. Предположим же теперь, что в результате решения системы (9) получены уравнения (2), выражающие кривую без особых точек *). Будет ли эта кривая огибающей нашего семей- ства кривых? Так как функции (2) удовлетворяют уравнениям (9), то выпол- няются тождества (3) и (8). Дифференцируя первое из них, получим (4), а сопоставляя это с (8), придем к равенству (7). Если точка (2) (ни при одном а) не будет особой на соответствующей кривой (1), так что уравнение (5) действительно выражает касательную к назван- ной кривой, то равенство (7) обусловливает совпадение этой каса- тельной с касательной (6) к кривой (2). В этом случае кривая (2) на самом деле будет огибающей семейства. В частности, это можно гарантировать, если, например, кривые данного семейства вовсе лишены особых точек. Наоборот, если такие особые точки имеются и при изменении а геометрическое место их образует кривую (2), то соответствующие ей функции ср и у необходимо удовлетворяют системе (9) **), хотя в этом случае кривая может не быть огибающей. *) При наличии отдельных особых точек ограничимся промежутком измене- ния параметра, не содержащим критических его значений. **) Для них выполняется (3), значит и (4). Затем, имеет место (7) как выше упоминалось в тексте; сопоставляя с (4), приходим к (8).
239] § 3. КАСАНИЕ КРИВЫХ МЕЖДУ СОБОЙ 545 Итак, при наличии особых точек кривая (2), полученная в резуль- тате решения системы (9), подлежит еще проверке: она может быть огибающей, может быть геометрическим местом особых точек на кри- вых семейства или, наконец, частью - огибающей, частью же - та- ким геометрическим местом. Обыкновенно при разыскании огибающей не останавливаются на системе уравнений (9), но идут дальше - исключают из них а. Иными словами, получают соотношение вида Ф(х,у)=0, (10) уже не содержащее а и представляющее собой условие, необходи- мое и достаточное для того, чтобы для пары значений х, у нашлось такое значение а, которое совместно с ними удовлетворяло обоим уравнениям (9). Все точки кривой (2), полученной решением системы (9), должны удовлетворять уравнению (10). Поэтому, если это последнее уравне- ние не выражает никакой кривой, то сразу ясно, что огибающей нет. Если же уравнение (10) выражает кривую (ее называют дискри- минантной кривой семейства), то она как выше подлежит проверке. В ее составе должна оказаться огибающая (если она суще- ствует), но должно быть и геометрическое место особых точек (если таковые налицо). Кроме того, здесь есть еще одна неприятная воз- можность, которую следует исключить проверкой: именно, в состав дискриминантной кривой может попросту входить одна или несколько частных кривых семейства. Так будет в том случае, когда беско- нечному множеству точек дискриминантной кривой отвечает одно и то же значение а, совместно с ними удовлетворяющее урав- нениям (9) *). Все сказанное всего лучше выяснится на примерах. 239. Примеры. 1) Найти огибающую для семейства окружностей (х-а)2+у2= г2 (г=const) (рис. 141). Д ифференцируем по а: - 2(х - а) = 0. Исключая а, получим у2 - г2 = 0 или у = ±г: две прямые, параллельные оси х, которые, очевидно, составляют огибающую **). *) Если оперировать непосредственно уравнениями (9), то такая возможность исключается, потому что уравнения пытаются решить при заведомо переменном а. *♦) Если уравнение семейства взять в виде х-а± Уг2-у2 = 0, то результат дифференцирования по а будет -1=0; из невозможности этого равенства, казалось бы, вытекает заключение об отсутствии огибающей. Такое заключение, однако, было бы неверно, так как вся изложенная теория предполагает существование и непрерывность частных производных от левой части уравнения семейства, а здесь (именно при у = ± г) конечной производной по у нет. 35 М. Фихтенгольц, т. I
546 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [239 2) Найти огибающую различных положений прямой, скользящей двумя точ- ками, находящимися друг от друга на постоянном расстоянии а, по осям коорди- нат (рис. 142). Взяв за параметр угол в, составленный перпендикуляром к движущейся прямой с осью х, уравнение прямой можно написать в виде — sm е cos е Дифференцируем по 0 -------cos 0 Н---------sin 0 = 0 или sin2 0 cos2 0 * У sin3 0 cos3 0 ' Иначе это можно написать так: х у х у sin 0 cos 0 sin 0 cos 0 sin2 0 cos20 sin2 0+cos2 0 откуда x = a sin3 0, у = a cos3 0. Читатель узнает в этих уравнениях параметрическое представление астрой- Г 71 1 д ы 1224, 4): t =—- 0 I, которая в данном случае и является огибающей. С этим свойством астроиды мы уже однажды сталкивались [231, 3)]. 3) Во многих случаях огибающая как бы ограничивает («огибает») часть плоскости, занятую кривыми семейства. Что это не всегда так, показывает пример: у=(х-с)3 (рис. 143). Здесь огибающей служит ось х, пересекающая все кривые семейства. Аналогичное обстоятельство проявляется и в следующем, более сложном примере. 4) Найти огибающую семейства у=а2(х - а)2 (параболы). Сопоставляя это уравнение с уравнением 2а(х - а)2 - 2as(x - а) = 2а(х - а) (х-2а) = 0, получим либо х = а 0=0), либо х = 2а О = о1)> так что дискриминантная кривая состоит из прямой у=0 и кривой 16у*=х\ Первая касается всех парабол в верши-
239] § 3. КАСАНИЕ КРИВЫХ МЕЖДУ СОБОЙ 547 нах. Вторая имеет с каждой параболой три общие точки: касается ее прих = 2ли пересекает при х = -2а±2а^2. 5) Рассмотрим эллипс Приняв за параметр абсциссу t центра окружности, напишем уравнение этого семейства в виде: Ь2 F(x, у, Г) = (х-Г)2+у2--(а2-Г2) = 0, а2 причем t изменяется в промежутке [ - а, а]. Имеем 2/>2 а2 F}=-2(x-f)+—-t = 0, откуда t = ——x. а2 а2+Ь2 Подставив это значение t в уравнение F=0, мы получим уравнение огибающей в следующем виде: ( <Рх V Z>2 ( а1х2 А I х------1 +у2---I а2--------I = О t o2 + 62J с21. (а2+62)2/ или, после преобразований: х2 у2 а2+Ь2+Ь2=1' Мы пришли к эллипсу с теми же осями симметрии, что и данный. Любопытно отметить, что этот эллипс касается не всех окружностей семейства. Это обстоятельство легко усмотреть, если не исключать t из уравнений F= 0 и F(' = 0, а выразить из них х и у через t: a2+b2 b ,,------------- х=—-— t, у- ±— Уа*-(а2+Ь2)(2. а2 я2 Действительно, отсюда сразу видно, что выражение для у может быть веществен- а2 ным лишь при | t — . Значит, только для части семейства окружно- }а2+Ь2 стей, соответствующей указанным значениям г, существует огибающая. 35»
548 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [239 Этот поучительный пример показывает, что параметрическое задание огиба- ющей может оказаться более выгодным, потому что из него легче усмотреть, для какой части данного семейства огибающая действительно существует. 6) Для семейства концентрических окружностей х2+у2 = а (as^O) огибающей нет: дифференцирование по а сразу приводит к невозможному равен- ству 0=1. 7) Рассмотрим два семейства полукубических парабол (а) (у-а)2-х3 = 0 и (б) у2-(х-а)3=0 (рис. 145). Дискриминантная кривая будет (а) х = 0, (б) у=0, и в обоих случаях является носительницей особых точек. Но в случае (б) она все же одновременно будет огибающей; в случае (а) огибающей нет. 8) Более сложный пример такого же типа дает другое семейство полукуби- ческих парабол: (у - а)2 - (х - а)2 = 0 (рис. 146). Здесь дискриминантная кривая распадается на две прямые: у = х и у = х—— . Первая является лишь геометрическим местом особых точек, а вторая будет огибающей. 9) Наконец, рассмотрим семейство прямых 4(l+/)x = i2y. Если продифференцировать по t: 4x = 2ty и исключить t из обоих уравнений, то получим, как результат исключения: х(х4 у) = 0.
240] § 3. КАСАНИЕ КРИВЫХ МЕЖДУ СОБОЙ 549 Это уравнение представляет две прямые: х = 0 и у= -х, которые входят в состав данного пучка (при t = 0 и t = - 2). Ни одна из них не является ни огибающей, ни носительницей особых точек. Огибающей в этом случае нет. Этот пример иллюстрирует указанную нами ранее возможность того, что уравнение (10) представит не огибающую, а одну или несколько кривых семейства. Если бы мы, не исключая t, попытались выразить х и у через (при перемен- ном /, то это оказалось бы невозможным. 240. Характеристические точки. С понятием огибающей тесно связано другое интересное геометрическое понятие - характери- стических точек. Возьмем одну из кривых семейства F(x, у, а) = 0, определяемую значением а параметра. Придадим а некоторое при- ращение Ла; значению а + Ла параметра будет отвечать другая кривая семейства F(x,y, а + Ла)=0, «близкая» к первой. Может случиться, что при достаточно малом Ла обе кривые пере- секаются в одной или в нескольких точках. При стремлении Ла к нулю эти точки пересечения будут каким-то образом перемещаться по пер- вой кривой. Если при этом какая-либо из точек пересечения стре- мится к определенному предельному положению, то эту предельную точку называют характеристической точкой на исход- ной кривой (рис. 147). [Обращаем внимание читателя на то, что ха- рактеристическая точка связана не только с той кривой, на которой
550 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [240 лежит, но и со всем семейством. Говорить о характеристической точке для отдельно заданной кривой было бы лишено смысла.] Точка пересечения упомянутых выше кривых должна удовлетво- рять системе уравнений F(x, у, а) = 0, F(x, у, а + Да) = 0 или равносильной ей системе Дх, у, а)=0, = 0 (п) Аа Устремив здесь Да к нулю, мы придем к уже знакомой нам систе- ме (9): Дх, у, а) = 0, F'a(x, у, а) = 0, которой, таким образом, при заданном а, и должны удовлетворять координаты характеристической точки. Точнее говоря, если сохранить за х и у значения координат точки пересечения, то вместо (11) (применяя формулу Лагранжа) можно написать: Дх, у, а) = 0, F’a(x, у, а + ОДа) = 0 (О<0<1). Если при Да->-0 координаты х, у имеют соответственно пределы х, у, то, переходя в написанных равенствах к пределу, ввиду непре- рывности функций F и F'a, легко убедиться в том, что координаты х, у характеристической точки, действительно, удовлетворяют системе уравнений (9). Допустим теперь, что характеристические точки существуют на каждой кривой семейства. Тогда можно поставить вопрос о гео- метрическом месте характеристических точек. Если это место представляет собой кривую вида (2), то функции <р(а), у(а), фигурирующие в ее уравнениях, должны удовлетворять системе (9), а значит - получаться в числе решений этой системы относитель- но х, у. Точно так же все точки упомянутого геометрического места удовлетворяют и уравнению (10), т. е. это место необходимо входит в состав дискриминантной кривой. Из сказанного ясно, что геометрическое место характеристических точек, если существует, представляет собой (полностью или по частям) либо огибающую, либо носительницу особых точек. Легко убедиться в том, что в примерах 1), 2), 4), 5) предыдущего п° геометрическое место характеристических точек совпадает с оги- бающей. Это в некотором смысле, - общий случай. Но вот в примере 7) (а) это геометрическое место служит лишь носительницей особых точек, а в примерах 3) и 7) (б) вовсе нет пересечения между кривыми (хотя огибающая существует).
241] § 3. КАСАНИЕ КРИВЫХ МЕЖДУ СОБОЙ 551 241. Порядок касания двух кривых. Рассмотрим две кривые, касаю- щиеся в точке Мо. Если кривые заданы явными уравнениями y=f(x) и Y=g(x), и Мо имеет абсциссу х0, то совпадение ординат и угловых коэффи- циентов касательных может быть записано так: Яхо)=/ W = g'(xo)- Для характеристики близости ности точки Мо возьмем точ- ки М и т на этих кривых (рис. 148) с абсциссой х и установим порядок бесконечно малого отрезка тМ = Y-y=g(x) -f(x) =д>(х) относительно основной бесконечно малой х-х0. Если этот порядок равен и + 1 (или больше, чем п +1), то говорят, что кривые в точке выше, чем п). Мы рассматриваемых кривых в окрест- Мо имеют порядок касания п (или видели, что при наличии касания всегда <p(*o) = g(^o) ~Ж>) = °, <Р'(*о) = g' (*о) W = °- Пусть в точке х0 для функций /(х) и g(x) существуют производные всех порядков до (п + 1)-го включительно, причем /"(х0)=/Ш , /(n)(x0)=g(n)(x0), так что <р"(*о)=#"(*о) -/"(*о) = 0, • • •, <Р(п)(х0)=g(n)(x0) -/(n)(x0) = 0. О величине производных /(п+1)(х0) и g(n+1)(x0) пока никаких пред- положений не делаем. Применяя к функции q>(x) формулу Тейлора с дополнительным членом в форме Пеано [124 (10а)]: тпЛГ=У-у=99(х) = ^~^^(х-х0)п+1, (12) видим, что lim тМ = 9’(п+1)(л0) £(п+1)(хо)-/("+1)(хо) (»+1)! (л + 1)! Таким образом, если /(n+1)(x0)#g(n+1)(x0), то кривые имеют каса- ние и-го порядка, если же /(n+1)(x0)=g(n+1)(x0), то порядок касания будет выше п. Отсюда (в предположении существования всех упоми- наемых производных) следует:
552 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [241 Для того чтобы в точке с абсциссой х0 кривые y = f(x) и Y=g(x) имели касание п-го порядка, необходимо и достаточно, чтобы выполня- лись условия f(x0) = g(x0), /'(х0) = g'fxo), ..., /<">(х0) = g^Kxo), (13) /<n+1)(Xo)^g<n+1U). (14) [Если последнее неравенство не установлено, то можно лишь утвер- ждать, что порядок касания не ниже и.] Для случая, когда порядок касания точно равен п, из (12) непо- средственно вытекает, что при п четном кривые, касаясь в точке Мо, взаимно пересекают одна другую, при п же нечетном этого нет. Замечание. В свете выведенных условий мы вернемся вновь к самому определению порядка касания. Это определение кажу- щимся образом связано с выбором координатной системы. На деле же порядок касания двух кривых от этого выбора не зависит (лишь бы только ось у не была параллельна общей касательной), так что установленное понятие является действительно геометриче- ским. Если повернуть координатную систему на произвольный угол а, то новые координаты х, у выразятся через старые х, у с помощью известных формул преобразования: х = х cosa+y sin а, у= -х sin ad-у cos а. Пусть в старой системе координат дана кривая у=f(x); если в преды- дущих уравнениях под у разуметь именно эту функцию, то они дадут параметрическое представление кривой в новой системе, с х в роли параметра. Очевидно, производные dx dy . dy . dy -v- = cosa + -r- sin a, -sin a+j- cos a dx dx ’ dx dx одновременно в 0 обратиться не могут, так что в новом предста- влении ни одна точка не будет особой, а тогда ясно, что первая из этих производных - не 0 в интересующей нас точке (ибо иначе касательная к кривой в этой точке была бы параллельна оси у!). Сле- довательно, в ее окрестности кривая выразится и в новой системе явным уравнением у=f(x). Теперь легко видеть, что [ср. 121] И вообще • ^dy -smad—cosa dy _ dx dx dy cos aH—sin a dx d2y d^y_ dx2 dx2 [ dy ]3> cos ad--sin a I dx J dky dxk (dy <Py \dx’ dx2' dky\ dx*)’
242] § 3. КАСАНИЕ КРИВЫХ МЕЖДУ СОБОЙ 553 где Rk есть знак рациональной функции. Отсюда ясно, что как только для двух функций у от х выполняются равенства (13), то для двух соответствующих функций у от х выполняются аналогичные равенства. Точно так же - при наличии (13) - из неравенства (14) вытекает такое же неравенство для новых функций, ибо - в противном случае - обратное преобразование привело бы нас, взамен неравен- ства (14), тоже к равенству. Этим и завершается доказательство высказанного утверждения. 242. Случай неявного задания одной из кривых. Рассмотрим теперь случай, когда вторая кривая задана неявным уравнением G(x, j)=0. (15) Пусть рассматриваемая точка М0(х0, у0) не является для этой кривой особой, а именно пусть G'y(x0, уо)#О. Тогда в окрестности этой точки уравнение (15) определяет однозначную функцию y=g(x), и для установления порядка касания могут быть использованы уже извест- ные условия (13) [и (14)]. Но так как явного выражения функции g(x) в этом случае мы не имеем, то было бы удобнее выразить эти условия в такой форме, которая использовала бы лишь данную функцию G. С этой целью вспоминаем, что значения функции g(x) и ее произ- водных g’(x), g"(x), ..., g(n)(x) последовательно и притом одно- значно определяются уравнением (15) и теми уравнениями, кото- рые получаются из него дифференцированием по х, если под у разу- меть g(x) [209]: G(x, g(x)) = 0, G'(x, g(x)) + G'(x, g(x))£(x) = 0, G". + 2G"yg'(x) + Gy*[g'(x)]2 + Gyg"(x) = 0. бМ+...тСУ(х) = 0*). Поэтому, если (при х = х0) в этих равенствах везде вместо g(x0), g'(x0~), ..., g(n)(x0) подставить, соответственно, f(x0), Д(х0), • • •> /(п)(хо)> то получатся условия G(x0, Дх0)) = 0, G'(x0, Дх0)) + G'(x0, Дх0))Д(х0)=0, G". + 2G''yf'(x0) + G;,[/'(x0)F + G;/"(x0) = 0, g^+... + g;/w(x0)=q, которые совершенно равносильны условиям (13). *) В каждом уравнении подчеркнута та именно величина, которая из него однозначно определяется, если уже определены предшествующие ей вели- чины. Это относится и к приводимой ниже системе уравнений,
554 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [243 Для того чтобы представить их в более обозримой форме, введем обозначение Ф(х) = С(х, /(х)). (16) Тогда условия эти перепишутся так: Ф(х0)=0, Ф'(х0)=0, ..., Ф(п)(х0) = 0. (17) Итак, при соблюдении условий (17) (в точке с абсциссой х0) кривая (15) будет иметь с кривой у = /(х) касание порядка не ниже п. Нетрудно сообразить, что этот порядок точно п, если сверх того Ф(п+1)(хо)#О. (18) 243. Соприкасающаяся кривая. Предположим теперь, что вместо кривой (15) нам дано семейство кривых с и + 1 параметрами п+1 G(x, у, а, Ъ, ..., /) = 0. (19) Теперь естественно поставить вопрос, можно ли, распоряжаясь зна- чениями параметров, выбрать из этого семейства такую кривую, которая с данной кривой у=/(х) в определенной ее точке М0(х0, /(х0)) имела бы наивысший возможный (для данного семейства) порядок касания. Подобная кривая и носит название соприкасающейся к данной кривой в точке Мо. [Точнее было бы сказать: соприкаса- ющейся кривой из такого-то семейства, ибо для отдельно взятой кривой (15) этот термин не имеет смысла.] Для разыскания соприкасающейся кривой введем обозначение, аналогичное (16): Ф(х, а, Ъ, ..., l) = G(x, f(x), а, b, ..., /), и напишем ряд условий, вроде (17): Ф(х0, а, Ь, ..., /) = 0, Ф'(х0, а, Ь, l) = 0, ...1 _ ..., Ф(^(х0, а, Ъ, ..., /) = 0. J Мы имеем здесь систему из п + 1 уравнений с и +1 не- известными а, Ь, ..I. Обычно эта система однозначно опреде- ляет систему значений параметров, и таким путем находится с о- прикасающаяся кривая, имеющая порядок касания не ниже п. При этом обычно оказывается, что Ф^Р(х0, а, Ъ, ..., I)#0, так что порядок точно равен и. Такое положение вещей (при и + 1 параметрах) считается нормальным. В тех же исключительных точках, где дополнительно выполняется и равенство Ф^(х0, а, Ь, 1) = 0, (21)
243] § 3. КАСАНИЕ КРИВЫХ МЕЖДУ СОБОЙ 555 говорят о пересоприкасании. Эти точки можно найти, если равенства (20) и (21) вместе рассматривать как систему изи + 2 уравнений си + 2 неизвестными х0, а, Ь, ..I. Примеры. 1) Соприкасающаяся прямая. Семейство прямых выражается уравнением у = ах+Ь с двумя параметрами. Поэтому наибольший порядок касания, который удается установить в общем случае, будет первый. Здесь имеем: Ф(х, а, Ь) = у-ах-Ь, ФЩх, а, Ь) = у'-а, Ф£1(х, а, Ь) = у", если под у разуметь f(x). Отмечая нуликами значения у, у', у", отвечающие вы- бранному значению х = х„, для определения параметров а и b получим уравнения уо-ахо-Ь = О, у'о-а = О. Отсюда а=у{> и Ь=у0—у'>х0. Подставляя эти значения в уравнение прямой, при- дем к уравнению У^Уо+У^х-Хо), в котором читатель без труда узнает уравнение касательной. Итак, соприкасающейся прямой является касательная. Порядок касания, вообще говоря, как указывалось, будет первый. Он повышается в тех отдельных точках, где выполняется дополнительное условие Уо = 0 (например, в точках перегиба). 2) Соприкасающийся круг *). Семейство окружностей выражается уравнением (хЧ)2+(у-»?)2 = Я2 с тремя параметрами г/ и й. Наивысший порядок касания вообще будет второй. Так как здесь, если снова под у разуметь /(х), Ф(х, f, rj, jR) = (x-f)2 + (y-?7)2-jR2, i<₽i(x, r„ R) = x-l; + (у - r/)y', ^Ф{Кх,Ц, j], jR) = 1 + y'2 + (y - »?)y", то параметры определяются из уравнений (х0-й2+(у0-»?)2 = Л2, Хо - £ + (Уо - чУу'о = о, 1 +Уо2+(Уо ~ Г1)У<> = 0. Из двух последних (в предположении, что у'о' * 0) находим координаты центра: е , l+J'i2 S = xo-y'o—— , »? = Уо+——, Уй Уч (22) *) В этом контексте слово круг привычным образом употребляется в смысле окружность.
556 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [244 а тогда из первого получится радиус и „ (1+Уо2)2 Iji'l (23) По этим элементам и устанавливается соприкасающийся круг. По сказанному в п° 241, как правило, касательная не пересекает кривой, а со- прикасающийся круг, наоборот, пересекает ее. Исключение может представиться лишь в точках, где порядок касания повышается против нормального. 244. Другой подход к соприкасающимся кривым. Пусть даны кривая y=f(x) и семейство кривых (19) с л+1 параметрами. Возьмем на кривой произвольные п+1 точек с абсциссами хх, х2, ..., хп+х- Для того чтобы кривая семейства через эти точки проходила, должны выполняться п + 1 условий: Ф(хх, а, Ь, ..., /)=0, Ф(х2, а, Ъ, ..., Г) = 0, ... ..., Ф(хп+1, а, Ь, ..., /) = 0. Обычно отсюда значения параметров определяются однозначно; обо- значим их через а, Ъ, ..., I. Предположим теперь, что когда взятые п +1 точек по произволь- ному закону стремятся к некоторой определенной точке кривой с абсциссой х0, той значения параметров а, Ъ, ..I стремятся к опре- деленным пределам а, Ь, ..I. Можно считать, что проходящая через упомянутые точки кривая семейства, перемещаясь или деформируясь, стремится к предельной кривой. Для того чтобы ее найти, станем рассуждать так. Функция от х Ф(х, а, Ъ, ..., 7) обращается в 0 для п+1 значений х: хх-<х2-< ... <хл+т. Тогда, по теореме Ролля [111], первая производная обратится в 0 для п значений хх<х2-= ... -<х'п, вторая - для п-1 значений: хх'<х2 < ... ~^х"п_х, ... ...,(«-1)-я - для двух значений: х[п-1)<х^п-1) и, наконец, п-я - для некоторого значения х[п); при этом все упомянутые значения лежат между хх и x„+i. Таким образом, имеет место п + 1 равенств: Ф(хх, а, Ъ, ../) = 0, Ф'х(х{, а, Ь, ..., 0 = 0, Ф'Ж, ц, 7, ..., 7) = 0, ..., Ф^(х<п>, а, Ъ, ..., 7)=0. Если теперь одновременно ххх0, х2-»х0, ..., xn+i-*x0, то а —a,b-*b,... ..., /-»/ и, очевидно, также хх->х0, хх — х0, ..., х[л)—х0. Переходя к пределу в написанных выше равенствах, мы вернемся к уже знако- мой нам системе (20), определявшей соприкасающуюся кривую.
245] § 4. ДЛИНА ПЛОСКОЙ КРИВОЙ 557 Итак, если существует предельное положение для кривой семей- ства, проходящей через п +1 точек данной кривой, то эта предель- ная кривая и будет соприкасающейся. В связи с этим иногда говорят (не слишком строго, но образно), что соприкасающаяся кривая - из семейства с п +1 параметрами - есть «кривая, проходящая через п +1 бесконечно близких точек» дан- ной кривой. В частности, касательная проходит через две бесконечно близкие точки кривой, а соприкасающийся круг - через три. § 4. Длина плоской кривой *) 245. Леммы. Рассмотрим (незамкнутую или замкнутую) плоскую кривую АВ, заданную параметрически уравнениями: X=g9(f), y=ip(t), (1) где функции <р и ip здесь пока предполагаются лишь непрерыв- ными. Пусть кратных точек на кривой нет, так что каждая точка получается лишь при одном значении параметра t (за исключе- нием - если кривая замкнута - совпадающих концов кривой) **). При этих предположениях кривую будем называть непрерывной про- стой кривой. Имея в виду установить для такой кривой понятие длины, мы начнем с некоторых вспомогательных предложений. Пусть r0=sZ'< и значениям параметра t' и t" отвечают точки М' и М”. Лемма 1. Для любого найдется такое что при t" -1' длина хорды М'М" -< д. Действительно, ввиду (равномерной) непрерывности функций q> и ip из (1), по б найдется такое что при 11"-t' \<Т] будет одно- временно \ч>(!") -<?('') Н , \v(t")-y(t') | < , а тем самым М'М" = / [<p(t") - <p(t ')]2 + [V(r") - ip(t ')]2 <= д. Имеет место также Лемма 2. В случае незамкнутой кривой для любого £>0 существует такое 5>0, что лишь только длина хорды М'М"-^д, тотчас же разность t" -1' значений параметра, соответствующих ее концам, будет <е. *) Хотя этот вопрос по существу относится к интегральному исчис- лению, но мы в некоторой части начинаем его изложение уже здесь, так как в сле- дующем § нам понадобятся и понятие длины дуги кривой и его свойства. Самое вычисление длины дуги кривой мы откладываем до второго тома. **) См. сноску на стр. 505.
558 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [246 Допустим противное; тогда для некоторого е>0, при лю- бом <5=-0, найдутся такие две точки M'{t') и M"{t"), что М'М"<д и в то же время t" -t's^e. Взяв последовательность {<5П}, сходящуюся к 0, и полагая поочередно д = дп (п = 1, 2, 3, ...), придем к двум по- следовательностям точек {M'(z')} и {М"(О}> для которых 3/'С<йп>но (и=1, 2, 3, ...). По лемме Больцано - Вейерштрасса [41], без умаления общности, можно предположить, что при этом т- t* *П 1 9 *Л 1 (этого легко добиться, переходя - в случае надобности - к частич- ным последовательностям). Очевидно, Z**-Z*B=e, так что t* # t**. В то же время для соответствующих точек М* и М** имеем М*М** = 0, т. е. эти точки должны совпасть, что невозможно, так как кривая не имеет кратных точек и не замкнута. Полученное противоречие завершает доказательство. Для замкнутой кривой утверждение леммы оказывается не- верным: хорда М'М" может быть сколь угодно малой и при достаточ- ной близости t' к t0, a t" к Т. 246. Направление на кривой. Будем считать, что точка А отве- чает значению параметра t = tg, а точка В - значению t = T, и назы- вать А начальной, а В - конечной точкой кривой. Вообще, расположим точки М кривой по возрастанию параметра t, т. е. из двух отличных от А и В точек ту будем считать следующей, которая отвечает большему значению параметра. Таким образом определя- ется «направление на кривой». Однако, формально это опреде- ление поставлено в зависимость от частного параметрического представления (1). Покажем, что на деле понятие направления на кривой не зависит от конкретного способа задания кривой. Начнем с более простого случая незамкнутой кривой. Если незамкнутая кривая АВ, наряду с представлением (1), имеет и представление {также без кратных точек) x=q>*(u), у=у>*{и), (1*) (uosu^U) где функции <р* и у>* по-прежнему непрерывны, и значению и = и0 отве- чает точка А, а значению u=U - точка В, то оба представления определяют на кривой одно и то же направление.
246] § 4. ДЛИНА ПЛОСКОЙ КРИВОЙ 559 Каждому значению t отвечает некоторая точка кривой, которая в свою очередь однозначно определяет значение и; обратно, каждому w отвечает одно определенное значение t. Таким образом, и оказы- вается однозначной функцией от f. u=co(t), которая к тому же при изменении t между г0 и Т - принимает каждое свое значение лишь однажды. В частности, ю(/0) = w0 и со(Т) = U. По лемме 1, двум достаточно близким значениям t отвечают сколь угодно близкие точки кривой, а тогда — по лемме 2 — им отвечают и сколь угодно близкие значения и, т. е. функция u = co(t) оказывается непрерывной. Отсюда можно заключить, что эта функция будет монотонно возрастающей (в узком смысле). Действительно, если бы при имели w' = a)(f)>w" = co(z")=-wo = co(zo), то - по известному свойству непрерывной функции [82] - между t0 и t' нашлось бы значение t"', для которого co(f") = w", так что значение и" принима- лось бы функцией w = a>(/) дважды (при t = t" и t = вопреки тому, что было доказано выше. Теперь, раз установлено, что u = a>{t) возрастает вместе с t, уже ясно, что расположение точек по возрастанию параметра t совершенно равносильно расположению их по возрастанию параметра и. Это направление, которое можно было бы назвать направлением на кривой от точки А к точке В, оказывается, таким образом, вполне геометрическим понятием. Аналогично, заменяя, скажем, t на -t' и располагая точки по возрастанию параметра t', установим понятие о направлении на кривой от точки В к точке Л; его очевидно, можно получить также, распола- гая точки по убыванию параметра t. Конечно, и это направление не зависит от частного выбора представления кривой. Обратимся, наконец, к вопросу о направлении на замкнутой кри- вой. Возьмем на ней по произволу две (отличные от А) точки С и Л, и пусть им соответствуют значения параметра t = tr и l = t2=~tlt так что в том расположении, которое было выше установлено с по- мощью параметра t, точка D следует за С. Можно показать, что всякое направление на кривой, определенное любым параметри- ческим представлением, но сохраняющее этот порядок точек С и Л, совпадает с прежним. Действительно, если значениям t = и t = Т*, где и t2<T*<T, отвечают точки А* и В*, то для (незам- кнутой) дуги А* В* подобное заключение вытекает из предыдущего; но так как может быть взято сколь угодно близко к а Т* - к Т, то оно справедливо и для всей кривой. Таким образом, можно говорить о направлении от А через С и D к А, как не зависящем от выбора параметрического представления кривой. Аналогично устанавливается понятие о направлении от А через D и С к А.
560 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [247 247. Длина кривой. Аддитивность длины дуги. Будем исходить из представления (1) кривой АВ и. направления на ней, определяемого возрастанием параметра t. Возьмем на кривой ряд точек А=М0, М2, ..., Мь М1+1, Мп=В, (2) так,чтобы они шли в указанном направлении, отвечая возрастающим значениям параметра ^2 '' ^+1 '' • • • (3) Соединяя эти точки последовательно прямолинейными отрезками (рис. 149), мы получим ломаную МОМГ ... Mn_iMn, вписан- ну ю в кривую АВ. Напомним, что в предыдущем п° выяснена неза- висимость понятия направления, а с ним и понятия вписанной ломаной - от частного выбора параметрического задания (1). Длиной кривой АВ называется точ- ная верхняя граница S для множества периметров р всевозможных вписан- ных в кривую ломаных: 5 = sup {р}. Если это число S конечно, то кривая называется спрямляе- мой*). Из определения длины кривой сле- дует, что периметр любой вписанной в кривую АВ ломаной не превосходит длины S кривой', в частности, это относится и к длине хорды АВ, соединяющей начальную и конеч- ную точки кривой. Возьмем теперь на кривой АВ точку С межпу А и В, так что она отвечает значению t = t, промежуточному между Го и Г: г0<г<7. Если кривая АВ спрямляема, то спрямляемы порознь и дуги АС ч-/ и СВ. Обратно, из спрямляемости этих дуг вытекает спрямляемость всей кривой АВ. Обозначая длины дуг АВ, АС и СВ, соответственно, через S, S' и S", будем иметь при этом S= S' + S". (4) Для доказательства, предположим сначала спрямляемость кривой АВ и впишем произвольные ломаные, с периметрами р' и р", *) Обращаем внимание читателя на важность уточнения понятий направ- ления на кривой и вписанной ломаной. Если бы точки Л/, можно было брать где попало, то граница S в с е г да была бы +
247] § 4. ДЛИНА ПЛОСКОЙ КРИВОЙ 561 соответственно в дуги АС и СВ. Из этих ломаных, взятых вместе, составится ломаная, с периметром р'+р"=р, вписанная в кривую АВ. Так как p^S, т. е. р' +p"*sS, (5) то, очевидно, и порознь p'^S и p"^S. Таким образом, множества {р'} и {р"} ограничены сверху (S - конечно!), и дуги АС, СВ спрямляемы, ибо имеют конечные длины S’=sup {р'}, S"=sup {р"}. По свойству точных верхних границ [11] периметры р' и р" - независимо один от другого - могут быть взяты сколь угодно близ- кими к своим границам S' и S". Поэтому из (5) с помощью предель- ного перехода получаем: S' + S" S. (6) Пусть теперь дано, что спрям- /] ляемы дуги АС и СВ. Впишем про- f If извольную ломаную, с пе- <f В риметром р, в кривую АВ. Если а/ точка С входит в состав вершин г ломаной, то последняя непосред- Рис 150 ственно распадается на две лома- ные, с периметрами р' и р", вписан- ные, соответственно, в дуги АС и СВ. Если же С не оказалась вер- шиной взятой ломаной, то мы дополнительно введем эту тЬчку в состав вершин, от чего периметр ломаной может лишь уве- личиться (рис. 150); новая ломаная, как указано, распадется на две. Во всяком случае, имеем p^p'+p"=sS' + S". Множество {р} ограничено сверху (S' и S" конечны), и кри- вая АВ спрямляема, причем ее длина S=sup{p}=s=S' + S". Наконец, из сопоставления этого неравенства с (6), приходим к требуемому равенству (4). Таким образом, введенное выше понятие длины дуги кривой обла- дает свойством аддитивности [ср. 21, 3)]. Доказанное предложение легко распространяется на случай лю- бого числа частичных дуг. 36 Г. М. Фихтенгольц, т. I
562 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [248 248. Достаточные условия спрямляемости. Дифференциал дуги. До сих пор мы рассматривали общий случай непрерывной простой кривой (1). Желая дать удобные достаточные условия ее спрямляемости *) и изучить дальнейшие свойства длины дуги, мы вер- немся к обычным в этой главе предположениям о существова- нии непрерывных производных g/(t) и Докажем, что при сделанных предположениях кривая (1) спрямляема. Рассмотрим ломаную с вершинами в точках (2), определяемых значениями параметра (3). Координатами точки Mt будут =(/>(?,•) и J’/==’/)(4) (I = 0> 1, 2, ..., п). Тогда периметр р ломаной запишется так: р = £ У(^+i - + (ун-1 -уд2- 1=0 Но по формуле конечных приращений [112] X/+1 - Xi =<p(ti+i)-<p(td =<р’^д {ti+1 ~ td, yl+i-У, =y(ti+d =4>'(?d (4+i - 4), так что, окончательно, p=2 VWW?+• (z/+1 - (7) i=0 Если через L и £ обозначить, соответственно, наибольшие зна- чения функций |<р'(0| и |’/),(0| в промежутке [Zo, Т], то из (7) нетрудно получить оценку: p*sl/L2 + I?-(T-t0). (8) Множество {/>} оказывается ограниченным сверху, значит, кривая имеет конечную длину S, т. е. спрямляема, что и требовалось доказать. Так как S=sup{p}, то из (8) попутно получаем и оценку для S' сверху: S^Vl2+Z2-(T-I0) (9) которая нам сейчас понадобится. Впрочем, нам нужна будет и оценка снизу; если ввести наименьшие значения I и Г функций | и |т>'(0| в промежутке [Zo, Т], то из (7), аналогично (8), найдем, что p^l2 + l2-(T-t0), а тогда тем более S^//2 + /2-(T-/0). (9*) *) Самые общие условия спрямляемости (необходимые и достаточные!) чита- тель найдет в третьем томе.
248] § 4. ДЛИНА ПЛОСКОЙ КРИВОЙ 563 Если изменить t, а с ним вместе и положение точки M(t) на кривой, то длина переменной дуги AM окажется функцией от параметра t; мы будем обо- значать ее через 5 = s(0- Придадим переменной t положи- тельное приращение At: точка М переместится вдоль по кривой, по направлению к В, в положение М' (рис. 151). Величина S' полу- чит положительное же при- ращение As, равное длине дуги ММ' (по аддитивности длины дуги, доказанной в предыдущем п°). Таким образом, функция s(t) оказывается возрастающей. Рассмотрим теперь, вместо промежутка [10, Т], промежуток [/0, t0 + At] и применим к дуге ММ', длины As, оценки (9) и (9*): f/2 + Z2 • At^As^ L2 + L2- At, но здесь под I и L (I и L) мы вправе разуметь наименьшее и наи- большее значения функции | cp'(t) | (| ip'(t) |) уже в промежутке [Z, t + At]. Отсюда }72TK^Wl2+Z2 и, так как - по непрерывности производных - при At—O оба числа / и L-* |<р'(г)|, а оба числа? и /,-> |у'(0|, то оба корня в предшествую- щем неравенстве стремятся к общему пределу /W)]2 + W)]2- Следовательно, к тому же пределу стремится и отношение ; как легко видеть, это справедливо и для zk<0. Итак, имеем оконча- тельно: длина переменной дуги s = s(t) оказывается дифферен- цируемой функцией от параметра Z; ее производная по параметру выражается формулой: s'(t) =lim J = r[<pWW(0f2 или, короче, (10) Если возвести это равенство в квадрат и умножить почленно на dt2, то получим замечательную по простоте формулу ds2 = dx2 + rfy2, (И) 36»
564 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [248 которая к тому же обладает геометрической наглядностью. На рис. 152 в (криволинейном) прямоугольном треугольнике MNMr, «кате- тами» служат приращения координат точки М: MN=Ax, NM1=zly, а «гипотенузой» - дуга MMr = As, которая является приращением дуги AM=s. Оказывается, что если не для самих приращений, то для их главных частей - дифференциалов - имеет место своеобразная «тео- рема Пифагора». Полезно отметить частные слу- чаи важной формулы (10), отвечаю- щие различным частным типам за- дания кривой. Так, если кривая задана явным уравнением в декартовых координатах у=f(x), то в роли «параметра» оказывается х, дуга 5 зависит от х: s = s(x), и фор- мула (10) принимает вид (Юа) Если же кривая задана полярным уравнением r=g(O~), то это, как мы знаем, равносильно заданию ее параметрическими урав- нениями х = г cos 0, у = г sin О, где параметром будет б; дуга на этот раз будет функцией от 0: s = s(O). Так как, очевидно, х'в = г'в cos в - г sin в, у'в = г'в sin 0 + г cos в, то х?т^2 = ге2+г2, и формула (10) преобразуется так: (106) Часто представляется удобным взять в качестве начальной точки А для отсчета дуг не один из концов дуги, а какую- либо внутреннюю точку ее. В этом случае естественно дуги, откла- дываемые от нее в направлении возрастания параметра, считать положительными, а в другом - отрицательными и, соответственно этому, длину дуги в первом случае снабжать знаком плюс, а во вто- ром - знаком минус. Вот эту величину 5 дуги со знаком мы для краткости будем называть просто дугой. Формулы (10), (11), (10а), (Юб) имеют место во всех случаях. [Заметим, что если положительное направление для отсчета дуг выбирать не в сторону возрастания периметра, как это делается
249] § 4. ДЛИНА ПЛОСКОЙ КРИВОЙ 565 обычно, а в сторону его убывания, то в формулах (10), (10а), (106) пришлось бы перед радикалом поставить знак минус.] 249. Дуга в роли параметра. Положительное направление касательной. Так как переменная дуга s = s(f) является непрерывной монотонно возрастающей функцией от параметра t, то и последний, в свою очередь, может быть рассматриваем как однозначная и непрерывная функция от s: t = a>(s), где s изменяется от 0 до длины 5 всей рас- сматриваемой кривой [83]. Подставляя это выражение t в уравнения (1), мы получим текущие координаты х и у выраженными в функции от х= q>(co(sy) = Ф($), y=V>(a>(j)) = ’?f(j). Несомненно, дуга s, играющая роль «криволинейной абсциссы» точки М, является самым естественным параметром для определения ее положения. Заметим, что начальная точка А для отсчета дуг может быть взята и не на одном из концов рассматриваемой дуги кривой; тогда, как это разъяснено выше, дуга 5 может принимать как положитель- ные, так и отрицательные значения. Пусть точка М кривой - в представлении (1) - будет обыкно- венной, так что [см. (10)] s't = yW+y?^ тогда [94] для соответствующего значения 5 (и вблизи него) суще- ствует и непрерывная производная а следовательно, существуют и непрерывные производные *>Ф'(Д y's = ^’(s). Из основной формулы (11), считая, что все дифференциалы взяты, например, по s, получим, fdx}2 i<fyy _i ~1 Таким образом, если точка М была обыкновенной в прежнем пред- ставлении (1) кривой, то она наверное будет обыкновенной и при переходе к параметру s. Формула (12), далее, позволяет установить следующее полезное утверждение: Пусть М - обыкновенная точка кривой. Если через Мг обозначить переменную точку той же кривой, то при стремлении
566 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [249 Мг к М отношение длины хорды ММХ к длине дуги ММг будет стремиться к единице *): lim ^=1. (13) ммг-~о Примем дугу за параметр, и пусть точка М отвечает значению 5 дуги, а точка Мг - значению х+Дх. Их координаты пусть будут, соответственно, х, у и х + Дх, у + Ду. Тогда так что ММг=\Дх\, а ММх=1/Дх2 + Ду2, __У/1х2+Ду2 _ if (zlx)2 (zly)2 |zU| / (ztsj + • Переходя справа к пределу при zh-^O, в силу (12), получаем требуе- мый результат. До сих пор мы определяли положение касательной к кривой в (обыкновенной) точке М - ее угловым коэффициентом tg а, не различая двух противоположных направлений на самой каса- тельной: tga для обоих один и тот же. В некоторых исследова- ниях, однако, представляется не- обходимым фиксировать одно из этих направлений. Представим себе, что на кри- вой выбраны начальная точка и определенное направление для отсчета дуг; возьмем именно дугу за параметр, определяющий по- ложение точки на кривой. Пусть точке М, о которой была речь, отвечает дуга 5. Если при- дать х положительное приращение Дх, то дуга у+Ду определит новую точку М15 лежащую от Мв сторону возрастания дуг. Секущую направим от М к Мг, и угол, составленный именно этим направлением секущей с по- ложительным направлением оси х, обозначим через Проектируя отрезок ММг на оси координат (рис. 153), по известной теореме из теории проекций, получим np.xMMx = Дх = ММг cos fi, пр.уММу = Ду = MMr sin *) Для простоты мы пишем ММг - вместо «длина отрезка ММ,», и ММ, - вместо «длина дуги ММ,».
249] § 4. ДЛИНА ПЛОСКОЙ КРИВОЙ 567 J n Zlx . а Лу COS р — дугу , S1Q р — -гтгг • ‘ ММ1 г мм1 Так как MM1^=As, то эти равенства можно переписать так: с°^=£й|’ <14) Будем называть положительным то направление каса- тельной, которое идет в сторону возрастания дуг', точ- нее говоря, оно определяется как предельное положение при zls->-0 для луча ММХ, направленного так, как это разъяснено выше. Если угол положительного направления касательной с положитель- ным направлением оси х обозначить через а, то из (14) получим в пре- деле, с учетом (13), 4х • dy cosa = -j-, sina = -y. (15) ds ’ ds v 7 Эта формулы определяют угол а уже с точностью до 2кл (к - целое), следовательно, действительно фиксируют одно из двух возможных направлений касательной, именно - положитель- ное. Замечание. Все сказанное в пп° 245 - 249 по поводу плоских кривых переносится без существенных изменений на случай про- странственной кривой: х=9>(0. y=V>(0, * = Z(0- (1*) Понятие длины кривой устанавливается в тех же терминах, что и в п° 247. При наличии у функций <р, ip, % непрерывных производ- ных - длина конечна, и кривая спрямляема. Длина переменной дуги (от начальной точки кривой до переменной точки, отвечающей параметру /) 5 = s(t) дифференцируема по t, причем ее производная по t выражается фор- мулой j;=Vx;2 + y? + z{2. (10*) Отсюда получается формула для дифференциала дуги: ds2 = dx2+dy2 + dz2. (11 *) В случае отсутствия особых точек [228], можно перейти к такому параметрическому представлению кривой, в котором роль параметра играет сама дуга 5. Наконец, устанавливается понятие положитель- ного направления касательной, направляющие косинусы которого даются формулами: dx о dy dz ,, cosa=-j-, созр=^~, cosy=-r-. (15*) ds ’ r ds ’ 'ds v z
568 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [250 § 5. Кривизна плоской кривой 250. Понятие кривизны. Пусть снова дана простая кривая х=9>(0, У=уЮ (t0*st*sT), (1) где на этот раз функции ср и ip предполагаются непрерывными вместе со своими производными первого и второго порядка. Рас- смотрим дугу этой кривой, без особых точек. Если в каждой ее точке провести касательную (скажем, в поло- жительном направлении), то вследствие «искривленности» кривой эта касательная с перемещением точки касания будет вращаться; этим кривая существенно отличается от прямой, для которой каса- тельная (совпадающая с ней) сохраняет одно и то же на- ^7 правление для всех точек. Важным элементом, харак- \ы теризующим течение кривой, —°—является «степень искривлен- И, Л иости» или «кривизна» ее в М различных точках; эту кри- Рис 154 визну можно выразить числом. Пусть ММХ (рис. 154) есть дуга кривой; рассмотрим ка- сательные МТ и МГТГ, проведенные (в положительном направлении) в конечных точках этой дуги. Естественно кривизну кривой характеризовать углом поворота касательной, рассчитанным на единицу длины дуги, т. е. отношением —, где угол со измеряется в радианах, а длина <т - в выбранных еди- ницах длины. Это отношение называют средней кривизной дуги кривой. На различных участках кривой средняя кривизна ее будет, вообще говоря, различной. Существует впрочем (единственная) кривая, для которой средняя кривизна везде одинакова: это окружность*). Действительно, для нее имеем (рис. 155) со______________________со __1 а ~Rm~ R ’ о какой бы дуге окружности ни шла речь. От понятия средней кривизны дуги ММг перейдем к по- нятию кривизны в точке. Кривизной кривой в точке М называется предел, к которому стремится средняя кривизна дуги MMV когда точка Мг вдоль по кривой стремится к М. *) Не считая, разумеется, прямой, для которой кривизна всегда нуль.
250] § 5. КРИВИЗНА ПЛОСКОЙ КРИВОЙ 569 Обозначив кривизну кривой в данной точке буквой к, будем иметь к = lim —. <7-0 а ТТ , 1 Для окружности, очевидно, к = —, т. е. кривизна окружности есть величина, обратная радиусу окружности. Замечание. Понятия средней кривизны и кривизны в данной точке совершенно аналогичны понятиям средней скорости и скоро- сти в данный момент для движущейся точки. Можно сказать, что сред- няя кривизна характеризует среднюю скорость изменения направле- ния касательной на некоторой дуге, а кривизна в точке - истинную скорость изменения этого направления, приуроченную к данной точке. Обратимся теперь к выводу аналитического выражения для кри- визны, по которому ее можно было бы вычислять исходя из пара- метрического задания кривой. Предположим сначала, что в роли параметра фигурирует дуга. Как мы знаем [249], такое представление всегда осуществимо, если ограничиться дугой кривой, где нет особых точек. Возьмем на этом участке кривой точку М (заведомо не особую), и пусть ей отвечает значение 5 дуги. Придав 5 произвольное прира- щение As, получим другую точку Mr(s + As) (рис. 156). Приращение Ах угла наклона касательной при переходе от М к Мг даст угол а> между обеими касательными: со = Ах. Так как а=As, то средняя кривизна будет равна ~ . Устремив ММ} =Ask нулю, для кривизны кривой в точке М полу- чим выражение . Да da k = lim — = — . ds (2)
570 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [250 Важно отметить, впрочем, что эта формула верна лишь с точ- ностью до знака, так как кривизна, по нашему определению, есть число неотрицательное, а справа может получиться и отрицатель- ный результат. Дело в том, что как Да, так и As могут быть отрицательными, так что, строго говоря, следовало бы писать: со=|Да|, о= |Ду| и, наконец, , I da. «= д- • ds Это замечание следует иметь в виду и впредь. Для того чтобы придать формуле (2) вид, удобный для непосред- ственного вычисления (а вместе с тем установить самое существова- ние кривизны), обратимся к произвольному параметрическому зада- нию кривой (1). Так как рассматриваемая точка ЛД7) не является особой, и х,2+у? > >0, то без умаления общности, можно считать, что именно х,= =<p'(f)#O. Перепишем теперь формулу (2) иначе: da (3) dt ds s t 4 ' di Ho s't = yx't2+y^ [248 (10)], остается лишь найти at. Так как [106 (11)] tga = — и a = arctg Xf X't то , = 1 xfrff-xfo'i _ xtyil-xli/t ... W) Подставив в (3) значения s't и a.'t придем к окончательной формуле: (5) <х?+у?)г Эта формула вполне пригодна для вычисления, ибо все фигуриру- ющие в ней производные легко вычисляются по параметрическим уравнениям кривой. Если кривая задана явным уравнением у=/(х), то эта формула принимает вид *=^4- (5а) fl+Ti2)2
251] § 5. КРИВИЗНА ПЛОСКОЙ КРИВОЙ 571 Наконец, если дано полярное уравнение кривой: r=g(Q), то, как обычно, можно перейти к параметрическому представлению в пря- моугольных координатах, принимая за параметр 0. Тогда с помощью (5) получим lc_r2+2re2-rrel (г2+г^ (56) выпуклость кривой). Если 251. Круг кривизны и радиус кривизны. Во многих исследованиях представляется удобным приближенно заменить кривую вблизи рас- сматриваемой точки - окружностью, имеющей ту же кривизну, что и кривая в этой точке. Мы будем называть кругом*) кри- визны кривой в данной на ней точке М - круг, который 1) касается кривой в точке М; 2) направлен выпуклостью вблизи этой точки в ту же сторону, что и кривая', 3) имеет ту же кривизну, что и кри- вая в точке М (рис. 157). Центр С круга кривизны называется просто центром кривизны, а радиус этого круга - радиусом кривизны (кривой в данной точке). Из определения круга кривизны яв- ствует, что центр кривизны всегда лежит на нормали ж кривой в рассматриваемой точке со стороны вогнутости (т. е. со стороны, обратной той, куда направлена кривизну кривой в данной точке обозначить через к, то, вспоминая [250], что для окружности имели формулу: теперь для радиуса кривизны, очевидно, будем иметь Д = 1. Пользуясь различными выражениями, введенными в предыдущем п° для кривизны, мы можем сразу же написать ряд формул для ) Сюда также относится замечание, сделанное в сноске на стр. 555.
572 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [251 радиуса кривизны: da R _ (х?+у?У Xtyti-Xpyt ’ R (1+Ух¥; n . (r2 + ^2)2 r2+2^2-rr^’ (6) (7) (7a) (76) которые и применяются в соответственных случаях. Из всех формул радиус кривизны получается со знаком, как и выше - кривизна. Однако здесь мы знака не станем отбрасывать, а постараемся установить его геометрический смысл. С этой целью введем понятие о положительном направлении нор- мали к кривой. Мы разъяснили уже в 249, что на касательной поло- жительным считается направление в сторону возрастания дуг. На нормали же мы за положительное выберем такое направление, чтобы оно относительно (положительно направленной) касательной было так же ориентировано, как ось у относительно оси х. Например, при обычном расположении этих осей нормаль должна составлять с каса- тельной угол против часовой стрелки. 'Теперь, рассматривая радиус кривизны R = MC как направленный отрезок, лежащий на нормали, естественно приписывать ему знак Рис. 158. плюс, если он откладывается по нормали в положитель- ном направлении, и знак ми- т нус в противном случае. Так, на рис. 158 в случае кривой (I) радиус кривизны будет иметь знак плюс, а в случае кривой (II) знак минус. Мы утверждаем, что знак радиуса кривизны, получаемый по любой из выведенных вы- х ше формул, в точности соот- ветствует только что данному определению. При этом, одна- ко, важно подчеркнуть, что во всех случаях положительное направле- ние отсчета дуг предполагается соответствующим возрастанию пара- метра (7, х или 0).
252] § 5. КРИВИЗНА ПЛОСКОЙ КРИВОЙ 573 Убедиться в сказанном проще для случая явного задания кривой: здесь (рис. 158) касательная направлена направо, следовательно, нормаль - вверх. Если (как в рассматриваемой точке, так и - по непрерывности - вблизи нее), то кривая здесь выпукла вниз [143], и радиус кривизны R положителен; таким он и получается по формуле (7а). Наоборот, при у", < 0 кривая выпукла вверх, радиус R отрицателен, что и в этом случае вполне соответствует формуле (7а). То же можно показать и для других формул. 252. Примеры. 1) Цепная линия: (рис. 41) х у=асп~. л а В этом случае [ср. 99, 28)] ]/1+у£2 = ch — = —; а а с другой стороны, „ 1 U Х У yJ. = -ch- = -. а а а2 Поэтому [см. (7а)] У а а2 Так как то же выражение, как нетрудно видеть, имеет и отрезок нормали п=MN, то приходим к такому способу построения центра кривизны С: отрезок нормали MN (см. рис.) нужно отложить по нормали же, но в обратную (положительную) сторону. 2) Астроида: (рис. 116) х® +у3 = а3. Производные у* и у'хг можно найти, не разрешая уравнения, по методу диффе- ренцирования неявных функций: х 3 +у 3 у' = 0 I откуда у'= - затем: 1 -2- , 1 - 3 у + у у откуда г о3 /'= Зху3 1ЛИ х3 у'+у3 = 0, И- 2 1 3 у'+х8у" = 0, 2 ГТ’ Зх3/
574 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [252 Подставляя значения у' и у" в формулу (7а), получим Я=3(аху)2. 3) Циклоида: (рис. 118). х = a(t - sin t), у = а(1 - cos t) nt 1 Так как [231, 4)] а = ---, то da = --dt; с другой же стороны, как легко вы- числить, _Y/a(l-cosZ), y'f = awit, х[2+у/2 = 4а2 sin2 -, так что 5?= y^[2+y[2 = 2asin-, t. e. <7s=2asin-A. В таком случае для вычисления R можно воспользоваться основной формулой (6): t 2a sin- dt ds 2 t R= — =------------= - 4a sin -. da 1 2 — dt 2 Если вспомнить выведенное нами в 231, 4) выражение для отрезка нормали п, то окажется, что R = -2п. Отсюда - построение центра кривизны С, ясное из чертежа. 4) Эвольвента круга: х = a(cos 1+1sint), y = a(sin t — icost) (рис. 121). Здесь a=t [231, 6)], так что da = dt. С другой стороны, xf = at cos t, y't = at sin t, x't2+y/2=a2t2; отсюда s't = at, ds = at dt. Поэтому также получаем просто ds R = — = at = MB. da Таким образом, точка касания В (точка схода нити с круга) и будет центром кри- визны для траектории конца М нити. Геометрическим местом цен- тров кривизны нашей кривой оказывается исходный круг. [Здесь мы сталкиваемся с частным осуществлением одного факта, который в общем виде будет рассмотрен нами ниже, в 255J 5) Логарифмическая спираль: r=aem‘J (рис. 134). Имеем га = тг, = т2г. Подставляя это в формулу (76), найдем: з ЦТ''»»/ -1 !- ------------= г V1 + т- г2 + 2т2г2-т2г2 '
252] § 5. КРИВИЗНА ПЛОСКОЙ КРИВОЙ 575 Но т=ctg а> [233, 3)], так что выражение для R можно написать в виде г R =----, sin со а тогда непосредственно из чертежа ясно, что полярный отрезок нормали пр =NM. Следовательно, центром кривизны будет точка N', это дает легкий способ построе- ния центра кривизны для логарифмической спирали. 6) Кардиоида: r = a(l+cos 0) (рис. 135). Здесь г', = - a sin 0, г,'! = - a cos 0. Легко подсчитать, что 0 r2+r,'2' 4a2 cos2 у; остается еще вычислить , 0 г'2 - rrp = a2(l +cos 0) = 2a2 cos2 — , а тогда, по формуле (76), сразу получаем 4 0 R = — a cos — . 3 2 Вспоминая [233, 4)] выражение полярного отрезка нормали для кардиоиды, видим, что 2 R^3np' 7) Лемниската: г2 = 2a2cos220 (рис. 126). п Мы видели в 233, 5), что в этом случае а = 30+у, так что da=3M. Но тогда по формуле (6) сразу получаем rfy 1 1—z, 1 2°2 Так как нормаль к лемнискате мы строить умеем, то отсюда получается и способ построения центра кривизны. 8) Парабола: у2=2рх. Пользуясь здесь методами дифференцирования неявных функций, найдем последовательно Уу'х=Р, УУ$+У?=О, откуда уЬ^-р2. Теперь, по формуле (7а), £ £ £ „ (1+у£2)2 [у2+(уу£)212 (у2+р2)2 ( Ух" У3Ух" -Р2 Вспоминая [231, 1)], что отрезок нормали и= ]/у2+р2, получаем п2 R =-----------------------------------. Р2 9) Эллипс и гипербола: — ± — а2 Ь2 Дифференцируем это равенство дважды: X УУх — ±-----= 0, откуда а2 б2 Ь2х УУх = а2 далее, , & , УУхг = +— Ух2, или у3ух" а2 Ь*1х2 у2) _Ь* a2 la2 b2) а2
576 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [252 Как и только что, отсюда (64х2+а4у2)2 *=------------------------------ Мы имели уже [231, 2)] для этого случая выражение отрезка нормали УЬ4У2+а4у2 и =----------, а2 так что Известно, что как для эллипса, так и для гиперболы полупараметр р выражает- & „ ся так: р = — . Поэтому и здесь для R получается то же окончательное выражение, а что и для параболы. Для всех трех конических сечений радиус кривизны оказывается пропорционален кубу отрезка нормали. 10) В заключение скажем несколько слов об одном практическом вопросе, в котором как раз и используется существенно изменение кривизны вдоль кривой: речь идет о так называемых переходных кривых, применяемых при разбивке железнодорожных закруглений. Как устанавливается в механике, при движении материальной точки по кри- вой развивается центробежная сила, величина которой определяется формулой mv2 F=----, R где т - масса точки, v - ее скорость, a R - радиус кривизны кривой в рассматри- ваемой ее точке. Если бы прямолинейная часть железнодорожного пути непосредственно при- мыкала к закруглению, разбитому по дуге круга (рис. 159а), то при переходе на это закругление центробежная сила возникала бы мгновенно, создавая резкий и сильный толчок, вредный для подвижного состава и для верхнего строения пути. Для избежания этого прямолинейную часть пути сопрягают с круговой с помощью некоей переходной кривой (рис. 159 б). Вдоль нее радиус кри- визны постепенно убывает от бесконечного значения - в точке стыка с
253] § 5. КРИВИЗНА ПЛОСКОЙ КРИВОЙ 577 прямолинейной частью - до величины радиуса круга - в точке стыка с круговой дугой, и соответственно этому постепенно нарастает центробежная сила. В качестве переходной кривой чаще всего используется кубическая х3 парабола у-— .В этом случае, очевидно, имеем 6? , X3 „ X У =г-> У 2? <1 так что для радиуса кривизны получается выражение _з q ( х4)2 А = - 1+— . х V 4?2) При х = 0 имеем у' = 0 и R = ~, наша кривая в начале координат касается оси х и имеет нулевую кривизну *). Иногда в роли переходной кривой применяется и лемниската. 253, Координаты центра кривизны. Выведем теперь формулы для координат центра кривизны. Будем обозначать координаты рас- сматриваемой точки М кривой через х и у, а координаты отвечаю- щего ей центра кривизны С - через I и т/. Радиус кривизны R = MC (рис. 158) лежит на оси - именно на направленной нормали, которая с осью х составляет угол a + j. Проектируя отрезок МС поочередно на ось х и на ось у, по основной теореме теории проекций, будем иметь £-x = R cos = ~R sin a, T]—y = J?sin ^<z = R cos a. Отсюда для координат центра кривизны получаем: £ = х - R sin a, 1 . „ f w fj-y + R cos a. J Используя выведенные нами раньше формулы [251 (6); 249 (15)] п ds dx dy R = -r , cos a = -v-, sm к=T , da ds ds только что полученные выражения можно переписать в виде: , dx 1 z da (9) *) Методами дифференциального исчисления [134, 135] легко установить, что выражение для R убывает лишь до х = 0,946]/^ где оно имеет минимум 1,39О]/<7. Только эта часть кривой и используется на практике. 37 Г. М. Фикгешольц, т. I
578 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [254 Если кривая задана параметрическими уравнениями (1), то, вспом- нив выражение (4) для легко преобразовать формулы (9) следу- ющим образом: ХР + УР > ' ~,у., xtyp-xM'” (10) x’tyti-xpy't Как видим, ? и i) здесь выражены в функции от того же параметра t, что и х, у. В случае кривой, заданной явным уравнением y=f\x), формулы (10) принимают частный вид: (Юа) Формулы (10) можно применить и в том случае, если кривая задана полярным уравнением r = g(6), выбирая, как обычно, за параметр угол в. Если сопоставить только что полученные формулы (10а) с фор- мулами для пограничной точки на нормали, найденными при решении задачи п° 137 (рис. 62), то убедимся в том, что упомянутая погра- ничная точка совпадает с центром кривизны. Еще более важный результат получится, если сопоставить фор- мулы (Юа) и (7а) с формулами (22) и (23) п° 243: круг кривизны кривой в данной точке есть не что иное, как соприкасающийся круг. Иными словами [244], круг кривизны представляет собой предельное поло- жение круга, проходящего через три точки кривой, которые стремятся к совпадению с данной. Этот результат, конечно, можно было предвидеть: в случае каса- ния второго порядка между данной кривой и окружностью, орди- ната у и две ее производные у' и у", имеют в данной точке одни и те же значения для обеих кривых, так что для них совпадают в этой точке направления выпуклости и величины кривизны, зависящие только от упомянутых производных. 254. Определение эволюты и эвольвенты; разыскание эволюты. Если точка М(х, у) перемещается вдоль данной кривой, то соот- ветствующий ей центр кривизны С(£, rj), вообще говоря, также описы- вает некоторую кривую. Геометрическое место центров кривизны данной кривой называется ее эволютой. Обратно, исходная кривая по отношению к своей эволюте называется ее эвольвен- той.
254] § 5. КРИВИЗНА ПЛОСКОЙ КРИВОЙ 579 Формулы (10) или (10а) предыдущего п°, выражающие координа- ты £, г/ центра кривизны С через параметр t (или х), можно рассмат- ривать как уже готовые параметрические уравнения эволюты. Иногда представляется выгодным исключить из них параметр и выразить эволюту неявным уравнением т/) = 0. Примеры. 1) Найти эволюту параболы у2 = 2рх. Пользуясь полученными выше [252, 8)] результатами: УУ'х=Р, УУх^-р2, по формулам (10а) находим координаты центра кривизны: ( = х-уух У2+(УУ1)2 У2+Р2 , Зу2 = хН = Зх+р = 1-р, У3У'х‘------------------------------Р-2р Итак, параметрические уравнения эволюты параболы (где у - в роли пара- метра) будут , Зу\ £ = —+Р, У3 У =----2 Р2 Исключая из этих уравнений у, получим 2р T2=y(f-P)> у3=-р% откуда, наконец, 8 27р Мы видим, что эволютой параболы является полукубическая парабола (рис. 160). 2) Найти эволюту эллипса х = а cos t, y=b sin t. Имеем x't~— <7 sin/, acosl, y)=Z> cos/, y[>= — Z> sin/. Подставляя это в формулу (10), получим b cos t(a- sin2 t+b2 cos2/) a2 — b2 S = a cos t ----------------------=-------cos31, ab a a2-b2 ri =------sin3t. b Таково параметрическое представление эволюты эллипса. Исключив t, получим уравнение этой кривой в неявном виде: 2 2 4 (а^)3 + (6»;)3 = с3 (где с2 - а2 - Ь2). 37*
580 ГЛ. VI!. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ (254 Кривая напоминает собой астроиду и получается из нее путем вытягивания по вертикальному направлению (рис. 161). Рис. 161. Аналогично, но лишь с помощью гиперболических функций (вместо тригоно- х2 у2 метрических), и для гиперболы-------=1 получается эволюта а2 Ь2 2 2 4 (п‘)3 - (hr-)3 = с3 (где с2 = а2-162). 2. 2. 2. 3) Найти эволюту астроиды х3+у3 = а3. Мы имели уже в п° 252, 2): ( о2 )3 (Зх4у) ’ Подставив это в формулы (10а), после упрощений получим 1 2_ 2_ i = x + 3x3j^, т) = у + 3х3у3. Из этих уравнений, совместно с уравнением самой астроиды, следующим образом можно исключить х и у: £ + ^=\х’+у3/ > i -1? = \х3 - У3/ , 2 2/2 й\ 2 (Ui??+(f- i?)3 = 2\х3+у3) = 2а3. Если повернуть оси координат на 45°, то новые координаты тд выразятся через старые %, ц по формулам t _^+г7 Ь1 - —~7 Г) *71 = ~ ~~ . |/2
235] § 5. КРИВИЗНА ПЛОСКОЙ КРИВОЙ 581 так что в новой координатной системе уравнение искомой эволюты получит вид fi +»?? = (2а)3. Мы узнаем в этом снова уравнение астроиды. Таким образом, эволютой астроиды служит астроида же вдвое больших размеров, с осями, повернутыми по сравнению с прежним на 45° (рис. 162). 4) Найти эволюту циклоиды х = а(Г- -sin г), y = a(l-cosz). Так как мы знаем [231, 4)], что для цик- лоиды: то удобнее воспользоваться формулами (9). Под- ставив в них это значение da, получим ^=x + 2y't, ri = y-2x't или f = a(t • sin t), r/= - a(l - cos t). Положив t = т - л, полученные параметрические уравнения перепишем в виде £ = -ла+а(т-5Ш т), д == - 2a+a(l - cos т). Отсюда ясно, что эволюта циклоиды есть циклоида, конгруентная с данной, но смещенная на отрезок ла влево (параллельно оси х, в отрицательном направ- лении) и на отрезок 2a вниз (параллельно оси у, тоже в отрицательном направ- лении). Представляем читателю убедиться в том, что эволюта эпи- или гипоциклоиды также конгруентна с исходной кривой и получается из нее простым поворотом. 5) Найти эволюту логарифмической спирали r = aem0. Геометрическое построение центра кривизны, указанное в 252, 5) позволяет с легкостью установить его полярные координаты и 0!. Именно (см. рис. 134) ri= пр ~ r etg ш = /иг, п 01 = 0+—. Исключая г и 0 из этих уравнений и уравнения самой спирали, получим уравне- ние эволюты 1\ = тае ' =<,ет"1. Повернув полярную ось на надлежащий угол, можно отождествить это урав- нение с исходным; таким образом, эволюта логарифмической спирали есть такая же спираль, получающаяся из исходной поворотом вокруг полюса. К построению эвольвент для заданной кривой мы вернемся после того, как изучим некоторые свойства эволют и эвольвент. 255. Свойства эволют и эвольвент. Мы имели параметрическое представление эволюты в виде £ = х - К sin a, ?/-=y + flcosa, (8)
582 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [255 считая х, у, R, а функциями от параметра. Предположим теперь существование (непрерывных) третьих производных от х и у по параметру *); тогда выражение (8) можно продифференцировать: d^ = dx — R cos a dx — dR sin а, dr} = dy-R sin a dx + dR cos a. Принимая во внимание, что R cos a dx = ~^dx = dx, da as R sin xdx = ~~ dx = dy, dads J окончательно получим d£= - sin x dR, dr] = cos x dR. (11) Ограничимся теперь рассмотрением такого участка кривой, на котором R не обращается ни в нуль, ни в бесконечность и, кроме того, dR не обращается в нуль. Этим исключена возможность особых точек как на данной кривой, так и на ее эволюте. Так как dR^Q, то радиус кривизны R изменяется монотонно: либо возрастает, либо убывает. Деля одну на другую формулы (И), найдем: dr) 11 -^= -ctga= --—= --г-, dt ° tg a dy dx так что угловые коэффициенты касательных к эволюте и к эвольвенте обратны по величине и по знаку, а сами касательные - взаимно перпендикулярны. Итак: 1° Нормаль к эвольвенте служит (в центре кривизны) касательной к эволюте. Возьмем семейство нормалей к эвольвенте; оно зависит от одного параметра (например, от того, которым определяется положение точки на данной кривой). Из доказанного ясно, что эволюта является огибающей для этого семейства нормалей. Для упражнения предлагаем читателя убедиться в этом же другим путем: исходя из уравнения нормалей (X-x)xfl + (Y-y)y't = Q (где параметр t содержится в х, у, x't, yj), методами п° 238 найти оги- бающую и установить ее совпадение с эволютой (10). Можно доказать также, что центр кривизны есть характеристическая точка на нормали, *) Напомним, что в R уже входят вторые производные.
255] § 5. КРИВИЗНА ПЛОСКОЙ КРИВОЙ 583 т. е. предельное положение точки пересечения данной нормали с бесконечно близкой к ней. Перейдем теперь к рассмотрению дуги в на эволюте. Возводя равенства (11) в квадрат и складывая, найдем - с учетом формулы (11) 248 для дифференциала дуги - da2 = d^2 + dry = dR2, откуда da = ±dR (12) или (ведь dR # 0) Так как это отношение есть непрерывная функция от пара- метра, которая не может перескакивать от значения -1 к зна- чению ч-1 (не проходя промежуточных значений), то она на всем участке равна одному из этих чисел. Иными словами, в правой части равенства (12) на всем участке фигурирует один и тот же знак, плюс или минус. Знак этот зависит от выбора направления для отсчета дуг на эволюте. Если выбрать его так, чтобы дуга в возрастала вместе с радиусом кривизны R, то в формуле (12) нужно взять плюс; если же дуга а возрастает в том направлении, которому отвечает убыва- ние R, то будет минус. Сделаем первое из этих допущений; тогда dR = da, откуда R - а = с = const, (13) и мы получаем, что 2° радиус кривизны разнится от дуги эволюты на величину постоян- ную. Таким образом, разность радиусов кривизны в двух точках эволь- венты равна дуге эволюты между соответствующими центрами кри- визны. Отсюда, между прочим, вытекает любопытный способ спрям- ления дуги на эволюте. Доказанное свойство эволюты допускает изящное механическое истолкование. Для того, чтобы облегчить его изложение, допустим, что радиус кривизны R, который (не обращаясь в 0) сохраняет на всем рассматриваемом участке один и тот же знак, будет везде поло- жительным; этого можно добиться выбором надлежащего направ- ления для отсчета дуг на эвольвенте. Далее, отсчитывая дугу на эволь- венте от той точки Р, которой отвечает наименьший радиус кривизны, будем иметь и сг=-О. В этих условиях и постоянная с, фигурирующая в равенстве (13), также положительна.
584 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [255 Представим себе теперь, что на эволюту навернута гибкая нера- стяжимая нить, от конца Q (рис. 163) к началу Р; она сходит с эволюты в начальной точке Р по касательной и обрывается на расстоянии с от Р в соответ- ствующей точке А эвольвенты. Станем нить развертывать, сма- тывая с эволюты, но сохраняя ее в натянутом состоянии. Пусть QNM будет произвольное ее по- ложение; так как NM больше РА = с как раз на длину дуги PN = а, то NM и есть радиус кривизны R, т. е. точка М лежит на эвольвенте. Итак: эвольвента может быть описана путем разворачивания нити, предварительно навернутой на эволюту *). Иначе можно ска- зать, что эвольвента есть траек- тория точки А прямой АР, описы- по эволюте без скольжения. В заключение, выведем еще формулу для радиуса кривиз- ны q эволюты. Обозначив через /3 угол, составленный касатель- ной к эволюте с осью х, имеем, очевидно: /? = а±~, так что <7j3 = Ja. Поэтому [см. (13) и (14)] _da _ dR _ds dR _ „ dR d{}~ da da ds ds (14) (15) Нужно помнить, что эта формула предполагает, что а растет вместе с R; в противном случае следовало бы в правой части поста- вить минус. Если же считать, что а растет вместе с s, то формулу можно напи- сать в виде (16) объединяя, таким образом, случай > О (R возрастает вместе с 51) dR &S и случай -= О (R убывает с возрастанием s). *) Отсюда, собственно, ведут свое происхождение и самые термины эво- люта и эвольвента, означающие «развертка» и «развертывающая».
256] § 5. КРИВИЗНА ПЛОСКОЙ КРИВОЙ 585 256. Разыскание эвольвент. Мы видим, что каждая эвольвента может быть восстановлена по своей эволюте с помощью разворачива- ния навернутой на эволюту нити или - что по существу то же - путем качения прямой по эволюте (без скольжения). Докажем теперь обратное утверждение: если прямая катится (без скольжения) по данной кривой, то траектория любой ее точки служит для данной кривой эвольвентой. [Таким образом, каждая кривая имеет бесчисленное множество эвольвент.] Пусть кривая PN (рис. 164) задана параметрически уравнениями ri = ip(t), причем <р и у имеют непрерывные производные до второго поряд- ка; допустим также, что на рассматриваемом участке кривой нет крат- ных и вообще особых точек. Дугу at кривой будем отсчитывать от точки Р. На касательной в точке Р, направленной в сторону возрастания дуг, возьмем произвольную точку А, расстояние которой от Р (с уче- том знака) обозначим через с, и проследим ее траекторию при каче- нии прямой РА (без скольжения) по данной кривой. При новом поло- жении прямой, когда точкой касания станет N, точка Р перейдет в S', а Д - в М\ очевидно, S7V = PN=о, так что NM -=с~а.
586 ГЛ. VII. ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [256 Если координаты точек N и М обозначить, соответственно, через (£, rj) и (х, у), а угол между прямой SN и осью х - через /3, то, проектируя отрезок NM на оси, нетрудно получить: х=£ + (с-<т) cos/3, y = ri + (c-(f) sin/?. (17) Эти уравнения и дают параметрическое представление искомой тра- ектории. Дифференцируя их, найдем dx = d't, - cos /3 da - (c - a) sin /3 dp, dy = dr[-sin ft da + (c-a) cos/3 dp. Так как [см. 249 (15)] cos/3 = ~~ sin/3=^-, (18) ‘da 'da 4 то эти результаты упрощаются: dx= -(с-c) sin/3 dp, dy = (c-a) cosp dp. Исключим случаи, когда dp = O или a = с *); тогда, разделив почленно эти формулы, получим tg а = ~= — ctg /? = ° dx dr) dt Отсюда уже ясно, что касательные к обеим кривым взаимно пер- пендикулярны, так что данная кривая действительно является огибаю- щей для семейства нормалей к построенной кривой, т. е. ее эволю- той. Значит, построенная кривая служит для данной эвольвентой, ч. и тр. д. Примером получения эвольвенты указанным путем может служить уже рассмотренная выше эвольвента круга [225, 8); ср. 252, 4)]. *) Им отвечают особые точки на построенной кривой.
ДОПОЛНЕНИЕ ЗАДАЧА РАСПРОСТРАНЕНИЯ ФУНКЦИЙ 257. Случай функции одной переменной. Рассмотрим функцию Дх), определенную в некотором (конечном или бесконечном) проме- жутке X или - более обще - в области X, состоящей из конечного числа отдельных таких промежутков. Если функция f(x) непрерывна в X и имеет в этой области непрерывные же производные до п-го порядка включительно (и=^1), то говорят, что она в области X при- надлежит классу Qn. Отметим при этом, что если конец какого-либо из промежутков включен в его состав, то по отношению к этой точке имеются в виду односторонние производные*). Пусть же функция /(х) в некоторой области X, не охватываю- щей всей числовой оси, принадлежит классу gn (и = 1, 2, 3, ...). Пред- положим, что в какой-либо области X*, налегающей на X, существует функция /*(х), тоже класса Qn, которая в общей части областей X и X* совпадает с /(х); тогда эта функция /* осущест- вляет распространение функции f на X* с сохранением класса. Всегда ли возможно такое распространение функций на более широкую область? На этот вопрос отвечает следующая Теорема. Любую функцию Дх) класса g" (и= 1, 2, 3, ...) в зам- кнутой**) области X можно распространить на всю числовую ось X* = ( - ~, + ~) с сохранением класса. Покажем, что здесь распространение осуществляется просто с по- мощью целых многочленов. С этой целью сделаем пред- варительно следующие замечания. Как мы видели в 123, многочлен и-й степени р(х) = с0 + ^(х-а) + ^(х-а)2+...+^(x-a)n U) в точке х = а, вместе со своими п производными, принимает, соот- ветственно, именно значения с0, с1; с2, ..., сп. *) Или — что в данных условиях означает то же самое - предельные значения для производных, при приближении к названному концу со сто- роны самого промежутка. **) То есть состоящей из одного или нескольких замкнутых промежутков вида [а, 6], [а, +“), 6].
588 ДОПОЛНЕНИЕ [258 Пусть, далее, требуется построить такой многочлен, который, удовлетворяя по-прежнему условиям, относящимся к точке х = «, кроме того, принимал бы, вместе со своими п производными, в неко- торой другой точке х=/3 наперед заданные значения d0, dL, d.>, .. .,dn. Возьмем искомый многочлен в виде p(x) + (x-a)n+^(x), (2) где р(х) есть многочлен (1), а многочлен и-й степени д(х) еще под- лежит определению. Как бы ни выбирать q(x), многочлен (2) в точке х=а во всяком случае удовлетворяет поставленным условиям. Про- дифференцируем многочлен (2) последовательно п раз и подставим в этот многочлен и его производные х=$; приравняв полученные выражения, соответственно, dQ, dr, d^, ..., dn, мы придем к системе линейных уравнений относительно <//), </(/), q"(P), ., из ко- торых эти значения последовательно и определятся. По ним же, поль- зуясь формулой, аналогичной (1), уже нетрудно восстановить q(x). [Ср. 130.] Обратимся теперь к доказательству высказанного утверждения. Пусть, в общем случае, область X состоит из замкнутых промежут- ков Хк {к = 1,2, ...,т), перенумерованных слева направо. Полагая в этих промежутках функцию f* =f, дополним ее определение сле- дующим образом. Если левый конец ах промежутка есть конеч- ное число, то для х~=-а} положим/* равной многочлену вида (1), при со = ЛД1)> С1 = /"(«1), • - •, сп = Аналогично распространяется функция / и направо от Хт, если толь- ко правый конец Ьт этого промежутка есть конечное число. Наконец, для промежутка (bk, ак+1) (к = 1, 2, ..., т-1), отделяющего Хк от Жк+1, отождествим /* с таким многочленом, который вместе со сво- ими п производными в обеих точках х = Ьк и х = ак+1 принимает те же значения, что и функция / и ее производные. Нетрудно видеть, что определенная так функция /* и осуществляет требуемое распро- странение на всю область $?* = (- °°, + °°). 258. Постановка задачи для двумерного случая. Положение вещей сразу усложняется при переходе к функциям нескольких переменных. Мы ограничимся в дальнейшем случаем функции двух переменных. Результаты, которые для этого случая будут установлены, перено- сятся и на общий случай любого числа переменных. Мы будем рассматривать области зЛ в двумерном простран- стве, разумея под этим либо открытую область, либо же от- крытую с присоединением к ней части ее границы <5? или же всей гра- ницы (в последнем случае область будет замкнутой). При распространении на рассматриваемый случай определения функций класса (£'! (n&= 1) мы сталкиваемся с своеобразным затруд- нением. Дело в том, что в точке, лежащей на границе 5? области,
258] ЗАДАЧА РАСПРОСТРАНЕНИЯ ФУНКЦИЙ 589 может оказаться просто неприложимым самое определение частной производной того или иного типа. Например, если область есть замкнутый круг х2+^2=е1, то в точках (0, ±1) нельзя гово- рить о частной производной по х, ибо при у = ± 1 значению х - О нельзя придать никакого приращения, чтобы сразу же не выйти за пределы области, где задана функция; аналогично, в точках (±1,0) не имеет смысла частная производная по у. Говоря о частной производной (определенного порядка и типа), непрерывной в области е#, мы условимся в граничной точке Мо области разуметь под этой производной *) лишь предельное значение, к которому стремится одноименная производная, вы- численная во внутренней точке М, при стремлении М к Мо — неза- висимо от того, будет ли оно на деле играть роль производной или нет. Из дальнейшего изложения впоследствии выяснится, что упомяну- тое предельное значение - в широком классе случаев - будет вместе с тем и настоящей производной, если только положение точки Мо относительно области поз- воляет вообще говорить о производ- ной рассматриваемого типа. Впро- чем, для простейшего случая пря- моугольной области мы этот факт установим уже сейчас. Итак, пусть функция f(x, у) не- прерывна вместе со всеми своими производными, до п-го (иэЛ) по- рядка включительно, в некотором прямоугольнике е^, и точка М0(х0, у0) жГ xa+h Рис. 165. лежит на отрезке прямой у=у§, служащем границей этого прямо- угольника (рис. 165) и входящем в его состав. Начнем с производной f'y, для которой вопрос исчерпывается про- сто. По формуле Лагранжа [112] отношение приращений f(x0,y0+k) f(x0,y0) = ,уо+вк) (о<0< 1); и при к->0 стремится именно к предельному значению /у(х0, j0)> которое таким образом оказывается и производной в соб- ственном смысле [ср. 113]. Что же касается производнойто соот- ветствующее ей отношение приращений само может быть рассмотрено как предел /(Хо+Л, УО)-/(УО, у0) = ]jrn/(Xp + /?, Уо + к)~ f(x0, уа+к0) h к-0 h *) Сохраняя при этом для нее обычное обозначение.
590 ДОПОЛНЕНИЕ [259 Но последнее выражение, снова по формуле Лагранжа, преобра- зуется к виду уо + 1с) (О<0<1). При й-*0, к->-0 оно стремится к предельному значению /х(хо»Л)- По теореме же п° 168, ввиду существования простого предела при /с-0, этот двойной предел служит в то же время и повторным пределом: Л(х0,У0) = Нт lim Л-0 А-0 " = lim Уо)-/(ха, у о) л-о h ' ’ так что и здесь число /х(х0> >’о\ определенное лишь как предельное значение производной, является настоящей производной. Сказан- ное последовательно переносится и на производные высших по- рядков. Итак, заключенное выше условие позволяет теперь говорить о не- прерывных производных в любой области е^, как бы ни были рас- положены по отношению к этой области ее граничные точки (вклю- ченные в ее состав). Функция f(x,y) принадлежит классу Qn (иэ=1) в двумерной области е^, если она в оЖ непрерывна и имеет н е- прерывные же производные всех типов и всех порядков до п-го включительно. Пусть область не охватывает всей плоскости; если в какой-либо области е^*, налегающей на е^, существует функ- ция f *, тоже класса которая в общей части областей и сов- падает с/, то мы будем говорить, что она дает распространение функ- ции f на с сохранением класса. Естественно и здесь поставить вопрос: всегда ли возможно такое распространение на бо- лее широкую область, в частности, на всю плоскость? Как мы по- кажем, на этот вопрос для замкнутой области можно ответить утвердительно, если только ее контур удовлетворяет не- которым простым условиям. Впрочем, для облегчения изложения мы будем всегда предполагать область ограниченной, хотя окончательное утверждение верно и для неограниченной области. Излагаемые результаты в основном принадлежат У и т н е ю (Н. Whitney) и Хестинсу (М. R. Hestenes). 259. Вспомогательные предложения. Для облегчения доказа- тельства основной теоремы установим предварительно некоторые леммы.
259] ЗАДАЧА РАСПРОСТРАНЕНИЯ ФУНКЦИЙ 591 Лемма I. Пусть функция <р(и, v) будет класса g" (иэ= 1) в обла- сти S’, определяемой неравенствами*) a<u-=b, 0=sw<J. Тогда существует распространение <р* функции (р, с сохранением класса, на весь прямоугольник S’* - (а, Ь; - Л, Д). Определим п + 1 чисел Я2, ..., хп+1 из следующей системы п +1 линейных уравнений: \ Л ( 1 \ /с 4J Я2+... + (-^ Яп+1 = 1 (3) (Л = 0,1,2, Выполнить это можно, так как определителем системы является так называемый определитель Вандермонда для неравных между собою чисел -1, который, как известно, отличен от 0. Определим теперь в S’* функцию <р*(и, v), полагая <p*(w, v) =q>(u, v) для vs^O и <p*(u,v) = \<p(u, -v) + lpp(u, -|ц} + ...+Я„+1<р(ы, (4) для v «= 0. Если w0 есть произвольное значение и из (а, Ь), то прежде всего lim <р*(и, v) = (2Х + \ . + Ял+1)99(и0, 0) =<р(и0, 0), U-Uo r—— 0 в силу первого из условий (3), отвечающего & = 0. Этим установлена непрерывность функции <р* в тех точках прямоугольника S’*, которые лежат на прямой « = 0; непрерывность ее в остальных точ- ках S’* очевидна. Обратимся теперь к вопросу о существовании и не- прерывности производных функции у* в S’*; и здесь рассмотрения требуют лишь точки прямой г> = 0. Для всех производных (и> и) би1 6vk (l^i + k^n) (5) мы установим предельное равенство lim д1+к<р*(и, V) 6i+k<p(u0, 0) ~ duldtfi duldvk v-*- — 0 (6) *) Промежуток (а, Ь) может быть и бесконечным; точно так же и положитель- ное число А может равняться +~.
592 ДОПОЛНЕНИЕ (259 С этой целью продифференцируем равенство (4) i раз по и, а затем к раз по v (г><0): у) _ д!+к<р(и, -у) ди1 dvk ' 1 ди1 <)vk , ( И З'+кр и, ( v 2 / ' (~2j “ дй‘1)^ + ••• / , м, di+k<p [и, г>] / 1 \kz v л + 1 J + (-й+Т/ Zn+1 диП)^ и перейдем к пределу при и -* и0 и v — - 0. В результате, в силу ра- венства (3), мы и получим (6). Таким образом, существование единого предельного зна- чения для любой производной (5) как со стороны v>Q, так и со стороны v<Q - обеспечено. Больше того, если за значение произ- водной (5) в точках прямой г> = 0 принять это ее предельное значе- ние, то получится непрерывная во всем функция. Но точка (w0, 0) является для я'* внутренней точкой, и здесь нам нужна была бы производная в собственном смысле. В этом отношении мы имеем возможность сослаться на доказанное в предыдущем п°: упомяну- тое предельное значение будет в то же время и настоящей производ- ной. Функция <р* и осуществляет искомое распространение функции <р на $*. Лемма П. Пусть функция f(x, у) будет класса Qn в некоторой ограниченной открытой области Q/ft *). Если каждую точку границы этой области можно окружить окрестностью, в пределах кото- рой допустимо распространение функции f с сохранением класса, то такое распространение возможно и на всю плоскость Для любой точки М замкнутой области <55най- дется **) либо окрестность, в которой функция f определена и при- надлежит классу б", либо же окрестность, на которую f может быть распространена с сохранением класса. Эту окрестность можно взять, например, в виде открытого круга о = (М, Зг) с центром М и ра- диусом Зг. Таким образом, вся замкнутая область©^ покры- вается не только системой состоящей из этих кругов, а, но и си- стемой состоящей из кругов а = (М, г) с втрое меньшими ра- диусами. *) Мы не предполагаем этой области даже связной и пока ничего не говорим о виде ее границы. **) В зависимости от того, принадлежит ли М открытой области или ее границе <$5.
259] ЗАДАЧА РАСПРОСТРАНЕНИЯ ФУНКЦИЙ 593 Так как область а с нею и ограничены, то к данному слу- чаю применима лемма Бореля [175], ипокроется конечной системой 2т = {<*1 > а2> • • • > °т}> извлеченной из Здесь О’/ = , г() (/=1,2, ..., т); одновременно будем рассматривать и круги o’/ = 2rl), a't' = Зг,). Легко построить функцию hl[M)=hl\x,y) класса Qn в такую, что ht(M) = 0 в а, и //,(ЛГ) = 1 в S’-tr'i (i=l,2, .. ,,т). Можно, например, определить - методами п° 257 - функцию h(t) класса во всем промежутке + °° так, чтобы было Л(/) = 0 для /=sl и //(?) = ! для fs*2, а затем положить С помощью функций hi составим функции Я1 = Я1(М)=1-Л1, = Я,(М) = hr h2 ... h^(l -h^ (1 -= / m)- они также принадлежат классу Qn в g. Очевидно, Hj=0 в at (для всех j>i , (7) Ht=0 в g-o-J, (8) ибо в а, обращается в нуль множитель //,, а в g-o, - множитель 1-Л,. Так как Н1 + Н2+... +Я, = (1-Л1) + Й1(1-Л2)+... ... + hxh2 ... Л,-/! - fl,) = 1 - hrh2 ... Л,-, то Нх + Н2+ ... +Н=Л в <т(, (9) потому что там обращается в нуль множитель hi. Пусть теперь в а'/ совпадает с функцией f или с ее распростра- нением, о котором упоминалось выше, а вне а" пусть <pt=f в точках и = 0 в прочих точках. Функция обращается в нуль в g - [см. (8)] и, очевидно, во всей < плоскости g принадлежит классу Положим, наконец, во всех' точках g 1 ’ 38 Г. М. Фихтенгольц, т. I
594 ДОПОЛНЕНИЕ [260 Этим равенством функция /* определяется во всей плоскости и при- том оказывается функцией класса gn. Возьмем любую точку М из она принадлежит некоторому кругу <т,-. Так как все и, кроме того, в этой точке [ввиду (9) и (7)] HY +Н2 + ... +Hj = 1, a Hj = 0 для j>i, то /*(М)=f(M). Таким образом, функция f* и есть искомая. 260. Основная теорема о распространении. Теперь мы в состоянии доказать и для случая функции двух переменных теорему о распро- странении, но налагая ограничения на контур области. Условимся называть гладкой кривой класса Qn (hs=1) простую кри- вую без особых точек, выражаемую уравнениями X y=y>(t), (10) где t изменяется в некотором промежутке в предположении, что функции <р, у принадлежат в этом промежутке классу g”. Теорема L Если функция f(x, у) принадлежит классу О' (иэ=1) в ограниченной замкнутой области <&£, контур которой S6 состоит из одной или нескольких (непересекающихся) гладких кривых, тоже класса gn, то эта функция может быть распространена на всю пло- скость § с сохранением класса. Пусть М0(х0,уф есть произвольная точка контура <25; для про- стоты будем считать хо=уо = О. Эта точка лежит на одной из кри- вых, входящих в состав SC, и является обыкновенной ее точ- кой. В таком случае, без умаления общности, можно допустить, что в окрестности точки Мо кривая выражается явным уравнением V.. (6} и Рис. 166. /=Хх)> гДе g ~ также класса О1, и что область ©# лежит вверх от нее, т. е. (вблизи Мф определяется неравенством y^g(x) (рис. 166, а). Произведем преобразование переменных, полагая х-и, y=g(u) + v. Функция f(x,y) при этом перейдет в функцию <?(и, v) =f(u, g(u) + v),
261] ЗАДАЧА РАСПРОСТРАНЕНИЯ ФУНКЦИЙ 595 которая оказывается класса вблизи точки u = v = 0, именно, для vi&O (рис. 166, б). Тогда, по лемме I, функцию <р можно распростра- нить с сохранением класса и на значения w<0 (все время ограничи- валась точками, достаточно близкими к начальной). Если это рас- пространение осуществляется функцией ср* (u,v), то, возвращаясь к старым переменным, легко видеть, что функция f*(x, у)=<р*(х, у - g(x)) дает распространение функции f на некоторую окрестность точки Мо. На основании леммы II мы можем заключить теперь, что функ- ция/, действительно, допускает распространение, с сохранением класса, на всю плоскость g. 261, Обобщение. Однако полученный результат для практических надобностей все же недостаточен, поскольку часто приходится иметь дело с областями, контуры которых имеют «угловые точки». Усло- вимся называть кусочно-гладкой кривой класса Qn - кривую, состо- ящую из нескольких гладких дуг класса Qn, примыкающих одна к другой под углами (не равными ни 0, ни л!). Теорема II. Заключение теоремы I сохраняется, если контур S6 области состоит из одной или нескольких непересекающихся ку- сочно-гладких кривых к лас- с a Q,n. Мы уже видели, что любую точку кон- тура X, не являющуюся угловой, можно окружить окрестностью, в пределах кото- рой допустимо распространение функции /с сохранением класса. Докажем теперь то же относительно угловой точки М0(х0, у0). И здесь снова можно принять х0 = =уо=0; можно, не нарушая общности, предположить также, что смыкающиеся в начале дуги имеют в этой точке касательные, из которых одна совпадает с положительной ча- стью оси х, а другая идет к ней под углом (рис. 167). В таком случае в достаточной близости к началу эти дуги выражаются, соответст- венно, уравнениями y=g(x) и x = h(y), причем g'(0)=0; функции g и h принадлежат обе классу Qn- Прибегнем к замене переменных x = u + h(v), y=g(u) + v. (11) Так как якобиан этих функций
596 ДОПОЛНЕНИЕ [261 в точке м = « = 0 обращается в 1, то система (11) в окрестности нуле- вых значений всех аргументов допускает однозначное обращение: и = Я(х, у), v= [i{x, у), (12) причем функции Я, р, также оказываются класса Qn [209]. При »=0 и иэ=0 из (11) получаем y=g(x) и хэ=0, так что поло- жительной части оси и отвечает первая из названных дуг; аналогично убеждаемся в том, что поло- жительной части оси v отве- чает вторая из дуг. Очевидно, при этом пре- образовании две угловые об- ласти, на которые этими ду- гами делится окрестность на- чальной точки на плоскости ху, отвечают тем двум - «входя- щему» и «выходящему» - пря- мым углам, на которые поло- жительными частями осей и и v делится на плоскости uv окрестность начальной точки (рис. 168, а и б). Подставляя в функцию f выражения (11), получим преобразован- ную функцию <7-(м, V) =f(u + h(v), g(u) + v), определенную и принадлежащую классу Qn в том или другом - смо- тря по случаю - из упомянутых только что прямых углов. Если речь идет о «выходящем» угле (рис. 168, а), то, по лемме I, сначала функцию <р распространяют на IV координатный угол, а за- тем полученную функцию (меняя роли и и v) распространяют уже на II и III углы, т. е. на полную окрестность начала. Сложнее обстоит дело, если речь идет о «входящем» угле (рис. 168, б). В этом случае поступают так. Прежде всего, опираясь на лемму I (но меняя знак и), распространяют функцию <р С левой полуплоскости на правую*) и получают, таким образом, функцию (рг - в полной окрестности начала. Затем рассматривают функцию ip=(p-(pi в нижней полуплоскости и, пользуясь указанным при до- казательстве леммы I методом, распространяют ее на верхнюю полуплоскость, что дает функцию yi - Уже в полной окрестности начала. Но в III угле ^=^=^-^ = 0, а тогда, по самому характеру упомянутого метода, ясно*' что уг = 0 и во II угле. Если положить теперь в окрестности начала <Р*=У1+<Р1, то во II и Ill углах % = 0 и <рх=<р, так что и ср*=(р, и в IV угле у>1=у>=(р-(р1, и опять-таки (р*- *) Все время имея в виду лишь точки, близлежащие к началу.
262] ЗАДАЧА РАСПРОСТРАНЕНИЯ ФУНКЦИЙ 597 = ((р-(р1)+ф1=<р. Таким образом, построенная функция (р* дает рас- пространение <р на полную окрестность начала. С помощью обратного преобразования (12) к старым переменным получается и распространение /*(х, у) =<р*(2(х, у), fi(x, у)) функции f. Доказательство завершается, как и в теореме I, ссылкой на лемму II. 262. Заключительные замечания. Доказанная теорема о распро- странении функций имеет многообразные приложения. Мы ограни- чимся здесь указанием на обобщение с ее помощью ряда локаль- ных, т. е. связанных с окрестностью определенной точки, формул и теорем анализа - на случай, когда упомянутая точка лежит на границе рассматриваемой области, а не внутри нее, как обычно предполагается. Пусть, например, в замкнутой области ©#, ограниченной конту- ром <S? (рассмотренного выше типа), определена функция z = f(x, у), непрерывная вместе со своими производными /' и f'y. Тогда, если только точка (х0, у0) лежит внутри е^, имеет место из- вестная [178] формула для полного приращения функции: Zlz = f(x0 + Дх, у0 + Ду) - /(х0, у0) = = ЛОо > /о) Лх + Л (*о, Уо) 4у + а Дх + £ ^У, (13) где а и стремятся к нулю вместе с Дх и Ду. Рассуждения, приве- денные для доказательства этой формулы, вообще неприложимы, когда точка (х0,у0) оказывается лежащей на контуре. А между тем формула верна и для этого случая, если только свя- зать Дх и Ду условием, чтобы точка (х0 + Дх, у0 + Ду) не выходила за пределы &#. В этом легко убедиться, если написать сначала фор- мулу для функции /*, дающей распространение f на всю плоскость, а затем - ограничиваясь, как указано, точками области &#, - вер- нуться к исходной функции f Во всех случаях, когда в основе умозаключений лежала формула (13), мы получаем теперь существенное дополнение к прежним ре- зультатам. Так, при сделанных относительно функции f предположениях она оказывается дифференцируемой [179] не только во внутрен- них точках области е^, но и в точках ее границы. Для поверхности, выражаемой уравнением z = /(х, у), мы получаем возможность гово- рить о касательной плоскости [180] даже в точках ее контура. На рассмотренной формуле, как мы знаем, основано также пра- вило дифференцирования сложной функции [181].
598 ДОПОЛНЕНИЕ [262 Если функции x=<p(t), y=y(t) (14) имеют производные, и точки (</;(/), у(/)) лежат все внутри обла- сти то для сложной функции z = ipff)) мы имели формулу z't=f'xx't + f'yy't. Теперь она распространяется и на случай, когда «кривая» (14) под- ходит вплотную к контуру области еЖ и т. д., и т. п. Не входя в подробности, укажем еще один важный пример. Пусть имеем систему функций х =(р(и, v), у =у(и, v), (15) непрерывных вместе со своими производными в некоторой замкну- той области S’ на плоскости uv, с контуром $(, и пусть в некоторой точке (и0, v0) этой области якобиан D(u, v) отличен от 0. Если точка (u0,v0) лежит внутри S’, то по теореме IV п° 208 система функций (15) допускает обращение, так что в окрестности точки (х0,у0), где хо=<р(«о> f0), Уо=у(ио, v0), переменные и, v выражаются однозначными функциями от перемен- ных х, у: и = Я(х, у), v=fi(x, у), (15*) непрерывными вместе со своими производными в упомянутой окрест- ности. Таким образом, ограничиваясь значениями и, V, х, у, доста- точно близкими, соответственно, к и0, v0, х0, у0, можно сказать, что соотношения (15) и (15*) совершенно равносильны. Этим мы поль- зовались, например, при доказательстве утверждения, что поверх- ность х=(р(и, v), у =у(и, v), *=%(«, v), где (и, v) изменяется в области S’, вблизи ее обыкновенной точки Мо (отвечающей и-и0, v = v0) может быть выражена явным уравнением [228]. Но к точкам контура поверхности наши рассужде- ния были неприложимы, ибо в плоскости uv точка (и0, v0) не могла лежать на контуре области S’-
262] ЗАДАЧА РАСПРОСТРАНЕНИЯ ФУНКЦИЙ 599 Теперь же, воспользовавшись распространениями (р* и у* функ- ций (р и ip, мы можем обобщить результат, относящийся к обраще- нию системы функций, и на случай, когда точка (w0, »0) лежит на кон- туре Примыкающей к точке (w0, »0) части области § отвечает на плоскости ху некоторая примыкающая к точке (х0,у0) область, в пре- делах которой все же обращение допустимо. Соответственным образом дополняется и упомянутый геометри- ческий результат. Приведенных примеров достаточно для того, чтобы читатель уяс- нил себе важность доказанных теорем как для самого математиче- ского анализа, так и для его приложений. Другие примеры примене- ния теорем о распространении функций читатель найдет в последу- ющих томах.
АЛФАВИТНЫЙ УКАЗАТЕЛЬ Абсолютная величина 14, 31, 34 Абсолютный экстремум 469 Алгебраическая функция 448 Аналитический способ задания функ- ции 97, 98 Аналитическое выражение функции 98 — представление кривых 503, 517 -----поверхностей 517 Аномалия (эксцентрическая) планеты 174 Аргумент функции 95, 341 Арифметическое значение корня (ради- кала) 36, 103 — пространство 345 Арксинус, арккосинус и т. д. ПО Архимед 64 Архимеда аксиома 16, 34 Архимедова спираль 512, 529 Асимптота 309 Асимптотическая точка 513, 514 Астроида 506, 511, 526, 546, 573, 580 Барометрическая формула 95 Бернулли, Иоанн 206, 314 —, Яков 38 — лемниската 515, 530, 575, 577 Бесконечная десятичная дробь 22 — производная 209 Бесконечно большая величина 54, 117 --------, классификация 145 --------, порядок 145 — малая величина 47, 117 --------высшего порядка [обозначе- ние о (а)] 136—137 --------, классификация 136 --------, леммы 57 --------, порядок 137 --------, эквивалентность 139 Бесконечность (+~, —~) 26, 55 Бесконечный промежуток 94, 308 — разрыв 309 Бойля—Мариотта закон 94 Больцано 84 Больцано метод 88 Больцано—Вейерштрасса лемма 87, 367 Больцано—Коши теоремы 1-я и 2-я 168, 171, 182, 366 ----, условие 84, 134 Бореля лемма 181, 372 Варианта 44, 344 — возрастающая (неубывающая) 70 — , имеющая предел 52 — как функция значка 96 — монотонная 70 — ограниченная 53 — убывающая (невозрастающая) 70 Вейерштрасса—Больцано лемма 87, 367 — теоремы 1-я и 2-я 175, 176, 183, 369, 370, 373 Вертикальная асимптота 309 Верхняя граница числового множества 26 ---------- точная 26 Вещественные числа 19 ----, вычитание 31 ----, деление 34 ----, десятичное приближение 22 ----, непрерывность области 24 ----, плотность (усиленная) области 21 ----, равенство 19 ----, сложение 28 ----, умножение 31 ----, упорядочение области 19 Вивиани кривая 521, 535 Винтовая линия 521, 534 — поверхность 523, 535 Вложенные промежутки, лемма 83 Внутренняя точка множества 350 Вогнутые (выпуклые вверх) функции или кривые 295 ----------, условия вогнутости 298 — строго функции или кривые 298 Возврата точка 539, 541 Возрастающая варианта 70 — функция 133
АЛФАВИТНЫЙ УКАЗАТЕЛЬ 601 Вращения поверхность 522 Выпуклые (выпуклые вниз) функции или кривые 294 ----------, условия выпуклости 298 — строго функции или кривые 298 Высшего порядка бесконечно малые [обозначение о (а)] 136—137 -----дифференциалы 241 --------функции нескольких перемен- ных 410 -----производные 231, 232 --------, связь с конечными разностями 245 --------частные 402 Гармоническое колебание 208 Гаусс 74, 439 Гельдера—Коши неравенство 275, 302 Географические координаты 522 Геометрическое истолкование диффе- ренциала 214 ------ полного дифференциала 386 ----- производной 190 Гипербола 506, 575, 580 — равнобочная 102, 103 Гиперболическая спираль 529 Гиперболические синус, косинус и т. д. 107 — функции, непрерывность 149 -----обратные 108—109 -----, производные 205 Гипоциклоида 509 Главная ветвь (главное значение) арк- синуса, арккосинуса и т. д. 110— 114 — часть (главный член) бесконечно малой 141 Гладкая кривая 594 Горизонтальная асимптота 309 Градиент функции 394 Граница области 351 — числового множества (верхняя, ниж- няя) 25—28 -------- точная 26 График функции 100 ------, построение 305 -----пространственный 343 Гюйгенса формула 260 Дедекинд 17 Дедекинда основная теорема 25 Действительные числа, см. Веществен- ные числа Декартов лист 507, 538 Десятичное приближение вещественного числа 22 Десятичные логарифмы 79 Диаметр точечного множества 371 Дирихле функция 99, 102, 153 Дискриминантная кривая 545, 550 Дифференциал 211, 215 — 2-го, 3-го, л-го порядка 241 —, геометрическое истолкование 214 — дуги 562, 567 —, инвариантность формы 216 — полный 382 -----2-го, 3-го, я-го порядка 410 -----геометрическое истолкование 386 -----, инвариантность формы 394 -----, метод вычисления (при замене переменных) 489 —, применение к приближенным вы- числениям 218, 220, 396 — частный 378, 411 Дифференцирование 215 — параметрическое 243 —, правила 215, 395 Дифференцируемая функция 212, 382 Дифференцируемость неявной функции 451 Длина отрезков 40 — плоской кривой 560 -------, аддитивность 560 — пространственной кривой 567 Дополнительный член формулы Тей- лора 249, 257, 415 -------Лагранжа 263 -------Эрмита 266 Дробная рациональная функция 103 -------, непрерывность 148 -------нескольких переменных 353 6 (число) 78, 148 —, иррациональность 82 —, приближенное вычисление 81 Единица 14, 32 Дарбу теорема 224 Движения уравнение 187 Двойная точка кривой 538 Двойной предел функции 360 Двух переменных функция 341 Зависимые функции 478 Замена переменных 483 Замкнутая область 351 — сфера 351 Замкнутое множество 351 Замкнутый параллелепипед 351
602 АЛФАВИТНЫЙ УКАЗАТЕЛЬ Замкнутый промежуток 93 — симплекс 351 Заострения точка 539 Затухающее колебание 208, 282 Знаков правило (при умножении) 16, 32 Йенсен 295 Йенсена неравенство 301 Измерение отрезков 40 Изолированная точка кривой 536, 539 Инвариантность формы дифференциала 216, 394 Интерполирование 263 Интерполирования узлы 263 -----кратные 266 Интерполяционная формула Лагранжа 263 -------, дополнительный член 265 -----Эрмита 266 -----—, дополнительный член 267 Иррациональные числа 19 Кантора теорема 179, 184, 370, 374 Кардиоида 510, 515, 530 Касание кривых 542 -----, порядок 551 Касательная 188, 210, 386, 523, 530, 533, 555 — односторонняя 209 —, отрезок 524 —, — полярный 528 — плоскость 384, 532 —, положительное направление 567 Касательное преобразование 485, 487, 493, 500 Касательных метод (приближенного ре- шения уравнений) 328 Кассини овал 515 Квадратичная форма 423 -----, наибольшее и наименьшее зна- чения 476 -----неопределенная 425 -----определенная 423 — — полуопределенная 427 Кеплера уравнение 174 Клапейрона формула 340, 377 Класс гладкой кривой 594 Классификация бесконечно больших 145 -----малых 136 Классы функций 102 Колебание гармоническое 208 — затухающее 208, 282 — функции 177, 370 Комбинированный метод (приближен- ного решения уравнений) 335 Компрессор 433 Конечные разности 244 Конечных приращений формула 227, 390 Конус 2-го порядка 535 Координатные линии (поверхности) 520 Координаты л-мерной точки 345 Корень из вещественного числа, суще- ствование 35 — уравнения (функции), существование 170 ---—, приближенное вычисление 170, 324 Косинус 103 —, функциональная характеристика 160 — гиперболический 107 ---» функциональная характеристика 160 Косеканс 103 Котангенс 103 — гиперболический 107 Коши 67, 69, 84, 192 Коши—Больцано теоремы 1-я и 2-я 168, 171, 182, 366 ---условие 84, 134 — форма дополнительного члена 257 — формула 229 Кратная точка кривой 505, 519, 538, 540 Кривизна 568 — , круг 571 — , радиус 571 — средняя 568 —, центр 571 Кривые, см. соответствующее название — в пространстве 517, 518 — в л-мерном пространстве 347 — на плоскости 503, 508, 511 — переходные 576 Кронекер 99 Куб л-мерный 348 Кусочно-гладкая кривая 595 Лагранж 192, 257, 470 Лагранжа интерполяционная формула 263 -------, дополнительный член 265 — теорема, формула 226, 227 — форма дополнительного члена 257, 415 Лебег 181
АЛФАВИТНЫЙ УКАЗАТЕЛЬ 603 Лежандра многочлены 240 Лежандра преобразование 487, 499, 500 Лейбниц 192, 215, 241 Лейбница формула 238, 241 Лемниската Бернулли 515, 530, 575, 577 Логарифм, существование 39 — десятичный 50, 79 — натуральный (или неперов) 78 -----, переход к десятичному 79 Логарифмическая спираль 514, 529, 574, 581 — функция 103 -----, непрерывность 155, 174 -----, производная 195, 197 -----, функциональная характеристика 159 Ломаная (в «-мерном пространстве) 347 Лопиталя правило 314, 320 Маклорена формула 247, 251 Максимум, см. Экстремум Матрица функциональная (Якоби) 444, 478 -----, ранг 468, 471, 479 Матрицы умножения 444 Мерз 44 Минимум, см. Экстремум Минковского неравенство 276 Многозначная функция 96,109, 341, 447, 453 Множество точек замкнутое 351 ----- ограниченное 352 — числовое, ограниченное сверху, снизу 26 Множители неопределенные, метод 470 Модуль перехода от натуральных ло- гарифмов к десятичным 79 Монотонная варианта 70 — функция 133 -----, непрерывность, разрывы 154 Монотонности функции условие 270 П переменных функция 352 «-кратная точка кривой 540 «-кратный предел 360 «-мерная сфера 349, 351 «-мерное пространство 345 «-мерный параллелепипед 348, 351 «-мерный симплекс 349, 351 Наибольшее значение функции 176, 286 -------нескольких переменных 427 Наибольший предел варианты 89 ----Функции 136 Наименьшее значение функции 176, 289 -------нескольких переменных 427 Наименьший предел варианты 89 ---- функции 136 Наименьших квадратов метод 438 Наклонная асимптота 310 Наложение функций 114 Направление на кривой 558 Натуральный логарифм 78 Независимость функций 478 Независимые переменные 94, 341, 352 Неопределенности раскрытие 62, 314 0 — вида — 60, 314 -------- 61, 320 ОО ----о . оо 61, 322 ----„ 62, 323 ----1~, 0°, ==» 166, 323 Неопределенные множители, метод 470 Непер, неперовы логарифмы 78 Непрерывность области вещественных чисел 24 — прямой 42 — функции в области 365 ----в промежутке 148 ----в точке 146, 362 ----односторонняя 150 ----равномерная 178, 370 Непрерывные функции, операции над ними 148, 364 ----, свойства 168—185, 365—374 ----, суперпозиция 114, 364 Неравенства, доказательство 122, 273, 302 Неравенство Коши 275, 346 — Коши — Гельдера 275, 302 — Йенсена 301 — Минковского 276 Несобственные числа (точки) 26, 55, 355 Неявные функции 447, 453 ---, вычисление производных 460 ----, существование и свойства 449, 451, 453 Нижняя граница числового множества 26 ----------, точная 26 Нормаль к кривой 523 -------, отрезок 524 -------, — полярный 528
604 АЛФАВИТНЫЙ УКАЗАТЕЛЬ Нормаль к поверхности 532, 534 Ньютона метод (приближенного реше- ния уравнений) 328 Относительный экстремум 467 Отрезок, измерение 40 — касательной, нормали 524 -----, — полярный 528 Оценка погрешностей 220, 396 Мбласть в «-мерном пространстве 350 — изменения переменной (переменных) 95, 341 — замкнутая 351 — определения функции 95, 341 — открытая 350 — связная 352 Обратная функция 108 ----, непрерывность 172 ----, производная 196 ----, существование 172 Обратные тригонометрические функции 110 --------, непрерывность 156, 174 --------, производные 197 Обыкновенная точка (кривой или по- верхности) 504, 505, 520 Овалы Кассини 515 Огибающая семейства кривых 543 Ограниченная варианта 53 Ограниченное множество точечное 352 ---- числовое 26 Ограниченность непрерывной функции, теоремы 175, 183, 369, 373 Однозначная функция 96, 341 Однородная функция 399 Односторонние непрерывность и раз- рывы функции 150 Односторонняя касательная 209 — производная 209 ----высшего порядка 232 Окрестность точки 115 ----л-мерная 348, 349 Определитель, производная 388 — функциональный (Якоби) 441 Особая точка (кривой или поверхности) 504, 505, 517, 518, 519, 531, 533, 535, 537 ---- изолированная 536 ---- двойная 538 ----кратная 505, 519, 538, 540 Остроградский 442 Открытая область 350 — сфера 349, 350 Открытый промежуток 93 — параллелепипед 348, 350 — симплекс 349, 350 Относительная погрешность 140, 218, 397 Парабола 64, 103, 525, 546, 575, 579 Параболоид вращения 344 Параллелепипед л-мерный 348 Параметр 217, 504 Параметрическое дифференцирование 243 — представление кривой 217, 504, 512 --------в пространстве 518 ---- поверхности 519 Пеано форма дополнительного члена 249 Перегиба точка 303 Переменная 43, 93 — независимая 94, 341, 352 Переменных замена 483 Переместительное свойство сложения, умножения 12, 14, 29, 32 Перестановка дифференцирований 405, 407 — предельных переходов 361, 406 Переходные кривые 576 Периодическая десятичная дробь 24 Поверхность 343, 517, 519 — вращения 522 Повторный предел функции нескольких переменных 360 Подкасательная 207, 524 — полярная 528 Поднормаль 524 — полярная 528 Подпоследовательность 85 Пограничная точка 351 Погрешность абсолютная, относитель- ная 139, 140, 218, 221, 397 Показательная функция 103 ----, непрерывность 149, 155 ----, производная 194 ----, функциональная характеристика 158 Полное приращение функции 378 Полный дифференциал 381, 396 ----высшего порядка 410, 413 ----, геометрическая интерпретация 386 ----, инвариантность формы 394 ----, применения к приближенным вы- числениям 396 Полукубическая парабола 506, 540, 548, 579
АЛФАВИТНЫЙ УКАЗАТЕЛЬ 605 Полуоткрытый промежуток 93 Полярная подкасательная, поднормаль 528 Полярное уравнение кривой 511 Полярные координаты 493, 495, 512 Полярный отрезок касательной, нор- мали 528 Порядок бесконечно большой величины 145 ----малой величины 137 — дифференциала 241 — касания кривых 551 — производной 231 Последовательность 44 Постоянства функции условие 268 Правило, см. соответствующее назва- ние Предел варианты 46, 48 ----бесконечный 55 ----, единственность 54 ----монотонной 71 ----наибольший, наименьший 89 ----частичный 86 — отношения 59 — произведения 59 — производной 228 — разности 59 — суммы 59 — функции 115, 117 ----монотонной 139 ----наибольший, наименьший 135 ----нескольких переменных 354, 357 ----------повторный 360 ----частичный 135 Предельный переход в равенстве, в не- равенстве 56 Преобразование Лежандра 487, 499, 500 — точечное (плоскости, пространства) 485, 493 Приближенное решение уравнения 324 Приближенные вычисления, примене- ние дифференциала 218, 220, 396 Приближенные формулы 140, 143,. 218, 257—263 Приращение переменной 147 -г-r функции, формула 199 —* — нескольких переменных полное, формула 379 ----------частное 375 Приращений конечных формула 227, 390 Произведение вариант, предел 59, 61 — функций, предел 129, 130 ----, непрерывность 148, 364 ----, производная и дифференциал 200, 216, 236, 241, 395 Произведение чисел 14, 31 Производная 189, см. также название функции — бесконечная 209 — высшего порядка 231 -------, связь с конечными разностями 245 — , геометрическое истолкование 190 — , несуществование 211 — односторонняя 209 — по заданному направлению 391 — , правила вычисления 199 — , разрыв 211 — частная 375 ----высшего порядка 402 Промежуток 82 — замкнутый, полуоткрытый, откры- тый, конечный, бесконечный 93— 94 Промежуточное значение, теорема 171 Пропорциональных частей, правило 325 Простая точка (кривой или поверхно- сти) 505, 520 Пространственный график функции 343 Пространство «-мерное (арифметиче- ское) 345 Прямая в л-мерном пространстве 347 Равномерная непрерывность функции 178, 370 Радикал, арифметическое значение 36, 103 Радиус кривизны 571 Разность вариант и т. д., см. Сумма — чисел 13, 31 Разрыв производной 211 — функции 146 ----монотонной 154 ----, обыкновенный, 1-го и 2-го рода, 151 ----нескольких переменных 362 Ранг матрицы 468, 471, 479 Раскрытие' неопределенностей 62, 314 Распределительное свойство умножения' 15, 34 Распространение функций 587 Расстояние между точками в л-мерном пространстве 345 Рациональная функция 102 ----, непрерывность 148 ----нескольких переменных 353 —: ------ —, непрерывность 358, 563 Рациональные числа, вычитание 13
606 АЛФАВИТНЫЙ УКАЗАТЕЛЬ Рациональные числа деление 15 -----, плотность 12 -----, сложение 12 -----, умножение 14 -----, упорядочение 12 Риман 154 Ролля теорема 225 Роша и Шлемильха форма дополни- тельного члена 257 Связи уравнения 467 Связная область 352 Сгущения точка 115, 116, 117, 351 Секанс 103 Семейство кривых 542 Сечение в числовой области 17, 24 Сигнум (функция) 29 Сила тока 192 Сильвестр 423 Симплекс л-мерный 349, 351 Синус 103 — гиперболический 107 —, предел отношения к дуге 122 Синусоида 106, 304 Скорость движения точки 186 — в данный момент 187, 190 — средняя 186 Сложная функция 115, 353 -----, непрерывность 156, 365 -----, производные и дифференциалы 202, 216, 242, 386, 395, 413, 414 Смешанные производные, теорема 404 Соприкасающаяся кривая 554 — прямая 555 Соприкасающийся круг 555, 571 Сочетательное свойство сложения, умножения 13, 14, 29, 32 Сравнение бесконечно малых 136 Среднее арифметико-гармоническое 74 ------геометрическое 74 — арифметическое 275, 430 — гармоническое 74, 303 — геометрическое 74, 275, 303, 430 — значение, теорема 227 -----, обобщенная теорема 230 Средняя кривизна 568 — скорость 186, 190 Стационарная точка 277, 418 Степенная функция 103 -----, непрерывность 156 — —, производная 194 -----, функциональная характеристика 158 Степенно-показательная функция (двух переменных) 353 Степенно-показательная функция пре- дел 358, 359 — -------, непрерывность 363 ---------, дифференцирование 376 Степенно-показательное выражение, предел 165 — -------, производная 206, 388 Степень с вещественным показателем 37 Сумма вариант, предел 59, 62 — функций, предел 129, 130 — функций, непрерывность 148, 364 ----, производная и дифференциал 200, 216, 233, 395 — чисел 12, 28 Суперпозиция функций 114, 353, 364 Сфера 344 — л-мерная 349, 350 Сферические координаты 495 Сходимости принцип 84, 134 1 аблинный способ задания функции 97 Тангенс 103 — гиперболический 107 Тело геометрическое 345 Теплоемкость 191 Точка, см. соответствующее название Точки функции 352 Точная граница (верхняя, нижняя) 26 Тригонометрические функции 103 ----, непрерывность 149 ----, производные 195 Тройная точка 540 Тройной предел 360 Тейлора формула 246, 249, 257 и 415 Убывающая варианта 70 — функция 133 Угловая точка 209 Узлы интерполирования 263 ----кратные 266 Уитней 590 Улитка 514, 529 Уравнение кривой 100, 230, 503, 511, 518 — поверхности 343, 517, 519 —, приближенное решение 170, 324 —, существование корней 170 Ускорение 191, 231 Ферма теорема 223 Форма квадратичная 423
алфавитный указатель 607 Формула 97, 98, см. также соответ- ствующее название Функциональная зависимость 94, 340 — матрица 444, 478 Функциональное уравнение 157, 158, 160 Функциональный определитель 441 Функция 95, см. также название функ- ции —, исследование 268 — нескольких переменных 341, 352 — от функции (или от функции) 115, 353 Частный дифференциал 378, 411 Чебышёва формула 262 Числа, см. Рациональные, Иррацио- нальные, Вещественные числа Числовая ось 42 — последовательность 44 Шварц 407 Шлемильха и Роша форма дополни- тельного члена 257 Штольца теорема 67 Характеристическая точка на кривой 539 Хесгинс 590 Ход изменения функции 268 Хорд метод приближенного решения уравнений 325 Целая рациональная функция 102 --------, непрерывность 149 --------несколько переменных 353 --------, непрерывность 358, 363 — часть числа [Е (р)] 48 Центр кривизны 571, 577 Цепная линия 207, 505, 573 Циклоида 508, 526, 574, 581 Цилиндр проектирующий 518 Частичная последовательность 85 Частичный предел варианты 86 -----функции 135 Частная производная 375 -----высшего порядка 402 Частное вариант, предел 59, 60 — значение функции 96 — приращение 375 — функций, предел 129, 130 -----, непрерывность 148, 364 -----, производная и дифференциал 201, 216, 395 — чисел 15 Эвольвента 578, 582—583, 585 — круга 511, 527, 574 Эволюта 579, 582—583, 585 Эйлер 78 Эйлера формула 401 Эквивалентные бесконечно малые вели- чины (знак ~) 139 Экстремум (максимум, минимум) 277 —, правила отыскания 277, 278, 284, 287 — собственный, несобственный 277 — функции нескольких переменных 417 ----------абсолютный 469 ----------относительный 467 Электрическая сеть 436, 474 Элементарные функции 102 -----, непрерывность 155 -----, производные 193, 197, 233 Эллипс 448, 506, 525, 547, 575, 579 Эллипсоид 535 Эрмита интерполяционная формула 266 -------, дополнительный член 267 Эпициклоида 509, 527 Якоби 376 — матрица 444, 478 — определитель (якобиан) 441