/
Text
и*л
Государственное издательство
иностранной
литературы
*
INEQUALITIES
by
G. H. HARDY
J. E. LITTLEWOOD
G. POLYA
1934
Г. Г. ХАРДИ, Дж. Е. ЛИТТЛЬВУД и Г. ПОЛИА
НЕРАВЕНСТВА
Перевод с английского
В. И. ЛЕВИНА
с дополнениями
В. И. ЛЕВИНА и С. Б. СТЕЧКИНА
19 4 8
Государственное издательство
ИНОСТРАННОЙ ЛИТЕРАТУРЫ
МОСКВА
Редактор СБ. Стечкин
Техн. редакторы А. Никифорова и А. Дронов Корректор М. Шулименко
Сдано в производство 31/VII 1947 г. Подписано к печати 23/VII 1948 г. А-05679.
ne4ji.28V2. Уч.-изд.25,1. Заказ 1323. Формат 60Х921/г. Издат.№1/62 Цена25р.60к.
4-я типография им. Евг. Соколовой треста «Полиграфкнига» ОГИЗа
при Совете Министров СССР, Ленинград, Измайловский пр., 29
ОГЛАВЛЕНИЕ
Теоремы Стр.
От переводчика 11
Из предисловия авторов к английскому изданию . . 12
Глава I
ВВЕДЕНИЕ
1.1. Неравенства для конечных сумм, рядов и
интегральные неравенства — 13
1.2. Обозначения — 14
1.3. Положительные неравенства — 15
1.4. Однородные неравенства — 15
1.5. Аксиоматическая основа алгебраических нера- —
венств — 17
1.6. Сравнимые функции — 18
1.7. Выбор доказательств — 19
1.8. Выбор предмета — 21
Глава II
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
2.1. Обыкновенные средние — 24
2.2. Взвешенные средние — 25
2.3. Предельные случаи средних Шг(а) 1—5 26
2.4. Неравенство Коши 6—8 28
2.5. Теорема о среднем арифметическом и среднем
геометрическом 9 29
2.6. Другие доказательства теоремы о средних ... — 31
2.7. Неравенство Гельдера и его обобщения .... 10—11 35
2.8. Неравенство Гельдера и его обобщения
(продолжение) 12—15 38
2.9. Общие свойства средних Шг{а) 16—17 41
2.10. Суммы (&г(а) 18-23 42
2.11. Неравенство Минковского 24—26 44
2.12. Аналог неравенства Минковского 27—28 47
2.13. Иллюстрации и приложения основных неравенств 29—36 48
2.14. Доказательства основных неравенств методом
индукции 37—40 53
2.15. Элементарные неравенства, связанные с
теоремой 37 41—42 55
2.16. Элементарное доказательство теоремы 3 . . . . — 58
2.17. Неравенство Чебышева 43—44 59
2.18. Теорема Мюрхеда 45 61
2.19. Доказательство теоремы Мюрхеда — 62
2.20. Другая теорема о сравнимости симметрических
средних 46—47 65
6
ОГЛАВЛЕНИЕ
Теоремы Стр.
2.21. Дальнейшие теоремы о симметрических средних 48—50 66
2.22. Элементарные симметрические функции от п
положительных чисел 51—55 68
2.23. Замечание о положительных формах — 72
2.24. Теорема о строго положительных формах . . . 56—57 75
Разные теоремы и примеры 58—81 79
Глава III
СРЕДНИЕ ЗНАЧЕНИЯ С ПРОИЗВОЛЬНОЙ ФУНКЦИЕЙ
И ТЕОРИЯ ВЫПУКЛЫХ ФУНКЦИЙ
3.1. Определения 82 85
3.2. Эквивалентные средние 83 86
3.3. Одно характеристическое свойство средних Шг 84 88
3.4. Сравнимость 85 90
3.5. Выпуклые функции — 91
3.6. Непрерывные выпуклые функции 88—87 92
3.7. Другое определение 88—89 93
3.8. Случаи равенства в основных неравенствах . . 90—91 95
3.9. Новая формулировка и обобщение теоремы 85 92—93 96
3.10. Дважды дифференцируемые выпуклые функции 94—95 97
3.11. Приложения свойств дважды дифференцируемых
выпуклых функций 96—97 98
3.12. Выпуклые функции от нескольких переменных 98—99 100
3.13. Обобщения неравенства Гельдера 100—101 103
3.14. Некоторые теоремы о монотонных функциях . 102—104 105
3.15. Суммы с произвольной функцией, обобщения
неравенства Иенсена 105 106
3.16. Обобщения неравенства Минковского 106 107
3.17. Сравнение последовательностей 107—ПО 111
3.18. Дальнейшие общие свойства выпуклых функций 111 114
3.19. Дальнейшие свойства непрерывных выпуклых
функций 112 117
3.20. Разрывные выпуклые функции — 119
Разные теоремы и примеры 113—139 120
Глава IV
РАЗЛИЧНЫЕ ПРИЛОЖЕНИЯ АНАЛИЗА
4.1. Введение —- 126
4.2. Приложения формулы конечных приращений . 140—143 126
4.3. Дальнейшие приложения элементарных теорем
дифференциального исчисления 144—148 128
4.4. Максимумы и минимумы функций от одного
переменного 149—150 131
4.5. Приложения ряда Тэйлора 151 132
ОГЛАВЛЕНИЕ 7
Теоремы Стр.
4.6. Приложения теории максимумов и минимумов
функций от нескольких переменных — 132
4.7. Сравнение рядов и интегралов 152—155 135
4.8. Неравенство Юнга 156—160 136
Глава V
БЕСКОНЕЧНЫЕ РЯДЫ
5.1. Введение — 140
5.2. Средние 9ЯГ — 142
5.3. Обобщения теорем 3 и 9 — 145
5.4. Неравенство Гельдера и его обобщения .... 161—162 146
5.5. Средние Шг (продолжение) 163 148
5.6. Суммы (&г 164 149
5.7. Неравенство Минковского 165—166 150
5.8. Неравенство Чебышева — 150
5.9. Сводка результатов 167 151
Разные теоремы и примеры 168—180 151
Глава VI
ИНТЕГРАЛЫ
6.1. Предварительные замечания об интегралах
Лебега — 154
6.2. Замечания о нулевых множествах и нулевых
функциях — 156
6.3. Дальнейшие замечания, относящиеся к
интегрированию — 157
6.4. Замечания о методах доказательств — 159
6.5. Дальнейшие замечания о методе; неравенство
Шварца 181—182 161
6.6. Определение средних Шг(/)> когда гфО . . . 183 163
6.7. Среднее геометрическое функции 184—186 165
6.8. Дальнейшие свойства среднего геометрического 187 168
6.9. Неравенство Гельдера для интегралов 188—191 169
6.10. Общие свойства средних Wr(f) 192—194 173
6.11. Общие свойства средних Шг(/) (продолжение) 195 174
6.12. Выпуклость log9#/ 196—197 176
6.13. Неравенство Минковского для интегралов . . . 198—203 176
6.14. Средние значения, зависящие от произвольной
функции 204—206 182
6.15. Определение интеграла Стилтьеса — 184
6.16. Частные случаи интеграла Стилтьеса — 186
6.17. Обобщения приведенных выше теорем .... — 187
6.18. Средние Шг (/; <р) 207-214 188
6.19. Функции распределения — 189
6.20. Характеристические свойства средних значений 215 190
6.21. Замечания о характеристических свойствах . . — 192
6.22. Окончание доказательства теоремы 215 .... — 194
Разные теоремы и примеры 216—252 196
8
ОГЛАВЛЕНИЕ
Глава VII
НЕКОТОРЫЕ ПРИЛОЖЕНИЯ
ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ
Теоремы Стр.
Общие замечания —
Предмет настоящей главы —
Пример неравенства с недостижимым
экстремумом 253—254
Первое доказательство теоремы 254 —
Второе доказательство теоремы 254 255
Дальнейшие примеры применения методов
вариационного исчисления 256
Дальнейшие примеры: неравенство Виртингера 257—258
Пример неравенства, содержащего вторые
производные 259—260
Более простая задача 261
Разные теоремы и примеры 262—272
Глава VIII
ТЕОРЕМЫ
О БИЛИНЕЙНЫХ И ПОЛИЛИНЕЙНЫХ ФОРМАХ
8.1. Введение —
8.2. Одно неравенство для полилинейных форм
с положительными коэффициентами и
переменными 273—275
8.3. Одна теорема Юнга 276—277
8.4. Обобщения и аналоги 278—284
8.5. Приложения к рядам Фурье —
8.6. Теорема выпуклости для положительных
полилинейных форм 285
8.7. Общие билинейные формы 286—288
8.8. Определение ограниченной билинейной формы —
8.9. Некоторые свойства форм, ограниченных в
[р, q] 289—290
8.10. Свертка двух форм в [р% р'] 291
8.11. Некоторые специальные теоремы о формах
в [2, 2] 292—293
8.12. Приложение к формам Гильберта 294
8.13. Теорема выпуклости для билинейных форм с
комплексными коэффициентами и переменными 295
8.14. Дальнейшие свойства максимальной
последовательности [х, у) —
8.15. Доказательство теоремы 295 —
8.16. Приложения теоремы М. Рисса 296—297
8.17. Приложения к рядам Фурье —
Разные теоремы и примеры 298—314
ОГЛАВЛЕНИЕ 9
Глава IX
НЕРАВЕНСТВО ГИЛЬБЕРТА,
ЕГО АНАЛОГИ И ОБОБЩЕНИЯ
Теоремы Стр.
9.1. Теорема Гильберта о двойных рядах 315—317 272
9.2. Об одном общем классе билинейных форм . . 318 273
9.3. Интегральный аналог теоремы 318 319 276
9.4. Обобщения теорем 318 и 319 320-322 278
9.5. Наилучшие константы: доказательство теоремы
317 — 279
9.6. Дальнейшие замечания к теоремам Гильберта . 323 282
9.7. Приложения теоремы Гильберта 324—-325 285
9.8. Неравенство Харди 326—327 288
9.9. Дальнейшие интегральные неравенства .... 328—330 293
9.10. Дальнейшие теоремы о рядах 231—332 296
9.11. Вывод теорем о рядах из теорем об
интегралах 333 298
9.12. Неравенство Карлемана 334—335 299
9.13. Теоремы с 0<р<1 336—338 301
9.14. Теорема с двумя параметрами р и q 339—340 304
Разные теоремы и примеры 341—367 306
Глава X
ПЕРЕСТАНОВКИ
10.1. Перестановки конечных систем переменных . . — 313
10.2. Теорема о перестановках двух систем 368—369 314
10.3. Второе доказательство теоремы 368 — 316
10.4. Другая формулировка теоремы 368 370 317
10.5. Теоремы о перестановках трех систем .... 371—373 318
10.6. Сведение теоремы 373 к частному случаю . . — 319
10.7. Окончание доказательства — 322
10.8. Другое доказательство теоремы 371 — 324
10.9. Перестановки любого числа систем 374—376 328
10.10. Еще одна теорема о перестановках любого
числа систем 377 330
10.11. Приложения — 332
10.12. Перестановка функции — 332
10.13. О перестановках двух функций 378 334
10.14. О перестановках трех функций 379 335
10.15. Окончание доказательства теоремы 379 .... — 338
10.16. Другое доказательство — 342
10.17. Приложения 380—383 345
10.18. Другая теорема о перестановке функции в
убывающем порядке 384—385 349
10.19. Доказательство теоремы 384 — 351
Разные теоремы и примеры 386—405 355
10
ОГЛАВЛЕНИЕ
ДОПОЛНЕНИЯ
Теоремы Стр.
I. Неравенства для выпуклых функций . . . . Д. 1—Д. 11 361
II. Неравенство Карлсона Д. 12 — Д. 17 367
III. Неравенство Карлсона (продолжение) . . . Д. 18 — Д. 22 377
IV. Обобщения теоремы 256 Д. 23 —Д. 26 382
V. Аналоги неравенства Виртингера Д. 27 — Д. 32 384
VI. Неравенства между верхними гранями
производных Д. 33 —Д. 37 388
VII. Неравенства для производных Д. 38 — Д. 41 393
VIII. Неравенство Ингама о билинейных формах Д. 42 397
IX. Обобщения неравенства Харди Д. 43 — Д. 48 398
X. Обобщения неравенства Карлемана .... Д. 49 —Д. 56 402
XI. Уточнение неравенства Эллиота Д. 57 — Д. 60 409
XII. Точные константы в неравенствах Харди и
Литтльвуда Д. 61 —Д. 62 413
XIII. Аналоги неравенств Харди и Литтльвуда . Д. 63 — Д.65 421
XIV Константы в двупараметрических
неравенствах Гильберта Д. 66 —Д. 68 424
XV. Интегральный аналог Д. 69 431
XVI. Разные теоремы Д. 70 —Д. 83 432
Библиография
442
ОТ ПЕРЕВОДЧИКА
До выхода в свет в 1934 г. английского оригинала
предлагаемой русскому читателю книги Г. Харди, Дж. Литтльвуда и
Г. Полиа в мировой математической литературе не существовало
монографии, посвященной неравенствам как таковым.
Появление этой книги способствовало повышению интереса к
неравенствам среди математиков и вызвало ряд новых работ в этой
области. Несмотря на то, что многие из рассмотренных в этой
книге неравенств приводятся в качестве вспомогательного
аппарата в уже существующих на русском языке книгах по
различным вопросам, и несмотря на то, что выбор материала
в предлагаемой книге по необходимости ограничен и далеко не
содержит всех типов неравенств, применяемых в анализе, книга
эта оказалась весьма полезной не только тем читателям, которые
заинтересованы в неравенствах как в специальном предмете
математического исследования, но и тем, для которых
неравенства являются лишь необходимым орудием при исследовании
других вопросов.
Содержание настоящей книги достаточно полно освещено в
предисловии авторов и во введении.
Книга снабжена дополнениями, которые содержат новые
результаты, появившиеся с 1934 г. Эти дополнения никоим
образом не претендуют на полноту; они содержат лишь отчеты
о тех новых исследованиях в области неравенств, которые по
своему характеру близки к содержанию книги.
Дополнения I, V, VI, VII, XI, XII, XIII написаны С. Б. Стеч-
киным, дополнения II, III, VIII, X, XIV, XV — переводчиком.
Остальные дополнения написаны совместно. Часть результатов,
содержащихся в дополнениях, публикуется здесь впервые.
ИЗ ПРЕДИСЛОВИЯ АВТОРОВ
К АНГЛИЙСКОМУ ИЗДАНИЮ
Настоящая книга была задумана и начата в 1929 г. По
первоначальному плану она должна была выйти в серии Cambridge
Tracts, но вскоре стало ясно, что размеры последних далеко
не достаточны для наших целей.
Задачи, которые мы поставили себе при составлении
настоящей книги, достаточно разъяснены в вводной главе. Здесь мы
добавим лишь несколько слов к истории и библиографии нашего
предмета. Исторические и библиографические вопросы особенно
трудны в такого рода предмете, который имеет применение в
каждой области математики, но никогда еще систематически не
разрабатывался.
В самом деле, иногда бывает действительно трудно
проследить историю возникновения даже какого-нибудь
общеизвестного неравенства. Весьма возможно, что оно появилось сначала
как вспомогательное предложение в каком-либо труде по
геометрии или астрономии, часто даже не сформулированное в
явном виде. Много лет спустя оно могло быть вновь найдено
несколькими авторами, и все же все опубликованные
формулировки его могут быть неполными. Мы почти всегда
находили, что даже к самым известным неравенствам можно
прибавить нечто новое.
Мы не предпринимали систематического исследования
библиографических вопросов, но привели все ссылки на
литературу, которые были нам доступны. Неравенства, обычно
связываемые с именем тех или иных математиков, мы также
называем по имени этих математиков; так, мы говорим о
неравенствах Шварца, Гельдера и Иенсена, хотя все эти
неравенства, как можно проследить в литературе, были известны
до них. Отметим еще, что мы не оговариваем всех небольших
дополнений, которые необходимы для исчерпывающей полноты.
Библиография содержит все книги и работы, ссылки на
которые были сделаны в тексте, но не выходит за эти пределы1).
г. г. харди
Кэмбридж и Цюрих дж. е. литтльвуд
Июль 1934 г. г. пол и а
х) В библиографию русского перевода внесены также все работы,
цитированные в дополнениях. (Прим. ред,)
ГЛАВА I
ВВЕДЕНИЕ
1.1. Неравенства для конечных сумм, рядов и
интегральные неравенства. Общие замечания, которые составляют
предмет настоящей главы, будет удобнее всего иллюстрировать на
примере какого-нибудь частного и типичного неравенства; мы
выбираем для этой цели одну замечательную теорему,
принадлежащую Коши, обычно известную как „неравенство Коши".
Неравенство Коши (теорема 7) гласит:
(l.i.i) (Mi + M2+.--+«,A)2<
<(«? + а22+ • • • + 4)(Й+ *» + . ..-\-bl)
или
(1.1.2) (Stfv#v)2<S^S£v2.
1 11
Оно справедливо для всех действительных значений аи а2, ..., ап,
blt b2i ..., bn. Мы называем аи . .., Ь1у ... переменными
неравенства. Здесь число переменных конечно, и неравенство
выражает соотношение между некоторыми конечными суммами.
Такое неравенство мы называем элементарным.
Самые основные неравенства относятся к конечным суммам,
но мы будем рассматривать также неравенства не элементарные,
содержащие обобщения понятия суммы. Наиболее важными
из этих обобщений являются бесконечные ряды
(1.1.3) £*v, bv
1 —с»
и интеграл
ь
(1.1.4) jf(x)dx
а
(где пределы интегрирования а и b могут быть конечными или
бесконечными). Этим обобщениям соответствуют следующие
аналоги теоремы (1.1.2):
со оо оо
(1-1.5) (S*A)2<lXS^
1 11
14
ВВЕДЕНИЕ
[ГЛ.1
(или подобная формула, в которой оба предела суммирования
бесконечны) и
ъ ъ ъ
(1.1.6) (J7 (х) g (х) dxf < J Р(х) dx j g* (x) dx.
a a a
Мы называем (1.1.5) неравенством для рядов, а (1.1.6) —
интегральным неравенством.
1.2. Обозначения. Нам часто придется рассматривать разные
последовательности переменных. Так, в (1.1.2) мы имеем две
последовательности av #2, ..., ап и bv b2i ..., bn. Удобно
ввести более короткое обозначение для последовательностей
переменных; поэтому вместо слов „последовательность аи а2, ..., апи
мы будем часто писать „последовательность (а)", „(я)", или
просто „а".
Мы будем, как правило, опускать индексы и пределы
суммирования там, где это не может вызвать недоразумений. Так, мы
п оо оо
будем писать %а для каждого из выражений £#v, £#v, £<V>
1 1 —оо
например,
(1.2.1) (Sa6)2<Sa2£62
может, таким образом, обозначать (1.1.2) или (1.1.5), смотря
по контексту.
В интегральных неравенствах последовательность заменяется
функцией; так, при переходе от (1.1.2) к (1.1.6), (а) и (Ь)
заменяются функциями / и g. В интегралах мы тоже будем часто
опускать переменные и пределы; например, вместо (1.1.4) мы
будем писать ifdx, так что (1.1.6) будет записано в виде
(1.2.2) (ffgdxy^fpdxfgZdx.
Пределы суммирования и пределы интегрирования будут
оговорены в начале глав и параграфов, или будут ясны из
контекста.
1.3. Положительные неравенства. Нас будут интересовать,
главным образом, „положительные" неравенства1).
1) Существуют и исключения, как, например, в §§ 8.8—8.17. Там
„положительные" случаи рассматриваемых теорем сравнительно
тривиальны.
1.4]
ОДНОРОДНЫЕ НЕРАВЕНСТВА
15
Неравенство называется положительным, если все входящие
в него переменные я, 6,... действительны и неотрицательны.
Из неравенства этого типа обычно следует как тривиальное
следствие неравенство на вид более общее и справедливое для всех
действительных и даже для всех комплексных #,#,.... Так,
из (1.1.2) и неравенства
(1.3.1) |Е«|<Е|и|,
справедливого для всех действительных или комплексных и,
мы выводим
(1.3.2) is^i2 < (SHW)2 < sh2s№
где а и Ь — произвольные комплексные числа. Обычно мы
будем ограничиваться формулировкой наших теорем в
основной „положительной" форме и оставлять формулировки
следующих из них более общих результатов читателю. Только
в случае очень важных неравенств мы будем приводить их
наиболее общую формулировку.
Аналогичные замечания относятся и к интегральным
неравенствам. Независимое переменное х будет действительным,
но вообще будет (как и индекс суммирования v) принимать
как положительные, так и отрицательные значения, тогда как
функции f(x), g(x), ... будут, вообще говоря, принимать
только неотрицательные значения. Неравенству, справедливому
для неотрицательных / и g} соответствует более общее
неравенство; так, из (1.1.6) следует неравенство
(1.3.3) \ffgdx^f\f\*dxf\g\*dx,
справедливое для любых комплексных функций /, g
действительного переменного х.
Показатели k, /, r, s, ..., входящие в наши теоремы, всегда
будут действительны, однако, они могут в общем случае
принимать как положительные, так и отрицательные значения.
1.4. Однородные неравенства. Обе части неравенства
(1.1.2) — однородные функции от а и Ь степени 2; вообще
обе части наших неравенств будут однородными функциями
относительно некоторых совокупностей переменных с
одинаковой степенью однородности. Так как однородные функции
положительной степени обращаются в нуль, когда все их
аргументы равны нулю, то и обе части наших неравенств (если их
16
ВВЕДЕНИЕ
[ГЛ.1
степени однородности положительны) будут равны нулю, а
значит и равны между собой, если все переменные, от
которых они зависят, обращаются в нуль. Так, (1.1.2) обращается
в равенство, если все а или все Ь равны нулю.
Назовем последовательность, состоящую из нулей, нулевой
последовательностью. Пусть (а) = (0) обозначает, что (а) —
нулевая последовательность. Многие из наших неравенств будут
обращаться в равенства, когда одна или все
последовательности переменных, в них входящие, — нулевые. Иногда это будет
единственным случаем равенства. Однако, чаще будут встречаться
и другие случаи равенства; так, например, (1.1.2), очевидно,
обращается в равенство, когда каждое а равно соответствующему Ь.
Где это только будет возможно, мы будем явно формулировать
все случаи равенства.
Однородность неравенства относительно некоторых
совокупностей переменных часто будет способствовать упрощению
наших доказательств, так как она позволит наложить некоторые
добавочные ограничения на эти переменные — нормировать их.
Так, например, в § 2.2 средние Шг(а) однородны, со степенью
однородности равной 0, относительно весов /?, и мы можем,
когда это нам будет удобно, предполагать, что£/? = 1. Или,
если мы хотим доказать, что
(1.4.1) (а\ + 4+ ... +4)1/8 < («I +aj+ ... -\-arnfr
при 0<r<s (теорема 19), то так как обе части однородны
относительно а со степенью однородности, равной 1, мы можем
предположить, что %аг=1. Тогда имеем
or <1, a* = (aV/r<er
и, таким образом, £as^£ar = l. Без этой предварительной
нормировки наше доказательство велось бы так:
(Sas)1''
(S.
Существует еще другой, иногда весьма важный, вид
„однородности". Сравним неравенство (1.4.1), записанное в виде
(1.4.2) (Saf/S<(2«'')1/r,
1.5] АКСИОМАТИЧЕСКАЯ ОСНОВА АЛГЕБРАИЧЕСКИХ НЕРАВЕНСТВ 17
с (1.1.2). Оба неравенства однородны относительно
переменных, но (1.1.2) обладает еще одним видом однородности,
которым (1.4.2) не обладает. Мы можем сказать, что неравенство
(1.1.2) „однородно относительно £", понимая под этим, что
буква £ входит в обе его части в одинаковой степени.
Следствием этой однородности относительно Е является то,
что (1.1.2) остается справедливым, если в нем каждую сумму
заменить соответствующим средним, т. е. если записать его в виде
0»)!<0*)G>«).
Значение этого вида однородности станет совершенно ясным
в §§ 2.10 и 6.4. Грубо говоря, неравенство, им обладающее,
имеет интегральный аналог, в то время как неравенство, им не
обладающее, как, например (1.4.2), интегрального аналога не
имеет.
1.5 *). Аксиоматическая основа алгебраических
неравенств *). Нашу тему трудно определить с достаточной четкостью;
частью она относится к „алгебре"; частью к „анализу". Алгебру
и анализ можно, подобно геометрии, построить аксиоматически.
Вместо того чтобы, как в дедекиндовой теории
действительных чисел, говорить, что рассматриваются такие-то и такие-то
определенные объекты, мы можем говорить, как в
проективной геометрии, что рассматривается множество объектов,
обладающих определенными свойствами, сформулированными в
некоторой системе аксиом. Мы не предполагаем детально
рассматривать „аксиоматику" различных частей нашего предмета, но нам
представляется целесообразным сделать здесь несколько замечаний
об аксиоматической основе тех теорем, которые, как (1.1.2)
и как большинство теорем гл. II, полностью относятся к алгебре.
Мы можем взять за аксиомы алгебры только обычные законы
сложения и умножения. Все наши теоремы будут тогда
справедливы во многих кольцах, например, в поле действительных
чисел, в поле комплексных чисел, в кольце вычетов по
любому модулю. Или мы можем добавить аксиомы о разрешимо-*
*) Этот параграф носит характер беглого наброска. В нем
затрагиваются вопросы, которые, как нам кажется, заслуживают более
обстоятельного рассмотрения. См. Ван-дер-Варден „Современная алгебра"
ГТТИ, 1947, т.1, гл. IX. (Прим. перев. и ред.)
х) См. Artin and Schreier [1].
18
ВВЕДЕНИЕ
[ГЛ.1
сти линейных уравнений — аксиомы, гарантирующие
существование и единственность разности и частного. Тогда наши
теоремы будут справедливы в поле действительных или
комплексных чисел или в поле вычетов по простому модулю.
В этой книге мы рассматриваем отношение неравенства —
понятие, присущее алгебре действительных чисел. Мы можем
аксиоматически обосновать теоремы о неравенствах
добавлением к уже приведенным „неопределимым" и аксиомам еще
одного нового неопределимого и двух новых аксиом. Мы берем
как неопределимое понятие о положительном числе, а в
качестве аксиом следующие два предложения:
I. Либо а есть нуль, либо а положительно, либо—а
положительно, и эти три возможности исключают друг друга.
И. Сумма и произведение двух положительных чисел
положительны.
Мы говорим, что а отрицательно, если — а положительно,
и что а больше {меньше), чем Ь, если а — b положительно
(отрицательно) Это может быть положено в основу любого
неравенства, если оно, как например (1.1.2), принадлежит
к чисто алгебраическому типу.
1.6. Сравнимые функции. Мы говорим, что функции
/О) = /(«1» я2, ..., ап), g (a) = g(ax, а2, ..., ап)
сравнимы, если между ними имеет место неравенство,
справедливое для всех неотрицательных действительных а, т. е. если
f^Cg для всех таких а или f^>g для всех таких а. Две
данные функции обычно несравнимы. Так, два положительных
однородных полинома разных степеней наверное несравнимы *);
если 0<;/^g- для всех неотрицательных а, и / и g*
однородны, то степени однородности fug должны быть равны.
Это определение, естественно, может быть распространено
на функции f(a,by...) от нескольких последовательностей
переменных.
В предлагаемой книге мы будем заниматься задачами о
сравнимости функций. Так, среднее арифметическое и среднее
геометрическое от а сравнимы: ©(#)<; 21 (а) (теорема 9).
Функции Q6(a-\-b) и ®(а)-\-(&(Ь) сравнимы (теорема 10).
Функции %(ab) и %{а) 21(£) несравнимы; их относительная
D Ср. § 2.19.
1.7]
ВЫБОР ДОКАЗАТЕЛЬСТВ
19
величина зависит от отношения величин а и Ь (теорема 43).
Функции
ф-ЧЕЖ*)), ГЧЕРХОО)
сравнимы тогда и только тогда, когда функция yty-1 выпукла
или вогнута (теорема 85).
Одна важная общая теорема Мюрхеда о сравнимости двух
функций типа S«J1 ^2 •.. af"n приведена в § 2Л8,
1.7. Выбор доказательств. Методы доказательств,
применяемые в настоящей книге, принадлежат весьма различным
кругам идей, и мы будем часто, особенно в гл. II, давать
несколько разных доказательств одной и той же георемы.
Может оказаться полезным обратить здесь внимание на основные
различия в применяемых нами методах.
В первую очередь, многие доказательства гл. II „строго
элементарны" в том смысле, что они опираются исключительно
на арифметические понятия и действия. Мы будем, как правило,
приводить по крайней мере одно такое доказательство
каждой важной теоремы, характер которой это позволяет.
Далее, многие доказательства — даже в гл. II — не
элементарны в этом смысле, потому что они оперируют с понятиями
предела и непрерывности. Мы также даем, в частности в гл. IV,
доказательства, применяющие элементарные свойства
производных, например, теорему Ролля. Все эти доказательства
относятся к элементам теории функций одного действительного
переменного.
Еще дальше, рассматривая в гл. VI интегралы, мы,
естественно, применяем теорию меры и интеграл Лебега. Они
предполагаются известными, но мы даем в §§ 6.1—6.3 краткую
сводку тех частей этой теории, которыми в дальнейшем
пользуемся.
Иногда мы прибегаем к более высоким областям теории
функций действительного переменного, но мы делаем это только
при повторных доказательствах или же при доказательствах
по существу трудных теорем. Так, в гл. IV (§ 4.6) мы
пользуемся теорией экстремумов функций нескольких переменных;
в гл. VII мы применяем метода вариационного исчисления,
а в гл. IX мы применяем двойные и повторные интегралы.
Мы нигде не опираемся на теорию функций комплексного
переменного, хотя в последних главах иногда ссылаемся на нее
20
ВВЕДЕНИЕ
[ГЛ.1
в целях иллюстрации. Параграфы, содержащие такие ссылка,
не принадлежат к основному содержанию настоящей книги.
Приведем еще несколько дальнейших замечаний более
частного характера.
(i) Неравенство Коши (1.1.2) является предложением алгебры
в том смысле, как это определено в § 1.5. Согласно широко
признаваемому принципу, доказательство такой теоремы должно
применять методы только той теории, к которой она
принадлежит.
(И) Нам будут часто встречаться теоремы, как, например,
неравенство Гельдера
(1.7.1) £ аЬ < (2 ak)lfk №кГ)1/к'
(теорема 13), в формулировке которых участвует некоторый
параметр k. Если k рационально, то теорема имеет
алгебраический характер и имеет силу наше замечание (i). Если k
иррационально, то ак не является алгебраической функцией,
и очевидно, что строго алгебраического доказательства не
существует.
Разумно, однако, требовать, чтобы при доказательстве
неравенства столь важного, как неравенство Гельдера, наши шаги
за пределами алгебры были сведены к тому абсолютному
минимуму, которого требует существо доказываемой теоремы.
Ясно, что эти шаги будут зависеть от нашего определения ак.
Можно определить ак как exp(&loga), и в этом случае,
очевидно, законно и неизбежно применение теории показательной
и логарифмической функций. Если же, что более обычно,
определить ак как предел а п, где kn — рациональные приближения
к ky то этот предельный переход должен быть единственным,
применяемым в доказательстве.
(Ш) Предположим, что, став на последнюю точку зрения,
мы доказали неравенство Гельдера в форме (1.7.1) для
рациональных k. Мы можем теперь вывести его справедливость для
иррациональных k переходом к пределу.
Однако, такое доказательство обычно недостаточно для нашей
цели. Мы всегда стремимся доказать более точную теорему,
чем (1.7.1), в которой, как в теореме 13, мы утверждаем
строгое неравенство, кроме определенных указываемых частных
случаев. Когда мы переходим к пределу, „ <а превращается
в *<Л МЬ1 теряем из виду возможные случаи равенства (хотя,
1.8]
ВЫБОР ПРЕДМЕТА
21
как оказывается, они остаются теми же, что и в случае
рациональных &), и наше доказательство становится неполным.
Необходимо поэтому вести доказательства таким образом, чтобы,
где это только возможно, избегнуть таких переходов к
пределу. То же затруднение возникает, когда мы хотим
перейти от неравенства для конечных сумм к соответствующему
неравенству для рядов или интегралов. Оно будет нам
встречаться на протяжении всей книги и часто будет определять
наш выбор доказательства.
(iv) При нашем выборе методов мы руководствовались
следующими общими принципами. Когда теорема проста и важна,
как, например, теоремы 7, 9 или 11, мы доказываем ее
несколькими различными методами, причем обращаем особое внимание
на то, чтобы один из наших методов соответствовал принципам,
изложенным в (i) и (и). Когда теорема имеет вспомогательный
характер, либо является трудной, или когда доказательство,
соответствующее этим принципам, затруднительно или длинно,
мы выбираем тот метод, который кажется нам наиболее
простым или поучительным.
1.8. Выбор предмета. При выборе материала и задач мы
руководствовались принципами, которые могут быть
резюмированы следующим образом.
(i) Первая половина книги (гл. II—VI1)) содержит
систематическое изложение определенного предмета. В этой части нашей
целью являлось детальное рассмотрение простых неравенств
(с их аналогами и обобщениями), которые „повседневно"
применяются в анализе. Из них три являются наиболее важными, а
именно:
(1) теорема о среднем арифметическом и среднем
геометрическом (теорема 9);
(2) неравенство Гельдера (теорема 11);
(3) неравенство Минковского ^теорема 24);
и эти три теоремы господствуют в первых шести главах. Мы
доказываем их многими путями: для конечных сумм — в гл. II,
для рядов — в гл. V и для интегралов — в гл. VI; что касается
гл. III (содержащей общую теорию выпуклых функций), то
она посвящена главным образом их обобщениям. В этих
главах, из которых наиболее важными являются II, III и VI,
1) Кроме, может быть, некоторых частей гл. IV.
22
ВВЕДЕНИЕ
[ГЛ.1
мы ставим своей целью полное и в некоторых отношениях
исчерпывающее изложение.
(и) Остальная часть книги (гл. VII—X) написана в другом
духе, и к ней необходим иной подход. Эти главы содержат
ряд очерков на темы, возникшие в связи с более
систематическим исследованием материала предыдущих глав. В них мы
не пытаемся достигнуть ни стройности, ни полноты. Они
мыслятся как введение к некоторым областям современных
исследований, и мы позволили нашим личным интересам влиять
на выбор тем.
Несмотря на это (или вследствие этого), гл. VII — X обладают
некоторым единством. Во многих современных исследованиях
по теории функций действительного или комплексного
переменного, теории рядов Фурье, или общей теории рядов по
ортогональным функциям «классы Лебега Lk» занимают центральное
положение. Эти исследования требуют полного овладения
техникой неравенств; неравенства Гельдера и Минковского и
другие более современные и более тонкие неравенства того же
общего характера применяются в них на каждом шагу. Нашей
целью было написать такое введение к этой области анализа,
которое могло бы считаться естественным продолжением и
развитием материала первых глав.
(Ш) Мы интересуемся главным образом некоторыми частями
действительного анализа, а не арифметикой или алгеброй как
таковыми. Часто бывает трудно провести границу между
алгеброй и анализом, особенно в теории квадратичных или
билинейных форм, и мы часто колебались в вопросе о том, что
включить и что отбросить. Мы, однако, отбросили весь материал,
в котором, как нам казалось, главный интерес представляли чисто
алгебраические соображения.
Мы также исключили чистую теорию функций
действительного и комплексного переменных. Однако в последних главах
мы в ряде случаев старались показать значение наших теорем,
намечая пути некоторых из их теоретико-функциональных
приложений.
Так, например, в нашу программу не вошли:
(1) неравенства определенно арифметического характера,
как, например, неравенства из теории простых чисел, или
неравенства, дающие грани форм от целочисленных переменных;
(2) неравенства, принадлежащие к чисто алгебраической
теории квадратичных форм;
1.8]
ВЫБОР ПРЕДМЕТА
23
(3) такие неравенства, как „неравенство Бесселя",
принадлежащие к теории ортогональных рядов;
(4) такие неравенства, как теорема Адамара о трех кругах,
принадлежащие к чистой теории функций;
здесь нет также систематического рассмотрения геометрических
неравенств, хотя мы часто применяли их в целях иллюстрации.
Нам представляется полезным закончить это введение
советом тем читателям, которые захотят избегнуть ненужного для
них проникновения в детали. Наша тема, несмотря на всю свою
привлекательность, требует, во всяком случае от авторов,
большого внимания к деталям довольно утомительного
свойства. Эти детали возникают главным образом в связи с
определением особых случаев, полным перечислением случаев равенства
и рассмотрением нулевых и бесконечных значений. Читатель,
которого мы сейчас имеем в виду, может пойти на следующие
упрощения: (1) пренебрегать различием между неотрицательным
и положительным, так что все числа и функции, с которыми он
будет иметь дело, он может предполагать положительными в
строгом смысле;(2) игнорировать наши соглашения относительно
„бесконечных значений"; (3) предполагать, что параметры km r в таких
неравенствах, как неравенства Гельдера и Минковского, больше 1;
(4) считать, что „все, что проходит для сумм, проходит с
очевидными изменениями и для интегралов" (и обратно). Тогда он
будет в состоянии усвоить самое существенное без излишних
хлопот.
Этот совет „легкого чтения" не надо понимать слишком
буквально. Существенно понять типы встречающихся особых
случаев и общие принципы определения случаев равенства.
Перечисление отдельных случаев равенства в таких
неравенствах, как неравенство Гельдера, не является лишь простым
упражнением; значение этих случаев дает нам в руки (как ясно
показано в §§ 8.13—8.16) могущественное средство для
открытия глубоких и важных теорем. Каждый читатель должен
поставить себе задачу хотя бы это неравенство исследовать до
конца.
ГЛАВА II
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
2.1. Обыкновенные средние. В дальнейшем мы будем иметь
дело с последовательностями, состоящими из п
неотрицательных чисел а (или Ь, с,...),
(2.1.1) аи а2 ..., а„ ..., ап (av>0)
и с вещественным параметром г, который мы пока
предположим не равным нулю.
Мы обозначим последовательность (2.1.1) через (а). Когда
мы говорим, что „(а) пропорционально (#)", мы
подразумеваем, что существуют два таких числа к и [а, из которых по
крайней мере одно отлично от нуля, что
(2.1.2) Xav = pb, (v = l, 2, ..., п).
Отметим, что нулевая последовательность, т. е. последовательность
(а), в которой каждое а = О, пропорциональна любой
последовательности (Ь). Пропорциональность, как мы ее определили, —
симметричное, но не транзитивное соотношение между последовательностями;
оно станет транзитивным, если мы исключим из рассмотрения
нулевую последовательность.
Если последовательности (а) и (Ь) пропорциональны и ни одна из
них не нулевая, то 6V = 0, если #v = 0, а для остальных значений
индекса v отношение #V/6V не зависит от v.
Мы полагаем
(2.1.3) ^ = ^(«) = (^^)1/Г = (^|1<),/Г,
кроме тех случаев, когда (i) r = 0 или (ii) r<0 и одно или
несколько а равны нулю. В особом случае (ii), когда (2.1.3)
не имеет смысла, мы по определению полагаем Ttr равным
нулю, так что
(2.1.4) Шг = 0 (г<0, некоторые а = 0)1).
Здесь и в дальнейшем мы будем опускать индексы и пределы
суммирования, когда это не может вызывать недоразумений.
*) Если бы мы допускали бесконечные значения, то имели бы
соответствующий особый случай для положительных г, а именно:
г>0, некоторые а бесконечны, Шг = оэ.
2.2]
ВЗВЕШЕННЫЕ СРЕДНИЕ
25
В частности, мы полагаем
(2.1.5) Я = «(я) = ЗЙ1(а)|
(2.1.6) $ = $(а) = Ш_г(а)
и, наконец,
(2.1.7) © = © (а) = \/ага2...ап = ]/11а.
Таким образом, 51 (я) есть обыкновенное среднее
арифметическое, ф (а) — среднее гармоническое и © (а) — среднее
геометрическое.
Мы исключили случай г = О, но ниже (§ 2.3) мы увидим, что ЭД?0
может быть интерпретировано как ®. Мы, вообще, не будем
рассматривать отрицательных а, но иногда удобно применять Ж (а) без
всякого ограничения на знаки а. Определение не меняется.
2.2. Взвешенные средние. Обычно мы будем рассматривать
более общую систему средних значений. Предположим, что
(2.2.1) Л>0 (v=l, 2, ..., п),
и положим
(2.2.2) Шг= mr(a) = mr(a,p)=(Zparfep)Vr,
(2.2.3) Шг = О (г < 0, некоторые а = 0),
(2.2.4) © = © (а) = © (а, р) = (Па*)1/г* •
Равенства (2.1.5) и (2.1.6) остаются в силе для 51 (я, р) и
ф(я, /?). Последнее замечание § 2.1 применимо и к
обобщенным 51. Взвешенные средние сводятся к обычным средним,
когда pv = 1 для всех v.
Так как средние являются однородными функциями нулевой
степени относительно р, мы можем, если пожелаем,
предположить, что £р = 1. В этом случае мы будем писать q вместор\ так,
(2.2.5) Шг(а) = Шг(*> g) = (lgarfr (E? = l),
(2.2.6) ©(*) = © (а, 9)= Пав (2? = 1).
Мы не будем, как правило, явно указывать веса в наших
формулах, но будем всегда подразумевать, что средние, которые
сравниваются друг с другом, образованы с одинаковой
системой весов.
26
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
[ГЛ. II
Обыкновенные средние являются частными случаями
взвешенных средних. С другой стороны, взвешенные средние с
соизмеримыми весами являются частными случаями обыкновенных
средних (для другой системы а). Действительно, в силу
однородности, мы можем предположить, что веса целочисленные а
средние с целочисленными весами получаются из обыкновенных
средних заменой каждого числа системой соответствующего
числа одинаковых чисел. Средние с несоизмеримыми весами
можно рассматривать как предельные случаи обыкновенных
средних.
Мы будем постоянно применять следующие очевидные
формулы:
(2.2.7) %)lr(a) = {%(ar)}lfr,
(2.2.8) ®(a)=e*{losa\
(2.2.9) К.дв)=_1_|
(2.2.Ю) аягв(«) = {2йв(^)}1^
В (2.2.8) мы предполагаем, что я>0; то же предположение
делается и в других формулах, если индекс отрицателен.
Уславливаясь надлежащим образом о смысле обозначений, мы
можем распространить все эти формулы и на исключенные
случаи. Далее,
(2.2.11) %(a-\-b) = %(a)-\-%(b),
(2.2.12) © (а*) = ©(<0 •©(*),
(2.2.13) ЖГ(Ь) = ШДа), если (b)=k(a)
(т. е. если &v = ka„ где k не зависит от v),
(2.2.14) ®(*) = А®(а), если {b) = k{a\
(2.2.15) a№r(fl)<2Rr(ft), если av<£v для всех v.
2.3. Предельные случаи средних Шг(а). Обозначим через
rnin a, max a
соответственно наименьшее и наибольшее значение av.
1. rnin a < 2)?Дя)<тахя, кроме тех случаев, когда либо
все а равны, либо г<0 и хотя бы одно а равно нулю.
2.3] ПРЕДЕЛЬНЫЕ СЛУЧАИ СРЕДНИХ Шг(й) 27
Здесь и в формулировках всех дальнейших теорем
подразумевается, что когда мы утверждаем справедливость
неравенств, кроме тех случаев, когда выполнены некоторые условия,
то по крайней мере одно из этих неравенств вырождается
в равенство в исключенном случае. Например, min а = Шг{а) =
= max а, если все а равны, и min a = Шг(а) ^ max а в другом
исключенном (особом) случае.
Образуем наши средние с весами q. Так как %q(a— %) = О,
то либо каждое а равно 51, либо а — % положительно по
крайней мере для одного а и отрицательно для другого а. Это
рассуждение доказывает нашу теорему для г = 1.
В общем случае мы можем предположить, что либо а > О,
либо г > 0, так как исключенные случаи тривиальны. Тогда
[тг(а)У = %{аг)
и лежит между (min a)r и (max #)r, что и доказывает теорему
в общем случае.
2. min а < © (а) < max я, кроме тех случаев, когда все а
равны, или хоть одно из а равно нулю.
Во втором исключенном случае © = 0. Если ©>0, то
так что либо каждое а равно ©, либо, по крайней мере одно
из них больше ©, а другое меньше.
3. limaRr(a)=ffl(a).
Если все а > 0, то
Шг (а) = ехр (1 log 2 gar) =
= ехр | у log (1 + r S q log a + О (r2))| -* exp (S? log a) =
= Ilaa=®(a)
при r~>0.
Если некоторые а = 0, * обозначает положительное а и 5
обозначает ^, соответствующее Ь, то
9Rr(a, ^) = (S^01/r=(2^)l//, = (S5)l/r2Kr(*,5) -* 0
при г-*+0, так как ШГ(Ь, s) -+ ©(£, s) и £s< 1. Если же
28
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
[ГЛ. II
г < О, то 2Wr и © оба равны нулю, и результат остается
верным и при г -> — 0.
Это доказательство основано на теории показательной и
логарифмической функций. В § 2.16 дадим более элементарное
доказательство теоремы 3.
4. Игл Шг (а) = max a, lim Шг (а) = min а.
Если ак является наибольшим а или одним из наибольших а и
г>0, то мы имеем
чТч < 3Rr (а) < ак9
откуда сразу следует первое равенство. Второе равенство
тривиально, если хотя бы одно из а равно нулю; в противном
случае оно следует из (2,2.9).
Условимся теперь писать
(2.3.1) SM0(a) = @(a), 2Roo(a) = тахя, 5W_a>(<0 = mina.
Тогда мы имеем
б. 3№_oo(#)<9J£r (я)<2Яоо(#) для ясяя конечных г, кроме
тех слу<аев, когда все а равны, или г<^0 # дго/ия Л/ одяо
из а равно нулю.
2.4. Неравенство Коши. Здесь удобно доказать следующую
теорему, хотя она является частным случаем более общей
теоремы 16.
6. ffir (а) < Т12г (я) (г > 0), кроме того случая, когда все а
равны.
Это неравенство, которое можно записать в виде
(£р<)2<£р£/*г2г,
вытекает из следующей очень важной теоремы.
7. (£я£)2<£а2££2, кроме того случая, когда (а) и (Ь)
пропорциональны *).
В самом деле
£ а2 £ ^ - (S аб)2 = 1S (а^ - «Л)а-
*) Это неравенство обычно называют неравенством Коши: см.
Cauchy [1, 373]. Соответствующее неравенство для интегралов
(теорема 181) обычно называют неравенством Шварца, хотя, повидимому,
оно было впервые сформулировано Буняковским: см. Buniakowsky
[1,4], Schwarz [2, 251].
2.5]
ТЕОРЕМА О СРЕДНЕМ АРИФМЕТИЧЕСКОМ
29
Вот другое доказательство: квадратичная форма
Е {xa -\-yb)* = jc2Е a2 + 2ху Е ab-\-у2Е *2
положительна для всех л;, ^, и, следовательно, ее
дискриминант должен быть отрицательным, если только не существует
таких х, у, что по крайней мере одно из них отлично от нуля
и ха?-\-уЬч = 0 Для всех v.
Для вывода теоремы 6 достаточно взять в теореме 7 вместо
а и Ь соответственно ]//7 и агУ~р.
8. Теорема 7 может быть обобщена следующим образом:
Ея2 ^ab ... 2 л/
Е/л Е# ... Е/2
>0,
кроме того случая, когда (а), (#), ..., (/) линейно зависимы,
т. е., когда сущрствуют такие числа х, у, ..., w, не все равные
нулю, что ха^ +уЬ^ + ... -J- wl^ = О для каждого v.
Оба доказательства теоремы 7 могут быть обобщены и для
доказательства теоремы 8, а именно, мы можем либо представить
определитель в виде суммы квадратов определителей, либо рассмотреть
неотрицательную квадратичную форму
Л(ха+уЬ+ ... +w/)2
как функцию от х, у, ..., w. Мы не вдаемся в подробности, так как
систематическое рассмотрение неравенств, связанных с
определителями и квадратичными формами, выходит за рамки настоящей книги.
2.5. Теорема о среднем арифметическом и среднем
геометрическом. Мы переходим теперь к самой знаменитой
теореме нашего предмета.
9. ®(a)<sil(a), кроме того случая, когда все араты.
Неравенство, которое нам предстоит доказать, может быть
записано в любой из следующих двух форм:
Р*4-... -4-©
(2.5.1) рх ар„ <(Рхах+-.-+Рпап\1 п
1 '" » ^ V А+•••+/>»» /
или
(2.5.2) <#...<#»< s fa
(где, как обычно, Е<7 = 1)-
Эта теорема настолько важна, что мы даем для нее несколько
доказательств разных степеней простоты и общности. Из двух
доказательств, приведенных в этом параграфе, первое совершенно
30
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
[ГЛ. II
элементарно. Второе основано на теореме 3, и, таким образом,
пока на теории показательной и логарифмической функций.
Ниже (в § 2 16) мы покажем, что и это доказательство может
быть изменено так, чтобы строже соответствовать принципам § 1.7.
(i) 1} Мы имеем 2)
кроме того случая, когда а{ = а2 и, таким образом,
aia'Aa^{ 2 J \ 2 J "Н 4 )
со знаком строгого неравенства в одном из случаев, если только
av a2, а$ и аА не все равны между собой. Повторяя это
рассуждение т раз, мы найдем, что
/at+ ... +а2т\
(2.5.3) аг... а2т< [ ^ ) '
кроме того случая, когда все а равны, Это — неравенство (2*5.1)
с единичными весами и п = 2т.
Допустим теперь, что п — любое число, меньшее 2W. Полагая
^1= я1» • • •» ®п = ат
А А а1 + ' ■ ' + аП Of
°П\-\ • * * °2Ш п Д
и, применяя (2.5.3) к (£), найдем
или
ах...ап< «»,
за исключением того случая, когда все А, а, значит, и все а
равны. Это — неравенство (2.5.1) с единичными весами. Мы
выводим (2.5.1) с любыми соизмеримыми весами рассуждением,
приведенным в § 2.2.
!) Cauchy [1.375].
V Euclid [I, II 5, V 25].
2.6] ДРУГИЕ ДОКАЗАТЕЛЬСТВА ТЕОРЕМЫ О СРЕДНИХ 31
Если веса несоизмеримы, то мы можем заменить их системой
соизмеримых приближений, доказать (2.5.1) для этих
приближенных весов и перейти к пределу. При этом знак „ < и
превращается в „ <Са, так что мы не получаем еще полного
доказательства теоремы. Мы можем закончить доказательство
следующим образом. Положим
Я* = Я»-\-я" 0 = Ь 2, . .., п),
где #v>0, #">0 и q\ рациональны. Тогда
рациональны и r'-J-r/7 = l. Мы уже доказали (2.5.1) с „<"
для рациональных р, и с „<;и для любых р. Отсюда
Другой способ закончить доказательство был сообщен нам Р. Палеем.
Он опирается на теорему 6. Из этой теоремы, формулы (2.2.10) и того,
что доказано выше, следует, что
% (а) = Я»! (а) > Щ2(а) = Tl\ (д1/в) > @2 (а^) = Ща).
(ii)1) По теоремам 6 и 3,
9l(a) = 3K1(a)>S»L (a) > SR (а) > ... > lim 3Ra_w(e) = ®(а).
М W-»00
Это доказательство очень коротко, но не столь элементарно,
как первое. Заметим, что мы применяем только частный случай
теоремы 3, когда г стремится к нулю, пробегая специальную
последовательность значений 2-т.
2.6. Другие доказательства теоремы о средних. Мы
вернемся к теореме 9 в §§2.14— 15 и еще раз в § 2.21. Здесь мы
добавим несколько замечаний по поводу других доказательств
этой теоремы с единичными весами.
D SchlOmilch [1].
32
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
[ГЛ. II
(i)1) Случай, когда все а равны, тривиален. Поэтому пусть
ах = min a < max a = а2.
Если мы заменим аг и а2 через у {ai-\-a^)) то 21(a) не
изменится, а так как
(£1±£.)«>в1в11
то © (а) возрастет.
Допустим теперь, что мы изменяем а так, что 21 не меняется,
и предположим, что существует последовательность (а*), для
которой © достигает своего наибольшего значения. Тогда все а*
х) Это доказательство, наиболее известное из всех доказательств,
было дано впервые (насколько мы могли это проследить) Маклореном
[Maclaurin, 2]. Маклорен формулирует теорему геометрически
следующим o6pd30M: „если Отрезок АВ разделен на любое Число Частей АС,
CD, Db, LB, то Произведение всех этих Частей будет наибольшим,
когда Части равны между собой". Его доказательство, по существу,
тождественно с приведенным в тексте; впоследствии это доказательство
было найдено вновь или воспроизведено многими позднейшими
авторами, например, Grebe [1], Chrystal [1,47].
Доказательство Коши (§ 2.5) может рассматриваться как более
замысловатая форма доказательства Маклорена, так как он
доказывает теорему в частном случае п = 2т рассуждением, подобным
рассуждению Маклорена. Доказательство Маклорена вообще не
принадлежит к „конечному" типу. В юм виде, как мы его привели, оно основано
на теореме Вейерштрасса о максимуме непрерывной функции. Это
Маклорен, естественно, считал очевидным, как и многие из его
последователей: Гребе, Кристал.
Можно избежать ссылки на теорему Вейерштрасса, но дорогой це*
ной. Ясно, что если aS±\ a{^\ af}, afKt ... обозначают наименьшие и
наибольшие числа последовательностей, получающихся в результате
применения рассуждения Маклорена 1, 2,... раза, то off* возрастает,
а а%' убывает с возрастающим s. Таким образом
^iS) -> аь #«>S) -> а2> а2 > аь
Небольшое рассмотрение показывает, что п повторений рассуждения
уменьшают разность между наибольшим и наименьшим а, по крайней
мере, наполовину, так что а!>п) — а^< -^ (а2 — а{). Следовательно,
a(f — а^-> 0 и а1 = а2. Отсюда следует, что все а стремятся к
одинаковому пределу 5Г. Это доказывает теорему, но значительно менее
просто, чем в тексте.
2.6] ДРУГИЕ ДОКАЗАТЕЛЬСТВА ТЕОРЕМЫ О СРЕДНИХ 33
должны быть равны, так как в противном случае мы могли бы
заменить их указанным образом другой системой, для которой
© было бы больше. Отсюда следует, что максимум © равен 51
и достигается только тогда, когда все а равны между собой.
Для доказательства существования (я*) положим
Ф(аи а2, ..., an_t) = ata2 ... an^t(n%—at — ... — an_t).
Тогда Ф непрерывна в замкнутой области
0i>O, ..., an-!>0, аг-\-а2-\-... + а?1_1<я5(
и, следовательно, достигает своего максимального значения для
некоторой системы (а*) в этой области.
Читателю рекомендуется провести доказательство, в котором
© сохраняется постоянным, а а1 и а2 заменяются на Уаха2.
(ii) Доказательству Коши можно придать вид, в котором выявляется
одно обстоятельство, важное с точки зрения логики.
Обыкновенное доказательство методом индукции ведется от п
к /i + l; справедливость некоторого предложения Р{п) следует из
предпосылок:
(a) Р(п) влечет Я(л + 1),
(b) Р(п) справедливо для п = 1.
Существует и другой метод доказательства, который может быть
наззан методом „обратной индукции"; справедливость Р{п) следует из:
(а') Р(п) влечет Р{п— 1),
(Ь'; Р(п) справедливо для бесконечного числа значений п.
Доказательство Коши может быть представлено, как
доказательство этого последнего типа. Во-первых, Коши доказывает (Ъг) для
п = 2т. Дальше, если теорема доказана для п и если % — среднее
арифметическое от аь а2, ..., an~lt то применение теоремы к п
числам аь #2> •••» tfn-i» 51 дает:
т = («,+ ...+о>_1 + «у > ^ # ап_х%
т.е. результат для п—1.
(ii)1) Определив а1 и а2, как в (i), мы можем заменить ах и
а2 через 21 и #i+tf2 — 51. Тогда 51 опять остается без
изменений и
51 (А + я2 — 51) — д^а = (21 — a.) (a2 — 51) > О,
2) Об этих доказательствах см. Sturm [1, 3], Crawford [1], Briggs and
Bryan [1, 1*5], Muirhead [3], Hardy [1, 32].
34
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
[ГЛ. II
так что © возрастает. Повторяя это рассуждение, мы
приходим, не более, чем через п—1 шаг, к системе я, каждое из
которых равно 51. Отсюда следует, что ©<ЭД.
Это доказательство несколько сложнее, но совершенно
элементарно. Аналогичное доказательство, в котором ах и а2
заменяются © и axa2/&t мы предоставляем провести читателю.
(iv) Существует целый ряд индуктивных доказательств теоремы:
см., например, Chrystal [1, 46J, Muirhead [3]. Одно из простейших
ведется следующим образом1). Предположим, что 0 < ах ■< я2 <*♦. .<#„,
ai < ап и что 2(v и ®v относятся к первым v числам а, и пусть уже
доказано, что 2ln_i>@w_i. Тогда, по теореме 1, an>2In-i и
% = {п—\)%п^ + ап _ ^ ап— %п_х
п п п х п
Возводя это равенство в п-ю степень и вспоминая, что л>1, мы
получаем
(v) Другое интересное доказательство было недавно дано Стефен-
сонэм [Sieffensen, 1, 2]. Оно исходит из следующей леммы: если av_i-<
< av, £v_x < by и ан < bH для всех v, то Ца £6 не убывает при
перемене местами а$ и Ь$ и возрастает, кроме тех случаев, когда
а$ = bj или av = bH для \>=£/. Эга лемма сразу следует из тождества
{£* + (*<-«<)> {£* + («< — *<)} =
= 2а sft + ^ — o,) {(Е*-*,)—(Ел-а,)}.
Чтобы вывести отсюда теорему о средних, представим ее в виде
(ах + аг + ... + аг) ... (ап + ап + ... + яп) <
< (ах + а2 + ... + ап). .. (ах + а2 + ... + ап).
Не уменьшая общности, мы можем предположить, что а!<я2<. • -Кап-
Если мы поменяем местами п — 1 слагаемое из первого множителя
в левой части с одним из слагаемых в каждом из остальных
множителей, то получим
(«1 + #2 + аъ + • • • + ап) (я1+я2+Я2+-. .+а2) • • • (at+an+an+... +ап)%
что по лемме больше, чем исходное выражение, если не все а равны.
Теорема выводится повторением этого рассуждения.
г) Другое доказательство, данное Р* Радо (R. Rado), приведено
в конце настоящей главы (теорема 60).
2.7]
НЕРАВЕНСТВО ГЕЛЬДЕРА И ЕГО ОБОБЩЕНИЯ
35
(vi) Дальнейшие доказательства теоремы 9 (или ее частных случаев,
рассмотренных в этом параграфе) даны в § 2.14, 2.21, 3.11 и 4.2.
2.7. Неравенство Гельдера и его обобщения. Следующая
группа теорем концентрируется вокруг теоремы 11 (неравенство
Гельдера)1).
10. Пусть (а), (#),...,(/) — т последовательность по п
чисел каждая. Тогда
(2.7.1) ®(а) + ®(й)+... +©(/)<©(я + £+ ...+/)>
кроме тех случаев. Когда либо (1) каждые две из
последовательностей (а), (Ь), .. ., (/) пропорциональны, либо (2)
существует такое v, что а^=Ь^= ... = /v = 0.
Теорема утверждает, что если £а=1, то
aqy* ...aqn+ bHf ...bqn-\ + lq4f ... lqn <
<(a1 + ft1+ ... +/1)^(«2+^2+---+/2^2--- (*n+*ii + ••• +/rc)(7n,
кроме тех случаев, когда каждые два столбца в таблице
аи Ь19 ..., /х
а2> #2> • • •» <2
пропорциональны, или одна из строк состоит только из нулей.
Необходимым и достаточным условием того, что все столбцы
пропорциональны (т. е. чтобы каждая пара столбцов была
пропорциональна), является система равенств: ajb^ — av#^=0,
а^с„ — а^с^ = 0, ..., для любых jx и v. Это же условие
необходимо и' достаточно для пропорциональности всех строк.
Учитывая это, поменяем местами строки и столбцы нашей
таблицы, и будем писать а, р, . .., к вместо qiy q2, • •., qn*
Тогда нетрудно видеть, что теорема 10 эквивалентна теореме
*) Строго говоря, неравенство Гельдера — это теорема 14, или
(2.8.3) теоремы 13. Неравенство (2.7.1) было сформулировано в явном
виде Минковским [Minkowski, 1, 117] в случае двух
последовательностей и равных весов.
36
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
[ГЛ. II
11. Если а, р, ... X положительны и а-\-$-\- . . . -\-\=1,
то
(2.7.2) 2 a'tf •. . Р< (S л)а (S &/.. . G0\
кроме тех случаев, когда либо (1) последовательности
(a), (ft), . . ., (/) #се пропорциональны, либо (2) хотя бы одна
из последовательностей нулевая.
Условия равенства могут быть выражены и так: одна из
последовательностей пропорциональна всем остальным (причем
нулевая последовательность считается пропорциональной всем
другим последовательностям). Случай, когда одна из
последовательностей нулевая, тривиален, и мы можем исключить его
при доказательстве.
И здесь мы даем два доказательства.
(i) По теореме 7,
(Sflft)2<£a2£ft9,
кроме того случая, когда (а) и (ft) пропорциональны. Отсюда
(2 abed)* < (2a2ft2)2 (2 c2d2)2 < 2 a* 2ft4 2^4 2d4,
причем, если (а), (ft), (с), (#*) не все пропорциональны1), то по
крайней мере в одном случае будет иметь место знак строгого
неравенства. Повторяя это рассуждение, мы находим, что
(2.7.3) (2 ab ... lfm < £а277 2 ft2"* .. . YPm
для 2т последовательностей (a), (ft), ..., если только они не
все пропорциональны. Это эквивалентно (2.7.2), если в нем
каждый показатель равен 2~w.
Пусть теперь М—любое натуральное число, меньшее,
чем 2W, и (g)— М-я последовательность. Если (aft . . . g) —
ненулевая последовательность, положим
А2т= ам,. . ., G2m = gM (M последовательностей),
н*п = к2т = tt=L2m=abtg (2» — Ж
последовательностей),
так что AB ...L = ab...g, и применим (2.7.3) к А,
В, . . ., L. Тогда мы получим
(Е аЬ ■ ■ ■ g)»n < Ъам ... ZgM (S ab .. . g)*m-M,
ИЛИ
(2.7.4) (2 ab .. . g)M < 2 a*2 bM .. . 2£M,
*•) Так как нулевая последовательность исключена из рассмотрения,
то пропорциональность — теперь свойство транзитивное: см. § 2.1.
2.7]
НЕРАВЕНСТВО ГЕЛЬДЕРА И ЕГО ОБОБЩЕНИЯ
37
если не все последовательности (А), (£), . .., (Z,), а, значит,
и не все последовательности (я), (#), . . ., (^) пропорциональны.
Неравенство эквивалентно (2.7.2), в котором каждый показатель
равен \\М. Мы предположили, что (аЪ ... g)— не нулевая
последовательность; в противном случае (2.7.4) очевидно, так
как ни одна из последовательностей (а), (#), ..., (g) — не нулевая.
Если теперь а, [3, ... рациональны, мы можем выбрать их
так, что
где а', р', . . .—целые числа и 2<х' = Л/. Применяя (2.7.4)
к Ж последовательностям, образованным из а' одинаковых а,
Р' одинаковых # и т. д., мы получим (2.7.2) с показателями
*, Р, ....
Наконец, если a, (J, ... не все рациональны, мы заменяем их
рациональными приближениями с суммой, равной единице,
образуем (2.7.2) для этих рациональных показателей и переходим
к пределу. При переходе к пределу знак „<а вырождается
в „^а и, как в § 2.5(i), мы сперва не получаем полного
доказательства. Мы можем закончить доказательство следующим
образом. Положим, а = <хх -\- а2, [3 = (^ -|- (32, . . ., где все числа
положительны и числа с индексом 1 рациональны. Если тогда
Sa1 = o1, £а2=а2, так что ах + о2 = 1 и /?Ji = яК1№ . . ., р£ =
= а*Ф$* ..., мы имеем
£ fl«tf ... Iх = S pfy? < (S л)'1 (2 р*)\
Так как «j, j^, . .. рациональны, то
еа=е<^ .../*< (е*У*...(ео*;
для £/?2 мы получаем аналогичное неравенство, но только со
знаком „<!*. Сочетая эти результаты, мы получаем (2.7.2).
(и) Мы можем вывести теорему 11 из теоремы 9.
Действительно, так как ни одна последовательность не нулевая,
имеем
S а*$ ...Iх v / а V/ Ь у / t У s
(2a)e(S^.-(E0x Не«Де*У ' ' ' U/V ~^
38
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
[ГЛ. II
Знак равенства имеет место только, когда
ач1Ъа = Ь&Ь=... =Ш1 (v=l, 2, ..., л),
т» е. когда (я), (#), ..., (/) пропорциональны.
Заметим, что независимо от того, являются ли <х, р, ...
рациональными или нет, это доказательство не содержит никаких
предельных переходов, кроме уже встречавшихся в
доказательстве теоремы 9. Принцип этого доказательства тот же, что
и следующего ниже доказательства теоремы 13, данного
независимо друг от друга Фрэнсисом и Литтльвудом *) [Francis and
Littlewood, 1] и Ф. Риссом [F. Riesz, 6].
2.8. Неравенство Гельдера и его обобщения (продолжение).
Если мы предположим, что гфО, и заменим в теореме 11
а,Ь, ..., / через qa^*, qbr®} ..., qlr*K9 то получим теорему
12. Вели г, а, (3, ..., к положительны и а-|- p-f- ... -|-
+ Х = 1, то
Жг (а* ... О < 2Кг/а (а) Шт ф)... ддгД (/),
кроме тех случаев, когда (а1/а), (ЬЛ®)9 ..., (/1/х)
пропорциональны, или один из множителей правой части равен нулю.
Для г<0 имеет место обратное неравенство.
Следует отметить, что когда г>0, то второй исключенный
случай встречается только если одна из последовательностей
(а), (#), ... нулевая, тогда как при г < 0 он наступает уже,
если в одной из последовательностей содержится нулевой член.
Когда г = 0, то всегда имеет место знак равенства.
При рассмотрении только двух последовательностей мы часто
будем пользоваться обозначением
(2.8.1) k'=JT^T>
где k — любое действительное число, отличное от единицы.
Соотношение (2.8.1) может быть также записано в следующих
симметричных формах:
(2.8.2) (ft_i) (*'-l) = l, 4"+-F=1
») См. Hardy [81.
2.8]
НЕРАВЕНСТВО ГЕЛЬДЕРА И ЕГО ОБОБЩЕНИЯ
39
(последняя форма теряет смысл, когда k = 0, k'=0). Мы
называем k и kr сопряженными показателями.
13. Пусть кфО, k Ф 1 и kf сопряжено с k. Тогда
(2.8.3) Se»<(Se*)1/*(E^)1/*r (*>1),
кроме того случая, когда (ак) и (Ьк*) пропорциональны; и
(2.8.4) ЪаЬХ^а*)11*^)11*' (k < 1),
кроме тех случаев, когда (ак) и (Ьк') пропорциональны или
{ab) —нулевая последовательность.
Неравенство Кош и (теорема 7) является частным случаем
теоремы 13 при k = k'=2\ здесь k сопряжено с самим собой.
(О Предположим, что £>1; тогда (2.8.3) является частным
случаем теоремы 11 для двух последовательностей и а = 1/&,
Р=1/А\ Этот случай представляет собой обычную форму
неравенства Гельдера1).
(и) Предположим теперь, что 0 < k < 1, так что k' < 0.
Если одно из Ь равно 0, то второй множитель правой части
(2.8.4) должен быть, как в § 2.1, интерпретирован как 0, так
что (2.8.4) справедливо, если (ab)— не нулевая
последовательность. Если же каждое b положительно, то определим /, и, v
с помощью равенств
так что
/>1, k' = — klr,
и
и = (аЬ)к, v = b~k,
так что
ab = ul, ak = uv, bh' = v1'.
Тогда (2.8.4) сведется к (2.8.3) с и, v, l вместо a, b, k.
Исключенным случаем является тот, в котором (и1) и (vl), т. е.
(ab) и {bv) пропорциональны; но если это так, то (так как
теперь все b положительны) последовательности (а) и (^&/""1),
а значит, и последовательности (ак) и (Ьк'), пропорциональны,
(iii) Если k < 0, то 0 < k1 < 1, и этот случай сводится к (и),
если поменять местами а и b, k и k1 \ оба случая (и) и (iii)
содержатся в (2.8,4).
*) Holder [1]. Гельдер формулирует теорему в менее симметричной
форме, данной несколько раньше Роджерсом [Rogers, 1].
40
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
[ГЛ. II
Неравенства остаются в силе в исключенных случаях k = 0t
k = l, если мы надлежащим образом осмыслим входящие
в них выражения. Если k = 0, k' =0, то под (2.8.4) мы
должны понимать неравенство
аА + ЧК~\- • • • + апЬп >п(ах... onb^.. . bn)Vn.
Если k = 1, мы можем интерпретировать k' как + со или
— оо. В первом случае мы должны понимать под (2.8.3)
£я#<тах#2а, а во втором: £tf£>min b%a. Мы
предоставляем читателю нахождение случаев равенства.
Мы можем объединить (2.8.3) и (2.8.4) в одно неравенство
(2.8.5) (Ъ<*Ь)кк' <(Ъа*)к\ЪЬк')* (кфО, кф\).
Ввиду чрезвычайной важности неравенства Гельдера, мы
отклоняемся здесь от нашего обычного правила и в явном виде
формулируем вытекающую из него теорему для комплексных а, Ь.
14. Если k > 1 и kf сопряжено с &, то
ISfl*I<(SlflI*)v*(EIftr)1/fcr.
Равенство имеет место в том и только в том случае^ когда
( | av \к) и (| £v \к') пропорциональны и arg av£v не зависит от v.
Единственным дополнительным замечанием, необходимым для
доказательства, является то, что
\ЪаЬ\<Ъ\аЬ\,
кроме того случая, когда arg я,Д не зависит от v. Мы
рассматриваем 0 как число, имеющее любой аргумент.
Следующий вариант первой части теоремы 13 называют
иногда „обратным неравенством Гельдера".
15. Предположим, что А>1, k' сопряжено с k и Б> 0.
Тогда необходимым и достаточным условием для того, чтобы
%ак^А, является £ аЬ <; А1/кВ1/к' для всех Ь, для которых
Из (2.8.3) вытекает необходимость этого условия. Если же
Еа&>Л, то мы можем выбрать Ь так, что %Ьк, = В и {Ьк')
пропорционально (ак), и тогда
2 аЬ = (2 аУк (Е^)17*' > Ах/кВ1/к'.
Следовательно, это условие также и достаточно.
Теорема 15 часто бывает полезной при определении верхней
грани 2 ак. Каждое рассуждение, опирающееся на эту теорему,
может быть изменено так, чтобы оно содержало только одну
2.9]
ОБЩИЕ СВОЙСТВА СРЕДНИХ
41
специальную последовательность (Ь), но приведенная здесь
форма теоремы, где последовательность (Ь) не фиксирована,
иногда более удобна1).
2.9. Общие свойства средних Шг(а). Мы можем теперь
доказать теорему, которая завершает и дополняет некоторые
из теорем §§ 2.3—4.
162>. Если r< s, то
(2.9.1) Шг(а)<Ш8(а),
кроме тех случаев, когда все а равны или s^Oa хотя бы
одно а равно нулю.
Мы уже доказали это в частных случаях (i) г = — оо
(теорема 5), (и) 5=+оо (теорема б), (Ш) г=0, s=l
(теорема 9), (iv) s = 2r (теорема 6).
Предположим сначала, что 0<r<s и положим г = $а,
так что 0< а < 1, и pas = ut p = v, так что v > 0 и pas« =
= (/?as)a pl~« = u*vx-«.
Тогда, по теореме 11,
(2.9.2) Еав'01-«<(2а)*(ЕгО,-в,
кроме того случая, когда av/t/v не зависит от v, т. е. когда ач
не зависит от v. Следовательно,
vrr) <\-yf) •
а это и есть (2.9.1).
Случаи, в которых г ^ 0 и одно а равно нулю, тривиальны,
и мы можем исключить их из рассмотрения. Если все а
положительны и г = 00, мы имеем, по теореме 9 и (2.2.7),
{дЯ0(а)? = {©« = «(«■)< «(a-) = {5Re(a)}#.
Два оставшихся случая, г < s < О и r<s = 0, сводятся, в силу
(2.2.9), к разобранным выше.
17 8). Если О < г < s < *, то
(2.9.3) 2RS < (Э#)^(К*)'""Г ,
!) См. §§ 69 (стр. 172) и 6.13 (стр. 180).
2) SchlOmiich [11. См. также Reynaud and Duharael [1,155] и Chrystal
П,48].
3) Liapounoff [1, 2J.
42
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
[ГЛ. II
кроме того случая, когда все отличные от нуля а равны
между собой»
Мы ограничиваемся положительными значениями параметров,
так как осложнения, вызываемые отрицательными и нулевыми
значениями, вряд ли заслуживают систематического рассмотрения.
Мы можем положить
s = ra-\-t(l— а) (0 <<х < I).
Неравенство (2.9.3) принимает тогда вид
Zqa'KiSqay&qaty-*,
и подстановкой u = qar, v = qaf сводится к частному случаю
теоремы 11. Условием равенства является пропорциональность {и)
и (v), что, очевидно, эквивалентно данной формулировке. Читатель
должен отметить разницу в условиях равенства в теоремах 16 и 17.
Ниже (§ 3.6, теорема 87) мы увидим, что теорема 17 может
быть сформулирована в более сжатой и компактной форме.
2.10. Суммы ®r(a). (i) Мы пишем
®r=@r(a) = (Ea')1/r (r>0).
Мы ограничиваемся положительными г, оставляя построение
теории <£)г для г<^0 как упражнение для читателя,
18. Если 0<r<s</, то
t—s s—r
(2.10.1) ®1<{Ф*-Г{&Ь*~\
кроме того случая, когда все отличные от нуля а равны
между собой.
Это в сущности теорема 17. В самом деле,
(2.10.2) ег(а) = п1/гШг(а),
где среднее 9Jfr(a) образовано с единичными весами, и (2.10.1)
сводится к (2.9.3), так как степени п сокращаются.
Соответствие между теоремами 17 и 18 объясняется тем,
что (2.9.3) и (2.10.1) однородны относительно знака Е. Имеет
место также теорема 19 для сумм, соответствующая теореме 16,
нос обращенным знаком неравенства. Неравенство (2.10.3)
теоремы 19 не однородно относительно Е и не соответствует (2.9.1),
как (2Л0.1) соответствует (2.9.3).
2.10]
СУММЫ ©r(tf)
43
19 О. Если 0<г<5, то
(2Л0.3) ®e(*)<©r(e).
за исключением того случая, когда все а, кроме одного
равны нулю.
В силу однородности неравенства (2.10.3) относительно а мы
можем предположить, что £ аг = 1, т. е. @г = 1 2). Тогда а, <; 1 для
каждого v и, следовательно, а* <^ я* и
£а*<£аг = 1.
Если более одного а положительно, то, по крайней мере, одно
положительное я<1, и тогда имеет место знак неравенства.
Теорему 19 обычно называют неравенством Иенсена (Jensen),
(if) Приведем теперь две теоремы для ©r(a), соответствующие
теоремам 4 и 3 для ffir(a).
20. При г -> оо ®r -> max a.
21. При г -> 0 <ВГ -> оо, гели более одного а отличны от нуля.
Теорема 20 следует из (2.10.2) и теоремы 4% Для
доказательства теоремы 21 мы должны только заметить, что £#г =
=/V+o(l), где N—число положительных а.
(Ш) Теорема 19 в сочетании с теоремой 11 дает следующую
теорему Иенсена3).
22. Если а, (3, ..., X положительны и а-\- р + .. . + Х> 1, wo
Sa**P ••• /x<(Ee)e(S*)p...lE0x,
за исключением тех случаев, когда каждое число одной по~
следователъности, или все числа, кроме одного, в каждой
последовательности равны нулю и, в последнем случае, поло*
жительные члены всех последовательностей имеют один
и тот же номер.
Положим а = £а', В = k$', ..., где k > 1 и а' -|- fT -|- . ..= 1,
и введем обозначения ак=А, Ьк = В, ... . Тогда из теорем
11 и 19 следует, что
£ а*№ . .. Л = £ 4*'ВР' ... Lx' < (Е Л)й' (S Я)3'- • • (S £)х/=
= (S ^)а/* • • • (S /*/*< (Е а)*... (£ /)\
г) Pringsheim fl]. Jensen [2]. Прингсгейм приписывает свое
доказательство Люроту (Luroth).
2) Ср. с замечаниями к этому доказательству в § 1.4.
3) Jensen [2J.
44
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
[ГЛ. II
причем равенство имеет место в том и только в том случае,
когда одновременно удовлетворены условия равенства в
теоремах 11 и 19.
(iv) Естественно рассматривать взвешенные суммы
%г = %г(а) = %г (а,р) = ftparf*.
Ясно, что для таких сумм не может существовать никакой
универсальной зависимости типа (2.9. 1) или (2. 10. 3), так как при /?v = 1
%г совпадает с (&г теоремы 19, а при £pv = 1 — с Шг. Возможности
в этом направлении определены следующей теоремой.
23. Необходимым и достаточным условием для того, чтобы
(2.10.4) %г<%8 (0<r<s)
для данных весов р и всех а, является Ер<!1. Равенство в (2.10.4)
имеет место в тех и полько тех случаях, когда последователь*
носггь (а) нулевая, или когда JJ/? = 1 и все а равны.
Необходимым и достаточным условием для того, чтобы
(2.10.5) г,<Жг (0<r<s)
для данных весов р и всех а, является р., > 1 для каждого v.
Равенство в (2.10.5) имеет место в тех и только тех случаях,
когда последовательность (а) нулевая, или #&>0, р^ = I и все
остальные а равны нулю*
(i) Пусть ач= 1 для каждого v; тогда SEr = (E/j)1/r, и (2.10.4)
может иметь место только в том случае, когда £/?<1. Если это
условие удовлетворено и r= so., так что 0<<х<1, то мы имеем
Ъраг = Пр*9)*рх~* < (Zpa8)a(Sp)1~a<(S pa8 )a,
что представляет собой (2.10. 4). Указанные условия равенства опять
очевидны.
(и) Пусть ак = 1, а все остальные а равны нулю. В этом случае
%г = рк1/г и (2.10.5) может иметь место только в том случае, когдарь>\*
Предполагая это условие выполненным, положим s = рг, так что (з>1,
и допустим (мы имеем право сделать это в силу однородности 5£),
что %раг = 1. Тогда раг < 1 для каждого v и
Ър* = Я(раг)У-*<Я(раг)*<Ъраг;
мы получили неравенство (2.10.5). Указанные условия равенства снова
очевидны.
2.11. Неравенство Минковского. Следующая теорема является
обобщением теоремы 10.
24. Допустим, что г конечно и не равно 1. Тогда
(2.11.1)
SWr(a) + SWr(ft)+ ... +5Кг(/)> аМ« + »+ •••+/) (г>1),
2.11]
ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ МЮРХЕДА
45
(2.11.2)
swr(a) + a»,(ft)+...+aRr(o<sWr(«+*+...+/) (/-<i),
кроме тех случаев, когда (а), (£), ... (/j пропорциональны,
или г^Ои
а^ = Ь^= • • • = /v = 0
для некоторого v.
Если г = 1, то равенство имеет место для любых а, Ь, ... .
Теорема 10 является частным случаем г = 0 теоремы 24.
Для г=оо или г=—оо основной результат остается
справедливым (и становится тривиальным); только условия равенства
требуют в этих случаях иной формулировки, которую мы
оставляем читателю.
Возьмем средние с весами q и положим
а-\-Ь-\- ... +l = s% Wlr(s) = S.
Тогда
Sr = £ qsr = £ qasr"x + S qbsr~x + ... + S ?//"'=
= E tf"«) (^rl + ... + S (<7V7) (^Г К
Предположим сначала, что г > 1. Применяя (2.8.3) теоремы 13
к каждой сумме в правой части, получим
(2.11.3) Sr<(Stf«r),/*"G!g/),/''+... =Sr-l{&qar)Vr+...).
Равенство имеет место только когда все (qar), (qbr), ...
пропорциональны (qsr), т. е. когда (а), (£), ...
пропорциональны. Так как 5 положительно (за исключением тривиального
случая, когда все последовательности нулевые), то из (2.11.3)
следует (2.11.1) ^.
Предположим далее, что 0<г<1. Если не все
последовательности (а), (&), ... нулевые, то ^ > 0 для некоторого v.
Если sv = 0 для некоторого частного значения v, то ан=Ьн= ... =
=/v = 0, и мы можем исключить это значение v из рассмотрения.
Поэтому можно считать, что все sv > 0. При этом
предположении (2.8.4) теоремы 13 дает (2.11.3) с обратным знаком
неравенства, и доказательство может быть закончено так же,
как выше.
Предположим, наконец, что г < 0. Если какое-либо sv равно
нулю, то все средние равны нулю. Мы можем поэтому предпо-
*) Это доказательство дано Ф. Риссом [F. RIesz, 1, 45].
46
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
[ГЛ. II
дожить, что s^ > О для каждого v. Если какое-либо #v равно
нулю, то 9Jir(a) = 0, и мы можем опустить букву а [мы применяем
здесь (2.2.15)]. Вследствие этого мы вправе предполагать, что
каждое а, Ь, ... положительно, а тогда наша теорема следует
из (2.8.4) теоремы 13.
Когда все q равны между собой, мы получаем теорему
25. Если г конечно и не равно «а 0, ни 1, то
(2.11.4)
|Е(а+Н...+//)1/Ч(ЕаГ+... + (Е/Г (г>1),
(2.11.5)
{S(a + ^+...+//}^>(SaV/r+...+(S/r)1/r (г<1),
кроме тех случаев, когда (а), (Ь), ..., (/) пропорциональны,
или г< 0 и ан, Ьн, ..., /v равны нулю для некоторого v.
Неравенство (2.11.4) обычно называют неравенством Минко-
вского1). Теорема 24 только кажется более общей, чем теорема
25; на самом же деле она может быть выведена из теоремы 25
заменой а, Ь,... на p1/ra, p!rb,....
Теорема 24 может быть сформулирована в следующей очень
изящной и симметричной форме 2).
26. Пусть Ш^У обозначает среднее, взятое по индексу \i
с весами р^, и 9ft(v) — среднее, взятое по индексу v с весами tfv8),
и пусть 0 < г < 5 < оо. Тогда
кроме того случая, когда а^ = b^cr
Результат остается справедливым для всех г, s, таких %
что г < 5, за исключением случаев равенства.
Мы докажем эту теорему для 0 < г < s < оо, оставляя
другие случаи читателю. Если г ^ 0 или одно из г и
*) Minkowski [1,115—117].
2) Теорема 26 была сообщена нам в 1929 г. А. Ингамом (А. Е.
Ingham). Эта же формулировка неравенства Минковского была
независимо найдена Иессеном и опубликована им [Jessen, 1J Эта и
позднейшие его работы [2] и [3] содержат много интересных
обобщений: см. теоремы 136 и 137.
3) Мы отклоняемся здесь от принятого нами обозначения и не пред^
полагаем, что Е<? = 1 (хотя мы докажем неравенство, преобразуя его
в такое, в котором мы можем предположить, что 2 q = 1).
2.12]
АНАЛОГ НЕРАВЕНСТВА МИНКОВСКОГО
47
5 бесконечно, то равенство имеет место в целом ряде
дополнительных случаев.
Пусть $jr=k> 1 и р^а^ = А^- Тогда искомое неравенство
принимает вид
[ п т ) 1/8 ( т п )1/г
\ X ЧЛЪР^)8/Г\ <{ SpAZwUФ\
( V=sl р.=1 J ( Ц-1 ' V=l J
или
f w m ) 1/fc m n . ,
i S^(S^v) <£ (S ?Л\Г.
Это неравенство однородно относительно q, и поэтому мы
можем предположить, что 2 # = 1; а тогда оно сводится
к (2.11.1).
2.12. Аналог неравенства Минковского, Следующая теорема
аналогична теореме 25, но более проста.
27. Если г положительно и не равно 1, то
(2.12.1) S(a+6 + ... + /X>S^+S^+...+ S/r (г>1)|
(2.12.2) E(a+& + ... + /)'<E«r+E»r+...+ S/r (0<г<1),
за исключением того случая, когда в каждой из последовав
тельностей av, &v, .. ., /v (v = 1, 2, . . ., n) все числа, кроме
одного, равны нулю.
Это сразу следует из теоремы 19, так как, например,
(а+* + ... + /)'>а'+&' + ... + /г,
если г>1, за исключением того случая, когда все числа й,
Ь, .. . /, кроме одного, равны нулю. Заметим, что знаки
неравенства в (2.12.1) и (2.12.2) изменены на обратные по
сравнению с (2.11.4) и (2.11.5).
На практике обычно применяется сочетание неравенств
(2.11.4) и (2.12.2), а именно, следующая теорема
28. Если г > О, то
{S(a+ft + ... + /)r}B<(SaOB + (S*r>B+...+(S/r)B,
где R=\ для 0<г<1 и R = ljr для г>1.
48
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
[ГЛ. II
2.13. Иллюстрации и приложения основных неравенств.
(i) Геометрическая интерпретация неравенств Гельдера и
Минковского. Особенно простыми случаями неравенств
Гельдера и Минковского являются следующие неравенства:
и
(2.13.2) {{х, + x,f + (Л + Л)а + (*i + ^)2)% <
- / 2 ■ 2 | 2ЧУ« | / 2 | 2 | 2ЧУ»
<(^1+^1 + ^1) +(^2 + ^2+^2) •
Эти неравенства имеют место для всех действительных
значений переменных и выражают, соответственно, что абсолютное
значение косинуса действительного угла меньше 1 и что
сумма длин двух сторон треугольника больше длины третьей
стороны; (2.13.1) обращается в равенство, когда векторы
0*1» У и zi) и (*2> У& гъ) параллельны (и имеют одинаковое
или противоположное направление), а (2.13.2) — когда эти
векторы параллельны и одинаково направлены.
Обычная форма неравенства Минковского является
обобщением (2.13.2) на пространство п измерений с обобщенным
определением расстояния, а именно,
ЛР9 = (|*1-*а|' + |.у1-.уа|'+...),л' (г>1).
Наиболее очевидные обобщения (2.13.1) связаны не с
неравенством Гельдера для общих г, а с обобщением случая г = 2
в другом направлении.
29. Если Е я^рЛ» з<?£ а^ = а^ есть положительная
квадратичная форма (с действительными, но не обязательно
положительными, коэффициентами), то
(2 Wv)2 < £ a^x, S <VJV^>
кроме того случая, когда {х) и (у) пропорциональны.
Это непосредственно следует из положительности
2 ар (Ц.+ X'JV) (**v + Vyjl
см. второе доказательство теоремы 7. Геометрически теорема 29
является обобщением (2.13.1) на пространство п измерений
с косоугольной системой координат.
2.13]
ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ МЮРХЕДА
49
Для иллюстрации теоремы 15 возьмем & = 2, Л = /2, В = \
и прямоугольную систему координат. Тогда теорема
утверждает, что если длина проекции вектора на любое
направление не превосходит /, то длина самого вектора тоже не
превосходит /.
(И) Одна теорема Адамара1). В нашей следующей теореме
мы также имеем
предполагаются
тельными.
30. Пусть D
Тогда
дело с совокупностью чисел я^,
действительными, но не обязательно
— определитель с элементами
которые
положи-
(2.13.3)
a>v^> v = 1» 2>'"> п>'
£>2<S<&2a2x ... Ея£
Равенство имеет место только в том случае, когда
(2.13.4)
^1 + я^2+ ... -\-а
un^vn "
бы
для каждой пары различных ц, v, или когда хотя
один множитель в правой части (2.13.3) равен нулю.
Геометрический смысл этой теоремы заключается в том, что
объем параллелепипеда в пространстве п измерений не
превышает произведения длин его ребер, исходящих из одной
вершины, и что равенство имеет место, когда эти ребра
взаимно перпендикулярны, или когда длина одного ребра равна
нулю.
Предположим, что liC^x^x^ где с^ = сч^
положительная квадратичная форма и что А обозначает определитель
с элементами £av. Тогда уравнение
(2.13.5)
,—X
'12
L21 с22"
= 0
имеет п положительных корней2), сумма которых равна %с
Н"
х) Hadamard [1]. Адамар рассматривает определители с
комплексными элементами. Теорема 30 была найдена раньше Кельвином
(Kelvin) и доказана Мюиром [Muir, 1J.
2) См. Бохер [1,1711.
50
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
[ГЛ. II
а произведение которых равно Д. Следовательно, по
теореме 9,
(2.13.6) А < (С11+^+'"+^у .
Если с > 0 для всех {а, то форма
Zj / ^=Ху.Хч == 2j^\xvX\>.Xv
также положительна, и если мы применим (2.13.6) к этой
форме, то получим
(2.13.7) А<citCn ... ст.
Это, в основном, эквивалентно теореме Адамара. Ибо форма
S (#ix^l ~Г #2xX2 ~Г • • • Т" ^мх-^п) = S ^jxv^jjl^'v
положительна, если А Ф 0. Кроме того, А = Z)2 и
*>[* = Яц1+ Яц2+ • • • + йц.п>
так что (2.13.7) совпадает с (2.13.3).
Для равенства в (2.13.6) все корни (2.13.5) должны быть
равны, что возможно только в том случае, когда c„v = 0 для
jj. Ф v и с^ не зависит от jx. Следовательно, для равенства
в (2.13.7) мы должны иметь С^ = 0 для ja Ф v, С не зависит
от |а. Последнее условие заведомо выполнено, так как С^= 1,
а С^=0 следует из с^ = 0, что представляет собой (2.13.4).
Мы можем распространить теорему на определители с
комплексными элементами, используя вместо квадратичных форм
эрмитовы. Дальнейшие обобщения были даны Шуром [Schur, 2]1).
Следующее остроумное доказательство (2.13.7) было дана
Оппенгеймом [Oppenheim, 2]. Рассуждение Оппенгейма
доказывает не только (2.13.7), а, следовательно, и теорему Адамара,
но и приведенные дальше неравенства (2.13.8) и (2.13.9),
найденные соответственно Минковским и Фишером2).
Любые две положительные квадратичные формы Ъсгкхгхъ
Ъ dikxixk могут быть одновременно приведены одним линейным
преобразованием с определителем, равным 1, к суммам
квадратов3), скажем £cVey? и Edju где с^ и dH положительны.
!) См. также A. L. Dixon [1].
2) Minkowski [2], Fisher [l].
») См. Бохер [1,171].
2.13] ИЛЛЮСТРАЦИИ И ПРИЛОЖЕНИЯ ОСНОВНЫХ НЕРАВЕНСТВ 51
Тогда Efojc+^fc) xixk приведется к £(£v+dv)_yv, и определители
I ctk |> \dik Iй \cik H~ dik I этих форм удовлетворяют соотношениям
\cik\ = Hc„ \dik\=Ud„ |cifc + rf<fc|=II(cv+rfv).
Отсюда, по теореме 10, для последовательностей (£v), (д?у) мы
получаем
(2.13.8) \cik\x'n +|rf„r <|c« + rf«r.
Предположим теперь, что матрица d образована из матрицы с
умножением сначала первых г ее строк, а затем первых г
столбцов на —1 *). Если мы теперь разделим (2.13.8) на 2 и
возведем в п-ю степень, то получим
(2.13.9) \cik\ = \cn ... спп\*С\сп ... crr\\cr+ltr+1 ... спп\9
где \сп ... сгг\ и \cr+1>r+i ... спп\—определители,
остающиеся в рез)льтате отбрасывания в \cik\ соответственно
последних п — г и первых г строк и столбцов. Повторяя это
рассуждение, т. е. заменяя каждый множитель в правой части
(2.13.9) произведением двух множителей и т. д., мы придем
к (2.13.7).
(iii) Модуль матрицы. Пусть А и В — две матрицы,
элементы которых суть а^ и Ь^н\ они могут быть
комплексными. Матрицы А-\-В и В А определяются как матрицы,
элементами которых являются
<h-n + b^ и Ь^аи + Ь^аъ +... + Ь^папн.
312). Если |Л|, модуль матрицы А, определен как
то
|Л + В|<|л| + |Я|, |ВЛ|<|В||Л|.
Первое неравенство является непосредственным следствием
теоремы 25 с г = 2. Второе следует из теоремы 7, так как
г) Таким образом, форма Ц dikXiXk получается из формы Е Чт^^ь
в результате замены xi9 xk (/, k = 1, 2,..., г) на —Xi н—хк(и поэтому
положительна, если Ilcikxixk положительна).
2) См. Wedderburn [1].
52
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
[ГЛ. II
(iv) Максимумы и минимумы в элементарной геометрии. Мы
приведем (как упражнения для читателя) некоторые из
многочисленных приложений основных неравенств к задачам элементарной
геометрии.
32. Площадь треугольника данного периметра 2р имеет
наибольшее значение, когда его стороны a, bt с равны.
[Применить теорему 9 кр—а, р— b, p — с].
33. Если поверхность прямоугольного параллелепипеда дана,
то его объем имеет наибольшее значение\ когда
параллелепипед является кубом.
[Обозначить ребра, исходящие из одной вершины, через а, Ь, с и
применить теорему 9 к be, са, аЬ. Аналогичная теорема имеет место
для параллелепипеда в /2-мерном пространстве; если й<ли
поверхность ^-мерной границы задана, то объем будет наибольшим, когда
параллелепипед прямоугольный и его ребра равны. Это может быть
доказано с помощью теорем 9 и 30 и тождеств между определителями.]
34. Definition Si la Base d'une Pyramide est circonscripttble a un
Cercle; et si le Pie de la Hauteur est au Centre de ce Cercle: fap-
pele cette Pyramide droite.
Dans une Pyramide droite toutes les Faces ont une тёте Hauteur,
et sont e gat erne nt inclinees au Plan de la Base.
Theoreme. Solent deux Pyramides de тёте Hauteur, dont les
Bases sont egale tant en Surface qu'en Contour; que Г une soil droite
et que Vautre nelesoit pas: faffirme que la Surface de la premiere
Pyramide est plus petite que la Surface de la seconde*).
[Lhuilier, 1. 116]
[Пусть h — высота пирамиды, &v — сторона основания и /?v —
перпендикуляр к &v, опущенный из основания п. Тогда боковая
поверхность второй пирамиды равна
по (2.11.4) теоремы 25, если не все /?v равны.]
(v) Некоторые неравенства, полезные в элементарном анализе.
Следующие теоремы, которые являются простыми следствиями из
теоремы 9, играют основную роль в теории показательной и
логарифмической функций.
*) Определение. Если в основание пирамиды можно вписать
окружность, и если основанием высоты является ^центр этой
окружности, то я называю такую пирамиду прямой.
В прямой пирамиде все грани имеют одинаковую высоту и равно
наклонены к плоскости основания.
Теорема. Пусть даны, две пирамиды одинаковой высоты,
основания которых имеют как одинаковую плоищдь, так и
одинаковый периметр-, когда одна из них прямая, а другая нет, я
утверждаю, что поверхность первой пирамиды меньше
поверхности второй. (Прим, ред.)
2.14] ДОКАЗАТЕЛЬСТВО НЕРАВЕНСТВ МЕТОДОМ ИНДУКЦИИ 53
35. Если £>0, 0</гс<я, то
Если, кроме того, £ < /я, то
(■-1Г>('-4Г.
36. £слы £>0, £=£ U 0</я<л, /яо
«(е1^ —1)</и(е1/т—1).
Имеем, по теореме 9,
т п — т
\ /га/ ^ п \ т/ l n n
Если £</я, мы можем писать — £ вместо 6. Это доказывает
теорему 35. Теорема 36 следует из теоремы 35, если мы заменим £
/ £ \ т
в теореме 36 на ( 1 rt — J .
2.14. Доказательства основных неравенств методом
индукции. Нашими основными теоремами являются теоремы 9,
10 (или 11) и 24 (или 25), которые мы будем для краткости
обозначать соответственно через G, Я, М. Мы вывели И из G1)
и М из Я; G является предельным случаем Я, а И — частным
случаем или предварительной формой М.
Простейшим случаем О является теорема
37. (G0): a«£P<aa + *p (<* + Р = 1).
Покажем прежде всего, что G может быть выведено из G0
методом индукции.
Предположим, что G доказано для m букв а, Ь, ..., &
(или любого меньшего числа) и что
а+р+ ... +х + Л = 1, а + р+... +х = а.
Тогда
а«*Р . .. № = (аф.. . £X/V/X <V/J. • • Аж/в)о + Д<
<аа+.. . +£х + А
*) Хотя мы дали и прямое доказательство Н.
54
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
[ГЛ. II
по О для 2 и для т букв. В окончательном неравенстве
равенство имеет место только в том случае, когда
т. е. когда все буквы равны. Следовательно, О справедливо
для т-\-\ букв.
Простейшими случаями Я и М являются следующие:
38. (Я0): ^*? + 4*|<(а1+а2)а(^1 + ^ (* + Р = 1),
39. (Af0):
{(«1 + *1Г +(«2+ *2)Г}1/Г< («1+ 4)1/Г + (*Г+ blfr (Г> 1)
(с обратным знаком неравенства, когда г < 1). Мы можем
вывести Я0 из О0 и Ж0 из Я0, перенося на эти частные
случаи наши выводы Н из О и Af из Я. Мы можем также
вывести Н и М из Н0 и М0 методом индукции, но так как эти
индуктивные доказательства несущественны для наших
рассмотрений, то мы их только наметим.
(i) Имеем
< 0*1 + <*2+ *sWl + *2 + *3)Р-
Повторяя это рассуждение и выявляя случаи равенства, мы
получаем неравенство (2.8.3) теоремы 13 (Я для двух
последовательностей по п чисел каждая).
Далее, если a + |3-|-у = 1, a-|-[3 = a, то имеем
2 a«Ato = S (афЬ*,9)9л < (£ аф Ь*!*)\Ъ <0Т < (£ a)a(S *ЖЕ *)т.
Это рассуждение тоже может быть повторено и ведет
к общей форме теоремы Я.
Мы можем проводить индукцию и иначе, увеличивая сперва
число последовательностей. Получающееся промежуточное
обобщение Н0 (Я для любого числа последовательностей из двух
чисел) заслуживает отдельной формулировки.
40. Если а+р+... + Х=1, то
albl...l\+albi... l\ < {а, + a2)a(*i + hf ■ ■ • d + '*)\
2.15]
ЭЛЕМЕНТАРНЫЕ НЕРАВЕНСТВА
55
креме тех случаев, когда — = ~ = ... = j- или когда одна
из последовательностей — нулевая.
(и) Подобным образом и М0 можно обобщать в двух
направлениях. С одной стороны,
{(«l + *l + 'l)r + («2 + *2+ <-2)'f/r < («1 + <№ + { (*, + «,)'+
+ (*.+<2УГ < («Г+*D1/r+(ftT + ftS)1/'+ W+4)1/r,
а с другой—
{(«! + *,)-+ (в9+*ЯУ + 1вв+*в)г}1/Г< [{(al + a2r),/r +
+ (ft[+ftD1/4(a3+ft3)'-)l,/''<(«i+^+aI)1/'-+(ftI+ft2r + ft3)1/r.
Повторяя и сочетая эти рассуждения, мы приходим к общему
случаю.
2.15. Элементарные неравенства, связанные с теоремой 37.
Перепишем G0 в следующей форме
аа< {аа + й(1 — ос)} b*-1
или
а" — £* < вй'-^а — й) (0 < а < 1).
Это — частный случай системы неравенств, занимающих важное
место в учебниках анализа. Полная система установлена ниже
в теореме 41. Эта теорема настолько важна, что стоит дать
ее прямое доказательство, которое строго удовлетворяет
критериям § 1.7.
41. Если х и у положительны и не равны, то
(2.15.1) гхГ-\х — у)>хГ—уг>гу-\х—у)
(г< 0 или г> 1),
(2.15.2) гхГ-\х — у) < хг — уг < гу-^х—у) (О < г < 1).
Здесь, очевидно, имеет место равенство, если г = О, г = 1
или лс=#у. Начнем со сведения теоремы к одному из ее
случаев.
(i) Мы можем предположить, что г положительно. В самом
деле, допустим, что (2Л5.1) доказано для г>1 и что г<0,
56
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
[ГЛ. II
г = — s, так что 5 + 1 > 1. Тогда
ХГ _ уГ = X-S —y-S _ X-Sy -8-1£ув+1 _ XSy) =
= х-8у-8-1 {у8+г — х8*1 — xs(y —х)} >
> x-sy-s-lsxs(y — x)=ryr-l(x —у).
Подобным образом можно доказать и второе неравенство
в (2.15.1).
(И) Обозначим левое и правое неравенства в (2.15.1)
соответственно через (1а) и (lb) и введем аналогичные обозначения
для (2.15.2). Если мы поменяем местами хну, (lb) и (2Ь)
перейдут в (1а) и (2а). Поэтому достаточно доказать (lb) и (2Ь).
(Ш) Из соображений однородности мы можем предположить,
что у = 1.
Таким образом, мы свели доказательство теоремы 41 к
доказательству следующей теоремы.
42. Если х положительно и не равно 1, то
(2.15.3) хг — 1 >г(х— 1) (г> 1),
(2.15.4) хг — 1<г(х — 1) (0<г < 1).
Если в (2.15.3) положить г=х18 и х =yl'r =ys, то оно
переходит в (2.15.4) с у, s вместо х, г. Поэтому
достаточно доказать (2.15.3).
Если q—целое, большее 1 !) и ву>1, то
Если 0 <Zy < 1, то знак этого неравенства меняется на обратный.
Заменяя уя. на х> мы в обоих случаях получаем
(2.15.5) х-=± < q (х^ — 1)< х - 1.
Далее, мы имеем
У^±=± _ yjzil = -^\- (ay* -ya-i - у*-* -...-1) =
= jj=fjj (У*-1 + Су»-1 +^-2) + • • • +
+ ^«-1 + ^-8+...+!)}.
*) Здесь мы отказываемся от нашего обычного соглашения о
значениях q и р.
2.15]
ЭЛЕМЕНТАРНЫЕ НЕРАВЕНСТВА
57
Фигурные скобки заключают у<7(<7 + 1) членов, и все они ле-
2
жат между / и 1, так что
(2.15.6) |(у_1)»^?^=1_2£=l^^a(y_i)« (у>1).
Таким образом, если р — какое-нибудь целое число, большее
чем <7> то
(2.15.7) i-(p_,)(^-l)2<^_zi_3lzii<
^T^-^^Cv-i)2 o>i).
Из (2.15.5) следует теперь, что
х* '
^l<q^x^-lf<{x-l)\
если х>1, в то время как для 0<#< 1 неравенства
заменяются на обратные. Следовательно, заменяя уй через х в (2.15.7),
мы получаем
Г2 15 81 Р-Ч (*-W^*p,q-l (х п<
gE=lj*ix-ir (x>l).
Пусть теперь г>1. Если г рационально, то мы
положим r=vlq\ если г иррационально, то пусть v/q—>r. В обоих
случаях мы получим неравенства
(2.15.9) |(r_i)<£^12<*^I_(jt_i)<
<-!(/•-1)х'(*-1)2 (г>1, х\\)
которые, очевидно, содержат (2.15.3).
Это доказывают теоремы 42 и 41, но полезно также иметь
неравенства, соответствующие (2.15.9), когда г<1. Для их
вывода заменим в (2.15.7) yv через х и применим (2.15.5)
с #, замененными на р. Таким путем мы получим
(2Л5.10)
2р х* >Х Х */р > 2Р V J \ <* J
58
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
[ГЛ. II
<j(l— r)x(x—lf (0<r<l,*>l).
Мы сделали доказательство (2.15,3) несколько более сложным,
чем нужно, чтобы получить неравенства „второго порядка" (2.15.6) —
(2.15.11), которые интересны сами по себе. Если же мы заинтересованы
только в доказательстве (2.15.3), то можем рассуждать следующим
образом. Вместо (2 15.6) напишем просто
j/g^1 — 1 у*— 1
д-1 > я '
откуда
уР—\ у*— 1
Р Ч
если р и q целые np^>q. Отсюда мы выводим (2.15.3) для
рациональных г и, таким образом, переходя к пределу, получаем
х* — 1>г(дг — 1)
для любого г>1. Если г иррационально, мы можем написать г = as,
где а и s оба больше 1 и а рационально. Тогда
xr—\ = (л*)*— 1>а(л:5— \)^as(x—\)= г(х — 1),
так что (2.15.3) всегда справедливо.
Другие доказательства теоремы 41, удовлетворяющие нашим
требованиям, см. Штольц и Гмейнер [Stolz und Gmeiner, 1, 202—208]
и Прингсгейм [Pringsheim, 1]. Прингсгейм пользуется этим
результатом для элементарного доказательства Н. Радон [Radon, 1, 1351]
выводит Н и М из теоремы 41, но доказывает эту последнюю
методами дифференциального исчисления. Доказательства теоремы 41,
приводимые в учебниках, обычно ограничиваются рациональными г.
2.16. Элементарное доказательство теоремы 3. В последнем
параграфе мы, между прочим, доказали несколько предложений,
более сильных, чем теоремы 41 и 42. Мы не придаем этому большого
значения, так как легко найти гораздо более точные неравенства
с помощью дифференциального исчисления (см. § 4.2); но, быть может,
интересно кратко показать, как эти неравенства позволяют нам, если
это желательно, „элементаризировать" доказательство теоремы 3.
Заметим, прежде всего, что
(2.16.1) аг=1 + 0(г)
для данного положительного а и малых (положительных или
отрицательных) г;
(2.16.2)
(1+я)« = 1 + 0й + О(я«)
2.17]
НЕРАВЕНСТВО ЧЕБЫШЕВА
59
для данного q и малых и и
(2.16.3) {1 + 0(r*)}Vr = 1 + O(r)
для малых г. Мы оставляем читателю вывод этих формул из
результатов последнего параграфа.
Предполагая теперь, что г мало, мы имеем а* = 1 + hv, где,
по (2.16.1), и,= О (г), и
ау =({ + u,)v = 1 + q4uH + ОИ
ло (2.16.2). Следовательно, принимая во внимание (2.16. 3), имеем
=(1+?11,+ ".;+ ^ИЛ°(ГТ={1+ому=1+о w-,1.
\ А -Г #1а1 "Г • • • -Г Япип J
2.17. Неравенство Чебышева. Мы знаем (теорема 24), что
Шг(а-\-Ь) сравнимо (§1.6) с %)1г(а)-\- ШГ(Ь). Естественно
поставить вопрос, сравнимы ли Шг(аЬ) и Шг (а) Шг (р).
Теорема 43 показывает, что это не так.
Мы говорим, что (а) и ф) одинаково упорядочены, если
(alt-a,)(*Ht-ftv)>0
для всех {л и v, и обратно упорядочены, если всегда имеет
место обратное неравенство. Ясно, что (а) и {Ь) будут
одинаково упорядочены, если существует перестановка индексов
vi, v2,..., v„ такая, что aVjL> aVa, ..., а,л и fcVl, *v2, - - -, &»„ СУТЬ
последовательности неубывающие, и обратно упорядочены,
если ап,... есть последовательность невозрастающая, a #V1,... —
неубывающая. Обратные предложения, очевидно, также
справедливы.
43!). Если г>0 и (а) и (Ь) одинаково упорядочены, то
(2.17.1) Wlr (а) Шг (Ь) < Шг (oft),
*) Интегральный аналог был дан Чебышевым. См. Hermite [1, 46—47],
Franklin [1], Jensen [1] и теорему 236. Когда г = 1, Шг= Й, и
неравенство справедливо для любых вещественных и одинаково
упорядоченных (a), (b).
60
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
[ГЛ. II
кроме того случая, когда все а или все b равны. Если
последовательности обратно упорядочены, то имеет место
обратное неравенство.
Как видно из (2.2.7), достаточно рассмотреть случай г = 1.
Тогда
1р1раЬ — %ра%рЬ = Ър^р^Ь, — %р^%р,Ь,=
= ЕЕ 0\АяА — /уЧ^Л) = SS (ЛР^Д. ~~ /W Д) =
= -2%% (р^р^А — р^д Д + лр^ Д — PvP^bj =
= тг£Е /V/\ (flj, — ОД — Ьч) > 0
или
31 (я) «(*)<« (а*),
если последовательности одинаково упорядочены.
Мы можем определить случаи равенства следующим образом.
В силу предыдущих замечаний, сделанных в этом параграфе,
мы можем предположить, что (а) и (Ь)— неубывающие
последовательности. В этом случае двойная сумма содержит член
PiPn <Л — ап) (Ьх — Ьп)
и может обратиться в нуль, только если все а или все b равны
между собой.
Непосредственным следствием является неравенство
Tir (а)Жг(Ь). . .3Rr(/) < Шг{аЬ. . ./),
если г положительно и (а), (Ь), ...(/) одинаково упорядочены;
в частности Шг(а) < Штг(а), где т — целое число > 1. Это
обобщает теорему 6 и, в свою очередь, является частным
случаем теоремы 16.
Вопрос о сравнимости Ttr (ab) и Шг (а) Шг (Ь)
содержится в более общем вопросе о сравнимости Шг (ab...l) и
$)i8 (a) Tit (b). . .Ttv (/), который решается следующей теоремой.
44. Пусть r9 s, .. ., v положительны; для того чтобы
Шг (ab. ../) и Ш8 (a), Tit (b), ..., Tlv (I) были сравнимы,
необходимо и достаточно, чтобы выполнялось неравенство
(2.17.2) 1>1 + 1.+ ...+1,
и в этом случае
(2.17.3) Жг(аЬ.. ./)<aKe(e)SR«(ft).. .Ttv(l).
2.18]
ТЕОРЕМА МЮРХЕДА
61
Достаточность этого условия следует из теорем 12 и 16.
Если подставить вместо каждой последовательности в (2.17.3)
последовательность (1, 0, 0, . . ., 0), то станет очевидным,
что условие (2.17.2) и необходимо. Общее неравенство,
обратное (2.17.3), невозможно ни для каких г, £,..., так
как av£v... /v может быть нулем для каждого v, в то время как
правая часть остается положительной.
2.18. Теорема Мюрхеда. В этом и в четырех следующих
параграфах мы будем предполагать, что все а положительны.
Обозначим через
2\F(aua& ...,an)
сумму п\ выражений, получающихся из F(av a2, ... ап) путем
всех возможных перестановок а. Мы будем рассматривать
только специальные случаи
F(au а2, ..., ап) = с^сф ...aft (av>0, av > 0)
и вводим обозначение
[«] = [«!, «2. •••> a«l =^S!^1<*?...<*£'.
Ясно, что при любой перестановке а значение [а] не меняется,
так что мы можем рассматривать две последовательности
а как одинаковые, если они отличаются друг от друга только
порядком своих членов. Средние типа [а] могут быть названы
симметрическими средними. В частности,
[1, 0, 0, ..., 01=^=^(^ + 0,+ ...+an) = 9t(e),
[11 11л! 1/п 1/гс 1/гс ал/ \
являются средним арифметическим и средним геометрическим
с единичными весами. Когда лг -\- а2-\- ... -|- лп = 1, [а] есть
обычное обобщение %(а) и ©(а).
В общем случае [а] и [а'] несравнимы в смысле § 1.6.
В настоящем и следующих двух параграфах определяются
условия, при которых они становятся сравнимыми.
Мы говорим, что (а') мажорируется (а), и пишем (а')-^(а),
если (а) и (а') могут быть перегруппированы так, чтобы
62
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
[ГЛ. II
удовлетворялись следующие три условия:
(2.18.1) <*; + «;+...+«„ = «! + а2+ ... +«„;
(2.18.2) а;>а;>...>а;, «1>а2> . .. >ап;
(2.18.3) «; + «;+... +а;<«1+а2+...+а, (l<v<«).
Второе условие само по себе, конечно, не является
ограничением, так как («') и (а) можно перегруппировать в любом
порядке, но оно существенно для формулировки третьего.
Ясно, что (а)-<(«).
45. Для того чтобы [а'] было сравнимо с [а] для всех
положительных а, необходимо и достаточно, чтобы одна
из последовательностей (а), (а') мажорировалась другой*
Если (ot')-<(a), то
(2.18.4) [«']<[«].
Равенство имеет место только в том случае, когда (а')
и (а) тождественны, или когда все а равны1}.
2.19. Доказательство теоремы Мюрхеда. (1) Условие
необходимо. Предположим, на что мы имеем право, что
выполнено (2.1$.2) и что (2.18.4) справедливо для всех
положительных а. Полагая все а равными х, мы получаем
х = [а ] < [а] = х .
Это может иметь место как для больших, так и для малых х,
только если удовлетворено (2.18.1). Далее положим
ai = ^2= • • • =яУ = х, flWi= ... =ая= 1,
причем х предположим достаточно большим. Так как (о/)
и (а)—последовательности невозрастающие, то наивысшими
степенями х в [а'] и [а] являются
а1 + а2+-"+< И а1 + а2+ ...+«*.
откуда следует (2.18.3).
(2) Условие достаточно. Доказательство достаточности
несколько более затруднительно, и нам потребуется одно новое
определение и две леммы.
1) Теорема 45 найдена Мюрхедом [Muirhead, 2], но он
рассматривал только целые значения о.
2.19]
ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ МЮРХЕДА
63
Определим некоторый специальный тип линейного
преобразования а, который мы назовем трансформацией Г. Пусть ак и аг —
два неравных а, скажем, ак > <xh и пусть
(2.19.1) ал = р + т, аг = р-т (0<т<р);
если теперь
(2.19.2) 0<о<т<р,
то трансформация Т определяется формулами
(2.19.3)
X + ° I Т a
/ I •* Т" u I
2л "^ 2%
а,
< = av (v#*, v=£/).
Если Г преобразует (а) в (а'), то мы пишем а7 = Га. Это
определение не предполагает, что а или а' убывают.
Ясно, что достаточность нашего условия сравнимости и
утверждения теоремы 45 относительно случаев равенства будут
доказаны, если мы докажем следующие две леммы.
Лемма 1. Если а' = Та, то [a']^[a], причем равенство
имеет место только в том случае, когда все а равны.
Лемма 2. Если (а') ""ч (а)> но (а7) не тождественно с (а),
то (а') может быть получено из (а) последовательным
применением конечного числа трансформаций Т.
Доказательство леммы 1. Мы можем так
перегруппировать (а) и (а7), что ^ = 1 и /=2. Тогда
(2.19.4) /г! 2 [а]— п\2[а'] =
= л!2[р + т, р— т, а3, ...] — и!2[р+о, р —о, а3, ...] =
= £!aJ... а«пп (аР+тдР-т + а[~ха^ — а[^°а^ — а[~аа^)=
= V.(aia^al> ...а«п (а^ - а^) (aj- - а^)^ О,
и знак равенства имеет место, только если все а равны.
Доказательство леммы 2. Пусть для (а) и (а7) удовлетворено
условие (2.18.2). Обозначим через A (a, a7) число отличных
от нуля разностей av — а7. Если A (a, a7) = 0, то (а) и (а7)
тождественны. Мы докажем лемму методом индукции, полагая
ее справедливой для А (а, а7)< г и доказывая ее для А (а, а7) = г.
64
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
[ГЛ. II
Предположим, что (<*')-<(<*) и что А (а, а') = г > 0. Так как,
согласно (2.18.1), £(av— о^) = 0 и не все эти разности в
отдельности равны нулю, то между ними должны быть положительные и
отрицательные; по (2.18.3), первая отличная от нуля разность
должна быть положительна. Следовательно, мы можем найти
k и / так, что
(2.19.5) a^<aft> a'k+l = ak+v ..., «;_1 = ^1, «J > V>.
Положим, как в (2.19.1), afc = p + T, аг = р — т и определим
(2.19.6) а = тах(К-р|, J «; — р|>.
Тогда 0<х^р, так как сак > аг. Далее,
си'г — р=—а или а'к — р=а2),
так как a^>-ap и a < т, ибо а'к < ак и а'г > <хг
Следовательно,
0<а<т<р,
как и в (2.19.2).
Положим теперь
(2.19.7) < = p + a, < = р-о, < = *v (v ф k, v Ф I).
Если <хк — р = <3у то а& = о4; если <х^—р =—а, то а^=а^3).
Так как каждая из неравных пар ак, ак и <хг, а^ увеличивает
Л (а, а') на единицу, то А (а', а")< А (а, а') = г, а именно,
A(a',a") = r—1 или г—2.
Далее, сравнивая (2.19.7J и (2.19.3) и замечая, что имеет
место (2.19.2), мы видим, что (а ) получается из (а) с помощью
трансформации Т.
Наконец, (а') мажорируется последовательностью (а"). Чтобы
доказать это, мы должны показать, что удовлетворены условия,
соответствующие (2.18.1), (2.18.2) и (2.18.3), с а" вместо а.
Что касается первого условия, то мы имеем
(2.19.8) afc+a? = 2p = afc+aif £*'=£«=£*".
*) ац — <хг есть первая отрицательная разность, а^. — а'к—последняя
положительная, ей предшествующая. В тексте принято, что / — &>1;
случай / — k= 1 проще.
2) Возможны оба случая.
3) Снова возможны оба случая.
2.20]
ДРУГАЯ ТЕОРЕМА О СРАВНИМОСТИ
65
Что же касается второго условия, то мы заметим, что
ак < Р + | а'к — Р \< Р + ° = 4',
*i > Р — I «г — Р I > р — а = а?
и следовательно, в силу (2.19.5),
<х"_1 = аА_ j> ак = р + т > р + о = а£>а*> 4+1 = «*+i= «*+i»
«Li = *i~i = «Li > a'*>af = р — о >р — т = аг>ат = а?+1,
что и дает нужные неравенства, относящиеся к а". Наконец, мы
должны доказать, что
/ I / I | / ^ /У | П | | /У
«1 + *2 + . . . + «v < <*i + а2 + . . . + а*.
По (2.19.7) и (2.18.3) это неравенство справедливо для v<&
и v^/; оно справедливо также для v = &, так как оно
справедливо для v=k—1 и ajc^ak) для &<v</ это неравенство
также справедливо, потому что оно справедливо для v = £, и
промежуточные а' и а" равны.
Мы, таким образом, доказали, что («') "К (а"\ гДе а" = 7а
и А (а7, а") < г. Это заканчивает доказательство леммы 2,
а с ней и теоремы 45 х\
2.20. Другая теорема о сравнимости симметрических
средних. Мы называем (а') осреднением (а), если существуют я2
чисел /7^, удовлетворяющих условиям
(2.20.1) /V>0, SPu* = l, 2/^=1,
так что
(2.20.2) < = /VA+/V*2+ • • • +/VV
Так как условия (2.20.1) не нарушаются от перестановки ja или v,
то наше определение, подобно тому, как это имеет место в§ 2.18,
не зависит от порядка а„ и <х^. Равенства (2.19.3) показывают,
что (р + о, р — о, ог3, ...) есть осреднение (р + т, р —т, <х3, ... ),
если выполнено условие (2.19.2).
^ Другое доказательство можно получить из теорем 74 и 75.
66
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
[ГЛ. II
Последние два условия (2.20.1) могут быть выражены так:
£а', как функция от а, тождественна с £<х, и каждое а' = 1,
если каждое а=1. Отсюда следует, что это соотношение
обладает свойством транзитивности: если (а') есть осреднение (а) и
(а")—осреднение (а'), то (а") есть осреднение (а). А отсюда,
и из леммы 2 § 2.19 следует, что если (а') -< (а), то (а') есть
осреднение (а).
Обратное также справедливо. Предположим, что выполнены
условия (2.20.1) и (2.20.2). Тогда, складывая почленно равенства
(2.20.2), мы получим (2.18.1). Наконец, предполагая, что (а) и
(V) — невозрастающие последовательности, и полагая
Ри~\- Р*» + • • • + Pmv = *vi
мы будем иметь &V<!1, £&v=m по (2.20.1). Отсюда следует,
что
<*1 + <*2 + ... -fel»^
<*1«1+... +Viam-l+(^-^l- ••• — £m-l)am<
<(а1 — am) + • • • +К»-1 — ат)+т*м = а1 + а2 + • • • + «я»,
т. е. (2.18.3). Мы, таким образом, доказали следующие две
теоремы.
46. Для того чтобы (а') было осреднением (а), необходимо
и достаточно, чтобы (а') мажорировалось (а).
47. Для того чтобы [а'] и [а] о"ыли сравнимы, необходимо
и достаточно, чтобы одна из последовательностей (а') и (а)
была осреднением другой. Если (а') есть осреднение (а), то
[<*'] <С 1аЬ причем равенство имеет место в тех же
случаях, что и в теореме 45.
2.21. Дальнейшие теоремы о симметрических средних.
(1) Теоремы 45 и 47 могут служить для двух целей. Во-первых,
каждая из этих теорем дает простой критерий сравнимости
средних [а] и [а']. Во-вторых, доказательство теоремы 45
показывает нам, как повторным применением трансформации
(2.19.3) и формулы (2.19.4) мы можем разложить разность
двух сравнимых средних в сумму очевидно положительных
выражений. Мы получаем, например, новое и интересное
доказательство теоремы о среднем арифметическом и среднем
2.21] ДАЛЬНЕЙШИЕ ТЕОРЕМЫ О СИММЕТРИЧЕСКИХ СРЕДНИХ 67
геометрическом (с единичными весами); в самом деле,
Я(а*) —®(a»)=[/i,0,0, •••> 0] —[1,1, ..., 1] =
= ([л,0,0, ..., 0] — 1/1—1,1,0,..., 0]) +
+ ([Л-1,1,0, ...,0]-[я-2, 1,1,0, ..., 0J) +
+ ([/1-2,1,1,0,..., 0]-[/1-3, 1,1, 1,0, ..., 01)+ ...=
+ S!(«rB-4~3)(a1-a2)a3a4+...}.
Теорема доказана, так как {аг — as) (al — ^)>0, если
агфа8г).
(2) 48. Если аг-\-(х2-\- ... +ал = 1, wo
®(л)< [«]<«(*),
кроме тех случаев, когда [а] = ®(а), [а] = 31 (а) или все а
равны.
Эта теорема2) показывает, что все [а] со степенью
однородности, равной единице, сравнимы с ® (а) и 51 (а), хотя
между собой они вообще несравнимы. Для доказательства
применяем теорему 47; так как
J_ _ а^ ■ «2_ . | ^тг
Л Я ~1~ П ~Г" ' ' ' "I" я
И
а^ = v 1 + Vl • 0 + ... + ап . 0 + а, . 0 + ... + а,_, . 0,
Г—,—,..., —J есть осреднение (а) и (а) есть осреднение
(1,0,..., 0). Теорему 48 можно также вывести
непосредственно из теоремы 45.
(3) Приведем еще две теоремы аналогичного характера.
49. Если 0<а<[1, то необходимым и достаточным условием
для того, чтобы было [а'] < [ар, является (а')-<(са). Если а>1,
то это условие необходимо, но не достаточно.
$ Это доказательство было известно до работы Мюрхеда; см.
Hurwitz [1].
У Сообщенная нам Шуром.
68
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
[ГЛ. II
[Доказательство необходимости вести так же, как § 2.19 (1).
Для доказательства достаточности объединить теоремы 45 и 11.
В качестве примера получается:
[г, 0, 0, ...]< [5,0,0,... fs (0<г<>).
Это Шг (а) < Ш8 (а) (теорема 16) с единичными весами. Тот же
самый пример показывает, что условие перестает быть достаточным
для а> 1.]
50. Если г, р, а положительны и
Тг = Zp,a \ = %гг
(в обозначениях § 2.10 (iv)), mo необходимым и достаточным
условием для того чтобы выполнялось неравенство
Т, Та, ... Та. < Та Та ... Та
a j «2 а» ai 2 n
для всех аир, является (а')-<(а).
[Необходимость условия может быть установлена, как и выше.
Для доказательства достаточности применить теорему 46 и
неравенство Гельдера, которые дают
т = т <г(Т ч^/т \№ (Т \sv-m
'ар/ iS^1«1+SlJl2a2-f...-f-S|Jim«m^iia1j V а2' " ^ W
мы слегка изменили обозначения, чтобы избежать конфликта с
обозначениями в § 2.10. Перемножая эти неравенства, получаем нужный
результат.]
2.22. Элементарные симметрические функции от п
положительных чисел. Если
(х-\-а1)(х-\-а2) ...(х-\-ап) = х* + с^'1 + с2х"-2+... -\-сп=
= хп+(П1)Рг*п-1 + (1)р*хп-2-\----+Рп,
то сг является r-й элементарной симметрической функцией
от а, т. е. суммой всевозможных произведений г различных
чисел последовательности (а), а рг — средним от этих
произведений.
В этом параграфе мы рассматриваем две известных теоремы
о рг. Мы полагаем с0= р0= 1.
В обозначениях § 2.18
сг= г\(п-г)\ ЕЧДя — вг»
Рг=Г1{П^Г)1 cr=[l,l9...,1,0,0,...у0]
2.22] ЭЛЕМЕНТАРНЫЕ СИММЕТРИЧЕСКИЕ ФУНКЦИИ 69
(г единиц и п — г нулей). Очевидно, рх=%{а) и рп = ®п(а)
с единичными весами. Различные /?г, будучи различных
степеней, несравнимы между собой1); они, однако, удовлетворяют
следующим нелинейным неравенствам.
51. /V_1/Vm< Рг (I ^Сг^Сп), кроме того случая, когда
все а равны.
52. /?1>/4/2>/?з/3> • • • >/7w/w> кроме того случая, когда
все а равны.
Теорема 51, данная Ньютоном2), на самом деле
справедлива для всех действительных, не обязательно
положительных а; в § 4.3 мы докажем методами дифференциального
исчисления более общую теорему. Теорема 52данаМаклореном3).
Теорема 52 является следствием теоремы 51, ибо из
(Р0Я2) (PiPs)2 (PzPtf • • • (Pr-iPr+iY <p\p\pl -..p2/
следует
prr+i < prr+1
или
pf>p*k-
Это замечание, вместе с доказательством в § 4.3,
устанавливает справедливость теорем, однако интересно рассмотреть их
доказательства методами настоящей главы.
(i) Доказательство теоремы 52 методами § 2.6 (iii).
Начнем с доказательства теоремы, подобной теореме 51, но
более слабой.
53 4). cr_1cr+1<cl.
Эта теорема слабее, чем теорема 51, так как /V-i/Vfi</V
эквивалентно
(г+1)(П-Г+\) 2
г(п-г) *г-1 'г+1 < Сг-
*) Это — тривиальный случай теоремы 45.
2) Newton [1, 173]. См. также Maclaurin [2].
3) Maclaurin [2]. См. также SchlOmilch [1]. Неравенство Р\^>рЦп
есть частный случай теоремы 9.
4) Теорема сформулирована, как и теоремы 51 и 52, для
положительных а. Как показывает доказательство, она остается
справедливой и для #;>0, если сгфО (т. е. если больше, чем г—1 чисел а
отличны от нуля).
70
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
[ГЛ. II
Для ее доказательства заметим, что общий член в cr_1cr+l —
справен
2 2 2
a^u-i ... ur_sur_SJrl ... or^s
и входит с коэффициентом
(ЛН2;)<о-
Из теоремы 53 следует, что если г < s, то
(2.22.1) cr_xcs<crcs_v
Мы можем теперь следующим образом доказать теорему 52.
Если не все а равны, то положим
а{ = min я, a2 = max a.
Тогда
(2.22.2) ах < ах < а2,
1/а
где а1 = рр:1.
Заменим at и а2 на а! и а2, выбирая а2 так» чтобы р{и не
менялось, и докажем, что каждое /?N, для которого v>[x,
увеличивается от такой замены. Результат будет тогда получаться,
как в § 2.6 (iii).
Мы имеем
где с'г есть сг, образованное из п — 2 чисел, отличных от ах
и а2. Так как р^ не меняется, то
*1*2<-2 + («1 + «2><-l + < = *1а2<-2 +(а1 + а2) <-1 + <>
(2.22.3) (аха2 — аха2)с^2 = — (ах + а2 — а, — fl2)<_lf
(2.22.4) (a1<-.2+<-i)«2 = aiflr2^-2 + (flr1+flra— aiK-f
Значение ог2, определенное формулой (2.22.4), положительно
в силу (2.22.2).
Следовательно, если /?v переходит в /?*, то
( 1 )(Р* — Pv) = Ol«2 — ^2) ^'-2 + К + «2 — а1 — а2) ^-1,
2.22] ЭЛЕМЕНТАРНЫЕ СИММЕТРИЧЕСКИЕ ФУНКЦИИ 71
и, таким образом, р*—/?v имеет знак выражения
(«1+«2-«1-«2)(4111-4^-)-
Из (2.22.1) следует, что второй множитель отрицателен, а из
(2.22.3) —что
sign (<хх + а2 — аг — а2) = sign (аха2 — аг<х2) =
= sign {а1(а1 -\- а2 — аг — а2) -\- ага2 — аха2} =
= slgn{{a1 — a1){a1—a2)]= — l
ввиду (2.22.2). Отсюда /?* > pv, что и доказывает теорему.
(и) Доказательство теоремы 51 методом индукции1). Пусть
теорема 51 доказана для п — 1 чисел av а2, ...,flrn_1, и
пусть с'Гу рг суть сг, /?г, образованные для этих п — 1 чисел,
о которых мы сначала предположим, что они не все равны. Тогда
cr = Cr-\-anc'r_u
и, таким образом,
п —r „' i r „'
Рг = —— Рг-\- — anPr-i-
Отсюда мы выводим, что
n2(pr-iPr-H — pi) =A + Вап + Са2ПУ
где
Л = {(п — rf— l) p'r-ip'r+i — (n — rfp'r,
B = (n-r + l)(r+l)p'r-1p/r + (n-r-l)(r-l)p'r_2p'r+1-
— 2r(n — r)p'r-iPr>
С =(r2 - 1) Pr-2Pr- fpti-
Так как av a2, ..., an_x не все равны, то имеем, по
предположению,
p'r-lp'r+l<p'r, p'r-2 p'r < p'r"-l , p'r-2p'r+l<p'r-lp'r,
х) Это доказательство сообщено нам независимо друг от друга
А. Диксоном (A. L. Dixon), А. Жолифом и М. Ньюменом (А. Е. Jolliffe,
М. Н. A. Newman).
72
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
[ГЛ. II
так что
Л<— Pr\ B<2p'r-lP'r, C<ptx
и
п (Pr-1 Pr+i — Pi) < —(p'r—arPr-i)2 < 0.
Это доказывает теорему. Результат остается справедливым и
при at = а2 = . .. = ап_и так как тогда ап Ф ах = prlpr—v
Теорема 51 может быть также основана на тождествах типа,
рассмотренного в § 2.21 (1).
54. Если
причем сумма распространена на все произведения указанного
типа, то
Р*-Р р , 1 ryV2^i^-
Pr Pr-iPr+i rir+D(x;i)A(,;/+1'
55. {^„.^(pl-Pr-iPr^ =(я-1)Е(аг-й2)Ч^?)2+
где cj?—i обозначает сумму произведений по г—1 из (п — 2)-х
а, отличных от аь a<i и т. д.
Теорема 54 принадлежит Мюрхеду [Muirhead, 1], теорема 55 —Жо-
лифу [Jolliffe, 1]. Теорема 55 делает „интуитивно" ясной более общую
форму теоремы 51 (для действительных а любого знака), упомянутой
в начале этого параграфа.
2.23. Замечание о положительных формах. Тождество
Гурвица и Мюрхеда, приведенное в § 2.21 (1), показывает,
что если а > 0, то
П \ П \ | П
Я1+Д2+ '-•-\-ап — па1а2. . .ап
может быть представлено в виде суммы, очевидно,
неотрицательных членов.
Если мы положим
2 2
2.23]
ЗАМЕЧАНИЕ О ПОЛОЖИТЕЛЬНЫХ ФОРМАХ
73
то получим
(2.23.1) хТ+ ... +x2? — nxlx\...xl =
= n^Y)][mx\n-2-xT-i){xl-xl)+...).
Далее
= (х\-х\)\х?-* + хТ -"*! + • • • +хГ~А)
является суммой квадратов многочленов, подобных (х± — xi)Xi~ ;
таким образом, правая часть (2.23.1) есть сумма квадратов.
Наконец, так как
Х-± —\- . . . —|— Х%п 2ПХ^2 • • • %2п == %1 ~\~ • • • —Г~ %п
2 2 | 2п | I 2п 2 2 I
ПХ± . . •Хп-\- Хп^.± -\- . . . -|- Х2п Пхп+1 • • • Х2п ~]~
П> \ Л | • • • Xfi Л^ +■ 1 • • • <2?2 >
то, следовательно,
у2,26.2j Г = ЛГ^ —р- ... —р- Л^2п — аПХ^Хс^» • • A^2W = Zipi у
i
где р€— действительные многочлены я-й степени. Например,
xQ-\-yQ-\-zQ-\-uQ-\-ifi-\-wQ — Sxyzuvw =
= j {X2 -\-у* + **) {(j/2 — г2)2 + (г2 — л:2)2 + (л:2 — .у2)2} +
+ у ("2+^2 + ^2> {(^2 — w*f + О2 — и2)2 + О2 — *>2)2} +
+ 3 (xyz — uvw)2
есть сумма 9+9+ 1 = 19 квадратов действительных
многочленов.
Под вещественной формой мы понимаем однородный
многочлен F(x1,x2y ...,xm) с действительными коэффициентами от
действительных переменных xvx^ ...,xm. Форма F называется
определенной в некоторой области переменных, если она в этой
области не меняет знака, например, если F^>0.
Определенные формы можно подразделить на положительные и
отрицательные и, очевидно, достаточно рассматривать поло-
74
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
[ГЛ. II
жительные формы. Так, форма (2.23.2) положительна для
всех действительных значений переменных. Ясно, что
положительная форма, обладающая этим свойством, должна быть
многочленом четной степени.
Если в некоторой области F > 0, то говорят, что F строго
положительна в этой области.
Форма (2.23.2) и формы, рассмотренные в теоремах 7 и 55
(с х вместо а), могут быть представлены в виде сумм
квадратов действительных многочленов. Естественно поставить вопрос,
является ли это общим свойством положительных форм.
Верно ли, что если F^>0 для всех действительных х, то
F = YiPn где pi — действительные многочлены ?
i
Эта проблема была полностью решена Гильбертом 1К Мы
можем поместить здесь только несколько отдельных замечаний.
Начнем с указания, что существует два случая, в которых
ответ получается сразу. Обозначим степень F через 2п и
число переменных через т.
Если т=2у так что F = F (хуу)} и п произвольно, то любой
действительный множитель ах -\- by должен входить в F с
четной кратностью, а комплексные множители должны входить
парами сопряженных чисел ax-\-by, ax-\-by. Следовательно,
группируя надлежащим образом множители, мы получаем
Р=РЧЯ+ ir) (Я — ir) = {pqf + {prf,
где /?, qt r — действительные многочлены.
Из алгебры хорошо известно 2\ что любая определенная
квадратичная форма от какого угодно числа т переменных
может быть представлена как сумма не более чем т
квадратов действительных линейных форм. Таким образом, ответ на наш
вопрос положителен в следующих двух случаях:
1) т = 2, п произвольно,
2) т произвольно, 2п = 2.
Гильберт нашел третий случай
3) т=3, 2п = 4
и доказал, что любая положительная биквадратичная форма от
трех переменных представима в виде суммы трех квадратов
действительных квадратичных форм. Он доказал также, что
!) Hilbert [1].
2) См., например, Бохср [1].
2.24] ТЕОРЕМА О СТРОГО ПОЛОЖИТЕЛЬНЫХ ФОРМАХ 75
во всех других случаях ответ отрицателен, и существуют
определенные формы степени 2п от т переменных, которые не
могут быть представлены указанным образом.
Гильберт высказал тогда следующее предположение: всякая
положительная форма F может быть представлена в виде
где Ri — действительные рациональные функции.
Этому предположению эквивалентна следующая теорема:
всякая положительная форма F представима в виде
отношения сумм квадратов действительных форм1).
Гильберт 2) дал очень трудное доказательство этой теоремы
для тернарных форм относительно (х, у, г). Общая теорема
впервые была доказана Артином 3). Доказательство Артина
весьма замечательно и сравнительно просто, но настолько
использует идеи современной абстрактной алгебры, что мы не
можем воспроизвести его здесь.
2.24. Теорема о строго положительных формах. Замечания
§ 2.23, носящие довольно отрывочный характер, являются
естественным введением к следующей более простой задаче. Мы
рассматриваехМ формы, которые строго положительны в области
положительных х. Теорема, которую мы докажем, напоминает
теоремы § 2.23, утверждая, что положительная форма может
быть представлена в таком виде, который делает очевидным ее
положительный характер. Здесь уже не требуется, чтобы степень
формы была четной.
56 4). Если форма F(xvx2l ...,хш) строго положительна
для
х>0, 1х>0,
х) Очевидно, что из первого утверждения вытекает второе (только
с одним квадратом в знаменателе). И, так как
то из второго следует первое.
2) Hilbert [2].
3) Artin [l].
*) Polya [3]. Первое утверждение теоремы было доказано раньше
Пуанкарэ [1J для т = 2 и Мейсснером [Meissner, 1] для т = 3.
Принципиально метод Мейсснера применим и в общем случае, но приводит
уже не к столь простому результату.
76
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
[ГЛ. II
то она может быть представлена в виде
F = G/H,
где G и Н—формы с положительными коэффициентами.
В частности, можно взять
Н={хх-\-х2-\-... +хту
с надлежаще выбранным р.
Для простоты записи положим т = 3; доказательство
применимо и к общему случаю.
Функция F(x,y,z) положительна и непрерывна в замкнутой
области
(2.24.1) *>0, j/>0, г>0, x+y+z=l
и достигает в этой области положительного минимума [*..
Положим
(2.24.2) F(x,y,z) = LnA^^,
где суммирование производится по
(2.24.3) а>0, р>0, т>0, а + (3 + Т = л,
и
(2.24.4) Ф(х,у, г; t) = f> I» A^ [xt'1) (^f) (^,
/xt-i\
где />0 и J, — обычные биномиальные
коэффициенты, так что
(Т)-1
и
ъ(**-1\ _ x(x—t)(x — 2f)...{x-(a — l)t}
Г\ а )— 1 .2-3...а
для а = 1,2, 3,... .
Ясно, что $>(x,y,z\f)-*F(x%ytZ) при £->0; если мы
положим
<$>(x,y,z;0) = F(x,y,z).
2.24] ТЕОРЕМА О СТРОГО ПОЛОЖИТЕЛЬНЫХ ФОРМАХ 77
то Ф непрерывна в области
*>0, у>0, г>0, х-\-у-\-г=1, 0</<l.
Существует поэтому такое е, что
(2.24.5) Ф(х,у,г;1)>Ф(х,у,г;0)-^ =
= F(x,y, z)— 2-{a>2-|a>0
для 0</< 8 и всех х,у, z из области (2.24.1).
Мы имеем также
(2.24.6) {x+y+zy-n = ik-n)\Zk_n^,
где суммирование производится по
х>0, А>0, |х>0, x+X+jjl = A—л.
Умножая (2.24.2) на (2.24.6), получаем
(*+у+*)*-^=(* -»)' sa- ла,т xZ"mTJ •
Положим теперь
так что
(2.24.7) а>0, £ >0, £>0, а + £ + £ = &
и
(2.24.8) 0<«<а, 0<р<£, 0<Т<с, а+р + Т = я.
Тогда мы получим
(2.24.9)(a: + ^ + ^-F = (&-«)!E,^S'^0(*)Q.
Е' в (2.24.9) означает, что суммирование производится по
a, р, у при условиях (2.24.8); но так как ( а J = 0, (Л = О, ...,
если а > а, р > # . . ., то это суммирование можно заменить
суммированием по а, р, у» удовлетворяющим (2.24.3), т. е.
2П- Таким образом мы получаем
78
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
[ГЛ. II
(2.24.10) (x-\-y-\-z)k-*F=
=<*-..>!*-S,*(f,|,J;>)3g.
По (2.24.5), Ф здесь положительно, если k достаточно велико,
и теорема доказана.
(I) Эта теорема дает регулярный процесс для решения вопроса,
является ли данная форма F строго положительной для л:>0, или нет.
Мы умножаем F повторно на 1>х и, если F>0, мы должны после
конечного числа шагов получить форму с положительными
коэффициентами.
Поучительно применить этот процесс к форме
где £>0 и мало. Коэффициент при
л1л2 .. .лп,
где h + h+ .- + in = n(g+\)B
несомненно положителен, если одно из /равно нулю. Если ^ ;>!,...,
/W>-1, этот коэффициент равен
(пд)\ , (пд)\ (пд)\
(/1-л)!у/8!..."|"/1!(/,«л)!/8!...^--- ^ 'ft-1)1(1,-1)!...
и имеет одинаковый знак с
<К*1. ** • • •, «») = 'i(*i — !)• • -('i— п + 1) + Z2 (*2 — 1).. .(/2 — л +1) +
+ ... —(я —e)iv2...in-
Мы должны показать, что ф>0 для всех допустимых /Ч. ^ • • •,'»•
Если не все / равны #+1»т0 существует одно /, скажем ib
меньшее, чем д + 1, и одно Л скажем /2, большее, чем # + 1. Заменим ib l2
на ^ + U Н—1; тогда значение ф изменится на
/i{/i(/i —l)...(/i — л + 2) — (i2 — 1) (г2 — 2)...(г2 — я + 1)} —
— (Я — е) /3- • -/Л (fe— 'Ч ~ 1)<0.
Следовательно, ф будет положительным для всех допустимых /, если
оно положительно, когда все / равны q-\-\. А в этом случае оно
будет положительно, если
n(g + l)g(g-l)...(q-n + 2)>(n-z)(g+l)n,
РАЗНЫЕ ТЕОРЕМЫ И ПРИМЕРЫ
79
или
('-*ТТ)0-7Ш'-?П)>'-*-
и тем более, если 4)
Таким образом, если это условие удовлетворено, все коэффициенты
у ф положительны.
Отсюда следует, что F;>0 для лс>0, £д:>0. Переходя к пределу
при £-^0, мы получаем еще одно доказательство теоремы о средних
в форме 1>хп > nlix.
(2) Если мы положим
хт = I -^1 • * • Хт _ 1»
то получим теорему об общих неоднородных многочленах от т—1
яеременного.
57. Если (неоднородный) многочлен f(xb х2, .. *,хт^1) положите-
лен в области
х1^0,...,хт.1^0, хг + х2+ .,. +*«,_! <1,
то f(x) может быть представлен в виде
f(x) = S ex?.. .хУ~\ (l-Xl-... - дсж_1)в«.
где а — целые неотрицательные числа и с положительны.
Эта теорема является обобщением одной теоремы Хаусдорфа 2).
РАЗНЫЕ ТЕОРЕМЫ И ПРИМЕРЫ з) *)
58. Если а, р, у,---Д больше —1, и все положительны или все
отрицательны, то
(1+а)(1+Р)...(1 + Х)>1+« + Р+...+ Х.
[О случае а = р= ... = X см. James Bernoulli [l, 5, 112].]
59. Если с>0, то
|a + M*<(l+*)|e|*+(l+i)|M*
для всех (действительных или комплексных) я, #.
[См. Bohr [1, 78].]
*) См. теорему 58.
2) Hausdorff [1] Хаусдорф рассматривает случай п = 2.
3) Некоторые из этих теорем являются простыми упражнениями
для читателя, но большинство имеет самостоятельный интерес.
*) См. также Дополнение XVI в конце книги. (Прим. ред.)
80
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
[ГЛ. II
60. Если Жп, (&п— среднее арифметическое и среднее
геометрическое от аь а2,...,ап с единичными весами, a 2ln+i, @Wi —от
аъ а2, •. ч ап, ап+1, то
^n-®n)<(n+l)(Wn+1-@n+i).
кроме того случая, когда ап+1 = ®п.
[На этой теореме сообщенной нам Р. Радо (R. Rado), можно
основать еще одно доказательство теоремы о средних.
Если мы положим ап+1 = хп+1, (&п = уп+1, то искомое неравенство
примет вид
xn+i _ (Я _[- 1) хуп + nyn+i > 0,
а это следует из теоремы 41.].
61. а*< ^ + т? (а>°> b>°> r>V>
причем знак равенства имеет место, только если Ь = а*-1.
[Другая форма теоремы 37. Об этой и двух следующих теоремах
см. Юнг [Young, 1, 5, б).]
62. т<и——+ ^ т/^ j (и>0> „>_ ^п).
[Заменим г в теореме 61 через 1 + jc? na,b через к, (1 +р#)/(1 + р).]
63. uv < и log и + ^-1 (и >0).
[Предельный случай р -> 0 теоремы 62. См. также § 4.4(5).]
64. Если я>0, я^- • «лп = /п, то
(1+«1)(1+в2)...(1+А«)>(1+/Л
кроме того случая, когда все а равны.
[Chrystal [1, 51]. Пример к теореме 40.]
65. Если а и b положительны и /?>1 или /?<0, то
*л ЪР-1^(2 Ь)Р~1'
кроме того случая, когда (а) и (Ь) пропорциональны. В случае
0</?<1 имеет место обратное неравенство.
[Radon [1, 1351]; видоизменение теоремы 13.]
66. Если я>0, то SaStf-^tf2, кроме того случая, когда все а
равны.
[Следует из теорем 7, или 9, или 16, или 43.]
РАЗНЫЕ ТЕОРЕМЫ И ПРИМЕРЫ
81
67. S(a + 6)S^L<SaS&,
кроме того случая, когда (а) и (6) пропорциональны.
[Milne [1].]
68. S(a + b + с) S &g + Cf + "* S , ** L , <SaS&Sc,
v ' ' ' a+6 + c bc + ca-\-ab ^
кроме того случая, когда (a), (&), (с) пропорциональны.
69. Если 0<r<s и
(я, &) = (^ 2"
Шт (а, Ъ) Mi-r (а, Ь) <Ш8 (a, b) SAf _s (a, &) <SaS&,
кроме того случая, когда (а) и (6) пропорциональны.
70. Если 0<&<1 и
Saft>i4(S^*/)1/Ar
для всех #, то Sa& > Лй.
[Это является аналогом теоремы 15 в случае 0<&<1 (когда£'<0).
Если все #>•(), определим b равенством ab = а**, т. е. b = a7*-1,
Ьк' = аъ тогда
(i) Saft>i4(Sa*)1/A\ ЪаЬ>Ак.
Если все а обращаются в нуль, то А должно быть равным нулю, и
нечего доказывать. Если некоторые, но не все а равны нулю, то
пусть Е будет множество всех (скажем (х) отличных от нуля а;
положим тогда в Е b = ali~1, а в дополнительном множестве СЕ из
п — (х = v элементов положим b =G. Тогда
Safe = %ab > A (S^ _[_ vGfef)i/fe' = л (Safe + vG*'W*\
Переходя к пределу при G-»oo, опять получаем (i).]
71. Если 0<u<av<#, 0</? <£„<#, то
1 ^ (Sa&)2 ^ 4 \К ЛЛ ^ К Я/С )
(Sa&)2
[См. Полна и Сеге [1, I, 57,213], где даны и условия равенства.]
72. mr+i(
п->оо Шгг(а)
lim It, / = ^„(a).
Если все а положительны, то существует аналогичная теорема для
п ->—со.
82
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
[ГЛ. II
73. Если
3t(fl) — ©(fl)
<£<1,
Ж (а)
причем средние образованы с единичными весами, то
l + E<flv/a<l+5',
где Z есть отрицательный и £'— положительный корни уравнения
(\+х)е-х = (1 +ъ)п.
[См. Полна и Сеге [1, I, 58, 215].]
74. Если [т{....ЛлК[Т1. "мТа!. 1ьр • • ->ьг\< lh, - • -Л] Для всех
рассматриваемых значений переменных, то
[Ti' • • •• Ъ К> • • •» ь\\ < [Ti. - • •> Т*. &ь- •.. hi
[Из первого предположения и определения сумм следует
iTi»..., Yfc.^iKhit •••• Тл. hi
повторяя это рассуждение, получаем
(i) ГТ1- • • •» Тл. blf..., Sz]<[Tn •-.. Tft. blf...,^].
Аналогично, имеем
(и) iTl.---.Ti. «I. •••.«;] <[7i,.--.7i. ^.•••. ад.
и теорема следует из (i) и (И).]
75. Если (а')~<(а) и как а так и а' сгруппированы в убывающем
порядке, то существует наибольшее неотрицательное В, для которого
(о (Р) = (< + ». «i ««-!• «»-*)-<(«)•
Если $ имеет это максимальное значение, то
(И) («!.<) "<(Рь Рп)
й для некоторого & (1 < & < я —-1)
(Ш) (Pi,..., h) •< («i».-., Ы (Pa+1. • •.. P») ■< («A+i» • • •. an).
[Из определений следует (а), что (i) справедливо для В = О, (Ь) что
Множество значений о, для которых (i) справедливо, замкнуто,
(с) что если (i) справедливо для какого-нибудь &>0, то оно справедливо
и для всех меньших положительных значений Ь. Отсюда следует, что
максимум S существует и что для него справедливы (i) и (iij.
РАЗНЫЕ ТЕОРЕМЫ И ПРИМЕРЫ
83
Если Ь имеет это максимальное значение, то или (а) $п = ап — Ъ = О,
или
(b) ?! + .-. +^ = «i + ... +4+* = «i+ •••+«*
для некоторого &</г; ибо в противном случае мы могли бы
увеличить Ъ, не нарушая (i). В случае (а)
М—1 W tt М—1 М—1
till 1
так что Pi + ... + рл-1 = aj-j- ... -}-а>г-1' а это есть (Ь) с k = п— L
Таким образом, (Ь) справедливо и в этом случае, и (ш) следует из
определений.
Р. Радо, сообщивший нам теоремы 74 и 75, пользуется ими для
нового и изящного доказательства достаточности критерия Мюр-
хеда (теорема 45). По лемме 1 (стр. 68) результат верен для п = 2;
пусть теперь /г>2, условия (2.18.1), (2.18.2) и (2.18.3) удовлетворены,
и результат верен для любого числа переменных, меньшего, чем п.
Тогда в силу наших предположений,
WV an] <lh hh lh> • • -A ] < [«!,. . ., «A:], [ftfc+i, .. ., Ы < [Яй+l. • • м anJ.
Дважды применяя теорему 74, мы получаем
К «nl = [«i» P2.....P»-i. <1<Г?1 Ря] =
= [Pl. •••. ftfe. Ра+1» •••» М<[а1. •••• «A>aA-H»---i *я] = [«1» •••,<%]•
76. Если я>0 и г и 5 — натуральные числа, то
a1a2...ar WW
кроме того случая, когда все а равны.
[Обобщение теоремы 66. По теореме 45,
[г. г,..., (* раз), 0, 0,...,0]>[2, р..-.^].
Образовав теперь соответствующее неравенство с s вместо г и с г
вместо ^ и заменив а через 1/а, перемножим оба неравенства.]
77. Необходимым и достаточным условием для того, чтобы для всех
положительных a
Pi P2 • • - Рп -Ч. Z7! /^2 ' ' ' Рл '
84
ЭЛЕМЕНТАРНЫЕ СРЕДНИЕ ЗНАЧЕНИЯ
[ГЛ. II
где /?!,... определены, как в §2.22, и а положительны, является
выполнение неравенств
+ ... +(л — т+1)ап
для 1 <]/я-<я, с равенством для т = 1.
[Достаточность этого условия следует из теоремы 51:
необходимость может быть доказана методом §2.19(1). Дугалл [Dougall, 1]
дает доказательство для целых а, основанное на одном тождестве.
О некоторых частных случаях, как, например,
Лч + ^2 + • • • + нт ^Л^Лт • *^Vr.
см. Kritikos [1].]
78. Средние | |-, 1, О, 0,.... 01 и |-|, 1, 1, 0, .... 0|
несравнимы.
[Пример к теореме 45 и иллюстрация теоремы 48.]
79. Если а>0 и Р^ — средние арифметические [х-х корней из
произведений по ^ различных а, то
^1>Р,>...>РП,
кроме того случая, когда все а равны.
[Smith [1.440] Пример к теореме 45:
П. о, о о]>[1. 4-,о....,о]>[1, I, 1,о,....о]>....]
80. Если [l^Q n х, у, z положительны, то
х* (х —y)(x-z)+ yv- (у -z)(y — x)+ z* (z -x){z— _y) >0,
кроме того случая, когда х = у = z.
81. Если v>0, S>0 и а положительны и не все равны, то
[v + 25, 0, 0, a4,...]-2[v + 5f Ъ, 0, сс4, ... ] + [v, Ъ, I, сс4,...]>0.
[Этот результат, сообщенный нам проф. Шуром, не является
следствием из теоремы 45, но следует из теоремы 89 с у. = v/§.]
ГЛАВА III
СРЕДНИЕ ЗНАЧЕНИЯ С ПРОИЗВОЛЬНОЙ ФУНКЦИЕЙ
И ТЕОРИЯ ВЫПУКЛЫХ ФУНКЦИЙ
3.1. Определения. Средние Шг (а) и ©(а) имеют вид
(3.1.1) 2)i9H = ?-1{S??W},
где о(х) — есть, соответственно,
х\ log*,
a o~l(x) — функция, обратная v(x). Естественно рассматривать
более общие средние типа (3.1.1), образованные с
произвольной функцией ср, подчиненной некоторым условиям. Наиболее
очевидными такими условиями являются непрерывность и
строгая монотонность <р> так как в этом случае ф-1 существует и
удовлетворяет тем же условиям.
В дальнейшем нам понадобится следующая предварительная
теорема.
82. Если
(i) функция <ь(х) непрерывна и строго монотонна
в интервале И < х < AT,
(ii) Я<Ж</С (v=l,2, ..., л)
u (iii) ?v>0, 2<7v = l,
то (1) существует одно и только одно Ш в (Н, К), для
которого
(3.1.2) <р(9Я) = Е??(а)
и (2) Ж больше одних и меньше других а, если не все а
равны.
Так как ®(х) непрерывна и при возрастании х от Н до К
возрастает или убывает от <?(Н) до <?(К), а £#<?(#) лежит
между этими пределами, то существует в точности одно 9Л,
которое удовлетворяет (3.1.2). Далее,
E?{?(2R)-?(a)} = 0,
так что некоторые слагаемые этой суммы должны быть
положительны, а некоторые — отрицательны, если они не все равны
нулю. Следовательно, Ш — а иногда положительно, а иногда
отрицательно, если оно не всегда равно нулю.
Мы предположили, что ©(#) непрерывна в замкнутом
интервале (Й, К). Рассуждение остается справедливым и тогда,
86 СРЕДНИЕ ЗНАЧЕНИЯ С ПРОИЗВОЛЬНОЙ ФУНКЦИЕЙ [ГЛ. III
когда <?(х) непрерывна и строго возрастает в Н<х<К,
причем <?(х) -> — со при х ->Я и у(х) -> со при х ->/С, если
только под ?(#) и у(К) мы будем, соответственно, понимать
— со и со и считать, что 9J1 = #, если %qy(a) = — со, и Ш = К,
если Zqy(a) = со. Здесь может быть Н=—со, или /С = со;
особенно важным случаем является #=0, /С = со. В
следующем ниже определении и далее при рассмотрении свойств Ш^
мы будем предполагать, что у(х) непрерывна и строго
монотонна в замкнутом интервале, или ведет себя только что
указанным образом.
Мы пишем *)
2tf9 = 3)t9(a) = 9й9(а, q) = <rl[Zq<f(a)} =
(3.1.3) =<?-1{Ш?(а)}}.
Веса q — произвольные положительные числа с суммой
равной единице, и когда мы сравниваем два средних, мы
предполагаем, что они образованы с одной и той же системой весов.
В случаях 9 (х) = х, log x и дсг, 9JL сводится, соответственно,
к %, © и Шг.
3.2. Эквивалентные средние. Среднее ЗГО9 определено,
если задана функция <р- Возникает естественный вопрос,
справедливо ли обратное предложение: если 9№ф = ЭД£у для всех
а и q, то следует ли отсюда, что ^ тождественно с у? Ответ
на этот вопрос дает следующая теорема.
832). Необходимым и достаточным условием равенства
(3.2.1) Щ(а) = Ща)
для всех а и q является условие
(3.2.2) Х = «Ф + Р,
где а и $ — постоянные и а Ф 0.
При доказательстве мы предполагаем, что ty и ^ непрерывны
в Н^х^К. Нетрудно убедиться, что оно применимо (с три-
*) В настоящей главе мы даем прямое (конструктивное)
определение ЭД1ф и выводим его свойства из определения. В гл. VI
(§§ 6.19—6.22) мы покажем, как ЭД1ф может быть определено
„аксиоматически", т. е. предписанием его характеристических свойств.
2) Knopp [2J, Jessen [2].
3.2]
ЭКВИВАЛЕНТНЫЕ СРЕДНИЕ
87
виальными изменениями) и в других допускаемых нами случаях
(§ 3.1). Мы в действительности докажем больше, чем
утверждается в теореме, а именно, что (3.2.2) является достаточным
условием для справедливости (3.2.1) для всех а и q и что
оно является необходимым условием для того, чтобы (3.2.1)
имело место для всех последовательностей из двух переменных
и весов. Ниже, в § 3.7, мы докажем еще больше, а именно,
что (3.2.2) необходимо для справедливости (3.2.1) для всех
последовательностей из двух переменных и данной системы
весов.
(i) Если выполняется условие (3.2.2), то
X {Ща)} = Е?Х(«) = S<7{«<Ka) + P1 = «№(«)} + Р =
и, следовательно, ЗГОу= Ш^. Таким образом, условие достаточно.
(ii) Для доказательства необходимости условия мы
предположим только, что (3.2.1) имеет место для всех
последовательностей из двух переменных и двух весов.
В (3.2.1) положим
п = 2, ах=Н> а2 = К, qx = £Z*H > Яъ= *K~ZH >
где H<t<K. Тогда
(3,2.3) ф-1{-^ф(/0 + ^=^фЦ =
для Н <£< /С, это также верно для t = H и t = K. Если мы
обозначим через х общее значение левой и правой части, то
когда t изменяется от И до К% х принимает все значения
из интервала (Н, К) и
-f^F «"> + Т=ТТ W = «*>•
88 средние значения с произвольной функцией [гл. ш
где а и р не зависят от х. Отсюда
*=х"1К(*) + Р}
для всех х в (Я, ДГ), что совпадает с (3.2.2). Таким образом,
теорема 83 доказана.
Вот одно следствие из теоремы 83, которое иногда
оказывается полезным. Так как —о является линейной функцией отер
и —ср возрастает, когда <р убывает, то мы всегда можем, при
желании, предполагать, что <р в Ш^(х) является функцией
возрастающей.
Теорема 83 дает нам также возможность объяснить, почему,
несмотря на иное определение, естественно включить 9Ло = ® в число
средних ffir гл. II. Так как
1
есть линейная функция от хг для гфО, то, по теореме 83,
Это равенство остается справедливым и для г = О, ибо 4q(x) = lim —— =
r->o r
= log x.
3.3. Одно характеристическое свойство средних 9№г.
Естественно возникает вопрос, обладают ли средние гл. II каким-
нибудь простым свойством, выделяющим их среди более общих
средних, рассматриваемых в настоящей главе.
84!). Пусть <р(л') непрерывна в открытом интервале (0, со)
и пусть
(3.3.1) Щка) = к%(а)
для всех положительных a, q и k. Тогда Шу{а) = Шг(а)-
Другими словами, средние Т1Г являются единственными
однородными средними Шу.
Естественно, что (3.3.1) не влечет ср = л;г (или logх); ибо,
согласно теореме 83, мы можем заменить <р через аср-|-|3, не
меняя Шг
Очевидно, что (3.3.1) справедливо, когда <э = хг или log .г.
Предположим теперь, что равенство (3.3.1) имеет место, и
выведем из него вид функции о. В силу теоремы 83 мы можем
предположить, что
(3.3.2) ?(1)=0,
V Nagumo [1], de Finetti [1], Jessen [4]. Приведенный в тексте книги
простой вариант доказательства де Финетти был сообщен нам Иессеном.
3.3] ОДНО ХАРАКТЕРИСТИЧЕСКОЕ СВОЙСТВО СРЕДНИХ 89
так как мы можем заменить &(х) на ®(х)— <?0)*
Перепишем (3.3.1) в виде
2»9(а)= к~Щ19(ка) = А"1?"1 {!??(*«)} = Ща),
где б(^) = <p(kx).
Из теоремы 83 *) следует, что
(3.3.3) y{kx) = a(k) <р(лг) + р (А),
где a(k) и Р(А) — функции от k, и а(&)=^0; а из (3.3.2) и
(3.3.3), —что
(3.3.4) ?(£) = Р(£).
Подставляя теперь значение [3(£) в (3.3.3) и заменяя k на
j/, найдем, что
(3.3.5) ср (*у) = «(у) <?(х) -+- <р00
для всех положительных х и у.
Аналогично,
(3.3.6) <р (*у) = а(х)<?(у) + ?(*);
и формулы (3.3.5) и (3.3.6) дают:
а(Х) - 1 ^ g(jf) - 1 2)
<Р(*) <РО0
Отсюда следует, что каждая из этих функций равна
постоянной с, так что а 00 = 1 -\- су (у). Из (3.3.5) вытекает теперь,
что
(3.3.7) <?(ху) = с®(х)и(у) -\- <?(х) -\-и(у).
При рассмотрении этого функционального уравнения мы
различаем два случая:
(1) с=0; тогда (3.3.7) сводится к классическому уравнению
?(*у) = ?(*) +?00-
2) Если бы мы применили одну из более точных форм теоремы 83,
упомянутых вслед за ее формулировкой в § 3.2 то мы получили бы
более точную форму теоремы 84, в которой однородность
предполагалась бы только для ограниченных классов переменных и весов.
2) Если только хФ\ и уФ\, однако (3.3.7), очевидно, справедливо
н для этих значений х и у, т. е. это ограничение несущественно.
90 СРЕДНИЕ ЗНАЧЕНИЯ С ПРОИЗВОЛЬНОЙ ФУНКЦИЕЙ [ГЛ. III
Наиболее общим решением, непрерывным для х > 0, является1)
ср = с log х.
(2) с ф 0; положим
Тогда (3.3.7) сведется к уравнению
f(xy)=f(x)f(y),
общим решением которого является f(x) = xr. Отсюда
у(х) = с~1(хг — 1).
3.4. Сравнимость. Наши общие замечания о „сравнимости"
функций от а (§ 1.6) приводят нас к следующему вопросу:
Пусть даны две функции ф и у, непрерывные и строго
монотонные в {Н, К)\ будут ли тогда сравнимы средние Ш^ и ЭД?у,
т. £. справедливо ли неравенство
(3.4.1) 2^<2КХ
(или обратное ему) для всех а и q? Если ф и у —
степенные функции, теорема 16 говорит нам, чго ответ на этот во-
прос положителен.
Положим УЛ^'Ч*)} = ?(*)•
Тогда о (х) непрерывна и строго монотонна, так что
существует обратная функция <р-1 = <1^-1. Положим также
х = ^(а), а = ^'1(х).
Тогда х—произвольные числа между ^(#) и <J>(/C), и (3.4.1)
примет вид
(3.4.2) ?№)<S??W
(для всех q), если ^ — возрастающая функция; если же у
убывает, то (3.4.1) сведется к (3.4.2) с обратным знаком
неравенства. Таким образом мы получим теорему
85. Если ф и у — непрерывные и строго монотонные функ*
ции> то для того, чтобы Ш^ и Wly были сравнимы у необходимо
a Cauchy [1,103—105].
3.5]
ВЫПУКЛЫЕ ФУНКЦИИ
91
и достаточно, чтобы функция <? = 7^"~1 удовлетворяла
неравенству (3.4.2) или обратному неравенству.
В дальнейшем мы подробно изучим класс функций ©, для
которых имеет место (3.4.2).
Для любых весов (3.4.2) принимает вид
(3.4.3) *(%г)<
2/>
3.5. Выпуклые функции. Функция ср из § 3.4, будучи
монотонной функцией от монотонной функции, сама монотонна; но
теперь мы рассматриваем функции <р, подчиненные только (3.4.2).
Простейшим случаем неравенства (3.4.2) является
(3.5.1) ?№)<
Функция, удовлетворяющая (3.4.2), удовлетворяет и (3.5.1), но
класс функций, удовлетворяющих (3.5.1), шире. Однако мы
покажем, что эти два неравенства эквивалентны для функций,
удовлетворяющих некоторым, не очень ограничительным,
условиям.
Функция, удовлетворяющая (3.5.1) в некотором интервале,
называется выпуклой в этом интервале. Если —<р выпукла,
ср называется вогнутой. Мы можем также определить выпуклость
и вогнутость в открытом интервале. Часто бывает удобно
допускать бесконечные значения на концах интервала; ясно, что
такие значения должны быть положительны для выпуклых и
отрицательны для вогнутых функций.
Основы теории выпуклых функций были даны Иенсеном
[Jensen^]1). Геометрически (3.5.1) выражает, что середина
любой хорды кривой у = <р (х) лежит над этой кривой или на
ней; под кривой здесь следует понимать любой, не обязательно
непрерывный, график. Неравенство
(3.5.2) ср (qlXl + q2x2) < ^«pfo) + <72?(*2)
(для всех q) выражает, что вся хорда лежит над кривой или на ней,
а общее неравенство (3.4.2) утверждает то же самое
относительно центра тяжести любого числа произвольно взвешенных
точек. Геометрически очевидно, что если кривая непрерывна,
*) Хотя Гельдер [Holder, 1] рассматривал неравенство (ЗА.2) еще
до Иенсена.
92 СРЕДНИЕ ЗНАЧЕНИЯ С ПРОИЗВОЛЬНОЙ ФУНКЦИЕЙ [ГЛ. III
то из самого слабого условия (3.5.1) следует и более сильное,
и мы увидим, что из наших рассмотрений будет вытекать
гораздо больше. Мы могли бы взять (3.4.2) или (3.5.2) за наше
определение выпуклости, но мы следуем Иенсену и начинаем
с самого слабого определения. Наиболее естественными
определениями являются, пожалуй, (3.5.2) и еще одно определение,
которому будет посвящен § 3.19. Возможно более слабые
предположения представляют некоторый логический интерес.
Иногда полезно иметь определение выпуклости или вогнутости
конечной или счетной последовательности чисел. Мы будем говорить,
что последовательность ah ..., ап выпукла, если
20v<tfv_i + tfvfl (v = 2, 3, ..., п — 1),
т. е. если вторые разности неотрицательны.
Так, теорема 51 (в менее точной форме с „<") утверждает, что
последовательность log/? вогнута; полная теорема говорит, что log/?
строго вогнута (см. § 3.8), если не все а равны. Когда два
произведения степеней от р сравнимы, неравенство, связывающее их, может
быть выведено (в основном аналогично тому, как теорема 52 была
выведена из теоремы 51) из вогнутости log р. Это является ядром
теоремы 77.
3.6. Непрерывные выпуклые функции. Перейдем теперь
к исследованию простейшего случая, когда (3.4.2) и (3.5.1)
эквивалентны.
Если ®(х) удовлетворяет условию (3.5.1), мы имеем
< ? (*i) + ? (*s) + ? Оз) + ? (*«)
и т. д. Таким образом мы докажем, что
(3.6.1) ? (** + -+*») < I {<р (Xl) + ... + <р (*„)}
для специальной последовательности значений я, а именно п = 2т.
Для того чтобы доказать справедливость неравенства (3.6.1) в
общем случае, достаточно еще доказать, что если оно имеет место
для я, оно также имеет место для п — 1 !). Допустим, что (3.6.1)
доказано для п чисел и что хи х9, ..., хп* даны. Взяв
*) Здесь мы следуем рассуждению в § 2.6 (ii). Доказательство,
более тесно следующее рассуждению Коши, дано у Иенсена [Jensen, 2].
3.7]
ДРУГОЕ ОПРЕДЕЛЕНИЕ
93
в качестве хп среднее арифметическое 51 (с одинаковыми
весами) этих п — 1 числа и применяя (3.6.1), мы получим
? (Я) = ?|(*-1Щ + %| = 7^i+^+--+^n-i + g|<:
9{Xl) + ?(*,) + .. . + cp(^n-l) + У(ЭД)
и, следовательно,
?(*i) + ?W + - - - + y(*n-i)
?(%)<■
/i—1
т. е. неравенство (3.6.1) с п — 1 вместо п. Таким образом,
(3.6.1) справедливо для всех п.
Далее, предполагая, что в (3.6.1) лоы образуют надлежащим
образом выбранные группы равных чисел, мы получаем (3.4.2)
для любых соизмеримых q.
Наконец, если функция ®(х) непрерывна, мы можем доказать
(3.4.2) для всех #, ибо, если q несоизмеримы, мы можем их
заменить соизмеримыми приближениями и перейти к пределу.
Таким образом получим
86. Любая непрерывная выпуклая функция удовлетворяет
условию (3.4.2).
В качестве приложения рассмотрим теорему 17. Если s =
= "о" (г Н~ 0> имеем, по теореме 7,
или
{Ш88(а)}2=Шгг(а)Ж1(а),
или
log2K>)< ±-{log 3Rj(e) + log 2ГС*Ц •
Другими словами
87. log2ft£(a) = rlog2ftr(a) является выпуклой функцией
от г.
Отсюда, используя теорему 86 (или повторяя рассуждение,
которым эта теорема была доказана), мы получаем теорему 17
(кроме определения случаев равенства).
3.7. Другое определение1). В § 3.5 мы определили выпуклую
функцию <?(х) тем, что середина любой хорды кривой у = у(х)
й М. Riesz [1], Jessen [2].
94 средние значения с произвольной функцией [гл. ш
лежит над этой кривой или на ней. Рисе и Иессен заметили
интересный и иногда важный в приложениях факт*), что если
<р (х) непрерывна, то достаточно потребовать, чтобы какая-
нибудь точка хорды лежала над кривой или на ней.
88. Если ср (х) непрерывна, и на каждой хорде кривой
у = <? (х) существует по крайней мере одна точка {отличная,
от концов хорды), лежащая над кривой или на ней, то
каждая точка каждой хорды лежит над кривой или на ней,
так что <р (х) выпукла.
Пусть PQ—хорда и R— точка на ней, лежащая под
кривой. Тогда существует последняя точка S на PR и первая
точка Т на RQ, в которых кривая пересекает хорду; S может
совпадать с Р и Т может совпадать с Q. Но хорда ST лежит
целиком под кривой, а это противоречит условию теоремы.
Это замечание дает нам новое доказательство теоремы 86.
Если ®(х) выпукла, середина каждой хорды лежит над кривой
или на ней. Следовательно, как мы доказали, каждая точка
хорды лежит над кривой или на ней, т. е.
?(?1*1 + Я*Ч) < <7l?Ol) + ?*?(*&
если q1>0, #2>0> <7iH-<72 = l> a B остальном qx и
^произвольны.
Далее рассуждаем по индукции. Если qt -\- q2-\- qs = 1, то
(3.7.1) yfrrt+ftSa+g»^
<Л?(^1) + (Л+98)T(^+P)<,
= ?i¥(*i) + <72?(*2) + WP(*a)
и т.д.
Следствием теоремы 88 является теорема
89. Если <р(лг) непрерывна и если каждая хорда кривой
у =<?(х) пересекает кривую в точке, отличной от ее концов,
то ®{х) —линейная функция.
По теореме 88 каждая точка каждой хорды лежит над кривой
или на ней. Но теорема 88 остается в силе, если „над"
^ См., например, § 8.13.
3.8] СЛУЧАИ РАВЕНСТВА В ОСНОВНЫХ НЕРАВЕНСТВАХ 9 5
заменить на „под" в условии и в утверждении. Поэтому каждая
хорда кривой совпадает с кривой.
Из теоремы 89 можно вывести уточнение теоремы 83,
упомянутое в § 3.2. Пусть
*"1{flri*(flri) + 9ra*(ea)}=X"1{?iX(ei) + ?aX(fla)}
для фиксированных дх и д2 и произвольных а. Полагая у^~1 = <р,
ф(а) = лг, а= ^"1(х), мы получаем
?(?Л + <7а*а) = <7i?Oi) + ?a?(*a),
так что, по крайней мере, одна точка каждой хорды кривой
лежит на кривой. Тогда по теореме 89 следует, что <р —
линейная функция.
3.8. Случаи равенства в основных неравенствах. Мы
предполагаем теперь, что <?(х) непрерывна и выпукла;
рассмотрим, когда может иметь место равенство в (3.5.1), (3.5.2)
или (3.4.2).
Предположим, что хг < х% < х2} что д:3 = дххх -\- д2х2 и
что Pv Р2, • • • —точки на кривой j/=<p(jc), соответствующие
xv x2i ... . Если <?(х) не линейна в интервале (xv х2), то в
этом интервале найдется такая точка хА, что РА лежит под
отрезком РХР2. Допустим, например, что л*4 лежит в (xv хъ).
Тогда хь лежит в (лг4, х2) и Р3 лежит под РАР2 или на этом
отрезке, а, следовательно, под РХР%. Следовательно, в (3.5.2)
имеет место знак неравенства. Отсюда следует, что равенство
может иметь место в (3.5.2) только тогда, когда у(х)
линейна в (xv х2).
Этот вывод легко распространить на общее неравенство
(3.4.2). Допустим, например, что равенство имеет место
при й = 3 и что xt < х2 < хь. Тогда все знаки неравенства
в (3.7.1) должны свестись к равенству и у(х) должна быть
линейна в каждом из интервалов
/ ?2*2+03*3 \ ( v
Г1' Я* + Я* Г <**'*8>'
а, следовательно, и в (xv л:3).
Мы, таким образом, доказали теорему
90. Если ®(х) непрерывна и выпукла, то
(3.8.1)
?(Е?*)<Е ??(*),
96 СРЕДНИЕ ЗНАЧЕНИЯ С ПРОИЗВОЛЬНОЙ ФУНКЦИЕЙ [ГЛ. III
/о « 9ч J^PX\ ^ ЯР'*(*)
(3.8.2) ,(__)<__,
кроме тех случаев, когда либо (i) все х равны, либо (и) у(х)
линейна в некотором интервале, содержащем все х.
91. Любая хорда непрерывной выпуклой кривой, за
исключением ее концов, лежит целиком над кривой, или
совпадает с ней.
Мы говорим, что о(х) строго выпукла, если
(3.8.3) ?(^+iL)<|{?(x) + ?(y)}
для каждой пары х, у, хфу. Так как строго выпуклая
функция не может быть линейной ни в каком интервале, такая
функция, если она непрерывна, удовлетворяет условиям (3.8.1)
и (3.8.2), если не все х равны.
3.9. Новая формулировка и обобщение теоремы 85 *). Мы
можем теперь придать теореме 85 следующую форму:
92. Если ty и у — непрерывные и строго монотонные
функции и у возрастает, то для того чтобы Tt^ ^ Шу для
всех а и q, необходимо и достаточно, чтобы функция
<р = уф-1 была выпуклой 2).
При выполнении условий этой теоремы будем говорить, что
yw выпукла относительно ф. Так, t8 выпукла относительно tr,
если s ^ г>0.
Кривая у = ср (*) имеет параметрическое представление
Хорда, проходящая через точки кривой, соответствующие t = tx
и t = t2, имеет уравнение
где
является функцией вида
«Ф(') + Р.
D Jessen [2, 3].
2) Что касается необходимости условия, то мы доказали в
действительности больше: см. замечания к теореме 83.
3.10] ДВАЖДЫ ДИФФЕРЕНЦИРУЕМЫЕ ВЫПУКЛЫЕ ФУНКЦИИ 97
принимающей значения x(^i) и Х(4) для t = h и t=t& Мы
можем назвать y=ty*(x) ^-хордой кривой у=-£(х). Для
того чтобы функция х была выпукла относительно ф,
необходимо и достаточно, чтобы х^^*> т- е- чтобы каждая точка
^-хорды кривой 1 лежала над кривой или на ней.
Теорема 92 может быть обобщена на случай нескольких
переменных. Пусть
будет функцией от т переменных vx, v2, ..., vw, и пусть
2R> ... Wl]2Wl4(a)
будет результатом последовательного образования средних по
Vi, v2, ..., vm. Имеет место следующая теорема.
93. Пусть ^ и ^— непрерывные и строго монотонные
функции, и пусть все ^ являются возрастающими
функциями. Тогда для того чтобы
для всех а и q, необходимо и достаточно, чтобы каждая ^
была выпукла относительно соответствующей ф .
При этом, конечно, подразумевается, что веса, входящие в ЗИ^
и Ttx , одинаковы, хотя они могут быть различными для
различных [а. То, что условия достаточны, следует из теоремы 92.
Для доказательства их необходимости достаточно предположить а
функцией одного v .
ЗЛО. Дважды дифференцируемые выпуклые функции.
Мы отложим до §3.18 дальнейшее изучение общих свойств
выпуклых функций и рассмотрим здесь один особенно важный
подкласс этих функций, а именно, функции, имеющие вторую
производную.
94. Предположим, что ®(х) имеет вторую
производную ?"(*) в открытом интервале (Я, К). Тогда необходимым
и достаточным условием выпуклости у{х) в этом интервале
является неравенство
(3.10.1) <?"(*) >0Х).
*) В приложениях важным случаем является тот, когда <р" существует
в открытом интервале (как в теореме). Однако, обычно желательно
98 средние значения с произвольной функцией [гл. ш
(i) Условие необходимо. Заменяя в (3.5.1) Мх-\-у)и -^(х—у)
через / и /г, и предполагая, что х>уу т.е. что /г>0, мы
получаем
(3.10.2) ср (* + h) + <?(t -h)- 2?(0 > 0
для всех /, /г, таких, что аргументы лежат в интервале (Я, К).
Предположим теперь, что <р"(0 < °- Тогда существуют
положительные числа 8 и /г, такие, что,
?'(* + «) — ?'('—«X —8"
для 0 < и -^ h. Интегрируя это неравенство от и = 0 до u = h,
мы получаем
?('+А)+?(<-*)-2? (0<--j8Aa>
что противоречит неравенству (3.10.2).
(И) Условие достаточно. Докажем, что ср удовлетворяет
условию (3.4.2). Действительно, если Х = %дх, то мы имеем
<р (*,) = ср (X) + (*, - Л) <?'(*) + -^ - Х? *"&)
для некоторого Ev между X и jcv и, таким образом,
S??(*)>?(*) = ?(E?*).
Если 9"(Л0>0> равенство может иметь место только в том
случае, когда каждое х^=Х. Таким образом мы доказали
951). Если ®"(х) > 0, то <?(х) строго выпукла и, если не
все х равны, удовлетворяются неравенства (3.8.1) и (3.8.2).
3.11. Приложения свойств дважды дифференцируемых
выпуклых функций. Следующая теорема, вытекающая из
теорем 95 и 85 2\ особенно полезна в приложениях.
утверждать выпуклость в замкнутом интервале. Так как ср" ^> 0»
ср' и ср монотонны вблизи концов интервала и стремятся к конечным
или бесконечным пределам; ср' может стремиться к —оо в левом конце
и к + оо в правом, и ср может стремиться к +оо в каждом конце.
Функция будет выпуклой в замкнутом интервале, если ее значение
в каждом конце не меньше ее предела в этом конце.
1) Holder[l].
2> Точнее, из теоремы 95 и доказательства теоремы 85. По теореме 95
(3.4.2) справедливо со знаком неравенства, и, таким образом, Wly < Wlt,
если не все а равны.
3.11]
ПРИЛОЖЕНИЯ ВЫПУКЛЫХ ФУНКЦИЙ
99
96. Если <|> и у монотонны, у возрастает, ср = у^~1 и ©" > О,
то Ш^ < 9№у, если не все а равны.
Примеры.' (1) Если ^ = log л*, х=л'> то <р =х<1'~1 =*я?-
Теорема 96 сводится к теореме 9.
(2) Если ty = xry y = xs, где 0<г<О, то © = *s/r, ср" > 0.
Теорема 96 дает теорему 16 (для положительных показателей).
Другие случаи теоремы 16 могут быть выведены подобным же
образом.
(3) Пусть <р = хк, где А не 0 и не 1. Тогда ср выпукла
в (0, со), если &<0 или А>1, и вогнута, если 0<&<1.
Предположим, что &> 1; применяя теорему 95, мы находим, что
ЪЯх<{ЪЯхку!к
или
Zpx<(Zpxk)lfk(Zp)1/k\
если не все х равны. Полагая рх = ab, рхк = ак> мы получаем
теорему 13 для А>1. В других случаях получаются аналогичные
результаты.
(4) Пусть ср = log (1 + ех\ так что
?"W = (IW>°-
и пусть абсциссы и веса в (3.8.1) будут соответственно log — ,
CL\
logjr,... и a, |3,... . Мы получаем
ajftg ... l\ + a\b\ ■ ■ ■ l\ < (a, + a,)« (\ + £2)? .. . (I, + /2)\
кроме того случая, когда — = ^ = ... (теорема 40: Я для
любого числа последовательностей из двух чисел).
(5) Пусть ср = (1 -|- xryir, где г не 0 и не 1, и пусть
абсциссы и веса в (3.8.2) будут ~, тг,... и аъ Ьи... . В дан-
Ui t?[
ном случае ср выпукла для г>1 и вогнута для г< 1. Мы
находим, например, что
{(а1 + *1+ ... + /,)" + (*, + *2+ ... + lj}1/r<
< К+<)1/г+(*Г+*gVr+... + (4 + Ф1".
100 СРЕДНИЕ ЗНАЧЕНИЯ С ПРОИЗВОЛЬНОЙ ФУНКЦИЕЙ [ГЛ. III
если г>1 и —, -т^, ... не все равны (теорема М для
любого числа последовательностей из двух чисел). Напомним, что
теоремы Н и М могут быть по индукции распространены на
последовательности, состоящие из любого количества чисел.
(6). 97. Если а>0, р>0, то
Mp(J^i)<^<exp(^Mf.),
если не все а равны.
Из соображений симметрии мы сформулировали эту теорему
с р вместо д. Первое неравенство — это обращенное
неравенство (3.8.2) с <? = logx, являющейся вогнутой функцией; оно
эквивалентно G (теорема 9). Второе неравенство — это (3.8.2)
с ® = x\ogx, являющейся выпуклой функцией.
3.12. Выпуклые функции от нескольких переменных.
Пусть D — выпуклая область в плоскости (х, у)> т. е.
область, содержащая целиком отрезок прямой, соединяющий
какие-либо две из ее точек1). Функция Ф(лг, у) называется
выпуклой в Д если она всюду определена в D, и
(3.12.1) ф(^1^,У1±У1)<1{Ф(х1,у1) + ф(Х2,у2)}
для всех (хи у{) и (x2> Уъ) из £*2)- Это определение
утверждает больше, чем выпуклость отдельно относительно х и
относительно у; так, ху является выпуклой функцией от х для
каждого у и выпуклой функцией от у для каждого х, но не
является выпуклой функцией от х и у.
!) Было бы достаточно рассматривать прямоугольные области,
но естественным ограничением, которое должно быть наложено на D,
является выпуклость. Рассмотрение вопросов о структуре выпуклых
или общих областей не входит в нашу задачу.
2) Существует более широкое обобщение понятия выпуклой
функции от одного переменного, важное в теории функций, но которое
мы здесь не будем рассматривать. Функция Ф (х, у) называется
субгармонической, если ее значение в центре любого круга не
превосходит ее среднего значения на окружности. В частности, Ф будет
субгармонической функцией, если она дважды дифференцируема и
У2ф = Фа7а7+Ф2/2/>0.
О теории субгармонических функций см. F. Riesz [5, 9], Montel [l]
и Привалов [1].
3.12] ВЫПУКЛЫЕ ФУНКЦИИ ОТ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ Ю1
Часто бывает удобно пользоваться другой формой
приведенного определения. Допустим, что х, у, и, v заданы, и рассмотрим
такие значения t (если они вообще существуют), для которых
(x-\-ut, у -\- vt) принадлежит к D. Так как D выпукла, то эти
значения t заполняют интервал (который может быть нулевым).
Тогда мы говорим, что Ф (х, у) выпукла в £>, если
(3.12.2) x(t) = Ф(х + ut, у + vt)
является для каждых х, у, и, v выпуклой функцией от t
в означенном интервале. Это определение эквивалентно
предыдущему, так как если
x-\-ut1=xi> y-\-vt1=y1, x-\-ut2=x2) y-\-vt2=y^
то (3.12.1) принимает вид
х(Ч^)<5<Ж) + х('9)}-
Ф называется вогнутой, если — Ф выпукла.
Если z = Ф (х, у) есть уравнение поверхности в
прямоугольных декартовых координатах, то (3.12.1) утверждает, что
середина любой хорды поверхности лежит над соответствующей
точкой поверхности, или совпадает с ней. Если поверхность
непрерывна, мы можем вывести, что вся хорда лежит над
поверхностью или на поверхности и что это же утверждение
справедливо относительно центра тяжести любого числа
произвольно взвешенных точек поверхности. Это составляет
утверждение следующей теоремы.
98, Если Ф(х9у) выпукла и непрерывна, то
(3.12.3) Ф(2<7*, lqy)<Zq*>(xfy).
Доказательство то же, что и для теоремы 86, если не считать
очевидных изменений в обозначениях.
Имеет место также теорема, соответствующая теореме 88;
достаточно утверждать, что ни одна хорда поверхности не лежит
(за вычетом ее концов) целиком под поверхностью. Все
другие замечания § 3.7 остаются (с очевидными изменениями)
также справедливыми.
Следующая теорема соответствует теоремам 94 и 95.
99. Если Ф(х, у) дважды дифференцируема в открытой
области Д то необходимым и достаточным условием для
102 СРЕДНИЕ ЗНАЧЕНИЯ С ПРОИЗВОЛЬНОЙ ФУНКЦИЕЙ [ГЛ.III
выпуклости Ф в D является положительность ^
квадратичной формы
<2 = ®ххи*+2Фхуиу + Фу^
для любых и, v и всех (х, у) из D.
Если Q строго положительна®, то в (3.12.3) имеет место
знак неравенства, кроме того случая, когда все х и у равны.
(1) Условие необходимо. Если (х, у) лежит в Z), то функция
y(t), определенная уравнением (3.12.2), выпукла в окрестности
/=0. Следовательно, по теореме 94, %"^>0, т. е. Q>-0.
(2) Условие достаточно. Если
2? = 1, X = %qx, Y=%qy,
то
+ \{(х,-Х)Чхх^2(х,-Х)(ун-У)Ф1у + (у,-У)Ч1У}9
где индекс 0 обозначает точку (X, Y), а индекс
1—некоторую точку отрезка, соединяющего эту точку с точкой (xv,
последовательно,
ЪяФ{х,у)>Ф{Х,У) = Ф{Ъях,Ъду).
Если Q строго положительна и имеет место знак равенства,
то xv = X, у., = Y для всех v.
Заметим, что форма Q положительна тогда и только тогда,
когда
(3.12.4) Ф^>0, Фуу>0, Фа?а?Ф2/2/-Ф2^>0,
и строго положительна тогда и только тогда, когда
(3.12.5) фхх > 0, Фуу > 0, ФХХФУУ- &ху > 0.
Она отрицательна, если имеют место третье неравенство (3.12.4)
и неравенства, обратные первым двум неравенствам (3.12.4).
Обобщение определений и теорем этого параграфа на
функции от более чем двух переменных может быть предоставлено
читателю.
$ Q > 0 для всех ut v.
2) Q>0 для ифО, уфО.
3.13]
ОБОБЩЕНИЯ НЕРАВЕНСТВА ГЕЛЬДЕРА
103
3.13. Обобщения неравенства Гельдера. Неравенство
Гельдера можно записать в следующей форме:
(3.13.1) %(ab)<,mF(a)TtG(b)
или
(3.13.2) S^</7-1{S^(a)}G~1{S^G(*)},
где F(x) =xr(r > 1) и G(x)=xr\ причем г' — число,
сопряженное с г в смысле § 2.8. Полагая <р = Z7"1, ф = G"1, F(a) = х,
О (Ь) =у, а = <? (х)у b = ф (.у), получаем
(злз.з) £??(*)ФО0<?(£?*Ж££У).
Простейшим случаем этого неравенства будет
| {? (*t) Ф (л)+т (*>) Ф 02)} < т {|(*i + *я)} Ф {|Oi +л)};
оно показывает, что функция <р(х)ФО0 является вогнутой
функцией от л: и у. Когда, как в данном случае, <р и ф
непрерывны, последнее неравенство эквивалентно более общему
неравенству (3.13.3). Следовательно, обращая рассуждение (с
произвольными <р и ф), получаем
100. Если F и G непрерывны и строго монотонны, то для
того чтобы %{ab) и TIf (#) 3Rg (b) были сравнимы,
необходимо и достаточно, чтобы Р-1(л:) 0~г(у) была вогнутой
или выпуклой функцией от двух переменных х и у; в пер-
вом случае имеет место (3.13.1), во втором — неравенство,
ему обратное.
Приведем пример. Пусть F (х) = xry G (у) = ys. Тогда из
теорем 100 и 99 следует, что
%(аЬ)<С$1г(а)Ж8(Ь)у
еслиг>1, 5>1 и (г — l)(s —1)> 1. Если г<1, $<1,
(1 — г) (1 — s) ^ 1, то имеет место обратное неравенство.
Эти случаи являются единственными случаями сравнимости 1).
Не вошедшие в рассмотрение случаи г = 0 и s = 0 могут быть
включены, если взять показательную функцию вместо степенной.
х) См. теорему 44.
104 СРЕДНИЕ ЗНАЧЕНИЯ С ПРОИЗВОЛЬНОЙ ФУНКЦИЕЙ [ГЛ.III
Мы могли бы искать более прямых обобщений неравенства
Гельдера. Неравенство Гельдера утверждает, что (3.13.1) имеет
место, или f(x) и g(x) — взаимно-обратные положительные
степени х и либо
(a) F(x) = xf(x), G{x) = xg{x),
либо
X х
(b) F{x)=lf{t)dt, Q{x)=\g{t)dt.
о о
Можно было бы ожидать, что (3.13.1) останется справедливым
для каких-нибудь других пар взаимно-обратных fug.
Следующая теорема показывает, что такое обобщение невозможно.
101. Предположим, что f(x) — непрерывная и строго
возрастающая функция^ обращающаяся в нуль при х = 0, и
что f"(x) существует и непрерывна для х>0; пусть g(x)
— функция, обратная f(x) (и, следовательно, обладающая
теми же свойствами). Предположим далее, что F(x) и G(x)
определены как в (а) или (Ь) и что (3.13.1) имеет место для
всех положительных а, Ь, Тогда f является степенью х и
(3.13.1) сводится к неравенству Гельдера.
Рассмотрим случай (а)1). Если мы обозначим F"1 и G~l
через ср и ф, то, как в доказательстве теоремы 100, <?(х)^(у)
должна быть вогнутой функцией от х и у. Из теоремы 99
и (3.12.4)2) следует, что <р" < 0, ф" <0 и
(3.13.4) {?'(*) Ф'О01я < ?(*Ж.У)?''(*) ПУ)
для всех положительных х и у.
Если <р(х) = и, ty(x)=v, то
— t'(f)-°G). f-«*>-*
а, следовательно,
(3.13.5) y(x)*t(x) = x.
Отсюда
ф"(*) ф (*) + 2cp'(x) ф'(*) + ?(*Ж (*) = О»
^ О случае (Ь) см. Cooper [4].
2) С надлежащими изменениями знаков.
3.14] НЕКОТОРЫЕ ТЕОРЕМЫ О МОНОТОННЫХ ФУНКЦИЯХ Ю5
а значит, по (3.13.4),
причем все аргументы равны лг. Это возможно только в том
случае, когда
<р/7ф = <рф" = — <ру, ср"ф -+- <р'ф' = О,
т.е. когда ср'ф постоянна. Отсюда, по (3.13.5), лгср'ср постоянна,
т.е. (р и другие функции являются степенями х.
3.14. Некоторые теоремы о монотонных функциях.
Докажем здесь несколько простых теорем, которые будут полезны
в дальнейшем. Первая из них характеризует монотонную
функцию, как (3.4.2) характеризует непрерывную выпуклую
функцию.
102 *). Для того чтобы для всех положительных х и р
выполнялось неравенство
(3.14.1) (£/?)?(£*) <£р?(лг),
необходимо и достаточно, чтобы ®(х) была функцией,
убывающей в широком смысле для х > 0. Обратное неравенство
характеризует возрастающие функции.
Если <р (х) — строго убывающая функция и число х-ов
больше единицы, то имеет место строгое неравенство.
(i) Если <р убывает, <р(£лг) ^ ?(#)> откуда следует (3.14.1).
(п) Если принять в (3.14.1) я = 2, хг = х, x%=h,px=\,
р2 = р, то получится неравенство
(l+p)?(x+A)<?W+MA).
Устремляя р к нулю, мы видим, что <р(л; + /*)<] ?(*)•
Случай у(х) = х*-1 (0<а<1), р=х дает теорему 19.
103. Для того чтобы для всех положительных х
выполнялось неравенство
(3.14.2) /(£*)<£/(*),
достаточно, чтобы х~г/(х) была убывающей функцией. Если
x~xf(x) строго убывающая функция и число х-ов больше
единицы, то имеет место строгое неравенство.
^ Jensen [2]. Иенсен не говорит о необходимости этого условия.
106 СРЕДНИЕ ЗНАЧЕНИЯ С ПРОИЗВОЛЬНОЙ ФУНКЦИЕЙ [ГЛ. III
В самом деле, если мы положим f(x) = х<?(х), то (3.14.2)
сведется к (3.14.1) с р = х. Условие не необходимо, так как
(3.14.2) удовлетворено для всякой f(x), для которой
f(x) > 0, тах/(л;) < 2 minf(x),
например, для f(x) = 3 -+- cos x.
104. Если
(3.14.3) <Р(Е/нО<Ер<р(*)
для всех положительных х и р, то у(х) = сху где с —
постоянная.
Положим в (3.14.3) я =2, xt = x, х2 =у, р1=у/2х и
/?2=1/2. Тогда мы получим, что
?О0/.У <?(*)/*•
Так как мы можем поменять местами х и у, то ®(х)/х
должна быть постоянной.
3.15. Суммы с произвольной функцией, обобщения
неравенства Иенсена. Наряду со средними, рассмотрим и „суммы",
содержащие произвольную функцию <р. Положим
®9(д) = ?-1{2?(«)}.
где, как в § 3.1, ср(лг) непрерывна и строго монотонна. Теперь
мы должны, однако, предположить значительно больше, так как
£<р(я) не является средним значением <р(а) (как £#?(я)), и,
таким образом, не обязана быть одним из значений ®{х).
Поэтому мы предположим, что ®(х) положительна для всех
положительных х и что ®(х) стремится к оо либо при х->0,
либо при л;—>со. Кроме того, мы предположим, что все а>0,
оставляя читателю рассмотрение случаев, когда некоторые из
а равны нулю 1}.
105.2) Если ф и х непрерывны, положительны и строго
монотонны, то ©^ и ©х сравнимы, когда (1) ф и — х °&е
г) Предположим, например, что ср(л:)=#г, где г>0 (случай§2.10).
Тогда ср(0) = 0, и мы можем не делать различия между такими
двумя системами а, как (1,1) и (1,1,0). Если же <р(0) было бы
положительным, то мы должны были бы эти две системы различать, и
рассмотрение случаев равенства в теореме 105 стало бы весьма
утомительным. Если ср(лг)->оопри х->0, то <5у (а) = 0, если какое-либо а
равно нулю.
2) В основном эта теорема принадлежит Куперу [Cooper, 2].
3.16]
ОБОБЩЕНИЯ НЕРАВЕНСТВА МИНКОВСКОГО
107
возрастают или обе убывают, или (2) ф и х обе возрастают
или обе убывают и х/ф монотонна.
В случае (1)
(3.15.1) ©ф<©х>
если ф убывает, а % возрастает. В случае (2) (3.15.1) имеет
место, если ^/ф убывает. Равенство имеет место в случае
(1) и, если х/Ф строго монотонна, также в случае (2)
только тогда, когда имеется одно а.
В случае (1), когда % возрастает,
©х(а) ^ X {X (max a)} = max a
и аналогично ©9(а) ^ min a.
В случае (2) допустим, что <{/ и ^ возрастают, и положим
ф(а) = дг, а = ф-^), хФ"1=/-
Тогда (3.15.1) сводится к (3.14.2) и будет иметь место,
если x~lf(x) убывает, т. е. если
убывает. Если ф и ^ убывают, (3.15.1) сводится к неравенству,
обратному (3.14.2), и будет иметь место, если f/x возрастает,
т. е. если ^/ф убывает.
Читатель без труда определит случаи равенства. Когда ^ = xs,
Х=хг, мы имеем теорему 19.
Мы можем также, подобно тому как это было сделано в §2.10 (iv),
определить взвешенные суммы, а именно
£9(«) = ?-ЧЕ/"р(«)}.
где р — произвольные положительные числа. % сводится к Ш^ если
2/7 = 1, и к <3 , если каждое /? = 1.
3.16. Обобщения неравенства Минковского. Если у(х)=хг,
где /*> 1, то имеют место неравенства
(3.16.1) 2K?(^)<|{2K9(a) + aK9(*)}.
(3.16.2) ©?(^±А)<|{©9(а) + !5?(*)},
(3.16.3) ^(^Чг) < |{*, («) +2,(*)Ь
108 СРЕДНИЕ ЗНАЧЕНИЯ С ПРОИЗВОЛЬНОЙ ФУНКЦИЕЙ [ГЛ.III
причем все эти неравенства, в сущности эквивалентные друг
другу, содержатся в теореме 24.
Они перестают, однако, быть эквивалентными для общих <р;
все они имеют вид:
(3.16.4) 2?-i{s/>?(^)}<?-i{2p?(a)} +?-MSP?(*)}.
но различия между весами р теперь уже существенны. В (3.16.1)
2р = 1; в (3.16.2) р = 1; в (3.16.3) р — произвольные
положительные числа. Назовем эти три случая (I), (II) и (III).
Рассматривая их, мы будем предполагать, что
<р>0, <р'>0
для л;>0.
Неравенство (3.16.4) утверждает, что <р-1{£р<р(*)} является
для данныхр выпуклой функцией от п переменных хи х2,...,хп;
или, по § 3.12 Ь, что
где х, р, и фиксированы и х, р положительны, выпукла
относительно t, при всех t, для которых х -\- ut положительны.
Если ср дважды дифференцируема, это условие, по теореме 94,
эквивалентно х'ЧО) ^ 0- Непосредственное вычисление дает
(3.16.5) {?'(*)}Y = {?'(X)}'SP«VW - ?"(X){SP^W}2,
где
(3.16.6) x = x(0) = ?-i{Sp?(x)}
и ^" = у"(0). Таким образом, мы должны найти, при каких
условиях
(злел) {<p'(x)}2sp«V(*) - <p"(x){sp«?'(*)f > о.
Нетрудно убедиться, что (3.16.7) не может быть всегда
справедливо без ограничения знака <р". Допустим, например, что
<р'>0 и что о" непрерывна и иногда отрицательна. Тогда мы
*) Мы пользуемся здесь очевидным обобщением сказанного в § 3.12
для двух переменных на случай п переменных.
3.16]
ОБОБЩЕНИЯ НЕРАВЕНСТВА МИНКОВСКОГО
109
можем найти xt и х2 такие, что ^'(^ХО, ?"(х2)<0 и иг
и и2 такие, что
/Wf'(*l) И" P2U2?'(X2) = °-
В этом случае (3.16.7) для я = 2 сведется к
\¥Ш2\рА ?Vi) + p2^?"(^)} >о,
а это — неверно. Мы будем поэтому в дальнейшем
предполагать, что
?>0, <?'>0Э ?">0.
Мы можем записать (3.16.7) в виде
(з.1б.8) Hy)=^>{T:'if: ■
4 ' т ЧЛ/ <? (х) ^ 2/ш2? " (х)
Но по теореме 7,
(3.16.9) №?? = {sl^7«-j/^f <ЪриЧ"Ър^г.
Следовательно, (3.16.8) заведомо справедливо для всех х, и,
если
(3.16.10) Ф(Х)>2/>^^ = Е/>Ф(*)
для всех х. Далее, равенство имеет место в (3.16.9), если
« = ?'(*)/?"(*) (v = l,2,...,/0,
так что (3.16.10) является достаточным и необходимым
условием для справедливости (3.16.8). Наконец, если мы положим
у = ср (л:) и
(3.16.П) ф(у) = ф(*) = «И?-1 (у)} = ^^"-/g})2 >
то (3.16.10) примет вид:
(3.16.12) Ф(2/уО>2/>Ф(У)-
Рассмотрим теперь в отдельности случаи (I), (II) и (III).
(i) В случае (I) (3.16.12) справедливо тогда и только тогда,
когда Ф(у) вогнутая функция от у.
(ii) В случае (II) (3.16.12) является неравенством, обратным
(3.14.2) с у, Ф вместо х, /. Достаточным (ноне необходимым)
условием для справедливости (3.16.2) является возрастание
функции Ф(у)/у или, что то же самое, убывание функции
v(x)y"(x)/v'2(x).
НО СРЕДНИЕ ЗНАЧЕНИЯ С ПРОИЗВОЛЬНОЙ ФУНКЦИЕЙ [ГЛ.III
(ш) В случае (III) (3.16.12) сводится к (3,14.3) с
надлежащими изменениями. Оно может иметь место в общем случае,
только если Ф(у)/у постоянна, т. е. если <р<р"/ср'2 постоянна;
в этом случае ср должна быть одной из функций
(3.16.13) (ах-\-Ь)с (а>0, с<11}), еах+ъ.
В этих случаях оно справедливо.
Чтобы яснее показать взаимоотношения между условиями (i)
и (ii), выскажем их в несколько иной форме. Предположим, что
ср"" непрерывна; этим мы не можем серьезно снизить интерес
к результатам. Тогда из
ФОО = ?*(*)/?"(*)
МЫ ВЫВОДИМ
^// \ d у'(х) , 1
^ КУ) ч'(х) dx* y"(x)'
Следовательно, Ф(у) вогнута тогда и только тогда, когда
<p'(-*0/?"(•*) вогнута или, что то же самое, когда cpV"/cp"2
возрастает. Это и является другой формой условия (i), а другой
формой (ii) является „ср/ср' выпукла".
Подводя итоги, мы имеем теорему
1062). Предположим, что ср"" непрерывна и что ср > 0,
?' > 0, ср" > 0. Тогда
(i) для того чтобы имело место (3.16.1), необходимо и
достаточно, чтобы ср'/?" была вогнута, или чтобы ср'ср'"/?"
возрастала;
(ii) для того чтобы имело место (3.16.2), достаточно
(но не необходимо), чтобы ср/ср' была выпукла, или чтобы
срср"/ср'2 убывала)
(iii) для того чтобы имело место (3.16.3), необходимо и
достаточно, чтобы ср была одной из функций (3.16.13).
Мы предоставляем читателю сформулировать варианты этой
теоремы, когда (например) <?>(), <р'<0, <р">0, или когда имеют место
обратные неравенства. Поучительно проверить, что (i)
удовлетворяется (для всех х, начиная с некоторого), когда y = xpj[ogx (p > 1),
U Так как ср" > 0.
2) Первые результаты этого типа были даны Бозанкэ [Bosanquet, 1];
Бозанкэ рассматривает случай (II).
3.17]
СРАВНЕНИЕ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
111
но не удовлетворяется при <р = xp\ogx, тогда как для (ii) имеет
место обратное положение.
3.17. Сравнение последовательностей. Теорема 105
утверждает, что
©Ф (а) < ©х (а)
для данной пары функций >} и р для всех а. Теоремы этого
параграфа имеют иной характер: они содержат данные
последовательности (а) и (а') и произвольную функцию ср. Мы
рассматриваем условия, при которых
©9(fl')<©9(fl),
или, что для возрастающих о то же самое,
(3.17.1)
?Oi) H- ?(4) Н- • • • + ?(0 < ?Oi)Н- ?(яа) + • • • + ?(fln)
для данных а и а' и всех <р, принадлежащих к некоторому
классу.
107. Предположим, что последовательности (а) и (аг)
убывают. Тогда, для того чтобы (3.17.1) имело место для.
всех непрерывных и возрастающих <р, необходимо и
достаточно, чтобы
a'v<flv (v = l,2, ..., п).
Достаточность этого условия очевидна. Чтобы доказать его
необходимость, предположим, что а!^ > а^ для некоторого [х,
что а^< #<я^ и что <?*(х) определена следующим образом:
?*(*) = 0 (*<*), <?*(х) = 1 (х>Ь).
Тогда
2 ?*(а') > ji > ц — 1 > S ?*(д).
Следовательно, (3.17.1) неверно для <р*, а, значит, и для
надлежащим образом выбранного непрерывно возрастающего
приближения к <р*.
Наша следующая теорема связана с теоремами §§ 2.18 —2.20.
108. Для того чтобы (3.17.1) имело место для всех
непрерывных выпуклых ф, необходимо и достаточно, чтобы
(1) (a')^S(a) в смысле § 2.18, или чтобы (2) (аг) была
осреднением (а) в смысле § 2.20.
112 СРЕДНИЕ ЗНАЧЕНИЯ С ПРОИЗВОЛЬНОЙ ФУНКЦИЕЙ [ГЛ. III
Если эти условия удовлетворены и <р"(#) существует и
положительна для всех х, то равенство имеет место
в (3.17.1) только в том случае, когда последовательности
(а) и (аг) тождественны1).
Мы уже доказали (теорема 46), что оба эти условия
эквивалентны. Поэтому достаточно доказать, что первое из них
необходимо, а второе достаточно. Мы можем предположить, что
(а) и (аг) убывают.
(i) Условие (1) необходимо. Оно утверждает, что
(3.17.2)
а[ Н- аг2 -\- . . . -+- а\ < аг -\- а2 -\- ... -\-а^ (v = 1, 2, ..., л),
со знаком равенства в случае v=#.
Функции х и —х непрерывны и выпуклы в любом интервале.
Следовательно, если (3.17.1) справедливо, Ея'^Хяи £( — а') ^
^Х(—а), т. е. E#'=£a, а это и есть (3.17.2) со знаком
равенства для v = n.
Далее, пусть
о(х) = О (х < av), ®(х) = х — а^ (х > ач).
Тогда о(х) непрерывна и выпукла в любом интервале, и
о(х)^>0, о(х)^>х — av. Следовательно,
а[-\-аг2-\- . . . -\-а'ч — v#v < 2?(я')< 2?(я) =
= fliH-fl2 + • • • -\~av — v^,
а это и есть (3.17.2).
(ii) Условие (2) достаточно. Если (а') является
осреднением (а), то мы имеем
а*=Ру.1а1-\-Р?.2а2-\- ••• +/Vflm
где
w п
р,=1 v=l
*) Schur [2] доказывает, что (2) является достаточным условием;
замечание о случае равенства было также сделано им. О полной
теореме см. Hardy, Littlewood and P61ya [2]; Karamata [1] рассматривает
условие (1).
3.17]
СРАВНЕНИЕ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
113
для всех [а и v. Если ср выпукла, то
(3.17.3) ?«)</Vi?(ai)+... +^п?Ю;
суммируя эти неравенства, получаем (3.17.1).
(iii) Если в (3.17.1) имеет место знак равенства, то каждое
из неравенств (3.17.3) должно быть равенством.
Если <р"(л;) > 0 и каждое р положительно, то из теоремы 95
следует, что все а равны, 'а в этом случае все а' тоже
равны и их общие значения одинаковы.
В общем случае, однако, некоторые из р будут равны нулю.
Мы будем говорить, что а£ и av непосредственно связаны,
если р > 0, т. е. если #v действительно встречается в формуле
для а£, и что два любых элемента {а или af) связаны, если они
могут быть соединены цепочкой элементов, в которой каждые
два соседних элемента непосредственно связаны друг с другом.
Рассмотрим теперь совокупность С всех элементов,
связанных с at. Мы можем предположить (меняя, если нужно,
нумерацию), что совокупность С состоит из элементов
(С) аъ а2, .. ., аг, а'ъ а'2, .. ., а'8,
в выражение каждого а' из С входят только а из С и никакие
другие а, и в выражения никаких других аг не входит ни одно
а из С. Следовательно, по свойствам сумм /?,
S Г Г S
так что С содержит равное число а и а'. Из теоремы 95 и из
равенства в (3.17.3) следует, что все а, непосредственно
связанные с каким-нибудь а\ должны быть равны этому а'.
Следовательно, все связанные а и af равны и С содержит г
элементов каждой последовательности, все равные ах.
Повторяя это рассуждение для элементов, связанных с аг+1
и т. д., мы заключаем, что последовательности (а) и (а')
состоят из некоторого числа групп одинаковых элементов, причем
значения элементов в соответствующих группах равны.
Попутно мы доказали следующую теорему.
109. Если <?"(*)>0, /?„v>0, Z/Vv = l> 2/Vv = l
114 СРЕДНИЕ ЗНАЧЕНИЯ С ПРОИЗВОЛЬНОЙ ФУНКЦИЕЙ [ГЛ. III
и < = Sjt?avav, то
(3.17.4) Ъ?{а')<Ыа),
если не все а и а' равны.
Когда все а' равны, (3.17.4) является частным случаем
теоремы 95.
Отметим еще следующий частный случай теоремы 108,
который часто бывает полезен*
ПО. Если ®(х) непрерывна и выпукла и \h'\ ^C\h\, то
(3.17.5) v(x — h')+y(x-\-ti)4.y(x — А)+<р(* + А).
3.18. Дальнейшие общие свойства выпуклых функций.
Начиная с § 3.6, мы предполагали, что <х>(лг) непрерывна. Мы
откажемся теперь от этого предположения и рассмотрим
непосредственные следствия из (3.5.1). Общим выводом из
следующих ниже теорем является тот, что выпуклая функция или
очень регулярна, или очень нерегулярна и, в частности, что
„не совсем нерегулярная" выпуклая функция обязательно
непрерывна (так что предположение непрерывности является
значительно менее ограничительным, чем можно было ожидать).
111. Предположим, что у(х) выпукла в открытом
интервале {Н, К) и ограничена сверху в некотором интервале /,
лежащем внутри (Н, К). Тогда <?(х) непрерывна в #<*</С.
Далее, <?(х) имеет всюду левую и правую производные;
значение левой производной не превосходит значения правой и
значения обеих производных возрастают вместе с х.
Отсюда следует, что разрывная выпуклая функция не
ограничена в каждом интервале.
Докажем сначала, что ®(х) ограничена сверху в каждом
интервале, лежащем внутри (Н, К).
Идея доказательства состоит в следующем. Рассуждение § 3.6
показывает, что
для любых рациональных q\ предположением непрерывности
мы пользовались только при переходе к иррациональным q.
Предположим теперь, что / является интервалом (h,k) и что
верхней гранью <р в / является О. Достаточно доказать, что <р
ограничена сверху в (/, h) и (k, т)^ где /и т — любые числа,
такие, что #</</z<£<w</C Если х лежит в (/, h\ то
мы можем найти в / такое ?, что х делит (/, $) рационально,
3.18] ДАЛЬНЕЙШИЕ ОБЩИЕ СВОЙСТВА ВЫПУКЛЫХ ФУНКЦИЙ Ц5
и тогда у(х) должна быть ограничена сверху величиной,
зависящей от <р (/) и О, и, следовательно, ограничена сверху в (/,/*).
Подобным же образом она должна быть ограничена сверху
и в (&, т).
Чтобы придать этому рассуждению точную форму, обозначим
через h левый конец / и через О верхнюю грань <р в /, и
предположим, что
H<l<x<h.
Мы можем найти целые числа т и п^>т такие, что
& = / + —(*—/)
лежит в /; тогда
<fG+(l-f )<?(/)< max (G,?(/)}.
Следовательно, <©(#) ограничена сверху в (/, К).
При доказательстве оставшейся части теоремы мы можем
ограничиться интервалом (//', К') внутренним по отношению
к (Н, К) или, что то же самое, мы можем предположить <р
ограниченной сверху в исходном интервале. Пусть, стало быть,
^О в (Н, К), Н<Сх<СК, т и п^>т—положительные
целые числа, и 8 — настолько малое (положительное или
отрицательное) число, что х-\-пЬ лежит в (//, К). Тогда
T(s + «8) = ?{m(* + ,,») + ("-m)*}<
или
<?(х + пЪ) — ч(х) > ч(х+тЪ) — ч(х) , < ,
п ^ т У )-
Заменяя 8 на —8 и объединяя оба неравенства, мы получаем
(3 18П у(х + пЬ) — у (л:) ч(х+тЪ) — ч(х) >
т
^ у(х) — у(х—тЪ) у{х) — у(х—пЬ)
116 СРЕДНИЕ ЗНАЧЕНИЯ С ПРОИЗВОЛЬНОЙ ФУНКЦИЕЙ [ГЛ. III
(среднее неравенство следует непосредственно из выпуклости
?(*))■
Положим в (3.18.1) т=\ и вспомним, что <?^G; тогда
получим
(3.18.2)
—^>?(*-И) — ?(*)>?(*) — ?(* — 1)>^-Ljl—•
Пусть теперь 8-^0 и я—>-оо так, что х±пЬ остается внутри
интервала. Из (3.18.2) тогда следует, что ф(а:-|-8) и у(х — 8)
стремятся к <p(x), т.е. что <? непрерывна.
Далее предположим, что 8>0, и заменим 8 в (3.18.1) на 8/я.
Тогда получим
/3 183) ?(* + $) — о(х) ^ ?(дс+у)_ср(лг) ^
>. ср(л:)—ср(л: —S') у^ ср(лг) —ср(лг— 5)
где Ь' = тЪ1п —любое рациональное кратное 8, меньшее 8. Так
как <р непрерывна, то (3.18.3) справедливо для любого 8'< 8.
Таким образом, при убывающем 8, стремящемся к нулю,
первая дробь в (3.18.3) убывает, а последняя возрастает, и,
следовательно, каждая из них стремится к некоторому пределу,
т.е. <р имеет правую и левую производные yfr и <pj и 9?^?г*
Положим, наконец, х — 8' = лг1э л: = л;21 х-\-Ъ=хъ (или
х—Ъ=х19 х=х2, х-\-&' =хъ); тогда (3.18.3) даст
.#3 — ^2 ^2 — ХХ
Если л:1<^2<л:з<л:4» мы тем более будем иметь
ср(лг4) —ср(л:3) ^ ср(лг2) —ср(лгх)
ДГ^ — ^з «*2 — **1
Переходя к пределам при л;3—>-л:4, л:2—►#!, получаем
(3.18.4) ?;(х4) > ?;(*4) > ?;(^> > ?j(^f
что завершает доказательство теоремы.
3.19] ДАЛЬНЕЙШИЕ СВОЙСТВА НЕПРЕРЫВНЫХ ВЫПУКЛЫХ ФУНКЦИЙ Ц7
Из предыдущего ясно, что
(3.18.5) ?;(х4) > 9ix*lzl[X2) > <?'М),
если хх ^ х.2<.хъ ^ лг4.
Теорема 111 не утверждает ничего о существовании
обыкновенной производной у'(х). Однако, легко доказать, что ?'(*)
существует, за исключением, быть может, счетного множества
значений х. Функция ^{х), будучи монотонной, непрерывна,
кроме, быть может, счетного множества значений х. Если она
непрерывна в точке хь то, по (3.18.4), ^fr{xx) лежит между
?i(*i) и ?'г(лч); но ¥i(x4)^ ?j(*i) ПРИ х*—* Х\-
Следовательно, <?'г{х1) = <?'1(х1) и <р'(лг) существует при х = хх.
Из (3.18.5) следует также, что если о(х) непрерывна и
выпукла в открытом интервале (я, Ь)> то
I уОО — 9МI
| х' — х |
ограничено для всех х и л;', лежащих в любом замкнутом
интервале, содержащемся в (а, Ь).
3.19. Дальнейшие свойства непрерывных выпуклых
функций. Предположим теперь, что <х>(дг) выпукла и непрерывна.
Из (3.18.5) следует, что если #<£</С и
то прямая
(3.19.1) у — о$) = к(х — S)
лежит полностью под кривой или на ней. Иначе говоря,
112, Если <?(х) выпукла и непрерывна, то через каждую
точку кривой у=<?(х) проходит, по крайней мере, одна
прямая, лежащая под кривой или на ней.
Прямая, проходящая через точку кривой и лежащая полностью по
одну сторону от кривой, называется опорной прямой. Если ср(дг)
вогнута, то через каждую точку кривой у = ср(лг) проходит опорная
прямая, лежащая над кривой. Если ср(дг) одновременно выпукла и
вогнута, то обе опорные прямые должны совпасть, т. е. у(х) должна
быть линейна.
Легко непосредственно убедиться в справедливости теоремы 112.
Если 6<л:<л:' и Р, Q, Q'—точки на кривой, соответствующие 5, х, х',
то PQ лежит под PQ' и угловой коэффициент PQ убывает, когда х
118 СРЕДНИЕ ЗНАЧЕНИЯ С ПРОИЗВОЛЬНОЙ ФУНКЦИЕЙ [ГЛ. III
приближается к £ и, следовательно, стремится к некоторому пределу \>.
Подобным образом, если х<СЛ и х стремится к ?, угловой
коэффициент QP возрастает и стремится к некоторому пределу \х. Если бы ^
было больше v и Х\ было меньше, а дг2—больше ?, но оба достаточно
близки к £, то точка Р лежала бы над PiP2» что противоречит
выпуклости кривой. Следовательно, р<<> и прямая (3.19.1) лежит под
кривой, если X имеет любое значение между ,а и v включительно.
В этом доказательстве мы не прибегаем к теореме 111, но оно
зависит как раз от тех геометрических понятий, которые лежат в основе
более формальных и аналитических рассмотрений § 3,18.
Предположим, наоборот, что <?(х) непрерывна и обладает
свойством, утверждаемым в теореме 112. Если Р1 и Р2—
точки кривой, соответствующие xt и л:2, а Р — точка,
соответствующая 5=-2"С*:1 + л;2), то Pj и Р2 лежат над некоторой
прямой, проходящей через Р, и середина РгР2 лежит также
над Р. Следовательно, <?(х) выпукла.
Таким образом, мы доказали, что свойство теоремы Ц2
представляет необходимое и достаточное условие выпуклости
непрерывной функции, которое можно взять в качестве нового
определения выпуклости. Другими словами, мы можем определить
выпуклость для непрерывных функций следующим образом:
непрерывная функция v(x) называется выпуклой в (#, К),
если каждому I этого интервала соответствует число
л = Щ) такое, что ?(£) -|- л(л: — £) ^ <э(х) для всех х из (И, К).
Это определение выпуклых функций так же „естественно", как и
основанное на (3.5.2). Интересно вывести некоторые
характеристические свойства непрерывных выпуклых функций непосредственно из
него. Неравенство (3.4.2), например, может быть выведено следующим
образом 3). Положим, как обычно,
и возьмем 5 равным % (а) — значению, лежащему между наименьшим
и наибольшим а. Тогда мы будем иметь
?{И(*)} + Х(л-5)<«р(*)
для некоторого X = Х(5) и всех а.
Взяв среднее 51 от каждой части, мы получим
?{«(«)} + ЧШа) - 6} < %Ы<*)}.
или
<?{«(*)> < И{«Р(*)},
а это и есть (3.4.2). Поучительно сравнить это рассуждение с
проведенными в § 3.10 (ii).
*) Jessen [2].
3.20]
РАЗРЫВНЫЕ ВЫПУКЛЫЕ ФУНКЦИИ
119
3 20. Разрывные выпуклые функции. По теореме 111,
разрывные выпуклые функции неограничены в каждом интервале;
их существование доказано пока только с помощью аксиомы
Цермело или (что для нашей цели эквивалентно) в
предположении, что континуум может быть вполне упорядочен. Если
(3.20.1) f(x+y)=f(x) + f(y),
то
/(2*) = 2/(*)
и
Таким образом, решение функционального уравнения (3.20.1)
есть функция выпуклая.
Гамель [Hamel, 1] *) доказал, что если аксиома Цермело
справедлива, то существуют базисы [а, [3, f, ...]
действительных чисел, т. е. каждое действительное число может быть
единственным образом представлено в виде конечной суммы
х = аа -\- Ь§ -\- ... -\- IX
с рациональными коэффициентами а, £,..., /. Если мы
предположим, что это так, то сразу найдем разрывные решения
уравнения (3.20.1); дадим f(x) произвольные значения /(а),
/(j3), ... для х = а, р, ... и определим f(x) для
произвольного х с помощью равенства
пх)=«/(«>+*/(р) +... +//(X).
Тогда, если y = a'ct-\- ... , мы имеем
/(х+У) = /{(« + «> + ...} =
= (а + «')/(«) + ... = /(*) + f(y).
Для более детального изучения свойств выпуклых функций,
решений уравнения (3.20.1) и неравенств, связанных с ним, мы отсылаем
читателя к работам Darboux [1], Frechet [1,2], F. Bernstein [1],
Bernstein und Doetsch [1], Blumberg [1], Sierpinski [1,2], Cooper [3] и
Ostrowski [1]. Блюмберг и Серпинский доказывают, что любая
выпуклая измеримая функция непрерывна, а Островский получает еще
более общий результат.
*) См также Hahn [1, 581].
120 СРЕДНИЕ ЗНАЧЕНИЯ С ПРОИЗВОЛЬНОЙ ФУНКЦИЕЙ [ГЛ.III
РАЗНЫЕ ТЕОРЕМЫ И ПРИМЕРЫ*)
ИЗ. Если а — постоянная, а^О, и х = а<?» то
<§х(а) = ®<р(а), %x(a) = Zv(a).
[Соответствующее свойство Ш содержится в теореме 83.]
114. Возрастающая выпуклая функция от выпуклой функции
выпукла.
115. Если каждая хорда непрерывной кривой содержит точку,
лежащую над кривой, то каждая точка каждой хорды, кроме ее концов
лежит над кривой.
116. Если «р(л:) выпукла и непрерывна, а <^Ь<с и ср (а) = <р (Ь) =
= <р(с), то у(х) постоянна в (а, с).
117. Если a, b, xty^>0t то
*log£+^og£>(*+.V)log£±£,
х у
кроме того случая, когда — = =^.
[<*iog*)">aj
118. Если /(лг)>0 и дважды дифференцируема, то для того чтобы
log /(лг) был выпуклой функцией, необходимо и достаточно, чтобы
///7-//2>0.
119. Если <р(лг) непрерывна для лс>0 и одна из функций ху(х) или
?(Va?) выпукла, то другая также выпукла.
120. Если <р(лг)>0, дважды дифференцируема и выпукла, то
8 + 1 #_
х 2 <?(х~8) (s>l), е2<?(е~х)
обладают теми же свойствами (первая для лс>0).
121. Если ф и х непрерывны и строго монотонны и х возрастает,
то для того, чтобы для всех а и q
Г1{^(«1)...^Ч«ге)}<Х-1{^,(«1)...^»(ага)}.
необходимо и достаточно, чтобы
?Cy) = iog{x^_1(^)}
была выпуклой функцией.
[Ср. с теоремой 92.]
*) См. также Дополнения I, XVI в конце книги. (Прим, ред.)
РАЗНЫЕ ТЕОРЕМЫ И ПРИМЕРЫ
121
122. Допустим, что
(О <K*i) (*з - х*) + 9(х2) (*i - *в) Н- <Р(*з) (*2 — *i) > °-
или (что то же самое)
(И)
1 ХХ <p(*l)
1 Х2 ср(АГ2)
1 *з <р(*в)
>о
для всех дг1э лг2, х3 открытого интервала /, для которых Х\ < лг2 < *3»
Тогда ср(лг) непрерывна в / и имеет конечные левые и правые
производные в каждой точке /.
Если у(х) дважды дифференцируема, то (i) и (ii) эквивалентны
дифференциальному неравенству <р"(л;);>0.
[(О и (ii) представляют собой другие формы неравенства (3.5.2.), и
у(х) выпукла, так что эта теорема является перефразировкой частей
теорем 111 и 94.J
123. Допустим, что
(О 9 (хх) sin (*3 — *а) + <Р С*2) sin (xt — х3) + <р (л:3) sin (х2 — хх) > О,
или (что то же самое)
(И)
COS*! ZinXi Cp(^i)
COSAT2 SinAT2 9(^2)
COSATg SinAT3 <?(Хг)
>0
для всех Arlf X?, xs открытого интервала /, для которых ^i<^2<^3<
<*iH- те. Тогда ^ (•*) непрерывна в / и имеет конечные левую и пра-
вую производные в каждой точке /.
Если ср (х) дважды дифференцируема, то (i) и (ii) эквивалентны
дифференциальному неравенству
9"(*)+9(х)>0.
[Этот результат важен при изучении выпуклых кривых и
поведения аналитических функций в секторах. См. Р61уа [1, 320; 4, 573—576].]
124. Для того чтобы непрерывная функция <р(*) была выпуклой
в интервале /, необходимо и достаточно, чтобы для любого
вещественного а и любого замкнутого интервала /, лежащего внутри /,
ср(лг) -+- ах достигала своего наибольшего значения в / в одном из
его концов. Далее, если х и ср(лг) положительны» то для того чтобы
log ср(лг) была выпуклой функцией от log*, необходимо и достаточно,
чтобы хау(х) обладала тем же максимальным свойством.
[По поводу приложений этой теоремы, которая следует
непосредственно из определений, см. Saks [1].]
122 средние значения с произвольной функцией [гл.ш
125. Для того чтобы непрерывная функция у(х) была выпукла
в (а, Ь), необходимо и достаточно, чтобы
x+h
(О ^x)<2h S *^dt
х — Ъ
для
а<лг—/г<л: + /г< Ь.
[Это является следствием теоремы 124. Если у(х) удовлетворяет (i),
то то же справедливо и для у(х) + ах; ясно также, что любая
непрерывная функция, удовлетворяющая (i), должна обладать свойством,
утверждаемым в теореме 124 *).
Теорема 125 может быть также доказана независимо от теоремы 124.
Существуют различные обобщения теоремы 125. В частности,
достаточно предположить справедливость (i) для любого х и произвольно
малого h = h{x).]
126. Если у(х) выпукла и непрерывна для всех х и не постоянна,
то ф (х) стремится к бесконечности при одном или другом
приближении х к бесконечности так, что становится в конце концов больше
с\х\, где с — постоянная.
127. Если <р">0 для дг}>0 и ф(0)<0, то yfx возрастает для
.v>0.
[Это сразу следует из равенств
128. Если <р">0 для л:>0 и
\\m(x'if — 9)<0,
а?~>оо
то ср/лг строго убывает для х > 0.
[Предел наверное существует, так как ху' — <р возрастает. Результат
следует из равенств, использованных при доказательстве теоремы 127.
Случаи, рассмотренные в теоремах 127 и 128, являются крайними
возможными случаями при у"^>0; если ни одно условие не выполнено,
то 2- имеет минимум при некотором положительном х.]
129. Если <р">0 для всех х, у(0) = 0 и если под у/х для а*=0
понимать ?'(0), то у)х возрастает для всех х.
130. Если последовательность аь я2» ...»^2м+1 выпукла в смысле
§ 3.5, т. е. если
Д2^ = flv — 2av+i + flv+2 > 0 (v = 1, 2, ..., 2/i — 1),
х) Для формального доказательства использовать теорему 183.
РАЗНЫЕ ТЕОРЕМЫ И ПРИМЕРЫ
123
то
#1 + ^3 + •-• +Я2м+1> #2+^4 + ••• +ЯЩ
/1 + 1 ^ П
причем знак равенства имеет место только в том случае, когда
последовательность а представляет собой арифметическую прогрессию,
[Nanson [1]. Просуммировать неравенства
г(п — г + 1) Д2я2г-1 > О, г(п—г) £?а2г > 0.
Теорема 130 может быть также доказана как частный случай
теоремы 108; последовательность, состоящая из чисел 2,4, ..., 2/х, взятых
каждое (п -\- 1) раз, имеет мажорантой последовательность, состоящую
из чисел 1, 3, ..., 2п -\-1, взятых каждое п раз.]
131. Если0<*<1, то
[Положим х = у2 и #v =_yN в теореме 130.]
132. Пусть С будет центром круга и AQA\ .. .АпА0 — вписанным
многоугольником, вершины которого лежат на окружности в
означенном порядке. С, А0 и Ап фиксированы, a /Jb Аъ ..., Аи^.1 меняются.
Тогда площадь и периметр многоугольника будут наибольшими, когда
А)А = AtAz = ... = Ап^Ап.
[Пусть Д_1СА=а^. Так как (sin x)"<^0 для 0<л:<<гс, мы имеем
по теореме 95,
IS Sin av < Sin (-^),
если не все av равны. Аналогичное неравенство имеет место, если
заменить av на av/2. Эти неравенства дают обе части теоремы. Когда
Ап совпадает с А0, теорема сводится к известным максимальным
свойствам правильных многоугольников.]
133. Пусть fug будут две непрерывные возрастающие взаимно
обратные функции, обращающиеся в нуль в начале, и пусть F=xf,
G = xg и g удовлетворяет неравенству
g(xy)<g(*)-g(y).
Пусть, далее, %аЬ*САВ для всех положительных а и Ь таких, что
£(/(&)< G(£). Тогда
[Cooper [3]. Этот результат содержится в теореме 15, когда /
является степенью х.\
134. Если у(х) выпукла и непрерывна для х > 0, v= 1, 2, ..., и av
неотрицательны и убывают, то
?(0) + 2 Ыпап) - ?[(л - 1) ап]} < 9&ап).
124 средние значения с произвольной функцией [гл.ш
Если, к тому же, у'(х) — функция строго возрастающая, то равенство
имеет место только в том случае, когда все ач, начиная с некоторого v,
равны нулю, а предыдущие равны между собой.
[Hardy. Littlewood and P61ya [2]. Положим
s0 = О, sv = а± + а2 + ... ■+- я, (v > 1)
и
•^ И" (v — 1) #v = ^v-1 H" vflv = 2ЛГ,
$v — (v — 1) av = 2/г, 5V -i — v#v = 2Л'.
Тогда легко проверить, что | Ь! | < h и что | А'| = Л только в том случае,
когда #v = 0 или
#1 = #2 = • • • = аг
Из теоремы 110 следует, что
?(vav) - <p{(v - l)av> < <?(sv) - 9(^-1),
и теорема получается суммированием.]
135. Если q > 1 и av убывают, то
S{v«-(v-l)«}a?<(aev)«.
[Частный случай теоремы 134.]
136. Допустим, что а является функцией от vb v2, ..., vw, что /j,
/2» . • •, ^m — перестановка чисел 1,2,..., /я. Пусть, далее, ф и х
непрерывны и строго монотонны и х возрастает. Тогда, для того чтобы
Ш1т... Ш11 (а) < ЯК *<* ... ml* (a)
для всех а и q, необходимо, чтобы
0) Xjx была выпукла относительно <]^ для [х = 1, 2,..., т\
(ii) i\ была выпукла относительно ф^> если X > [х и [х и X
соответствуют инверсии в перестановке il9 /2> •••» % (т. е. если в
последовательности 1, 2, ...,т — (х предшествует X, а в последовательности
/ь /2, • • •, *ш — X предшествует (х).
[Jessen [3].]
137. Для того чтобы
для всех a u q, необходимо и достаточно, чтобы было (1) r^s^ и
(2) г^ < 5Х (причем (х и X определены, как в теореме 136).
[Jessen (3). Наиболее важными случаями являются
(i) m = 1, г<>.
(ii) /я = 2, (/lf /2) = (2,1), s2 = r2 > st = rt.
Эти случаи соответствуют теоремам 16 и 26. Центральную часть
теоремы представляет утверждение, что если две части неравенства
сравнимы, то оно может быть доказано повторным применением частных
случаев, соответствующих (i) и (ii).]
РАЗНЫЕ ТЕОРЕМЫ И ПРИМЕРЫ
125
138. Если непрерывная кривая у = <р(лг), определенная в открытом
интервале, например 0<л:<1, обладает тем свойством, что через
каждую точку кривой проходит прямая, которая либо (а) лежит
полностью под кривой, либо (Ь) лежит полностью над кривой, то одно
из (а) и (Ь) справедливо для всех точек кривой, и кривая выпукла или
вогнута.
[Легко показать, что если Sa и S& — множества значений х, для
которых имеет место (а) и (Ь), то Sa и S& замкнуты (в открытом
интервале). Но континуум не может быть суммой двух непустых,
замкнутых и непересекающихся множеств.]
139. Предположим, что у(х) выпукла и ограничена снизу в (//, К)
и что т(х) — нижняя грань у(х) в точке х (предел нижней грани у(х)
в интервале, содержащем х). Тогда т(х) является непрерывной
выпуклой функцией от х и либо (ij y(x) тождественна с т(х), либо
(ii) множество точек графика <р(х) всюду плотно в области Н^х^К,
У>т(х).
Если у(х) выпукла и неограничена снизу, то множество точек
графика у(х) всюду плотно в полосе Я<лг</С
[Bernstein und Doetsch [1J.J
Г Л ABA IV
РАЗЛИЧНЫЕ ПРИЛОЖЕНИЯ АНАЛИЗА
4.1. Введение. Некоторые специальные неравенства,
встречающиеся в анализе, часто могут быть проще доказаны с помощью
особых приемов и методов, чем применением общей теории.
Поэтому мы прерываем здесь систематическое изложение нашего
предмета и включаем короткую главу, посвященную иллюстрации
простейших и наиболее полезных из этих приемов. Материал
этой главы подобран скорее с точки зрения применяемых
методов, чем с точки зрения получаемых результатов.
ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ ФУНКЦИИ
ОТ ОДНОГО ПЕРЕМЕННОГО
4.2. Приложения формулы конечных приращений. Наши
первые примеры являются непосредственным приложением
формулы конечных приращений
(4.2.1) f(x + А) —/(*) = hf'(x + 6й) (0 < 8 < 1),
или ее обобщений для производных высших порядков. Из
формулы (4.2.1) следует, что функция с положительной
производной возрастает вместе с х.
(1) Мы имеем
\og(x-\-\) — \ogx = lj^
где 0 < х < S < х -\- 1. Отсюда
j-[X{log(x+l)-\og(x)}] = \og(x + \)-\ogx-^ri>Oi
j-[{x-\-l){log(x-\-l)-log(x)}} =
= log(*+l) —log* —j[-<0.
Следовательно, (\-\ ] возрастает, а (\-\--j
убывает. Так как вторая из этих функций равна П j , где
у = лг-|- 1 >1, то имеет место теорема
4.2] ПРИЛОЖЕНИЯ ФОРМУЛЫ КОНЕЧНЫХ ПРИРАЩЕНИЙ 127
140. (l -\-—j возрастает для х>0; (1 ) убывает
для х>1.
В основном эта теорема совпадает с теоремой 35.
(2) Если х> 1, г> 1, то имеем
Xr=l+r(*-l)+lr(r-l)6r-a(JC-l)a,
где 1 <£<х и, таким образом,
141. ^>l+r(x-l)+|r(r-l)(^)2 (*>1,г>1).
Это неравенство было выведено в менее точной форме
в§ 2.15.
(3) Если хфО, то мы имеем
(4.2.2) ex=i-\-x + ^Jpeto9
где 0 < 6 < 1. Следовательно,
142. е*>\-\-х (хфО).
Мы можем дать теперь другое доказательство теоремы 9-
Если
20 = 1, 1qa = %
и не все а равны, то можно положить а = (1 -\- .*)?(, где
%qx=0 и не все х равны нулю. Тогда 1+д:^^ со знаком
неравенства по крайней мере для одного х, и
Па* = 5111(1 + xJ^JU?1** = 91= Iqa.
Это рассуждение является частным случаем приведенного
в конце § 3.19.
(4) Функция
f(x) = ex — \—x — -|х2
и ее первые две производные равны нулю при х = 0. Других
корней уравнения f(x) = 0 не существует, так как в противном
случае повторным применением теоремы Ролля можно было бы
доказать существование корня у уравнения f"(x) = ex.
Следовательно,
**>! + * + ■£*« (*>0), **<! + *+■£** (*<0).
128
РАЗЛИЧНЫЕ ПРИЛОЖЕНИЯ АНАЛИЗА
[ГЛ. IV
Такое же рассуждение применимо к любому числу членов ряда
Тэйлора многих других функций. Для функции ех мы получаем
143. Если п — нечетное число, то
(4.2.3) е*> *+* + f+ •••+§ (хфО).
Если п — четное, то для х > 0 имеет место (4.2.3), а для
х<0 — неравенство, обратное (4.2.3).
4.3. Дальнейшие приложения элементарных теорем
дифференциального исчисления. В этом параграфе мы дадим
некоторые приложения, носящие менее непосредственный характер.
(1) Повторное применение теоремы Ролля приводит без
труда к следующей лемме !): если все корни xjy уравнения
f(x, у) = с0х™ + c^-ty + ... + сту™ = О
действительны, то действительными будут и корни всех
нетождественных уравнений2), получаемых из него
дифференцированием по х и у. Далее, если Е обозначает одно
из этих уравнений и Е имеет кратный корень а, то а
является также корнем, кратности на единицу большей,
уравнения, из которого Е получено дифференцированием.
Эта лемма может быть применена к доказательству одной
теоремы, уже доказанной в менее точной форме в § 2.22.
144 3). Если аг, а2, ...,яп — п действительных
положительных или отрицательных чисел, р0 = 1, и р^ обозначает сред-
нее арифметическое произведений ja различных а, то
P^iP^i<P9; 0=1, 2, ..., /i — l),
если не все а равны.
Мы предполагаем, что ни одно а не равно нулю, так
как, если допустить нулевые а, перечисление случаев равенства
весьма осложняется.
Пусть
/(*> У)=(х-\- аху) (х -\-а2у).. .{х-\-апу) =
= Po^+(")Pi^-^+(J)p^"V+...+Pfir-
*) Maclaurin [2]. См. Полна и Сеге [1, II, 45—47 и 230—232].
2) Т. е. уравнений, не все коэфициенты которых равны нулю.
8) Newton [1, 173]. Дальнейшие ссылки даны в § 2.22.
4.3] ДАЛЬНЕЙШИЕ ПРИЛОЖЕНИЯ ЭЛЕМЕНТАРНЫХ ТЕОРЕМ 129
Так как все а Ф О, то рп ф О и х\у = О не является корнем
уравнения / = 0. Следовательно, х/у = 0 не может быть кратным
корнем ни одного из производных уравнений.
Отсюда мы можем заключить, что два следующих одно за
другим р, как например р и р^н, не могут быть оба равны
нулю, т. е. что уравнение
JV!*2 + tyxy+p^y* = О,
получающееся из f(x, у) = О последовательными
дифференцированиями, не может быть тождеством. Но так как оно имеет
действительные корни, то
Наконец, корни производного уравнения могут быть равными
только в том случае, когда все корни исходного уравнения
равны.
Отметим, что а не должны быть обязательно
положительными, как это было предположено в § 2.22 гК
(2) Пусть ср (л:) = log (£ рах), где а положительны и не равны
(это не является действительным ограничением). Тогда, по
теореме 7,
i = ZP<*xloga „ £ pax S pax (log a? - (S рах log a? ^ ft
Ъра* ' * — (£ряж)2 '
Если аг—наибольшее а, то мы легко находим, что
<р(0) = log 2/?, lim (*?'— <р) = — log/?r.
а? ->оо
Из теорем 127 и 129 теперь следует, что <р/я возрастает для
л:>0, если £/?<;!, и для всех х, если £р = 1. В последнем
случае
^ = log 3Re(a), lim ^gl = »'(0) = log ©(а).
Таким образом, мы имеем новые доказательства теорем 9 и 16.
Если же, с другой стороны, рч >- 1 для каждого v, то, по
теореме 128, у/х убывает. В частности, <Вх(а) = (Цаж)1/я?
убывает (теорема 19). Общий случай дает часть теоремы 23.
а) Кроме теоремы 55. Для положительных а см. теоремы 51, 54, 77
и § 3.5.
130
РАЗЛИЧНЫЕ ПРИЛОЖЕНИЯ АНАЛИЗА
[ГЛ. IV
(3) Следующие примеры применяются в баллистике.
145. log secx<у sinx \gх к)<л-<-|-)-
146. Если
х
g(x)= \ 0 +* sec t) dt = х + log (sec x 4* tg л:),
о
mo
8 log sec л:
o(x) =
g2W
убывает от 1 до 0, лгогда л: возрастает от 0 до у-.
[По теореме 145 ^-(^3p'ctgдт)<0, и, следовательно, p'<0.J
147. Функция
е (х) = ■
[ (1 + sec t) Jog sec t dt
_o
log sec* I (1 4*sec t) dt
монотонно возрастает от -г- до -у 5 когда х возрастает от
Odof .
При доказательстве теоремы 147 мы можем воспользоваться
следующей общей теоремой.
148. Если f, g и fig' — положительные и возрастающие
функции, то fjg либо возрастает для всех рассматриваемых х, либо
убывает для всех таких х, либо убывает до некоторого
минимума, а затем возрастает. В частности, если f(Q) = g(0) = Q,
то fjg возрастает для х>0.
Для доказательства заметим, что
JL(L) = (L_L)1
dx\g J \g' g J g '
/ f
и рассмотрим возможные пересечения кривых у = — ,у = —-, . В
одной из этих точек пересечения первая кривая имеет горизонтальную,
а вторая — поднимающуюся касательную, а, значит, более одного
пересечения быть не может.
Если принять g за независимую переменную, положить f(x) = y(g)
и допустить, как в последнем условии теоремы, что
f(0) = g(Q) = 0
4.4] МАКСИМУМЫ И МИНИМУМЫ ФУНКЦИЙ ОТ ОДНОГО ПЕРЕМЕННОГО 131
или что <р(0) = 0, то теорема примет вид: если <р(0) = 0 и y'(g)
возрастает для g>0, то y/g возрастает для £>0. Этот результат
является небольшим обобщением части теоремы 127. Теорему 148
следует также сравнить с теоремами 128 и 129.
4.4. Максимумы и минимумы функции от одного
переменного. Один весьма общеупотребительный метод
доказательства неравенств заключается в нахождении максимума или
минимума функции <э(х) путем рассмотрения знака <?'(х)-
(1) Так как
^1-х)е»)=-хе»,
то функция (1 —х)ех имеет в точности один максимум при х = О»
Следовательно,
149. **<т=7 (*<1> хФ0)>
Это является также следствием теоремы 142.
(2) Так как
^(log*-*+l) = JL-l,
то функция logх — х -\- 1 имеет один максимум при х = 1.
Следовательно,
150. \ogx<x — I (л;>0, хф\).
Заменяя здесь х на хх^\ где п любое положительное
число, мы получаем более общее неравенство logx < п(х1/п— 1).
Это неравенство является также следствием теоремы 36.
(3) Пусть
<?(х) = 1 + ху-(1 + хУк(1+укук\
где Л>1, х>0, у>0.
Легко проверить, что <?(х) имеет единственный максимум 0
при хк =ук'.
Это дает новое доказательство неравенства Н0 (теорема 38),
а, следовательно, и неравенства Н (теорема 11).
(4) Если х и у положительны и k > 1, то функция
X У
<?(*) = xy-T-JF-
имеет производную у — х ! ' и достигает своего максимума 0
при хк=ук'. Отсюда следует теорема 61 (а, следовательно,
и теоремы 37 и 9).
132
РАЗЛИЧНЫЕ ПРИЛОЖЕНИЯ АНАЛИЗА
[ГЛ. IV
(5) Функция
<?(*) = ху — л: log л: — еу~1,
где х положительно, достигает своего максимума 0 при х = еу~г.
Отсюда следует теорема 63.
4.5. Приложения ряда Тэйлора. Если f(x) = %anxn и
g (х) = £ Ьпхп — два степенных ряда с положительными
коэффициентами и ап^.Ьп для каждого п, то мы говорим, что
f(x) мажорируется g(x), и пишем f-^g. Ясно, что если
f<g и fi<gv T0 ffi<ggi и Т-Д-
Для иллюстрации приложения этого понятия в
доказательствах неравенств докажем теорему
151. Если sn = at -\- а2-\- ... -\-аПу где я>1 и все а
положительны, то
(1+в1)(1+аа)...(1+ач)<1+^ + |*+... + -|.
В самом деле, 1 -\-анх~^еа^х, так что
Далее, суммируя коэффициенты при 1, *, л:2, ...,хЛ и
замечая, что строгое неравенство имеет место уже между
коэффициентами при х2, получаем утверждение теоремы.
Его можно также доказать, представив левую часть в виде
Л - . п(п — 1) . .
1+VH—k~y^P2+ --~\-Рп
(так что прх = sn) и использовав теорему 52.
ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ;
ФУНКЦИИ ОТ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ
4.6* Приложения теории максимумов и минимумов
функций от нескольких переменных. Наиболее „универсальным"
методом нахождения и доказательства неравенств является
общая теория максимумов и минимумов функций от любого числа
переменных. Допустим, что мы хотим доказать сравнимость
двух функций © и 6 от непрерывных переменных хг, х2, ..., хп,
например, что ©— ^^0. Если функция ©— ф имеет
минимум, то искомое неравенство будет иметь место тогда и
только тогда, когда этот минимум неотрицателен; решение же
4.6] МАКСИМУМЫ ФУНКЦИЙ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ 133
задачи о нахождении этого минимума (во всяком случае, если
рассматриваемые функции дифференцируемы) может быть всегда
предпринято обычными методами теории максимумов и
минимумов.
Хотя теоретически этот метод и весьма заманчив, при
практическом применении он часто ведет к серьезным осложнениям
в деталях (обычно связанным с „граничными значениями"
переменных), и как бы полезен он ни был для получения
наводящих идей, сам по себе он редко ведет к простейшему решению.
Проиллюстрируем эти замечания на основных неравенствах О и Я.
(1) Для доказательства G рассмотрим функцию
/(A?j, ЛГ2, . . . , Хп-1) ^ Xi Х% ... Хпп ,
где
xn = -—(% — q1x1— ... — qn-\Xn-i),
Чп
в замкнутой и ограниченной области хх >- 0, ..., хп >- 0. Так
как / непрерывна, то она достигает своего наибольшего
значения во внутренней точке области, а не на границе (где / равно
нулю). В точке максимума
0 = Ш- = Л2—Л»Л± (у — 1 2 л—П
U f дхн х, xnqn lv-^^ ■■■. п lh
т. е. в ней все л;-ы равны %, В этом случае граничные значения
переменных не вводят никаких осложнений !).
(2) Неравенство Н (для двух последовательностей
переменных) может служить примером применения „метода Лагранжа".
Рассмотрим функцию
f(Xv ЛГ2, . . ., Хп)= ЬХХХ + #2*2 + • • • + ЬпХп*
где £v>0, при условии, что
?(лг1,лг2,...,лгп)=лг1+лг2+ ••• + *£ (*>1)
равно некоторой положительной постоянной X. Определенная
неравенствами x^Q и уравнением у = Х {п — 1)-мерная область
замкнута и ограничена, и в каждой из ее граничных точек по
крайней мере один из лг-ов равен нулю.
1) Ср. § 2.6 (i).
134
РАЗЛИЧНЫЕ ПРИЛОЖЕНИЯ АНАЛИЗА
[ГЛ. IV
Если наибольшее значение достигается во внутренней точке,
то в этой точке мы имеем
f ~ Ъ — '
причем X не зависит от v, и простое вычисление показывает,
что
/=хх/* (s ьк)1/к'=(s *Yk &к')т-
Остается еще возможность, что наибольшее значение
достигается в граничной точке, где одно из ху скажем хп, равно
нулю. Эта возможность может быть исключена индуктивным
рассуждением, так как если мы предположим, что наше
неравенство уже доказано для п — 1 переменного и что .^=0, то
/=Тм,<(Т^)^("£1*ГЛ<о:^1Л(2*ГЛ.
1 11
Недостаток этого метода заключается в том, что индукция
должна быть все-таки применена; а раз это так, то лучше уж
доказать всю теорему методом индукции, и мы приходим
к одному из доказательств Я, данных выше.
(3) То обстоятельство, что проведение этого метода во всех
деталях приводит, как в случае (2), к осложнениям, весьма
характерно; тем не менее он бывает весьма полезен, так как с его
помощью очень часто можно найти путь к решению задачи.
Многие из наших теорем утверждают неравенства между
симметрическими функциями f(xl9 дг2, ..., хп) и g(xu д;2,..., хп)
одинаковой степени однородности, положительными для всех
положительных х. Таковы, например, теоремы 9, 16 и 17
(для единичных весов — основной случай), теорема 45 (в
случае сравнимости) и теоремы 51 и 52.
Применяя метод Лагранжа, мы должны рассматривать
максимум/при постоянном g, скажем, g=l. Уравнения Лагранжа
в этом случае имеют вид
Эти уравнения всегда имеют систему решений
Лj Хл ... Xfiy
4.7]
СРАВНЕНИЕ ИНТЕГРАЛОВ И РЯДОВ
135
а \ является значением / для этой системы значений х. Если
\ равно единственному наибольшему значению /, то/^Ag*,
причем f=hg только в том случае, если все х равны.
Это действительно имеет место в приведенных выше
примерах, но существуют и другие случаи, в которых решение
не дает наибольшего значения /, как, например, в случае
несравнимости в теореме 45.
ИНТЕГРАЛЬНОЕ ИСЧИСЛЕНИЕ
4.7. Сравнение рядов и интегралов. Существует много
неравенств, которые могут быть легче всего доказаны методами
интегрального исчисления — часто интуитивно, рассмотрением
площадей и объемов. Ниже приведено несколько наиболее
полезных общих теорем, касающихся интегралов, взятых в
элементарном смысле Римана или Римана-Стилтьеса. В гл. VI,
где неравенства между интегралами будут рассмотрены более
систематически, мы будем оперировать с общими интегралами
Лебега и Лебега-Стилтьеса.
Следующие теоремы были в принципе доказаны уже Макло-
реном и Коши *).
152. Если f{x) убывает для л; ;> О, то
п
/(1) + /(2)+... +/(/*)< j7(*)tf*<
О
</(0) + /О)+...+/(я-1).
Если f(x) — функция строго убывающая, то имеют место
знаки строгого неравенства.
Действительно,
V+1
/(v + l)< j/(*)tf*</(v)
V
(со знаком неравенства, если f(x) строго убывает).
Следующие теоремы имеют аналогичный характер, и мы
приведем их без доказательств.
1) Maclaurin [1, I, 289]; Cauchy [2, 222].
136
РАЗЛИЧНЫЕ ПРИЛОЖЕНИЯ АНАЛИЗА
[ГЛЛУ
153. Если а0 < ах < а2 < . .. и f(x) убывает для х^а0,
то
п
Е (я„ — «v-i) /(«,) < f / (*) rf* < Е (я„ — а,„х) f{a,_x).
154. £сля /(•£)>-О и f(x) убывает в интервале (О, ;),
где 0<;S^1, а возрастает в интервале (5, 1), /#о
i{/(i)+/(i)+...+/(i=i)i<l/W*<
о
<¥{/(°)+/©+---+^)}-
155. ffc^a /(х>жу) является убывающей функцией от х
при постоянном у и убывающей функцией от у при
постоянном х, то
т п
Е Е /G»,v) < /(х, у) dxdy < е Е /Gm).
Применения этих теорем, особенно в теории сходимости
рядов, могут быть найдены в любом учебнике анализа.
4.8. Неравенство Юнга. Следующая простая, но полезная
теорема была доказана У. Юнгом1) и принадлежит к другому
типу.
156. Пусть ср(дг) — непрерывная и строго возрастающая
функция для х>>0, ср(0) = 0- Если ty(x) — функция,
обратная ср (х) (и обладающая, следовательно, теми же свойствами),
а>-0, *>0, то
а Ь
я*< f <?(*) rf*-}- Г ty(x)dx,
о о
причем знак равенства имеет место, только когда Ь = ®(а).
Теорема становится очевидной, если мы проведем кривую
у = ср (л:) или х = ф00, прямые л; = О, х = а, у = 0, у=Ь и
рассмотрим площади, ограниченные ими. Формальное доказа-
*) W. Н. Young pi.
4.8]
НЕРАВЕНСТВО ЮНГА
137
тельство содержится в доказательстве более общих теорем,
следующих ниже.
Следствием из теоремы 156 является
157. Если удовлетворены условия теоремы 156, то
аЬ^ау{а)-\-Ь№).
Теорема 157 слабее теоремы 156, но часто оказывается столь
же полезной в приложениях.
Перейдем теперь к более общим теоремам, содержащим
теорему 156.
158. Пусть v=l, 2, ..., я, av>0, /Jx) — непрерывные,
неотрицательные, строго возрастающие функции, и одно из
/v(0) равно нулю. Тогда
n/v«X2f П/Дат)<*/,(*),
причем равенство имеет место только в том случае, когда
aj = a2=... = an1).
Это неравенство становится очевидным, если рассмотреть
в пространстве п измерений кривую .rv = /v(£) и объемы,
ограниченные координатными плоскостями и цилиндрами,
проектирующими кривую на эти плоскости.
Для проведения формального доказательства положим
Ъ(*) = Л(х) (0<*<О, /Ц*) = Д(ау) (л;>0,
так что Fv (.*)<;/v(jt). Пусть ап будет наибольшим из av. Тогда,
принимая во внимание, что IIFv(0)=0, мы имеем
ап %
плк)=1Щ(ям) = | d{iiFv(x)} = z\ п/^(*)<адо=
о v о ^у
% «V
= Е \ nF,Cv)^/Xv)<sfn/,Cv)J/vCv),
причем знак равенства имеет место только в том случае,
когда каждое av равно ап.
*) Oppenheim fl]. Приведенное в тексте доказательство дано Т. Коу-
лингом (Т, G. Cowling).
138
РАЗЛИЧНЫЕ ПРИЛОЖЕНИЯ АНАЛИЗА
[ГЛ. IV
159*). Пусть gv(x) — система п непрерывных и строго
возрастающих функций, каждая из которых обращается
в нуль при х = 0; пусть
(4.8.1) llg;\x) = x
и av>-0. Тогда
О
причем равенство имеет место только в том случае, когда
gi(ax) = ^Ю = • • • = gn(an)-
Положим
g;\x) = x,(*), b v = g^\ a, = g;\b,) = ywV(£v),
и применим теорему 158 к системе f^(x) =у^(х). Тогда мы
получим
Система п функций
?*(*) = ft(*)/*,
связанных соотношением (4.8.1), является обобщением пары
взаимно-обратных функций. В самом деле, если п = 2,
положим g1(x) = xy(x), g2(x) = xty(x) и перепишем (4.8.1) в
следующих двух видах:
x/gj\x) = g*\x\ xlgi\x) = gi\x).
Тогда
?(*) = gi(x)/x = g^giMl ф(х) =g2(x)/x = йЧ&ООЬ
и g^gv gi±g2 взаимно обратны. Так как ср и ф теоремы 156
всегда могут быть представлены в такой форме, теорема 159
содержит теорему 156.
Если в теореме 159 положить g4(x) = xt/q4, 2<7v=1i
то условие (4.8.1) удовлетворено, и мы получаем
*) Cooper [l].
4.8]
НЕРАВЕНСТВО ЮНГА
139
т. е. теорему 9.
Если в теореме 156 положить ср(дг) = хк~1, где k > 1, то
^{х) = хк'~х> и получается теорема 61.
Если мы положим
?(*) = log(x+l), ^{у) = еУ— 1
и заменим и, -у через а-\- 1, &+ 1, то мы получим теорему 63
для и^> 1, т;>> 1 *).
Выше мы заметили, что можно интуитивно убедиться в
справедливости теоремы 156 на основании простых геометрических
соображений. Если же вместо площадей мы будем сравнивать
число точек с целыми координатами, то получим
160. Если у{х) строго возрастает вместе с х, <р(0) = 0,
и ^(х) функция обратная ср(х), то
т п
о о
где [у] обозначает целую часть от у.
Эта теорема сама по себе менее интересна, чем теорема 156,
но она дает представление об одном типе рассуждений, который
часто с успехом применяется в теории чисел.
*) В действительности этот результат имеет место для и > 0 и всех v.
См. § 4.4 (5).
ГЛАВА V
БЕСКОНЕЧНЫЕ РЯДЫ
5.1. Введение. До сих пор наши теоремы относились к
конечным суммам; теперь мы должны рассмотреть их
обобщения на бесконечные ряды. Мы покажем, что наши теоремы
остаются справедливыми при переходе к бесконечным рядам во
всех тех случаях, когда они сохраняют смысл.
Необходимо сделать два предварительных замечания.
(1) Первое замечание относится к пониманию наших формул.
Неравенство типа X < Y (или Х^С У)» где X и Y—бесконечные
ряды, следует всегда понимать как означающее, что „если Y
сходится, то X сходится и Х< Y (или X^.Y)U. Вообще
неравенство типа
(5.1.1) X<Y>AYb...Ze
(или Х^ %AYb...Ze), где К, ..., Z — конечное число
бесконечных, рядов, 2 — конечная сумма и А, Ь, ...,с
положительны, должно пониматься так: „если Г, ..., Z сходятся,
то X сходится и X удовлетворяет неравенству". Без эгого
замечания те неравенства, в которых стоит знак „<", могут
привести к недоразумению. Если Y расходится, мы можем
условно приписать ему величину оо; тогда Х^оо не содержит
никакого утверждения, тогда как Х<С.оо утверждает сходимость X,
что обычно будет неверно.
Некоторые из неравенств, которые нам встретятся, не будут
иметь вида (5.1.1). Они обычно будут вспомогательными, и
в случае сомнения относительно их толкования, они должны
быть сведены к виду (5.1.1). Так, Xa<iAYb должно быть
понято как
X<A1/aYb/ay
а это неравенство имеет вид (5.1.1); X>Y должно быть по»
нято как Y<X.
Одно важное неравенство, а именно,
(5.1.2) £a6>(S«fc)1№G^')1/u'.
где А<1, кфОг\ мы намеренно записываем в форме,
U (2.8.4) теоремы 13.
5.1]
ВВЕДЕНИЕ
141
отличной от (5.1.1). Мы могли бы записать его в виде
(5.1.3) 2 а* < (2 abf (2 Ь^Гк1к' >
если 0<£<1, или в виде
(5.1.4) 2**' < Gflbfil a*rkf/\
если &<0. Эти неравенства имеют вид (5.1.1) и в такой форме
возникают непосредственно в доказательстве теоремы 13. Мы
предпочитаем вид (5.1.2) по формальным соображениям, а также
потому, что он яснее выявляет различие между двумя случаями
теоремы; но если мы хотим явно и точно указать соотношения
сходимости, мы должны исходить из других форм.
В небольшом числе других случаев неравенство утверждается
не между двумя бесконечными рядами, а между выражениями,
являющимися результатами иных переходов к пределу. Так,
когда мы обобщаем неравенство G(a) < max а (теорема 2), то
получаем неравенство между бесконечным произведением и
верхней гранью бесконечного множества. Такое неравенство
X < К должно быть, конечно, истолковано так: „если Y конечно,
то X конечно и X < Yu.
(2) Второе замечание относится к методу и должно
рассматриваться в связи с § 1.7. Допустим, например, что мы
хотим доказать неравенство
(2a*)2<Sa2S*2
для бесконечных рядов. Мы знаем, что это неравенство имеет
место для конечных сумм (теорема 7), а так как а и Ь
положительны, то искомый результат сразу получается переходом
к пределу.
Таким простым методом мы не можем, однако, обобщить
теорему 7 на бесконечные ряды в ее полном виде, так как при
переходе к пределу знак строгого неравенства „<" переходить в
я^й, и мы не в состоянии выделить возможные случаи
равенства. Здесь, и в других случаях, мы должны избегать таких
переходов к пределу; вместо вывода теоремы для бесконечных
рядов из теоремы для конечных сумм, мы должны показать,
что доказательство, данное для конечных сумм, остается в силе
и для бесконечных рядов с теми минимальными изменениями,
142
БЕСКОНЕЧНЫЕ РЯДЫ
[ГЛ.У
которые необходимы в новых условиях. Например, каждое из
доказательств теоремы 7 в § 2.4 может быть распространено
на случай бесконечных рядов при помощи нескольких
очевидных замечаний о сходимости.
Нет необходимости систематически обобщать результаты
гл. II. Немногие возникающие при этом новые вопросы легко
разрешимы, и не особенно интересны, а наиболее важные из них
будут рассматриваться в более интересной форме в гл. VI.
В настоящей главе мы поэтому ограничимся лишь
иллюстрациями и замечаниями по поводу этих новых случаев и
закончим ее перечислением некоторых более важных теорем гл. II,
которые остаются справедливыми и для рядов.
5.2. Средние Шг. Начнем с некоторых замечаний,
связанных с одним новым вопросом, возникающим при определении
средних Шг. Мы имеем теперь бесконечное число элементов а
и весов /?, и должны рассмотреть два случая: сходимости и
расходимости ряда £/?.
(i) Если ряд £/? сходится, мы можем предположить, что %р = 1,
и писать q вместо р. В этом случае Шг определено для г > О
посредством равенства
(5.2 Л) ЭДг(<1) = (2?аг)1/г
и может рассматриваться, как „среднее" в смысле § 2.2, или
как „взвешенная сумма" в смысле 2.10 (iv). Шг{а) конечно или
бесконечно в зависимости от сходимости или расходимости
ряда %qar<
(ii) Если ряд 2р расходится, мы все же можем определить Шг
как предел, например, как
п п
(5.2.2) 2W, (а) = 11m (S p^/lp.f",
«->оо 1 1
или как соответствующий верхний предел lim. Последнее
определение не особенно интересно, хотя оно оставляет в силе
большинство наших теорем. Если мы определим Шу с помощью
(5.2.2), мы встретимся со следующим затруднением: из
существования Шг для данного г не следует его существование
ни для какого другого г. Действительно, мы можем найти
такую последовательность (а), что Шг будет существовать для
данных r = ru г2, ..., гт и ни для каких других значений /-.
Поэтому мы сосредоточим наше внимание на случае (i).
5.2]
СРЕДНИЕ Wlr
143
По поводу общего вопроса о существований Шг см., например,
Besicovitch [1]. В качестве иллюстрации указанного положения
наметим кратко, как найти а так, чтобы один из пределов
lim — (а, + cz2 + ...+ап), lim-(a\ + al + ... +a2n)
существовал, а другой нет; здесь р = 1.
Возьмем сначала две последовательности
ah а2, ..., аш, ах, а2» • • • * Pi» ?2» • • •» Рсо» Pi» ?2» • • •
с периодом со. Когда а = ее, оба предела существуют и равны
л = «i+«s+... +«о> л = ai + g2+...+gL
1 со ' 2 со
когда а = 3, они имеют соответствующие пределы Z?t и Б2.
Теперь возьмем в качестве а
ah c2, ..., «ш (повторенные Л^ раз),
f}lt £2, • • • 1 Ро> (повторенные N2 раз),
аь а2, •••» аю (повторенные N3 раз),
N9 Mi
Легко видеть, что предполагая последовательность Nlt -г^, -rf, ...
/Vi /v2
быстро стремящейся к бесконечности, мы можем сделать
— (а± + а2 + ••• +^п) и — (<*i + a2 +•••+я») колеблющимися
между соответственно, Ai% В± и Л2, #2* Условиями сходимости будут
тогда, соответственно, Аг = В\ и Л2 = В2 и очевидно, что мы можем
выбрать аир так, чтобы одно из этих условий было удовлетворено,
а другое нет.
Мы ограничиваемся в дальнейшем случаем (i). Определим Шг
для положительных или отрицательных г с помощью (5.2.1) при
условии, что 9ИГ = 0, если г < 0, и некоторые из а равны
нулю, или %раг расходится. Определим © (или Ш0) при
помощи равенства
(5.2.3) © (а) = TtQ (а) = I[aq = ехр (£ q log a)
и условимся, что © = сю, если Ш3 стремится к сю (т. е* если
Zq log tf стремится к + оо), и © = 0, если Шя стремится к О
(т. е. если %qloga стремится к —со). Заметим, что log a
может иметь любой знак и что определение © теряет смысл,
если Zqloga колеблется. В этом случае © не имеет смысла.
144
БЕСКОНЕЧНЫЕ РЯДЫ
[ГЛ.У
Из теорем 36 и 150 следует, что
(5.2.4) i0g/<^=i<^=i (0<r<U>0),
если £ф1. Определим log+/ и log-/ посредством равенств
log+/ = log/(/> 1), log+/ = 0 (0</<1),
log-/ = log / (0 < / < 1), log"/ = 0 (/ > 1),
так что
log+/>0, log"/<0, log/=log+/ + log-/,
log-/ = — log+—.
Из (5.2.4) тогда следует, что
0 < Zqlog+a < у S '? («r - 1) < -j E' ? («s-1),
где £' означает суммирование по всем а, превосходящим
единицу. Таким образом, если Ш8(а) конечно для некоторого
положительного 5, то Шг(а) конечно для 0 < г < s и %q\og+a
сходится. Аналогично мы можем доказать, что если Ш~8(а)
положительно для некоторого положительного s, то Ш_г(а)
положительно для —s < — г < 0 и £q\og~a сходится. В
первом случае © положительно и конечно или равно нулю, во
втором — положительно и конечно или бесконечно. Если £ q log a
колеблется, то оба ряда £#log+a и Zq\og~a расходятся; это
возможно только в том случае, когда ffir(a) = oo для всех
положительных г и Шг(а) = 0 для всех отрицательных л
Это и является тем единственным случаем, когда © теряет
смысл.
Мы сталкиваемся здесь с одним новым обстоятельством,
которое, как мы увидим в § 5.9, сказывается при определении
случаев равенства в некоторых из наших теорем. Это
обстоятельство возникает в связи с тем, что при г^ 0 ffir(a) может
быть нулем и в том случае, когда ни одно а не равно нулю.
Если г> 0, то, как и в гл. II, Ttr(a) может быть нулем только
в том случае, когда (а) — нулевая последовательность, и в этом
случае %Rr(a) = 0 для всех г. Но дело обстоит иначе, если
г<;0. Для такого г Шг(а) в гл. II было нулем в том и только
в том случае, когда некоторые а были нулями, и тогда Ttr(a)
было равно нулю для всех г <! 0. Теперь же при г <; 0 возможно,
5.3]
ОБОБЩЕНИЯ ТЕОРЕМ 3 И 9
145
что Ш8(а) равно нулю для $<г и положительно для $ ^ г,
или равно нулю для $^г и положительно для s > г.
Так, в теореме 1 мы имели два исключительных случая:
min a < Ttr (a) < max a *),
кроме тех случаев, когда все а равны или г < 0 и одно из а
равно нулю. Все, что мы можем сказать теперь, состоит в
следующем: „кроме тех случаев, когда либо все а равны (тогда
оба неравенства обращаются в равенства), либо г < О и
Ttr(a) = О (тогда первое неравенство обращается в равенство)".
Например, аналогичное затруднение возникает, в связи с
теоремами 2, 5, 10, 16, 24 и 25 (если ограничиться только
результатами, упомянутыми в нашей сводке в § 5.9).
5.3. Обобщения теорем 3 и 9. Мы воспользуемся
неравенствами (5.2.4) и соотношением
lim —— = iogf.
r->0 r
Полагая в (5.2.4) t = a\^qa = a\% иг=1, имеем
loga —log?l<-|r —1,
log © — log 51 = £ q (log a — log 21) < 1 — 1 = 0,
причем равенство имеет место только в том случае, когда
каждое а равно 51. Таким образом, аналог теоремы 9 доказан.
Предположим теперь, что Ш8 конечно для некоторого
положительного 5. Тогда © положительно и конечно или равно
нулю; приведенное ниже доказательство применимо к обоим
случаям^. Для данного е>0 мы можем найги N так, что
(5.3.1) S <7loga<log(© + e),
(5.3.2) 2 q£=±<*>
n>N s
*J Здесь под min и max нужно, конечно, понимать соответственно
точную нижнюю и верхнюю грани. (Прим. перев.)
^ Это доказательство построено аналогично данному Ф. Риссом
[F. Riesz, 7J для соответствующей интегральной теоремы; см. § 6.8.
146
БЕСКОНЕЧНЫЕ РЯДЫ
[ГЛ.У
и затем г0 так, что 0 < r0 < s и
(5.3.3) Е д^^< Е ^loga + s
для 0 < г < г0. Тогда мы будем иметь
log © (а) = у log © (ar) < у log % (a?) < «(£^Zli =
а*— 1 - v ar— 1 .
n<N r n>N r
< Е q\oga-\-s + Е ^^1<log(© + e)+2^
Следовательно,
log Жг (а) =у log 51 (а') -> log ©(а)
при /* -> -f- 0. Доказательство того, что если Wlr положительно для
некоторого отрицательного /*, то 9№г-> © при г-* — 0, мы
предоставляем читателю.
5.4. Неравенство Гельдера и его обобщения.
Доказательства неравенства Гельдера и других теорем того же типа,
данные в гл. II, применимы и к бесконечным рядам. Заметим,
что ряды могут быть также кратными. Так,
(£SMVv)2<2S^,SE4.
Предположим, например, что Sty! и Efv сходятся, и положим
V = «,Л> V* = О Н- v)-1"5 (S > 0).
Так как ЕЕ(^Н- v)-2-28 сходится, то, следовательно, сходится
и ряд
Это—неполная форма теоремы 315, которая будет
доказана ниже.
Теоремы о Шп выведенные из неравенства Гельдера (теоремы
16 и 17), остаются без изменений, за исключением формулировки
второго случая равенства в теореме 16, которая должна быть
изменена в соответствии с нашими замечаниями в конце § 5.2.
Теперь мы должны сказать: „кроме того случая, когда s<10
и Tis(a) = 0u.
2Е«Л/(»* + у)1+8
5.4] НЕРАВЕНСТВО ГЕЛЬ ДЕР А И ЕГО ОБОБЩЕНИЯ 147
В связи с этой группой теорем возникает еще один, более
интересный, вопрос. Существует теорема,, внушаемая теоремой 15,
но не являющаяся ее следствием (даже в ее обобщенном виде
для бесконечных рядов) и не имеющая аналога для конечных
сумм.
161 1). Если k > 1 и ряд ^ab сходится для всех Ьу для
которых %Ьк'<Ссо, то %ак сходится.
Мы выведем эту теорему из следующей теоремы Абеля 2>?
которая представляет и большой самостоятельный интерес.
162. Если ряд %ап расходится и
так что Ап-> со, то
(О Ет расходится,
00 S !?5 сходится для каждого положительного Ь,
Ап
(i) Правая часть неравенства
ап\-1 j^ ^w+2 _|_ _|_ ап+г -^ Ап+г Ап -. Ап
"Г • ' ' ~Г А.. , ^ А . .. — *
At + l^
[п+1 ^п±2 ппЛ-г лп+г лп+г
стремится к 1 для данного п и г -> со и, таким образом,
будет больше х/г Для каждого я и некоторого соответствующего г.
Это доказывает утверждение (i).
*) Landau [1].
2) Abel [1]. Существуют теоремы того же типа, содержащие
произвольную функцию /(•*)• Так, если Е ап расходится, f(x) положительна
и убывает и
■J/w
rfAT,
то сходимость / влечет за собой сходимость Е ctnf(An)% и из
расходимости / следует расходимость llanf(An--[): см., например, Ш. Ж.
де ла Балле Пуссен [1, 398—399], Little wood [1]. Эта теорема, хотя и
более общего характера, не содержит теорему 162 как частный
случай: из расходимости / еще не следует, что Е ^nf^An) расходится.
Примером может служить
ап=2~ , /(*) =
xlogx
148
БЕСКОНЕЧНЫЕ РЯДЫ
[ГЛ.У
(И) Мы можем, очевидно, предположить, что 0<8<1.
Тогда ряд
4-4-i /_i Л
ЛЬ АЬ ~ L\Ab ЛЧ
сходится. По теореме 41 числитель общего члена левой части
не меньше, чем ^A^Z\(An—^n-i) = &<V*n_1' Отсюда
следует, что ряд
сходится. Таким образом мы доказали даже несколько больше,
чем утверждается в (ii).
Для вывода теоремы 161 положим
ак = и> аЪ = uv, bh' = uvk'.
Мы должны доказать, что если ряд£#п расходится, то
существует последовательность vn, для которой Ъ^п°п расходится,
a Е unVn сходится. Возьмем vn = l/Un, где Un = u1-\-u2-\-
-\- ... -j- un, и результат следует из теоремы 162.
5.5. Средние fflr (продолжение). О средних Шг остается
добавить лишь несколько замечаний. Начнем с замечания,
касающегося обобщения теоремы 4. Та часть этой теоремы, которая
относится к положительным г, должна быть интерпретирована
следующим образом: „если последовательность (а) ограничена,
а а* = max а есть ее верхняя грань, то
при г-+-\-со; если же (а) неограничена, но дЛг конечно для
всех положительных г, то 3№г-*со.
Непрерывность Ttr для конечных положительных или
отрицательных г теперь не совсем очевидна. Мы формулируем
ниже полную теорему, но не приводим ее доказательства, так
как все возникающие в нем вопросы повторятся в более
интересной форме в гл. VI (§§ 6.10—6.11).
Если ап = С, то Ttr = С для всех г и положительного
или равного нулю С. Мы исключаем этот случай, а также тот
5.6]
суммы ©r
149
случай, в котором & не имеет смысла, когда Ttr = оо для г > О
и ЭД?у=0 для г<0. Мы пишем
^(a) = log2Rr(a)
(и условимся писать logoo=-|-co, logO =—со).
163. За исключением только что упомянутых случаев,
множество I значений г, для которых 8г(а) конечно,
является либо нулевым множеством, либо замкнутым,
полузамкнутым или открытым интервалом (ut v), где —со ^ и <;
^^^-|-оо, содержащим г = 0 внутри или в одном из
концов, так что «<;0<>, а в остальном произвольным (в
частности этот интервал может содержать все действительные г или
ни одного). gy=-|-co правее и 2Г=—со левее 1, а внутри
J (если он существует) Qr является непрерывной и строго
возрастающей функцией от г. Далее, когда г приближается
к концам I изнутри, Qr стремится к пределам, равным его
значениям в этих точках.
5.6. Суммы ©у. Определение ©г, данное в § 2.10, остается
без изменений, и мы ничего не можем добавить к теоремам,
относящимся к этим суммам; только теоремы о непрерывности
©^ как функции от г становятся теперь, естественно, менее
очевидными. Теорема 20 должна быть понята так, что „если
©у сходится для некоторого (достаточно большого) г, то она
сходится и для всех бблыиих г и т. д.а, а теорема 21 так, что
„если ©у сходится для всех положительных (произвольно малых)
г, то и т. д.". Обобщение теоремы 20 может быть доказано
следующим образом. Если ©j? сходится для некоторого
положительного /?, то ап->0, и ©г сходится для г > /?. Суще»
ствует наибольшее а, которое мы можем (в силу однородности)
предположить равным 1; предположим также, что
последовательность (а) убывает. Если тогда
#1 = а2= ... =ая= 1 > #д-+1,
то мы имеем
<зг=(лН-<&+1+...)1/>
для г > /?. Сумма бесконечного ряда лежит между 1 и
W + 4+1+.-. >
откуда и следует теорема.
150
БЕСКОНЕЧНЫЕ РЯДЫ
[ГЛ.У
Имеет место новая теорема (тривиальная в случае конечных
сумм).
164. Если Zr сходится, то ©г непрерывна для г > R и
непрерывна справа для r = R. Если ©# расходится, но ®г
сходится для /•>/?, то ©г->го при r-+R.
Доказательство может быть предоставлено читателю.
5.7. Неравенство Минковского. Основные рассуждения
§§ 2.11—2.12 не требуют изменений. Теоремы 24—26 могут
быть следующим образом обобщены на двойные бесконечные
ряды.
165 !). Если г>1 и атп не имеет вида Ьшсп, то
{ 1 Яп (Е Рт"тпУ )1/Г < S Pm (S Vfflmn)1".
п т т п
Если 0 < г < 1, то имеет место обратное неравенство.
Не ограничивая общности, мы можем предположить, что
/7=1, <7=1, и доказательство проходит, как раньше
Аналогично, теореме 27 соответствует
166.
п т т п
если г> 1 (г обратным знаком неравенства, если 0<г<1),
за исключением того случая, когда для каждого п атп = 0
для каждого т, кроме одного.
5.8. Неравенство Чебышева. В качестве дальнейшего
примера возьмем неравенство Чебышева (теорема 43).
Мы можем предположить, что %р=1. Тождество
п п п п 1 п п
2 /V S /\я А — Е V> 2 р А = о- S S /^/\ К — 0V) (*a — *v)
1 k 1 lrrl z 1 1 r 4 ^
показывает, предполагая, конечно, что ни (я), ни (b) не является
нулевой последовательностью, (i), что если (а) и (Ь) упорядочены
в одинаковом смысле, то из сходимости ^pab следует
сходимость %ра и £/А и (и), что если (а) и (р) упорядочены
в противоположных смыслах, то из сходимости %ра и £/;&
следует сходимость %pab. В каждом случае мы можем
положить в тождестве я = оо, и наши выводы следуют, как раньше.
V Здесь, как и в теореме 26, мы отклоняемся от нашего
обычного условия относительно q.
РАЗНЫЕ ТЕОРЕМЫ И ПРИМЕРЫ
151
5.9. Сводка результатов. Следующая теорема является по
существу перечислением основных теорем гл. II, которые
остаются справедливыми для бесконечных рядов, с теми
примечаниями и дополнениями, которые были приведены в предыдущих
параграфах.
167. Теоремы 1, 2, 3, 4, б, 7, 9, 10, И, 12, 13, 14,
15, 16, 17, 18, 19, 20, 21, 22, 24, 25, 27, 28 и 43 остаются
справедливыми и для бесконечных рядов, если их
утверждения понимать в соответствии с замечаниями § 5.1 и если
в теоремах 1, 2, 5, 10, 16, 24 и 25 изменить формулировки
случаев равенства в соответствии с замечаниями § 5.2.
Полезно все же развить последнюю оговорку теоремы более
подробно. Последние слова теорем должны быть заменены следующими:
(1) „или г<0и Жг(а) = 0\
(2) „или @(а) = 0",
(5) „или г<0« ЯЯЛя) = 0%
(10) „или (2) ® (а + Ь +..,+/) = 0",
(16) „или s^0 и Ж8(а) = 0«,
(24) „или г<0« Жг{а + Ъ+ ... + /) = 0\
(25; „или г<0и (%(а + Ь+ ...+ lf)xfr = 0".
Добавим также, что (как было разъяснено в § 6.4) большинство
теорем, перечисленных в теореме 167 (в особенности те, которые
относятся к Wlr)y могут быть выведены как частные случаи из
соответствующих теорем для интегралов. В гл. VI, однако, мы часто не
будем рассматривать отрицательные значения г.
РАЗНЫЕ ТЕОРЕМЫ И ПРИМЕРЫ *)
Большинство следующих ниже теорем связано, главным образом,
с теоремами 156 и 157. В теоремах 168—175 мы предполагаем, что
f(x) и g(x) взаимно обратные, строго возрастающие функции,
обращающиеся в нуль при х = 0, и что
X X
F(x) = J f(u) du, G(x) = J g(t) dt.
о о
168. Если ряды £ F(<in) и Е G (У сходятся, то }laubn тоже
сходится и
Е^я<Е/гЫ + ЕО(*||).
[Следствие из теоремы 156]
*) См. также Дополнение II в конце книги. (Прим. ред.)
152
БЕСКОНЕЧНЫЕ РЯДЫ
[ГЛ.У
169. Если ряды Tlanf(an) и Lbng(bn) сходятся, то ряд )±апЬп тоже
сходится и
2 апЬп < ЛапДап) + 2 bng(bn).
[Следствие из теоремы 157.]
170. Можно найти такую / (и, следовательно, g, F, G) и такие ап>
что YiF(a<ri) расходится, но %апЬп сходится для всех Ьп> для которых
2 О (Ьп) сходится.
171. Возможно сделать ряд 2 anf(an) расходящимся, в то
время как Ъ^пРп сходится для всех Ьп, для которых сходится %bng<bn).
[Последние две теоремы показывают, что для теорем 168 и 169 не
существует обратных теорем в том смысле, в каком теорема 161
обратна неравенству Гельдера, и, следовательно, не существует
соответствующего признака сходимости. Теорема 171 была доказана
Купером [Cooper, 3J; теорема 170, содержащая теорему 171 и несколько
более сильная, чем она, может быть доказана аналогично.]
172. Если 2; гп—: сходится, то 2i—— также сходится.
log(l/&n> ' log я
[Cooper [3]; теорема 172 используется в доказательстве Купера
теоремы 171.]
173. Если g(x) удовлетворяет неравенству
gfry)<gWg(y)
и если ЪапЬп сходится всегда, когда сходится Lbng(bn), то )^anf(an)
сходится. Аналогично, из сходимости Т>апЬп для всех Ьп, для которых
2С/(&пХ00' следует сходимость %F(an).
[По поводу первого утверждения, которое в данном случае
сильнее, см. Cooper [3]; второе утверждение является следствием первого.]
174. Если 2#А сходится всегда, когда сходится 2 О (Ьп), то
существует число \ = \(а), зависящее от последовательности (я), для
которого T,F(kan) сходится.
175. Если удовлетворены условия теоремы 174 и F(cx)^kF(x)
для малых х, некоторого с>1 и некоторого k, то TtF(an) сходится.
[О последних двух теоремах см. Birnbaum и Orlicz [1J.J
176. Если ап и Ьп стремятся к нулю, k положительно и
2 £* Е*~*/&*
log(l/an)'
сходятся, то 2 cin^n сходится.
[Использовать теорему 169.]
177. Если х > 0, ап > 0 и f(x) = 2 апхп, то f(x) — выпуклая
функция от х и \ogf(x) — oj log*.
[Ясно, что /"(л:)>0. Для доказательства второго утверждения
положим х = е У, f(x) = g (у). Тогда
ggrr -gr2=L ane-«v 2 п2апе-пу - (2 nane-*vf > 0,
по теореме 7. Результат следует теперь из теоремы 118.]
РАЗНЫЕ ТЕОРЕМЫ И ПРИМЕРЫ
153
178. Если ям>0, Xw>Xw_!>0h f(x) = %апе Х*Л то \ogf(x) —
выпуклая функция от лг.
179. Если flw>0 и Х^, }хп, ..., vn, х, у, ..., г — действительные
числа, то область D сходимости ряда
Е ae>*+Mf + — +v* = f(x,y z)
выпукла, и log/ — выпуклая функция от х, у, ... , z в D.
[Ибо (по теореме 11, обобщенной на бесконечные ряды)
<{/(*!, ...,^}Ч/(*8.---.«2)}1-*.
Здесь наши соглашения относительно сходимости играют важную
роль.]
180. S 4 < 2 (Е Л») V. (Е (вя - an+1)»)V.,
если не все а равны нулю.
[См. теорему 226.]
Г Л А В А VI
ИНТЕГРАЛЫ
6.1. Предварительные замечания об интегралах Лебега.
Интегралы, рассматриваемые в настоящей главе, — это интегралы
Лебега; только в §§ 6.15—6.22 мы будем иметь дело с
интегралами Стилтьеса. Здесь уместно указать, какие сведения из
теории интегрирования предполагаются известными. Как правило,
они очень невелики. Читателю, обычно, достаточно знать, что
существует некоторое определение интеграла, которое обладает
свойствами, перечисленными ниже. Многие из наших теорем
сохраняют смысл и остаются справедливыми и при более
старых определениях интеграла; однако рассмотрения становятся
легче и в то же время более полными, если мы будем
основываться на определении интеграла достаточной общности.
Мы предполагаем известным понятие измеримого множества,
как правило, линейного, но иногда и нескольких измерений.
Рассматриваемые нами множества могут быть ограниченными
или неограниченными. Определение меры применимо в первую
очередь к ограниченным множествам; неограниченное же
множество считается измеримым, если каждая ограниченная часть его
измерима, и за его меру принимается верхняя грань мер всех
его ограниченных частей *).
Мы будем без оговорок предполагать, что каждое
рассматриваемое нами множество Е измеримо. Мы обозначаем меру Е
через тЕ% а когда это не может вызвать недоразумений, то и
просто через Е. Когда Е неограничено, тЕ может быть
бесконечностью.
Мы также предполагаем, что читатель знаком с понятием
измеримой функции. Суммы, произведения и пределы
измеримых функций измеримы. Все функции, определяемые обычными
процессами анализа, измеримы, и мы ограничимся рассмотрением
только измеримых функций; мы не будем, как правило, каждый
раз повторять, что рассматриваемые нами функции
предполагаются измеримыми.
Далее, мы предполагаем у читателя знакомство с
определением интеграла от ограниченной или неограниченной функции
*^ Здесь под ограниченной частью множества понимается его общая
часть с некоторой конечной сферой. (Прим. перев.)
6.1] ПРЕДВАРИТЕЛЬНЫЕ ЗАМЕЧАНИЯ ОБ ИНТЕГРАЛАХ ЛЕБЕГА 155
по (ограниченному или неограниченному) интервалу, или по
измеримому множеству. Ограниченная измеримая функция
интегрируема по любому ограниченному измеримому множеству.
Мы называем класс (ограниченных или неограниченных)
функций, интегрируемых в (ограниченном или неограниченном)
интервале, или на множестве Е, классом L или, если нужно
подчеркнуть множество, по которому берется интеграл, классом L(E).
Если / принадлежит к L, то мы пишем f£L.
Если / = 1, то \ fdx = mE.
w
Если /£/,, то |/| gl.
Если /+ и /~ — функции, равные /, когда /, соответственно,
положительна или отрицательна, и равные нулю в остальных
случаях, так что
/+ = тах(/,0), /-=тШ(ДО), / = /+ + /~, |/| =/+-/",
и если /£L, to /+£Z, и / ^L и1)
J/rfx= J/+<**+ j/~^, f \f\dx= \f^dx — §f~dx.
Если/;^>0 и (f)n = min (/, /z), то (по определению)
[fdx = lim [{f)ndx.
Если f£Lu(g измерима и) \g\ < C|/|, to £*£/,.
Если /!,/2, ...,/„££, To
j Oi/i + ^2/2 + ■ ■ ■ + *«/«) ^ =
= a, j/x rfx -+- a2 J/2 ^x H- ... -+- an j/n rfx.
Если p>0 и (/ измерима и) |/|P£L, то мы говорим, что
/ принадлежит к классу 1Р, и пишем f£Lp. Эти классы
особенно важны при /?!>1. Класс Z,1 совпадает с L.
Если интегрирование производится по конечному интервалу
(или по ограниченному множеству), то класс Lp содержит каждый
*) Мы приводим результаты, относящиеся к функциям одного
переменного, и не указываем те множества, по которым производится
интегрирование.
156
ИНТЕГРАЛЫ
[ГЛ. VI
класс /Л с #>/?; f£Lq влечет /£/Л Ограниченная функции
принадлежит к каждому Lq. Эти предложения не имеют места для
бесконечных интервалов: / может принадлежать к Lp (О, оо)
для единственного значения р.
Если интервал конечен и /£/Л р <#, то \f\p < 1 + |/|3, так
что f$Lp.
Если рассматриваемый интервал есть (0, я), где а < 1, то
(1) х"^ $Lp~b для любого о > 0, но не принадлежит к Lp;
(2) x-''i/*(log~y2/P£LP, но не принадлежит к Lp+b; (3) log— $LP
для любого р\ и (4) е^х не принадлежит ни к какому Lp. Если мы
имеем дело с интервалом (0, оо), то х~^2 (] + I l°g-*" |)~~г €^2» но не
принадлежит ни к какому другому Lp.
6.2. Замечания о нулевых множествах и нулевых
функциях. Множество меры нуль называется нулевым множеством.
В теории интегрирования мы можем пренебрегать нулевыми
множествами. Если / = g\ за исключением точек, составляющих
нулевое множество, то мы говорим, что fug эквивалентны,
и пишем f = g. Эквивалентные функции имеют равные
интегралы (если они вообще интегрируемы).
Если / = 0, то мы говорим, что / есть нулевая функция.
Аналогично мы определяем понятия: „функции,
эквивалентные на £% „функция, нулевая на Еи. Вообще мы не будем
отмечать множество Е, если все ясно из контекста, как,
например, если мы рассматриваем интегралы, распространенные по Е.
Если все х, кроме х, принадлежащих некоторому нулевому
множеству, обладают каким-либо свойством р(х\ то мы говорим,
что почти все х обладают свойством р(х), или что р(х) имеет
место для почти всех х, или почти всюду. Так, нулевая
функция почти всюду равна нулю.
Обычно мы предполагаем, что наши функции /, gy ... почти
всюду конечны; но в некоторых случаях мы должны будем
рассматривать функции, бесконечные на множестве
положительной меры. Так, если / неотрицательна, равна нулю на
множестве Е положительной меры, и г < О, то мы должны
рассматривать fr на Е как бесконечность и \ frdx как имеющий
значение со.
6.3] ЗАМЕЧАНИЯ, ОТНОСЯЩИЕСЯ К ИНТЕГРИРОВАНИЮ 157
Если Е— нулевое множество, то
Е
для всех /. Мы будем без оговорок предполагать, что
множество Е, по которому распространяется интеграл, не нулевое.
Если /^>0, то необходимым и достаточным условием
для того, чтобы \ fdx = О, является /= 0.
Напомним здесь теорему, которая заменяет это предложение
в теории интеграла Римана. Мы обозначаем через R класс функций,
интегрируемых в смысле Римана. Чтобы / принадлежала к R,
необходимо и достаточно, чтобы / была ограничена и чгобы множество
точек разрыва / имело меру нуль.
Если f£R и />0, то необходимым и достаточным условием
для того, чтобы \fdx = 0 является выполнение равенства / = 0
во всех точках непрерывности /.
Действительно, если, во-первых, условие выполнено, то /=0 и,
следовательно, \/d* = 0. И, во-вторых, если оно не выполнено, то
существуют точка непрерывности £, в которой /(£)>0, и интервал,
содержащий 5, в котором f(x)> о-/(£), так что \fdx>0.
Эта теорема позволяет нам определять случаи равенства в наших
неравенствах, когда они относятся к функциям, принадлежащим к R.
Действительно, большинство наших теорем может быть понимаемо
двояко. Мы будем все время считать, что интегралы суть интегралы
Лебега и „нулевая функция" и „эквивалентные функции" должны
пониматься как в теории Лебега. Но можно также принять, что
интегралы суть интегралы Римана, а „нулевая функция" — это функция,
равная нулю во всех точках ее непрерывности, и „эквивалентные
функции" — это функции, разность которых есть нулевая функция в этом
смысле.
6.3. Дальнейшие замечания, относящиеся к
интегрированию. Изложенное в §§ 6.1 и 6.2 является достаточным
основанием для большинства дальнейших теорем, как, например, для
самых полных форм неравенств Гельдера и Минковского
(теоремы 188 и 198). Мы встретимся лишь с немногими случаями,
в которых мы должны будем прибегнуть к более сложным
теоремам, которые мы здесь сформулируем.
(а) Интегрирование по частям. Нужна следующая теорема:
если / и g—абсолютно непрерывные функции, то
]fg'dx=\fgfa-]f'gdx.
а а
158
ИНТЕГРАЛЫ
[ГЛ. VI
(b) Переход к пределу под знаком интеграла. Двумя
основными теоремами являются здесь следующие.
(1) Если \sn(x)\<y(x)% где <р££> и sn(*) стремится
к пределу s (х) для всех или почти всех х, то
\ sn(x) dx -> I 5 (х) dx.
(2) Если sn(x) £ L для каждого п, sn(x) возрастает с /г
для всех или почти всех х, и
\\msn(x) = s(x),
то
\ sn(x) dx -» i s(x) dx.
В предложении (2) интеграл в правой части может быть
бесконечен, и в этом случае результат должен читаться как
l sn(x) dx—> оо; в частности, это имеет место, когда $(.*;) = оо
на множестве положительной меры. В каждой из этих теорем
п может быть целым числом, стремящимся к бесконечности, или
непрерывным параметром, стремящимся к некоторому пределу.
Как показывается в руководствах по теории функций
действительного переменного, из (1) следует, что функция f(x), для которой
разностное отношение \f{x-\-h)— f(x)]jh ограничено (и которая,
следовательно, почти всюду имеет производную), является интегралом от своей
производной. Из этого замечания и из замечания сделанного в конце
§3,18 следует, что непрерывная выпуклая функция f(x) является
интегралом от своей производной f(x) или ее односторонних производных
f'i(x), f'r{x). Она является, таким образом, интегралом от возрастающей
функции. С другой стороны, если f(x) есть интеграл от возрастающей
функции g(x) и /г>0, то
хЛ-Ь х
/(* + *)-/(*)=]" g(u)du>^ g(u)du=f(x)-f(x-h),
х x—h
так что f{x) выпукла. Следовательно, класс непрерывных выпуклых
функций совпадает с классом интегралов от возрастающих
функций.
Любая возрастающая функция принадлежит к /?, так что эти
интегралы существуют в смысле Римана, и предыдущая теорема может
быть доказана и без применения теории Лебега.
6.4]
ЗАМЕЧАНИЯ О МЕТОДАХ ДОКАЗАТЕЛЬСТВ
159
(c) Подстановка. Основной теоремой является: если fug
интегрируемы, g^O, G— интеграл от gt и a = G(a),
й = 0(р), то
ъ р
(6.3.1) j f(x)dx = §f{G(y)}g(x)dy.
а а
Здесь любое из а> Ь, а, $ может быть бесконечностью^.
(d) Кратные и повторные интегралы. Мы будем применять
только „теорему Фубини": Если f(x,y) измерима и
неотрицательна и один из интегралов
ав а в в а
\ \ fdxdyy \ dx J f dy% J dy j fdx
а Ъ а Ъ Ъ а
существует, то существуют и два других, и все три равны.
Пределы интегрирования могут быть конечными или
бесконечными, и сами интегралы могут быть расходящимися (если один
из них расходится, то расходятся и другие два).
Пусть f(x, у) измерима и неотрицательна. Двойной интеграл
равен нулю только в том случае, когда f{x,y) — нулевая
функция, т. е. когда множество значений, для которых / > О,
имеет меру 0. Первый повторный интеграл равен нулю в том
и только в том случае, когда fix,у)—нулевая функция от
у для почти всех х\ второй—когда fix, у) —нулевая
функция от х для почти всех у. Следовательно, соответствующие
три понимания „нулевой неотрицательной функции от двух
переменных* эквивалентны.
6.4. Замечания о методах доказательств. Неравенства,
доказанные для конечных сумм, часто могут быть
распространены на интегралы посредством предельных переходов, но при
этом обычно кое-что теряется. В качестве примера рассмотрим
интегральный аналог теоремы 7.
^ Добавим еще два замечания, относящиеся к формуле (6.3.1).
(1) Если мы, как в тексте, предположим, что g неотрицательна
и интегрируема, но что / только измерима, то существование
выражения в правой части (6. 3. 1) является как необходимым, так и
достаточным условием для существования левой части, т.е. для
интегрируемости /.
(2) Хотя из интегрируемости f(x) следует интегрируемость
f{G(y)}g(y), отсюда не следует даже измеримость f{G (у)}.
160
ИНТЕГРАЛЫ
[ГЛ. VI
Предположим сперва, что f(x) и g(y) неотрицательны и
интегрируемы в смысле Римана в (0,1); положим в теореме 7
Разделив обе части на я2, получим !)
и, переходя к пределу при я-> сю,
(6.4.1) (J/^*) < \f*dx lg*dx.
о
При рассмотрении интегралов Лебега мы должны рассуждать
иначе2).
Предположим, что fug неотрицательны и £L? на (0,1)
и что ers есть множество, на котором
^</,<Т'£Т1<«в<Т C,s=l,2,3,...).
Тогда, по теореме 7,
о
Но
1
о
и для g имеет место аналогичное неравенство. Отсюда,
переходя к пределу при п-+ со, мы получаем (6.4.1).
В обоих случаях наш окончательный результат несовершенен
Даже если мы воспользуемся теоремой 7 с я<", это
вырождается в „ ^" при переходе к пределу, и мы теряем из
виду возможные случаи равенства.
Переход в обратном направлении от интегральных неравенств
к неравенствам между рядами значительно проще и может
*) Здесь существенна „однородность относительно 2а (§ 1.4).
*) Строгая форма этого рассуждения была предложена нам
Г. Эрселлом (Н. D. Ursell).
6.5]
ДАЛЬНЕЙШИЕ ЗАМЕЧАНИЯ О МЕТОДЕ
161
быть произведен подходящим выбором функций. Рассмотрим,
например, неравенство
1 1
(6.4.2) ехр (J logf(x) dx) < j f(x)dx
о о
(§ 6.7, теорема 184). Если
и мы положим
f(x)=a, (qx-\- ... H-^v-x <x<qx-\- ... + ^-i + ?„)»
причем ?! + ... + (7v-i означает нуль при v = 1, то получается
теорема 9. Случаи равенства в теореме 9 следуют также
непосредственно из случаев равенства в (6.4.2).
Этот метод часто бывает очень полезен, так как с
интегралами обычно легче оперировать, чем с рядами. Примеры этого
мы встретим в гл. IX.
6.5. Дальнейшие замечания о методе; неравенство
Шварца. Мы преодолеваем осложнения § 6.4 так же, как в
случае бесконечных рядов, а именно таким изменением
доказательств гл. II, что они становятся применимыми к интегралам
наиболее общего типа. Рассмотрим для примера „неравенство
Шварца" (или Буняковского; см. стр. 16), аналог теоремы 7.
181. (lfgdxf<\f*dxlg*dx,
кроме того случая, когда Af=Bg, где Л и В постоянные,
из которых, по крайней мере одна отлична от нуля.
Здесь, и дальше, мы опускаем пределы интегрирования, если
они не играют никакой роли. Они могут быть конечны или
бесконечны, или интегралы могут быть распространены на любое
измеримое множество £", причем в этом последнем случае
Af = Bg означает, конечно, что Af=Bg на Е. Мы также
предполагаем, в соответствии со сказанным в § 5.1, что „X <С Y"
означает, „если Y конечно, то X конечно и Аг< К", и что
другие формы неравенств, упомянутые в § 5.1, должны быть
интерпретированы аналогично. Так, каждое неравенство
содержит некоторое утверждение относительно „сходимости",
которое мы будем особо подчеркивать только в отдельных случаях.
Например, в теореме 181 неявно содержится утверждение,
162
ИНТЕГРАЛЫ
[ГЛ. VI
что „если \ f2dx и J g2dx конечны, то fgdx конечен; если
/и g£L\ то fg£L\
Приведем доказательства, соответствующие доказательствам
§ 2.4.
(i) Имеем
§f*dx$g*dx — ^/gdxf =
= \ J7V) dx J g\y)dy + i- j /»(*) rf* j Л.у) tfy -
-J/(*)tf(*) dx \f{y)g{y)dy =
= y j> J l/WtfOO—*(*)/00}a<** > o-
Остается рассмотреть возможности равенства. Во-первых,
равенство несомненно имеет место, если Af=Bg. Дальше,
если равенство имеет место и g—нулевая функция, то Af = Bg
с А = 0, В=\. Мы можем поэтому предположить, что g ф 0,
так что множество Е, на котором g Ф О, имеет
положительную меру. Если
|<*У j {/(*) giy) -g(x)f(y)fdx = 0,
TO
(6.5.1) j{/(*) g(y) —g{x)f(y)fdx = 0
для почти всех у и, следовательно, для некоторого у,
принадлежащего к Е. Мы можем поэтому предположить, что g (у0) Ф 0
и что (6.5.1) имеет место для у = у0. Но тогда f(x)g(yQ)—
— ё(х)/(Уо) = ® для почти всех х> и теорема доказана,
(и) Квадратичная форма
§W+\bg)*d* = V$f*dx + 2kp$fgdx + }L*§g*Jx
положительна. Мы можем теперь закончить доказательство,
как в § 2.4.
Подобным образом доказывается аналог теоремы 181 для
кратных интегралов. Обычно мы не будем приводить таких
обобщений, но будем ими иногда пользоваться. Во всех таких
случаях эти обобщения могут быть доказаны таким же образом,
как и основная теорема.
6.6]
ОПРЕДЕЛЕНИЕ СРЕДНИХ Шг(/) ДЛЯ гФО
163
Аналогично, перенеся доказательство теоремы 8, мы получим
182 О.
\fdx Ifgdx ... J/A
dx
\hfdx \hgdx ... \h2dx
>0,
кроме того случая, когда f,g, ..., h линейно зависимы,
т. е. когда существуют такие постоянные А, В, ..., С, из
которых, по крайней мере, одна отлична от нуля, что
Af + Bg+ ...+CA = 0.
СРЕДНИЕ Wtr(f)
6.6. Определение средних SWr(/) для г=£0. В
дальнейшем знак интеграла без указания пределов относится к
конечному или бесконечному интервалу (а, Ь), ияи к измеримому
множеству Е2\ Функция f(x) конечна почти всюду на Е и
неотрицательна; р(х), „весовая функция", конечна и положительна3)
всюду на Е и интегрируема. Параметр г — действительное число,
отличное от нуля.
Из наших предпосылок следует, что 0< J p afx < со. Часто
бывает удобным предполагать, что J p dx = 1; в этом случае
(ср. § 2.2) мы пишем q вместо р.
Положим
/ fpfdx '
vi/r
(6.6.1)
(6.6.2)
так что
(6.6.3)
Jpdx
W) = k1ifi
(гфО),
r(f)={Wr)}
1/r
i) Gram 11].
2) Когда /->0, мы можем свести каждый случай к интервалу
(— со, оо), полагая /=0 на множестве, дополнительном к Е.
3) Предположение /? > 0 вместо /?>0 привело бы к несколько
иным результатам относительно случаев равенства (например, /?/=/?С
вместо / = С). Этот случай мог бы быть сведен к нашему на вид
более специальному случаю заменой Е подмножеством Е, на котором
Р>0.
164
ИНТЕГРАЛЫ
[ГЛ. VI
и условимся, что если интеграл J pfdx бесконечен, то
jp/rAc = co, 3Rr(/) = co (r>0), mr(f)=0 (r<0).
В частности, Wlr(f) =0, если г < 0 и /= 0 на множестве
положительной меры. Если мы далее условимся рассматривать 0 и
оо обратными друг другу, то мы будем иметь
Эта формула дает нам возможность переходить от
положительных к отрицательным г, и в следующих ниже теоремах мы
будем ограничиваться в большинстве случаев положительными г.
Если/^ 0, %Rr(f) = 0 для всех г. Если/ = С, где 0 < С< оо,
то Шг (/) = С для всех г. Если /= оо *), то 2Wr (/) = со для
всех г. За исключением этих случаев, Шг(/) может быть равно
оо только для г > 0 и равно 0 только для г < 0.
Мы определим Мах/как „эффективную верхнюю грань" от/,
т. е. как наибольшее £, обладающее следующим свойством:
„для каждого е>0 существует множество e(s) положительной
меры, на котором />?— з". Если такого ? не существует,
мы пишем Мах/=оо. Для функций, непрерывных в
замкнутом интервале, Мах/ равен обыкновенному максимуму. Min/
определяется аналогично; Min/^О и
(6.6.5) Min/ = L—.
Мах (у)
Эквивалентные функции имеют одни и те же Мах и Min.
Предположим, например, что пределы интегрирования суть 0 иоо
и что f(x) и q(x) — ступенчатые функции
f(x)=an, q(x)=qn (n — 1 <* < п, п = 1,2,. . .)*
Тогда
8Rr(/) = (E^r)1/r=»rW.
по определению (5.2.1). Аналогично
Мах/ = Max a, Min / = Min a.
*) Мы на момент допускаем этот случай вопреки принятому
в § 6.2 условию что, / конечна почти всюду.
6.7]
СРЕДНЕЕ ГЕОМЕТРИЧЕСКОЕ ЗНАЧЕНИЕ
165
и (предвосхищая определение в § 6.7) © (/) = Ща). Это замечание
дает нам возможность включить многие теоремы гл. II и гл. V в
соответствующие теоремы настоящей главы.
Мы можем также предположить, что пределы интегрирования суть
О и 1, и положить
f(x)=an (<7i+-..+^-i<*<tfi+-.- +Яп)> «(*) = !•
И в этом случае Шг(/) сводится к Шг(а).
183. Если гфО и %Rr(f) конечно и положительно, то
Min/<3)tr(/)<Max/,
кроме того случая, когда / = С\
Здесь г может быть любого знака. Доказательство
аналогично доказательству теоремы 1. Докажем сначала искомое
неравенство для г = 1. Применяя весовую функцию q{x), мы имеем
j?(/— Я)<**=0.
Отсюда следует, что либо f=%, либо / — 91 положительно
и отрицательно на множествах положительной меры. Это
доказывает результат для г=1, и мы можем перенести его на
общий случай с помощью соотношения (6.6.3).
Если мы хотим сформулировать теорему 183 в форме, точнее
соответствующей теореме 1 и ее обобщению в § 5.2, мы должны
сказать:
„Min/< Шг(/) < Мах/, кроме тех случаев, когда f^c
или при г < О, когда Шг(/) = 0и. Мы тогда имеем два случая
равенства, в точности соответствующие случаям § 5.2, а именно
„основной" случай, в котором оба неравенства превращаются
в равенства (f=c), и „побочный" случай, в котором только
одно из неравенств сводится к равенству; последний может
иметь место только для г < 0. Это различие встречается во
многих иэ наших теорем, когда г < 0, как в гл. II и V; но оно
менее заметно здесь, так как мы часто пренебрегаем
отрицательными значениями г.
6.7. Среднее геометрическое функции. Мы определяем
среднее геометрическое ©(/) следующим образом:
(6.7.1) &{/)=& (f,p) = ехр [^У***|»
или
(6.7.2) iog&(f) = %(logf),
166
ИНТЕГРАЛЫ
[ГЛ. VI
так что, в частности, если р = q} \ pdx=l, то мы имеем
(6.7.3) ЗСЯ = log ©(/) = J q logfdx.
Здесь необходимы некоторые предварительные разъяснения.
Так как log/ не обязательно положителен, то вопрос
сходимости 3 более сложен, чем в прежних случаях.
Если мы обозначим через 3+ и 3~ интегралы, образованные
с функциями log+/ и log- / так, как 3 образовано с log/1),
то мы имеем четыре возможности: (а) 3+ и 3~ °^а конечны,
(Ь) 3+ конечен, 3~ =—°°> (с) 3+ = °°> 3~ конечен и (d) 3+ =
= 00> 3~" = — °°« Эти четыре случая будут, например* иметь
место, когда, соответственно,
/(*) = *, e"Vx, e1/x, exp^sin—)
в (ОД) и q(x) = 1.
Если ЗИГ(/) конечно для некоторого г>0, то вследствие
log+/<Max(^pi,0)
3+С0 будет конечен, и мы будем иметь только случай (а) или
(Ь). В случае (а) 3(/) существует как интеграл Лебега, и ©(/)
положительно и конечно. В случае (Ь) мы пишем
Аналогично, если 2Иг(у] конечно для некоторого г>0,
мы имеем случай (а) или (с); в последнем случае мы пишем
В случае (d) ©(/) не имеет смысла. В этом случае Ш£г(/)и
%Rr(l/f) бесконечны для каждого г>0 и й#г(/) = 0 для
каждого г<0.
В случае (а) мы имеем
(6.7.4) ®(j)=Wf)>
где обе части положительны и конечны. Легко убедиться, что
это равенство остается в силе во всех случаях, если мы
условимся, как в (6.6.4), считать 0 и оо обратными друг другу
г) Определение log* и log- дано в § 5.2.
6.7]
СРЕДНЕЕ ГЕОМЕТРИЧЕСКОЕ ЗНАЧЕНИЕ
167
и считать одну часть равенства лишенной смысла, когда не
имеет смысла другая.
Перейдем теперь к доказательству аналога теоремы 9.
184. Если %(f) конечно, то
(6.7.5) ©(/К Ж/),
кроме того случая, когда f = c, где с—постоянная. Вообще,
если 9№г(/), где г>0, конечно, то
(6.7.6) ®(/)<аЯг(/)
кроме того случая, когда f = cl).
Предположим сначала, что r=l, 2№r = St. Если 51(/)=0,
то/ = 0, и, следовательно, 2К/)=—°°> @(/) = 0 = 31 (/). Мы
можем поэтому предположить, что 51(/)>0. Так как по
теореме 150
(6.7.7) iog/<*_i,
если t > 0 и t Ф 1, мы имеем
log/-log«(/) <//«(/)-1,
«(log/) -log 3l(/) < 0, log ©(/) = «(log/) < log3l(/).
Равенство может иметь место только в том случае, если /=51(/).
Результат для любого г следует теперь из (6.6.3).
В теореме 184 мы явно указали предпосылки: „если 31(/)
конечно", „если %Rr(f) конечно"; как мы объяснили в §§ 5.1
и 6.5, мы будем такие предпосылки часто опускать. Где нет
опасности недоразумений мы будем также без объяснений
обозначать постоянные через С, А, В, а, Ь, . . . . Даже в
пределах одного и того же рассуждения С может обозначать разные
постоянные.
Добавим два следствия (обобщения теоремы 10).
185. ©(/) + ©(#)<©(/+£). кроме тех случаев, когда Af=Bg,
где А и В не оба равны нулю, или ®(/-f-g) = 0.
Мы можем предположить, что ©(/+#)> 0. Тогда, по теореме 184,
Складывая два неравенства этого Типа, мы получим искомый результат.
!) По поводу приведенного в тексте доказательства см. F. Riesz [7].
168
ИНТЕГРАЛЫ
[ГЛ. VI
Вообще,
186. <9(Л) + ©(/2) + ®(Д> + ... <<9(А+Л+Л+...)
(где число слагаемых может быть конечным или бесконечным),
кроме тех случаев, когда
и = Спъи или ®(Е/п)=о.
6.8. Дальнейшие свойства среднего геометрического.
Наша следующая теорема соответствует теореме 3 (для г > 0).
187. Если 9ЙГ(/) конечно для некоторого г > 0, то при
г-* + 0
(6.8.D амя-> ©(/).
Заметим, что ©(/) может быть конечным, даже если
Шг(/) = со для всех г > 0. Это, например, имеет место для
/(х)=ехр(х /2), <7(х) = 1 и интервала (0,1).
Если Е является замкнутым интервалом или замкнутым
множеством, и / непрерывна и положительна, то доказательство
очевидно. В этом случае / ^ 8 > 0, log/ ограничен и
Ш' = § e'^f qdx = § [I + rlogf + 0 { г* (log/ )*}] qdx =
= 1 + /-3+0(r»),
\im\0g№r=hm±\og{l-\-r%-\-0(r*)}=%
Распространение этого доказательства на общий случай
наталкивается на некоторые затруднения. Эти затруднения могут
быть преодолены следующим образом1). По (6.7.6) и (6.7.7)
мы имеем
(6.8.2) log®(f)^log<Dtr(f) = T logW'K
Когда г убывает и стремится к нулю, (t2—1)г убывает (по
теореме 36) и стремится к пределу log/.
г) F. Riesz [7]. Другие, менее простые, доказательства были даны
Безиковичем, Харди и Литтльвудом. См. Hardy [7].
6.9] НЕРАВЕНСТВО ГЕЛЬ ДЕРА ДЛЯ ИНТЕГРАЛОВ 169
Следовательно, *)
(6.8.3) Hmi:{9l(/r)-l} = 9((log/) = log©(/)f
причем правая часть конечна или равна —оо. Из (6.8.2) и
(6.8.3) следует, что
log ©(/)< lim log Ttr(f) <ЙЫ log S»r(/) < log ©(/),
и теорема доказана.
6.9. Неравенство Гельдера для интегралов. Рассмотрим,
далее, интегральные теоремы, соответствующие теоремам 11 —
—15. Здесь удобно ввести новое определение, которое
позволит упростить формулировку случаев равенства. Две
функции fug будут называться пропорциональными, если
существуют две такие постоянные Л и Л, не обе равные нулю,
что Af^Bg. Это понятие уже встретилось нам в теоремах
181 и 185. Нулевая функция пропорциональна любой функции.
Мы будем также говорить, что/, gy Л,... пропорциональны,
если каждые две из них пропорциональны.
188. Если a, J3,..., X положительны и a-|-J3-|-...-|-X = 1, то
(6.9.1) §f«gK..l4x< (§fdxj ($g dxj... ($ldxj ,
кроме тех случаев, когда одна из функций нулевая или они
пропорциональны.
Если ни одна функция не нулевая, то по теореме 9
jf«g$...lldx
({fdxy(jgdxf...(f/dxy =
причем равенство имеет место в том и только том случае, когда
/ _ g -...- *
j fdx jgdx '" jldx '
i) См. § 6.3 (b) (2).
170
ИНТЕГРАЛЫ
[ГЛ. VI
Как следствие *) мы имеем
189. Если & > 1, то
(6.9.2) \fgdx < (J /» dxfdf*' dx)m\
кроме того случая, когда fk и gk' пропорциональны.
Если 0 < k < 1 ими k < О, то
(6.9.3) J/*«te > (j /* ^(jV eta)"*,
кроле тех случаев, когда (a) /ft и gh' пропорциональны или
(b) fg — нулевая функция.
Вторая половина теоремы требует небольших разъяснений.
Предположим сначала, что 0<&<1 и что J g*' dx конечен,
так что g почти всюду положительна. Если тогда положить
/ = 1/й, так что / > 1, и
f = (uv)\ g=v~\
так что
fg = u\ f* = uv, gv = vv,
то и и v определены почти для всех х и
j uvdx < f J uldx ) (J vvdx J
или
jf*dx<($fgdx)* (lg*dx)l-\
кроме того случая, когда и1 и vl\ или, что то же самое,
когда fh и gw пропорциональны. Так как J g^dx конечен и
отличен от нуля 2), то последнее неравенство равносильно
(6.9.3).
Если \gV(ix= оо, то
0>4/fc'=o
1) См. § 2.8.
2) Из того, что \ gk'dx = 0, следовало бы gft' = 0 и, таким образом,
g^oo; но такая возможность была нами исключена в § 6. 2.
6.9] НЕРАВЕНСТВО ГЕЛЬ ДЕРА ДЛЯ ИНТЕГРАЛОВ 171
(так как £'<0). Следовательно, правая часть (6.9.3) равна
нулю и имеет место знак неравенства, если 1 fg dx Ф О, т.е.
Когда &<0, то 0<£' < 1, и рассуждения остаются в
сущности теми же.
Как уже было объяснено в §§ 5.1 и 6.5, теорема неявно
содержит утверждение о сходимости или конечности; если два
из трех интегралов, входящих в неравенство, конечны, то
конечен и третий. Интегралом, конечность которого следует,
когда конечны остальные два, является J fgdx, если k < 1,
j fk dx, если 0 < k < 1, и \gk'dx, если k < 0.
Теорема, соответствующая теореме 161, весьма важна и, как
теорема 161, не является прямым следствием предыдущих
теорем
1901). Если &> 1 и fg принадлежит L для каждой g,
принадлежащей Lk\ то f принадлежит /А
Рассмотрим сначала случай конечного интервала (а,Ь) (или
конечной тЬ) и предположим, что \ fk dx = oo. Мы можем
найти такую функцию /*, которая (1) принимает только
счетное множество значений ai и (2) удовлетворяет условиям
/*<i/< /*+s. Так как по теореме 13 /* не превосходит
2*-1 {/**+(/ —/*)*}, то §f*kdx = со. Следовательно,
если е^ есть множество, на котором /* = а^ то
2 а?е. = со.
Полагая теперь
aie,= и1' bYe, =vYy a.b.e. = u.v. ,
мы по теореме 161 заключаем, что существуют такие Ь^ что
2 bYei сходится, тогда как £ aJb^ = oot Положим g(x) = bt
на ei (для всех /). Тогда
\gk,dx = Yib],ei
сходится, но
^pgdx = Y,aibiei=co
1) F. Riesz [2].
172
ИНТЕГРАЛЫ
[ГЛ. VI
и, следовательно, \fgdx=oo, что противоречит
предположениям.
Если же мы имеем дело с бесконечным интервалом, скажем,
с (0, со), то положим
t
Тогда
оо 1 оо 1 оо 1
J fgdx = j FOdU \fMx = jf*rf*, J g*'dx = jo*'dt,
0
где
F{t) = (1 - F* f(j^j), G(t) = (l- tT^gljL-).
Таким образом, теорема сводится к случаю конечного интервала.
191. Если А>1, то необходимым и достаточным
условием для того чтобы \ fkdx <; Z7, является] fgdx <; FVkQVk'
для всех g9 для которых^ gk'dx <; G.
Условие необходимо, по теореме 189. Если оно выполнено,
то \fkdx конечен, по теореме 190. Если J fkdx > Т7, то
выберем g так, чтобы gk' было пропорционально /ft, и тогда, по
теореме 189,
Теорема может быть также сформулирована с „<" вместо
„-<" в первых двух неравенствах: для того чтобы \^fkdx<F,
необходимо и достаточно, чтобы \fgdx< F1' G1' для всех
gy для которых J gk'dx^G.
Теорема 191 может быть также доказана независимо от более
трудной теоремы 190. Если \fkdx>Ft то \(f)\dx~>F для
достаточно больших л. Тогда, выбирая функцию g пропорциональной (/)п-1,
находим
\fgdx > \if)ngdx = (|(/)* ^)VV*'> PWQ»* ,
что противоречит условиям теоремы.
6.10]
ОБЩИЕ СВОЙСТВА СРЕДНИХ Шг(/)
173
Другое доказательство теоремы 190 (и связанной с ней теоремы
161) было дано Банахом [Banach, 1, 85—86].
Один пример применения теоремы 191 будет дан в § 6.13 при
доказательстве теоремы 202, дальнейшие примеры— в гл. IX1). В § 6.13
теорема 202 доказана двумя различными способами, из которых один
явным образом зависит от теоремы 191, тогда как другой ее не
применяет.
Там же подробно разъяснено логическое место теоремы 191 в
доказательствах такого рода.
6.10. Общие свойства средних Шг(/). Мы переходим теперь
к доказательству ряда теорем, которые являются аналогами
теорем § 2.9.
Свойства, которые мы здесь будем исследовать, носят
несколько более сложный характер, чем в § 2.9. Сперва мы
наложим некоторые дополнительные ограничения, и лишь потом
сможем установить эти свойства с исчерпывающей полнотой.
Мы будем предполагать на первых порах, что г>0; теоремы,
которые будут доказаны для этого случая, вместе с теми,
которые мы уже доказали для ©(/), дадут нам достаточное
представление об искомых результатах, и мы сможем
формулировать теоремы для произвольных г, предоставляя детали
доказательств читателю.
192. Если 0<г<5 и Ш8 конечно, то Шг < 9KS, кроме
того случая, когда f = C.
Если r = sa, так что 0 < а < 1, то мы имеем по теореме 188
fa'dx = J (qf*yqi-*dx < {fa'dx? (fax?-* = (]qfdx)\
кроме того случая, когда qfs=Cqt Так как q > 0, то
теорема доказана.
193. Если Шг конечно для каждого г% то 2Rr->Max/ при
г-> -|- оо.
(i) Пусть ц=Мах/ конечен. Тогда (а) 9№гО и (Ь) />
> [1 — г на множестве е положительной меры С, так что
fax = t>0, aRr>({x — е)С1/г, Hm3Rr>ii —е.
в
(ii) Допустим, что ja = оо. Тогда, для любого О > 0, / > О
на множестве е положительной меры, и, как и выше, Шп Шг >- G.
1) См., в частности, §§ 9.3 и 9.7 [2].
174
ИНТЕГРАЛЫ
[ГЛ. VI
Из (6.6.4), (6.6.3) и теоремы 193 следует, что
2Rr-+Min/
при г-> —оо.
194. Если О < 5 < со и Ш8 конечно, то Шг непрерывно для
0<г<5 и непрерывно слева для г = s. Если 27ls = oo, но
Шг < со для 0 < г < 5, wo 9ftr ->со, /z/7z/ г ~* s.
(i) Допустим, что 2Rs<oo. Тогда
<?/>•< ? max (1,/5),
что является мажорантой, не зависящей от г и принадлежащей
к классу L\ теорема следует теперь из § 6.3 (b) (i)1}.
(ii) Пусть 9)Jg = co. Мы можем найти такое п, что
$(qf')nd*>0.
Но {qfr)n — непрерывная функция от г, и, следовательно2},
для г > s — е. Отсюда
lqfrdx>±Ot
и теорема доказана.
6.11. Общие свойства средних 9№г(/) {продолжение). В
предыдущих параграфах мы преимущественно ограничивались
рассмотрением средних для г^>0, оставляя читателю вывод
соответствующих результатов для средних отрицательного порядка
из формул (6.6.4) и (6.6.5). В настоящем параграфе мы
подвергнем средние более исчерпывающему рассмотрению. Как это
естественно делать после теорем 187 и 193, мы будем писать
(6.11.1) ®(/) = 2R0(/)* Max/ = 2R+00(/), Min/ = 2>U>(/).
97?о(/) может не иметь смысла, именно, в том случае, когда
2Кг(/) = оо для всех г>0 и 9Jir(/) = 0 для всех г<0.
Начнем с того, что освободимся от двух исключительных
случаев.
(А) Если /=С, то ffir = C для всех г, и это имеет место
даже в предельных случаях С = 0 и С = оо3).
1) Непрерывность для r<^s может быть также выведена из
теорем 111 и 197 (см. § 6.12).
*) По § 6.3 (Ь) (1).
3^ Строго говоря, второй случай исключен согласно § 6.2.
6.11]
ОБЩИЕ СВОЙСТВА СРЕДНИХ Шг(/)
175
(В) 2КГ = 0 (г>0), Ш0 не имеет смысла, 2»г= оо (г>0).
Эти случаи мы исключаем, и предоставляем читателю
доказательство справедливости следующих ниже утверждений
(1) и (2), которые покрывают все случаи, кроме исключенных
(А) и (В).
(1) 2ftr<9Ks для —ooO<s<;ao, кроме тех случаев,
когда (а) 2)tr = 2)£e = оо (что может иметь место, только если
г ^> 0) и (b) Ttr = ffi8 = 0 (что может иметь место, только
если 5<; 0).
(2) Мы обозначаем через 9№г__0 и 9Кг+о (всегда
существующие) пределы fflt при t-+ r соответственно снизу или сверху.
Если г>0, то 9№r__0 = !J)?r и 2Rr+o = 30tr, за исключением
того случая, когда Шг положительно и конечно, но Tlt = со
для t > г; в этом случае Шг±0 = оо > 9КГ.
Если г < 0, то Шг f0 = Шг и 2)ir_0 = 2Rr, за исключением
того случая, когда 0<2)?г<оо, но 2)£j = 0 для £<г; в этом
случае Шг_0 = 0 < 2КГ.
Если, наконец, г = 0, то имеют место исключительные случаи,
соответствующие каждому из указанных выше. Если Ш0 = 0
или оо, то либо (а) 2)1 _о и 9К+о равны каждое 9К0Э либо (Ь)
ак.0 = зИо = °. ж+о = °°
или
эк-0 = о> зк0=аи+0=оо.
Если 0<2)i0<oo, то каждое из Ш-о и 2!Я+0, если ohq
также положительно и конечно, равно Ш0\ но Ш-о может
быть также равно 0 и 2К+0 может быть равно оо.
Наконец, все не исключенные возможности могут
действительно иметь место (см. теорему 231).
Эти результаты могут быть сформулированы более симметрично
и кратко, если обозначить 2r = \og^Str и допустить, что logoo =
= + со, log0= — оо. Мы отбрасываем случаи, соответствующие (А)
и (В), т. е.
(a) /=С (где С может быть 0 или оо), т.е. 8г=к^Сдля всех г;
(b) Со не имеет смысла, когда gr=-|-oo для г>0 и £г= — оо
для г<0*
195. За исключением только что упомянутых случаев^ множество
значений г, для которых 8r=log2)?r конечно, является или
нулевым множеством или замкнутым, полузамкнутым или открытым
интервалом J (и, v), где — oo<w<0<t/<oo; в остальном оно
176
ИНТЕГРАЛЫ
[ГЛ. VI
произвольно (так что, например, и может быть -со и о может
быть +°°t или и и роба могут быть равны 0). 2r = -foo для г,
лежащих справа от /, а 8Г = — оо для л лежащих слева от I.
В I 2Г непрерывна и строго возрастает. Если г стремится
к одному из концов I через значения, принадлежащие к /, то 2Г
стремится к пределу (конечному или бесконечному), равному его
значению в этом конце.
6.12. Выпуклость log3W£. В настоящем параграфе (как и
в теореме 17), мы предполагаем, что г>0.
196. Если 0<r<s<t и 9Kf < со, то
кроме того случая, когда f^O в некоторой части Е uf = C
в дополнительной части.
Доказательство основано на теореме 188 и аналогично
доказательству теоремы 17. Для равенства должно быть qfr = CqfK
Как следствие мы имеем
197. logtylr(f) = r\ogtylr(f) является выпуклой функцией
от /\
Ср. с теоремой 87. Читатель найдет полезным вывести
непрерывность %ЛГ (теорему 194) из теоремы 197.
6.13. Неравенство Минковского для интегралов.
Неравенства типа Минковского выводятся по существу так же, как
в § 2.11. Обычная форма неравенства Минковского для
интегралов имеет следующий вид.
198. Если k > 1, то
(6.13.1) (j(/-|_£_|_...+/)*rfJC}1'*<
а если 0 < k < 1, то
(6.13.2) {§(f-\-g+...+l)kdx}llk>
>({/**)*+...+({/* Ас)"
кроме того случая, когда /, §-, ..., / пропорциональны.
6.13] НЕРАВЕНСТВО МИНКОВСКОГО ДЛЯ ИНТЕГРАЛОВ 177
Неравенство (6.13.2) остается справедливым и для k < О,
но тогда мы имеем еще и второй исключительный случай,
когда обе части неравенства обращаются в нуль.
Мы выводим эту теорему из теоремы 189 так же, как мы
вывели теорему 24 из теоремы 13, но определение
возможных случаев равенства здесь, естественно, несколько
сложнее, и поэтому мы приведем подробное доказательство
неравенства (6.13.2).
Если S=f-\-g-\- ... +/, то
(6.13.3) §S*dx = §fSk~1dx-\-§gS*-1dx-\- ... + J/S*-*d*.
Предположим сначала, что 0<&<1. По теореме 19
sk<fk-\-gk-\-... +/*.
Следовательно, если \fkdx1 ... конечны, то \Skdx также
конечен. Кроме того, \Sk dx > 0, если 5^0, т.е. если /, g,... —
не нулевые функции. Мы можем поэтому предположить, что
{skdx положителен и конечен.
По теореме 189,
J/5*-V*>(J/*dbr),A(j5^)w,
кроме тех случаев, когда (a) fk и Sk пропорциональны или (Ь)
jfS*-i=0.
Так как k — 1 < 0 и S почти всюду конечно, то fS*"1
может быть =0 только в том случае, когда /=0. Таким образом,
второе из приведенных условий является частным случаем
первого. Следовательно, из (6.13.3) мы получаем
(6.13.4) js*dx>{($f*dx)l,k+... + (J/* </*)"*) (Js*rf*)w,
кроме того случая, когда /, g, ..., / пропорциональны, откуда
следует утверждение.
Рассуждение проводится так же и в случае k < 0, если
только \Skdx положителен и конечен. Если \Skdx = Qt то так
как k < 0, S почти всюду бесконечно, что невозможно, так
так каждое / почти всюду конечно. Если J Sk dx = со, то (опять
178
ИНТЕГРАЛЫ
[ГЛ. VI
в силу k < 0) \fu dx, ... все бесконечны, и обе части
неравенства (6.13.2) равны нулю. Это и есть тот дополнительный
случай равенства, который упоминается в конце теоремы. Он
имеет, например, место, когда
f=g = ... =/ = 0
на множестве Е положительной меры.
В теореме 198 мы исключили из формулировки случаи k = \
и^ = 0.
Первый случай тривиален, второй содержится в теореме 186.
Мы предоставляем читателю сформулировать теорему
198 в форме, соответствующей теореме 24.
Соответственно теореме 27 мы имеем теорему
199. Если k > 1, то
(6.13.5) |(/ + г+... +/)*<&> j/ftrfx+ ... +j><fcr,
а если 0 < k < 1, то
(6.13.6) |(/ + г+... Jri)udx<^pdxjr ... +]>,**,
за исключением того случая, когда для каждого х, кроме,
быть может, точек множества меры нуль, не более чем одна
из функций f>g, ..., / отлична от нуля.
Если все /, g, ..., / почти всюду положительны, то
(6.13.6) имеет место и для k < 0.
Теорема 198 с k > 1 является частным случаем первой из
следующих ниже трех более общих теорем, в которых суммы
конечны или бесконечны и пределы интегрирования произвольны.
Мы ограничиваемся случаем /и > 1; для &< 1 знак неравенства
будет, вообще говоря, обратным.
200. Если k > 1, то
(6.13.7) [ ]{Y>fm{x)YdxY< г\\рт{х)йХ\Х,\
кроме того случая, когда fm{x) = Cmy{x).
201. Если k > 1, то
(6.13.8) [ SJ\fn{x)dx\k]ll; < j {2/*(*)}1/fcrf*,
кроме того случая, когда fn(x) = Cny(x).
6.13] НЕРАВЕНСТВО МИНКОВСКОГО ДЛЯ ИНТЕГРАЛОВ 179
202. Если k> 1, то
(6.13.9) [§[§nx,y)dy}kdx]vk<${§P(x,y)dx)l/kdy,
кроме того случая, когда f(x,y) = y(x)<b(y).
В исключенных случаях в каждой из теорем имеет место
знак равенства.
Рассмотрим, например, теорему 202 (наименее элементарную
из трех). Сначала докажем эту теорему в форме я<^". Мы
дадим два доказательства, в первом из которых применим
теорему 191. Возникающие в каждом доказательстве равенства и
неравенства должны пониматься так, что „если правая часть
данного равенства или неравенства конечна, то конечна и левая,
и обе части находятся в указанном соотношении". Перемены
порядка интегрирования законны, по теореме Фубини.
Мы пишем J = J (х) = /(х, у) dy.
(i) Для того чтобы
(6.13.10) ^Jkdx^M\
по теореме 191 необходимо и достаточно, чтобы
(6.13.11) ^Jgdx^M
для всех g, для которых
(6.13.12) J «*'<** <1.
Но
(6.13.13) §Jgdx = §g(x)dx§f(x,y)dy =
= §dy^g(x)f(x,y)dx)^$dy(§f(xiy)dx)1/k
по теореме 189 и (6.13.12). Следовательно, в (6.13.10) мы
можем взять
и теорема доказана в форме „<?'.
180
ИНТЕГРАЛЫ
[ГЛ. VI
(И) Если Г Л?л: = 0, то 7 = 0 для почти всех х, и,
следовательно, (для почти всех х) / = 0 для почти всех у. Отсюда,
по § 6.3 (d), f(x,y)=0.
Мы можем поэтому предположить, что I Jkdx > 0. Допустим,
что \ Jkdx <oo . Тогда
J j*dx = J J*"1^ J/dy = ^dy^f^fdx^C
и, следовательно,
(6.13.14) (JЛ**)"» <J(J/**c)"\<y,
т.е. (6.13.9) имеет место со знаком „<ltf вместо „<".
В этом доказательстве мы предположили конечность I Jkdxt
которая не была нам нужна в доказательстве (i). Для того чтобы
освободиться от этого ограничения, мы должны
аппроксимировать / функциями, для которых конечность I Jkdx несомненна.
Пусть, например, интегралы распространены на конечные
интервалы или множества конечной меры, (f)n определена, как
в§ 6.1, и
Тогда \Jkdx конечен и
( p>f<f( liftdxf dy < J( lfdXf dy.
Переходом к пределу я->оо отсюда следует (6.13.9) со
знаком „<\
Доказательства (i) и Ш) принадлежат, по существу, к одному
и тому же типу, причем роль произвольной функции g в (i)
играет в (И) определенная функция
удовлетворяющая (6.13.12), если \ Jkdx конечен. Применяя эту
специальную функцию g*, мы избегаем ссылки на не совсем
6.13] НЕРАВЕНСТВО МИНКОВСКОГО ДЛЯ ИНТЕГРАЛОВ 181
простую общую теорему, за счет, однако, некоторых
добавочных осложнений. Аналогичная возможность представляется нам
всегда, когда мы применяем теорему 191.
Остается рассмотреть возможность равенства в (6.13.9).
Неравенство будет иметь место, если $ Jgdx </W для всех g,
удовлетворяющих (6.13.12). В неравенстве
равенство будет иметь место, если для почти всех у J* n gh'
пропорциональны, т. е. если (для почти всех у)
(6.13.15) Р(у)/к(х,у) = а (У) £*'(*),
где р2-|-а2>0, для почти всех х. Если бы р(у) было равно
нулю для некоторого у, для которого имеет место (6.13.15),
то g(x) было бы нулевой функцией. Следовательно, в (6.13.15)
Р (У) > 0> и таким образом
/(х>У) = <?(*)№)•
Это равенство имеет место, для почти всех х, для почти
всех у, и следовательно, по § 6.3 (d), для почти всех х, у.
Доказательства теорем 200 и 201 ведутся аналогично. Так, в
доказательстве теоремы 201 мы пишем
Jn = J/w dx
и рассуждаем следующим образом. Для того чтобы J^J^<iMk по
теореме 152К необходимо и достаточно, чтобы %bnJn<^Mt коль скоро
£ Ь^ < 1. Следовательно,
SV» = 2 Ьп J/„ dx = J (s V») dx < ldx (S /»)1/fc(s &£')W <
и т, д. Суммирование под знаком интеграла законно по § 6.3 (b)(2),
*) См. последнее замечание в § 6.9.
*) Распространенной на бесконечные ряды.
182
ИНТЕГРАЛЫ
[ГЛ. VI
Аналогом теоремы 28 является
203. Если 0 < г О, то
кроме того случая, когда fix, j/)= у(х)<\>(у).
Доказательство см. Jessen [l].
6.14. Средние значения, зависящие от произвольной
функции. Существует теория интегральных средних значений,
содержащих произвольную функцию, аналогичная теории,
развитой в гл. III. Мы не будем подробно излагать ее здесь, ибо
это было бы большей частью повторением, в несколько иной
форме, того, что было нами уже сказано. Мы ограничимся
поэтому только доказательством аналога теоремы 95 *).
204. Предположим, что а <;/(*)<; р, где а. и $ могут быть
конечными или бесконечными, и что f(x) почти всюду
отлична от а и р; предположим далее, что пределы
интегрирования и весовая функция р(х) удовлетворяют условиям
§ 6.6 и что <р/7(0 положительна и конечна для «</<j3.
Тогда
(6.Н.1) ?r7"Z )<
$fpdx\ f9(f)pdx
jpdx)^ jpdx
если правая часть существует и конечна. Равенство имеет
место только в том случае, когда f=C.
Возможно, что \fpdx=oo или \fpdx=—со; тогда (6.14.1)
все еще справедливо при правильном понимании этого неравенства.
Но когда правая часть конечна, не может быть, чтобы \fpdx не
существовал, т. е. чтобы было \f+pdx = со, \f~pdx = — со , так
как в этом случае а = — со, |3 = со и ср(/), будучи выпуклой
и отличной от постоянной, должна стремиться к бесконечности
для больших положительных или больших отрицательных
значений /2) по крайней мере, как С|/|, так что \<?(f)pdx
не может существовать и быть конечным.
х) Целый ряд других аналогов теорем гл. III приведен среди
различных теорем в конце настоящей главы. Более подробное
рассмотрение некоторых из них дано у Иессена; Jessen [2], [3].
Значительная часть содержания этих работ была включена, с надлежащими
изменениями, в гл. III.
2> См. теорему 126.
6.14] СРЕДНИЕ ЗНАЧЕНИЯ, ЗАВИСЯЩИЕ ОТ ПРОИЗВОЛЬНОЙ ФУНКЦИИ 183
Возьмем р= q, \ qdx = 1, и предположим сначала, что
Ш = [fqdx конечно. Если /ф С, то а < Ш < р. Таким
образом, / конечна и а </< р для почти всех х; так что, для
почти всех х,
?(/)=? да+(/ - т 9'т+?(/- аюУоо,
где |i лежит между / и 2№, или а < ^ < р. Следовательно,
а это и есть (6.14.1). Равенство имеет место только в том
случае, когда (/—3K)acp"(ii,) = 0; но a<ji,<p, и
следовательно <р" (|а) > 0 для почти всех х, так что тогда / = Ш.
Далее, предположим, например, что \fqdx = oo, так что
р = оо. Тогда, как уже было доказано,
?fJ(/).***)<:J?((0»H*.
Так как <р(/) непрерывна и монотонна для больших /, интеграл
в правой части стремится к ®{f)qdx, тогда как интеграл
в левой части стремится к ср (со). Следовательно, ср(оо) конечна,
откуда следует, что о убывает и <р (со) < ср (/). Отсюда следует,
что
ср(со) = ^(оо) j qdx < j <p (/) ?А*,
причем равенство имеет место только когда <р(/)=<р(оо)—
случай, который мы исключили. Аналогичные рассмотрения
проводятся в случае \fqdx =—со.
Может случиться, что левая часть (6.14.1) равна—со.
Читателю полезно проверить, что все случаи, рассмотренные
нами, могут иметь место.
Если мы возьмем о (/) = — log t> то получим
ехр ( j q logfdxj < j qfdx,
т. е. ®(/Х?1(7) (теорема 184). Выбор <р = Г приводит нас
рпять к неравенству Гельдера; по аналогии с § 3,11 могут
184
ИНТЕГРАЛЫ
[ГЛ. VI
быть построены и другие примеры. Если мы положим <р(0 =
= tlogt, то найдем
205. IPf^<eJljpiI^\
)pdx \ jpfdx I
кроме того случая, когда f = C.
Мы можем распространить результат теоремы 204 (за
исключением перечня случаев равенства) на любую выпуклую и
непрерывную функцию ср.
206. Неравенство (6.14.1) имеет место и для ?(/),
выпуклых и непрерывных в а < t < р.
Как в § 3.19, имеем
<P(0><P(9R) + M/-2R),
где X — любое число между левой и правой производной <р (t)
в точке t= 3№. Следовательно,
|?(/)^>?(ЗЙ),
что и является неравенством (6.14.1).
ИНТЕГРАЛЫ СТИЛТЬЕСА
6.15. Определение интеграла Стилтьеса. До сих пор мы
рассматривали ряды и интегралы отдельно, и все основные
теоремы были сформулированы дважды; так, неравенство Гель-
дера содержится в теоремах 13 и 189. Естественно искать
обобщение этих теорем, которое объединяло бы оба эти случая.
Такое обобщение может быть найдено, если мы воспользуемся
интегралами Стилтьеса.
Предположим, что <р (х) возрастает (в слабом смысле) в
а^х^Ь и что <р(а) = а, <?(£) = р. Мы предполагаем, что а
и (3 (но не необходимо а и Ь) конечны1). Кривая
У=У(х) = Ч(х)
возрастает и может иметь счетное множество разрывов первого
рода и интервалов постоянства. Обратная функция
x = x(y) = x(i)
х) Если, например, Ь = со, то 48 = lim y(x).
6.15]
ОПРЕДЕЛЕНИЕ ИНТЕГРАЛА СТИЛТЬЕСА
185
определена однозначно, кроме (а) интервалов у{у^ у^
соответствующих разрывам х = I функции ср и (Ь) значений ул
соответствующих интервалам постоянства ср. Если мы условимся,
что (у19 у2) есть интервал постоянства функции х(у), в котором
она имеет значение S, то х(у) определена всюду, кроме
значений (Ь), и является возрастающей функцией от у для тех
значений у, для которых она определена. Наконец, мы
заканчиваем определение х{у) как возрастающей функции, приписывая
ей для значений (Ь) аргумента у любое из значений х в
интервале постоянства. Эти значения у составляют счетное
множество, и наш выбор значений х(у) для них не влияет
на следующие ниже определения. Мы теперь определяем
интеграл Стилтьеса или Лебега — Стилтьеса,
а?=Ь Ъ
х=*а а
от f(x) относительно <?(х), с помощью равенства
ъ Р
(6.15.1) J/(*)tf?=J/{*(?)}<*?.
а а
при условии, что интеграл в правой части существует в смысле
Лебега1}.
Определение (6.15.1), данное Радоном (Radon [1]), сводит
теорию интегралов Стилтьеса к теории интегралов Лебега,
и мы можем поэтому ожидать, что не возникнет никаких новых
затруднений. Полное рассмотрение этого, и более старых
определений интеграла Стилтьеса читатель найдет, например,
у Хобсона, Поллерда и Юнга: Hobson [1], Pollard [l],
Young [7] *).
Аналогично мы можем определить
Е
*) Если g — функция ограниченной вариации, то g = ср — ф, где ср
и ф — возрастающие функции, и мы сможем определить интеграл
Стилтьеса от / относительно g формулой
Однако это более общее определение нам не понадобится,
*) См, также Гливенко [1]. {Прим. ред.)
186
ИНТЕГРАЛЫ
[ГЛ. VI
где <р — возрастающая функция, а Е — некоторое множество
значений х, а именно:
J/(*)rf?=j/{.*(?)}rf?,
Е %
где $ есть множество значений <р, соответствующее Е. Мы
должны предположить $ измеримым. Интеграл I rfcp есть
Е
вариация <р на Е.
6.16. Частные случаи интеграла Стилтьеса. Простейшими
случаями являются следующие:
(a) ® = х. В этом случае интеграл Стилтьеса сводится
к обыкновенному интегралу Лебега;
(b) о есть абсолютно непрерывная функция. В этом случае
ь ъ
^f(x)do = ^f(x)of(x)dx;
а а
(c) ср — конечная возрастающая ступенчатая функция.
Предположим, чю а = ах < а2< .. . <#w = Ьу что cp(je) =
= аъ где ak<<xk+u в ak<x<ak+u и что <р (ак), где 1<А<я
имеет любые значения, совместимые с условием возрастания <р-
Тогда х(у) является ступенчатой функцией со значениями
аи <z2» . . ., ап, и
ь р
(6.16.1) J/rf? = J/{^(?)}rf? = (a1—«)/(а!) +
а а
+ (а2— *i)/(*2) + ••• +К-1 —««-2)/(fli»-i) +
+ (Р — *n-i)/Ю = S Pfc/Ы,
где Рй есть скачок ср в точке х = ак. Ясно, что любая конечная
сумма может быть выражена как интеграл Стилтьеса; так,
П /,
S«fc = J/(AT)rf?,
где ср — ступенчатая функция с единичными скачками в av
а2> ..., ап и uk=f(ak).
6.17]
ОБОБЩЕНИЯ ПРИВЕДЕННЫХ ВЫШЕ ТЕОРЕМ
187
(d) Эти рассуждения тотчас же распространяются на
ступенчатые функции со счетным множеством разрывов, причем
интеграл Стилтьеса будет тогда равен £pu/(#A-)» где
суммирование распространяется на все точки разрыва. Любой сходящийся
бесконечный ряд может быть представлен таким путем, как
интеграл Стилтьеса.
6.17. Обобщения приведенных выше теорем. Теперь
очевидно, что все наши основные теоремы могут быть сразу
распространены на интегралы Стилтьеса и что получаемые таким
образом теоремы содержат в себе как частные случаи теоремы
для интегралов Лебега и для сумм. Мы приводим наиболее
характерные из них в следующем параграфе. Два
предварительных замечания могут оказаться полезными.
(1) Если интеграл Стилтьеса записан как интеграл Лебега, то
переменная интегрирования есть <р- Наши условия равенства
всегда имели вид f = g, т. е. f = g, кроме множества
значений меры нуль. Это исключительное множество в наших новых
теоремах будет меры нуль относительно ®, и в нашей
формулировке для х это будет звучать так: „кроме множества
значений х, на котором вариация <р равна нулю", т. е. такого
множества Е, для которого соответствующие значения <р
составляют нулевое множество. Наши новые условия равенства
должны быть, таким образом, понимаемы в этом смысле. Так,
„/ пропорциональна g" означает, что
Af=Bgi
где Л и В — постоянные, не обе равные нулю, кроме точек
множества, на котором вариация ср равна нулю. Заметим, что
такое исключительное множество не может содержать точек,
в которых о(х) разрывна.
Аналогичное обстоятельство возникает и в определении Мах/
и Min/. Так, Мах/ есть наибольшее число £, обладающее тем
свойством, что для каждого е > О, / > S — г на некотором
множестве значений х, на котором вариация ср положительна.
(2) Многие неравенства „Х< Г", справедливые для
интегралов Лебега, для интегралов Стилтьеса справедливы только
с „ < а. Предположим, например, что интегралы
распространяются на (0, оо) и что |/dx=l. Тогда, по теореме 181,
(6.17.1) (\xfdxj< §fdx jx2/rfx = jx2/rfx,
188
ИНТЕГРАЛЫ
[ГЛ. VI
кроме того случая, когда x2f = Cf или х2 = С, что неверно,
так что (6.17.1) всегда справедливо. В соответствующей теореме
для интегралов Стилтьеса мы имеем \ do = 1 и
(6.17.2) ( J xdof < j d<p j xarf© = j *2^.
В (6.17.2) имеет место равенство, если л;2 = С, т. е. если х
постоянно, за исключением множества, на котором вариация <р
равна нулю; а это означает, что <р — ступенчатая функция
с одним скачком. Так, если ?(л;) = 0 для 0^л:<1 и <?(л;) = 1
для х ^ 1, то ( I xd<?j = 1 = x2^/cp.
6.18. Средние Ttr(f;o). Мы обозначаем
©(/;?)=ехР (^Ут) = 2К0</; ?)•
В этих определениях предполагается, что входящие в них
интегралы конечны. Если \frd® = oo, то мы условимся считать
(следуя соглашению, принятому в §6.6), что 9Кг=оо, когда
г > 0, и 2№г = 0, когда г < 0. Вопросы, рассмотренные в §§ 5.2
и 6.7 в связи с определением ©, естественно, возникают и здесь.
Теоремы, соответствующие теоремам 183, 184, 187, 189,
192, 193, 197 и 198, принимают следующий вид, — для простоты
формулировок мы предполагаем, что г>0:
207. Min/ < Ttr (/) < Мах/, кроме того случая, когда f^C.
208. ©(/)< 271г(/)> я, б частности, ®(/)<21(/), «рол*
/иого случая, когда f = С.
209. ££Л# 9#г(/) конечно для некоторого г, то
Шг(/) ->©(/), когда г -» + 0.
210. £сл# £ > 1, /яо
f uv du < Г \ andfS\ (\ vk'do
7 '
л;/?ол/£ ш>го случая, когда uk и vk' пропорциональны. Если
0 < k < 1 «ли ft < 0, то имеет место обратное неравенство,
6.19]
ФУНКЦИИ РАСПРЕДЕЛЕНИЯ
189
в котором знак равенства имеет место тогда и только
тогда, когда либо ик и vk' пропорциональны, либо левая часть
равна нулю (тогда и правая часть равна нулю).
Это — неравенство Гельдера; существуют, конечно, и
соответствующие обобщения теорем 11 (или 10) и 188.
211. Если г<5, то Шг(/) < Ш8(/), кроме того случая,
когда f = C.
212. Если 2№г(/) конечно для каждого г>0, то 9№г(/)-> Мах/
при г -> -f- со.
213. \ogWlrr{f) является выпуклой функцией от г.
214. Если & > \,то
(j (в+v?d*flk < (j «a*?)v*+(j л?)1/й,
кроме того случая, когда и и v пропорциональны. Если
0 < k < 1 или /г < 0, /яо будет иметь место обратное
неравенство1).
АКСИОМАТИЧЕСКИЙ ПОДХОД К СРЕДНИМ ЗНАЧЕНИЯМ
6.19. Функции распределения. В гл. III мы
непосредственно определили среднее значение
2R9 = 2R9(fl^) = ?-1{S^(fl)}
и вывели его характеристические свойства из определения. Здесь
мы действуем противоположным образом и даем
„аксиоматический" подход, обещанный на стр. 86. При этом оказывается
удобным употреблять обозначения интегралов Стилтьеса; это
и является причиной того, что мы не рассматривали этого
вопроса до сих пор; но интегралы Стилтьеса, которыми мы
воспользуемся, в действительности являются конечными суммами.
Рассмотрим специальный класс ступенчатых функций,
определенных для всех действительных х, которые мы называем
конечными функциями распределения. Мы называем F(x)
конечной функцией распределения, если
(a) она кусочно-постоянна и имеет только конечное число
разрывов;
(b) она возрастает (в широком смысле) от 0 до 1, так что
F(-co) = 0, F(co)=l,
и (с) F(x) = j{F(x — 0)-\-F(x-\-0)} для всех х,
х> Мы оставляем читателю определение возможных случаев равен»
ства.
190
ИНТЕГРАЛЫ
[ГЛ. VI
Функция распределения, имеющая скачки q в точках а, может
считаться представлением и значений а и весов q, входящих
в Ш9(а). Простейшей такой функцией является
£,W="2"(lH-sign а:),
которая имеет единственный скачок 1 для х = 0. Если мы
положим £*£ (х) =Е(х — !•), то
(6.19.1) F(x) = ZqEa(x),
где
а = а„ q = q4 (v=l, 2, . . ., п), 2?v= 1, ях < яа < • • • < *п>
является общей конечной функцией распределения со скачками #
в точках а. Таким образом,
с»
(6.19.2) j »(*) rff (*) = Б tf?(a),
— оо
и среднее (3.1.3) может быть записано в виде
с»
(6.19.3) ая,[/7]=?-,( j <р(*)<нч*))-
— оо
Любая конечная функция распределения равна нулю для
л:<Л и равна 1 для л:>В, где Л и В — некоторые конечные
числа, зависящие от F. В последующем мы ограничимся
рассмотрением подкласса этих функций, а именно рассмотрением
функций, удовлетворяющих условиям
(6.19.4) F(x) = 0 (х<А), F(x) = l (х>В)
для данных А и В. При этих обстоятельствах мы говорим,
что F принадлежит к О (Л, Б).
Если ср(дг) непрерывна и строго возрастает в замкнутом
интервале (Л, В), то ЯК^/7] определено, по (6.19.3), для всех
F из О (Л, Б). Значения ?(лг) вне (Л, Б) в действительности
не играют никакой роли, и мы можем их выбрать произвольно;
естественно выбрать их так, чтобы ©(л;) была непрерывной
и строго возрастающей функцией для —оо^дг^оо.
6.20. Характеристические свойства средних значений.
Нашей целью является доказательство следующей теоремы*
6.20] ХАРАКТЕРИСТИЧЕСКИЕ СВОЙСТВА СРЕДНИХ ЗНАЧЕНИЙ 191
215. Предположим, что каждому F из О {А, В)
соответствует единственное действительное число ffl[F],
обладающее следующими свойствами'.
(1) Ш\Е^х)\ = \ (Л <£<£);
(2) если Fx и F2 принадлежат к О (Л, В), FX^F2 для
всех х и Z7! > F2 для некоторых х, то
(3) если F, F* и G принадлежат к О (Л, В), и
то
2« W + (1 — 0 G] = Ж [tF* + (1 — 0 О]
для 0<*< 1.
Тогда существует функция <р(х), непрерывная и строго
возрастающая в замкнутом интервале (Л, В), для которой
со
(6.20.1) 3R [Z7] = 3R, I/7] = ?_I ( j ?(*) ^(*))-
— оо
Обратно, если Ш [F] определено с помощью (6.20.1) при ср(д:),
обладающей указанными свойствами, то оно удовлетворяет
условиям (1), (2) и (3), так что эта условия являются
необходимыми и достаточными для представления Wl [FJ в
форме (6.20.1) J).
Начнем с доказательства второй половины теоремы. Если Ж [F]
определено формулой (6.20.1), то очевидно, что оно обладает
свойством (1), и легко убедиться, что оно обладает и
свойством (3). В самом деле,
<р (Эй [tF + (1 — <)0]) = 'J <?<*F + О — t) jVG =
= t §<fdF* + (1 — t)J ?tfG = cp (3»[/F* + (1 — *) 0]).
Остается доказать (2). Допустим, стало быть, что Ft и F2
удовлетворяют приведенным условиям. Тогда существует число
*) См. Nagumo [1] Kolmogoroff [1], de Finetti [1]. Мы следуем
доказательству де-Финетти.
192
ИНТЕГРАЛЫ
[ГЛ. VI
|а>0 и интервал (а, Р) такие, что Fx {х) > F2 (лг) -\- р > F% (лг)
в («, Р)3).
Следовательно,
схэ схэ
<?(?R[F2])-<?(№[F1}) = J<№- j?^i =
— схэ —схэ
схэ
— схэ
р
> j С7,-^«р^МР)-?(«)}><>.
а
6.21. Замечания о характеристических свойствах. Мы
должны еще показать, что свойства (1) — (3) полностью
характеризуют средние 3№ф. Приведем сначала несколько общих
замечаний о „значении" этих свойств.
(I) (1) утверждает, что „если все элементы некоторой
совокупности равны между собой, то их среднее равно их общему
значению";
(II) (2) утверждает, что „%R[F\ является строго монотонным
функционалом от Fu. Было бы достаточно утверждать, что
(при данных условиях) Ш [FJ <9И [F2], т. е. что „Ш [F\ есть
монотонный функционал".
Рассмотрим некоторые примеры.
(а) Среднее арифметическое @ (a,q) = £ qa = \ xdF = <3[F] есть
строго монотонный функционал от /\ В этом случае у (х) = х.
*) Существует лг0, для которого
Fi(x0)>F2(x0)
или
±{Fl(x0-0) + Fl(x0+0)}> ±{Ft(x0-0) +F2(x0+0)}.
Следовательно, либо
Fi(x0-Q)>F2(x0-0),
либо
Fi(x0 + 0)>F2(x0 + 0).
В первом случае интервал, удовлетворяющий нашим условиям, лежит
слева от дг0, во втором — справа.
2) Если мы вспомним наше соглашение в конце § 6.19 об определе»
нии <р (л) вне (Л, В).
6.21] ЗАМЕЧАНИЯ О ХАРАКТЕРИСТИЧЕСКИХ СВОЙСТВАХ 193
(b) Мы можем определить „max я" как нижнюю грань значений х,
для которых F(x) = 1 (где/7—любая конечная функция
распределения со скачками в точках а). Тогда max а = \ь [F] есть монотонный
Функционал от F: если /71> F2 для всех х, то р- [Fi\ < p{F2]» Но функционал
p. [F\ не строго монотонен: если
F1 = F^ = 0 (*<0); ^1 = тр ^2 = 0 (0<*<1);
^1=^2 = 1 (*>1),
то
[х [F±] = max (0,1) = max (1,1) = \л [F2].
То, что p. [F] не может быть представлено в виде (6.20.1), следует из
самой теоремы; в противном случае \^[F] должно было бы быть строго
монотонным функционалом.
(c) Среднее геометрическое ® = (3(а, q) — не строго монотонный
функционал от F, так как, например, совокупности (0, а%, ... ) и
(0, Ь%, ...) имеют равные ©. Оно мож^т быть представлено формулой
оо
(3 = ехр ( (* log x dF(x)],
о
которая имеет форму (6.20.1) с функцией y(x) = \ogx для х>0; но (3
все же не представлено требуемым в теореме образом, так как
log х-> — оо при х -> 0.
(III) Если мы дважды применим (3), во второй раз с Z7*, G,
G*, 1 — t вместо G, F, Z7*, t, то мы увидим, что
(6.21.1) sfft[tF-\-{\ — t) 0] = 9R[tF* +(1 — 0 0*1.
если WtlFl = 9№[/7*] и ЗИ [О] =ЗИ [О*]. Иначе говоря,
(a) ffi[tF-\-(l—t) G] однозначно определяется через §l[F]>
3R[0] a t
Вообще,
(6.21.2) ^И2?А]=$М2 7Л*],
если aR[/\]=3№[/?] hS?v = 1-
Функционал g[F] называется линейным, если
g[^+«0]=^[/3'] + ttg[0]i'
в этом случае он несомненно обладает свойством (а). Если $)l[F]
удовлетворяет (а), или (3), следствием чего является (а), то мы
можем назвать 2Л [F] квазилинейным. Если мы, кроме того,
условимся называть свойство (1) свойством совместности, то
мы можем кратко сформулировать теорему 215 следующим
194
ИНТЕГРАЛЫ
[ГЛ. VI
образом: наиболее общий строго возрастающий квазилинейный
функционал, обладающий свойством совместности, может
быть записан в виде (6.20.1).
6.22. Окончание доказательства теоремы 215. Функции
ЕА(х), Ев(х) и (\ — f)EA(x)-\-tEB(x), где 0</<1,
принадлежат к О (Л, В)1). Обозначим
^(f)=mi(i-t)EA-\-tEB}>
так что
Ъ(0)=Ш[ЕА] = А, ^(1) = Ж[Ев] = В.
Допустим сначала, что ty(t) строго возрастает и непрерывна.
Тогда ф(7) имеет обратную функцию
ср(и) = ф-1(и),
которая также непрерывна и строго возрастает от 0 до 1г
когда и возрастает от А до В. Если
« = <К0, * = ?(«)>
то
Ж [EJ = « = ф (0 = а» [(1 - <? («)) ЕА-\-<? (и) Ев].
Следовательно, применяя (3) в обобщенной форме (6.21.2),
и выражение (6.19.1) для любой конечной функции
распределения Z7, мы получаем
W[E] = Tt[ZqEa] =
= W[Zq{(l-®(a))EA-\-u(a)EB}] =
= Ж [(1 - 2 ?? (а)) ЕА + (£ qy (а)) Ев] =
= Ф(Е?т(а)) = ?-1(2^?(а)),
т. е. утверждение теоремы.
Заметим, что здесь <р(Л) = 0, <рС#) = 1- Когда одно <р найдено, оно
может быть (по теореме 83) заменено на аср -J- р.
Остается еще доказать, что b(t) строго возрастает и
непрерывна.
г) Е. и Я —экстремальные функции из £) (А, В): если F принад-
лежит к О (Л, jB), то Е Л^ F^E_ для всех х.
6.22] ОКОНЧАНИЕ ДОКАЗАТЕЛЬСТВА ТЕОРЕМЫ 215 195
Если
0<*1<*2<1.
то
для всех х, со знаком неравенства для некоторых х.
Следовательно, по (2),
щ) = ж [(1 - g еа + ^ев] <Ш[(1- q еа + t2EB] = цд.
Допустим теперь, что &(f) разрывна справа в точке /0, где
0^/0<1. Тогда мы можем найти такое &, что
Wo)<*<Wo + *)
для произвольно малого е, и
£,<М*о)>££>£к*о+«)
для всех х, со знаком неравенства для некоторых х.
Следовательно, по (2),
(6.22.1) Ш^Е,Н(о)-\-^Ет]<Т1[^Е,-\-^Ет]<
<Ж
■jA'tfo+o + ^^W)]
для любого t в (0,1). Но если sat принадлежат интервалу
(0,1), то, по (1),
№)=ЩЕШ1 = ЗД s)EA + sEB],
и аналогично для t\ и, по (3),
^e,w+^w]-»["-,>eir+,g'+"-'y£']-
-«[О-^Н+^.Ь+т
Отсюда и из (6.22.1) следует, что
разделены некоторым числом, а именно, 9JM -^Щ-\- -~ E^(t) |>
196
ИНТЕГРАЛЫ
[ГЛ. VI
не зависящим от г; по переходе к пределу при г->0 мы получаем
♦№)<♦№ + <>)■
Следовательно ф разрывна в точках (t0-\-t)/2 для всех /из
некоторого интервала; но это невозможно, так так точки
разрыва монотонной функции образуют не более, чем счетное
множество.
Отсюда следует, что ty(t) не может быть разрывной справа;
аналогично, она не может быть разрывной слева. Следовательно
она непрерывна, и, таким образом, теорема доказана.
Мы ограничились рассмотрением конечных функций распределения,
так что все наши функции были ступенчатыми, а средние — средними
гл. III. Существует аналогичная теорема, в которой и предположения
и утверждение сильнее, а именно в том, что они относятся к более
обширному классу функций, чем О (Л, В). Обозначим через О* (Л, В)
класс функций, обладающих свойствами (а) и (Ь) § 6.19 и
удовлетворяющих также (6.19.4). Мы можем тогда доказать теорему,
отличающуюся от теоремы 215 только подстановкой О* вместо О.
Доказательство ведется почти так же, но оно несколько сложнее на последних
этапах. См. de Finetti [l].
РАЗНЫЕ ТЕОРЕМЫ И ПРИМЕРЫ *)
216. „Средняя скорость по времени меньше средней скорости по
расстоянию".
гт-е- (If dtJ<\ d($wds=$ <"КжУа<' сл^чай тео-
ремы 181.]
217. Если кинетическая энергия движущейся несжимаемой жидкости
массы М есть Е, а средняя скорость ее частиц V, то Ey>MV2/2,
кроме того случая, когда все частицы имеют одинаковую скорость.
[Если р — плотность, a v — скорость элемента dS = dx dy dz, то
M=9§dS, vj dS = §vdS, E = ±-?§v2dS,
и утверждение следует из теоремы 181 (для тройных интегралов).]
218. Через замкнутый провод, лежащий в плоскости и
ограничивающий площадь А, проходит единичный электрический ток. Пусть F
будет сила, действующая на единичный магнитный полюс Я, лежащий
в А. Тогда 2Л^2>(2тс)3, кроме того случая, когда провод есть круг
с центром в Р.
*) См. также Дополнение III в конце книги. {Прим. ред.)
РАЗНЫЕ ТЕОРЕМЫ И ПРИМЕРЫ
197
[Предположим для простоты, что область А „звездообразна"
относительно Р (т. е. что каждая точка отрезка прямой от Р до любой
точки провода принадлежит к А). Тогда, применяя полярные
координаты г и 6 с полюсом в Р, имеем (интегралы берутся в пределах
от 0 до 2ъ)
если г не постоянно.]
219. Если Л (дг, у) и q^(x, у) суть две (конечные или бесконечные)
последовательности функций от х и уу то
(Е J J fg dx dyj < S J J f dx dy S J J g* dx dy,
кроме того случая, когда существуют две постоянные а и Ь, из
которых, по крайней мере, одна отлична от нуля, такие что а^(х,у) =
= bg^(x,y) для каждого v.
[Это следует из теорем 7 (для бесконечных рядов) и 181 (для
двойных интегралов), или непосредственно вторым методом § 2.4. Теорема
иллюстрирует следующий принцип. Неравенство
(1) (222^)2<222"2225>2,
где и и v — функции трех целочисленных переменных т, п и р не
отличаются существенно от обычной формы неравенства Коши; но мы
можем вывести из (1) существенно отличные неравенства, заменяя по-
разному выбранные знаки сумм интегралами.]
220. Предположим, что все а положительны, и что qr определены
соотношением
— \ = 1 + rjqiX+... + (П + /1~~1 ) qrxr + ....
Тогда
rf<VA+i (г=1,2, ...),
кроме того случая, когда все а равны между собой.
221. qx<iqll2<^qllz- • •, кроме того случая, когда все а равны.
[Теоремы 220 и 221 были сообщены нам И. Шуром. Как и р в
§ 2.22, q суть средние однородных произведений из а, но теперь
в каждом из произведений множители могут повторяться. В
частности #1 = pi.
Теорема 221 следует из теоремы 220, так теорема 52 следовала из
теоремы 51. Для доказательства теоремы 220 заметим, что
(1) qr = (n — 1)!J j... J (a1x1+a2x2-\- ...+anxn)r dxt...dxn-l9
где xn= 1 — x1 — x2— ... — *n-i и область интегрирования
определена соотношениями": хх>0, ..., ^и_1>0, хп>0. Мы получаем
теорему 220, применяя к (1) теорему 181 (для кратных интегралов).
198
ИНТЕГРАЛЫ
[ГЛ. VI
Формула (1) ведет к более полной теореме. Если а действительны
[но не обязательно положительны, то квадратичная форма Ъцг+аУгУ8
строго положительна; если же все а положительны, то форма ИЯг+в+гУгУв
строго положительна — в обоих случаях, если не все а равны между
собой.]
X
222.
Если /?>1, f£Lp(Qt a) и F(x) = f f(t) dt% то F{x) = o(x1/p')
для малых х.
[По теореме 189
Fp< J f*dt (J dtf~l =xp~1\ fPdf,
0 0 0
и последний множитель стремится к нулю.]
223. Если /?>1 и /£/,^(0, оо), toF(x) = o (x1,p') для малых и
больших х.
[Для малых х, по теореме 222. Чтобы доказать теорему для боль-
оо
ших х, выберем X так, чтобы I fpdx<^zp, и положим х^>Х. Тогда
X
X X
{F{x)-F(X)f = (j/d/) < (x-Xf-l$fPdt<*pxp-x,
X
)'■
X X
F (x) < F(X) + гх1,J)' < 2гхг?р'
для достаточно больших x.]
224. Если у абсолютно непрерывна, за исключением, быть может,
точки x = 0t и ху'2 интегрируема в (0, а), то _y = o|(log— J J
для малых х.
225. Если у — абсолютно непрерывна, за исключением, быть может,
точек х=0 иаг=1,и х(1 — х)у'2 интегрируема в (0,1), то _у£/,2(0,1) и
1 1 1
0<§y2dx-^ydxj< ^§x(l-x)y'2dx.
0 0 0
[То, что у £/,2, следует из теоремы 224. Первое неравенство содержится
РАЗНЫЕ ТЕОРЕМЫ И ПРИМЕРЫ
199
в теореме 181. Далее, имеем
1 1
^y2dx — (^ydxj = ^^{y(u) — y(v)fdudv =
О 0 0 0
1 1 v 11 v
= [du [dv { {y'(t)dtj< [du [(y — u)dv\y'\t)dt =
о и и о и
1 t 1 1
= [yr\t)dt [duUv — u)dv = ^t{\ — t)y^dt.
о о t о
Из двух неравенств теоремы, первое может свестись к равенству
только когда у равен постоянной, а второе — когда у есть
линейная функция.]
226. Если /и>1, л> —1 и/—положительная функция и абсолютно
непрерывна, то
оо оо т(п-\-1) т—1 оо J^
a) jx»/m^<7rJT(jx^=5_/'tt^) m (||/ГЛс)и,
о ~*~ о о
причем равенство имеет место только когда /= В ехр{—£#(m+wV(m-~1)},
где£>0, С>0. В частности,
°° °° 1/9 °° 1/9
(Ь) j/2rf*<2(j>/2d*) J(j/'2^) '.
0 0 О
кроме того случая, когда f = Be~ , и это неравенство имеет место
независимо от того, положительна / или нет, а также для
интервала ( —оо, оо).
[Самым интересным случаем является (Ь); он был найден Вейлем
[Weyl 1,345], и оказался полезным в квантовой механике.
Предположим, что интегралы в правой части (а) конечны. Так как
/ непрерывна и п < т (п + 1)/(т— 1), интегралы в левой части тогда
тоже конечны. Следовательно
Hm xn+1fm=Q;
х-> оо
распространяя интегралы на (0, хк), где (хк) — подходящая
последовательность, стремящаяся к бесконечности вместе с /г, и интегрируя по
частям, получаем
оо хк
\xnfmdx= Т_ lim \ xn+1fm-lfdx.
J Л+lfc-Kog
200
ИНТЕГРАЛЫ
[ГЛ. VI
Но, по теореме 189,
оо оо т(п-\-1) т—1 оо J^
lx»+4m-l\f\dx<(lx~!!:=i~rdx) m (l\fVdx)m,
0 0 0
кроме тех случаев, когда /'<0 или f и x(n+i)/(m-~i)y
пропорциональны; в этих случаях мы приходим к f = Be~Cx*.]
227. Если ср возрастает, то
\fgdtf <^fd^g4b
кроме того случая, когда fug пропорциональны (в смысле § 6.17).
[Содержится в теореме 210; нужна для теоремы 228.J
228. Если а ;> 0, Ь *> 0, а Ф Ь, ср неотрицательна и убывает, то
оо оо оо
0 4 о о
кроме того случая, когда <р = £, где с^>0, в (0, £) и ср = 0 в (£, оо).
[£ может быть равно 0. Это неравенство сильнее получающегося
в результате непосредственного применения теоремы 181. Оно следует
из теоремы 227, если мы интегрированием по частям сведем
интегралы к рассмотренной там форме. Частный случай а = 0, Ь = 2 был
упомянут Гауссом в связи с теорией ошибок: см. Gauss [1, IV, 12] и
Полна и Сеге [1, И, 114, 318].]
229. Если а >• 0, &!>0, а Ф 1 и ср неотрицательна и возрастает, то
1 оо оо
о 4 о о
кроме того случая, когда у = С.
[См. Полна и Сеге [1, I, 57, 214]. В этом случае теорема 181 дает
обратное неравенство с множителем 1 в правой части.]
230. Если 0<а</<Л<оо, 0<& <g <£ <oo, то
[Аналог теоремы 71: см. Полна и Сеге [1, J, 57, 214].]
231. Если мы рассмотрим замкнутые или открытые интервалы
(в общем случае числом четыре) (—а,Ь), где а>0, £>0, и предположим
каждое из а, Ь нулем, положительным и конечным, или бесконечным,
то мы получим всего 34 типа интервалов /. Требуется найти для
каждого интервала / функцию f(x), определенную для 0<х<1, так,
чтобы log9Jtr(/), где ШГ(Л образовано для интервала (0,1) с д = 1,
был конечен только для значений г из /,
РАЗНЫЕ ТЕОРЕМЫ И ПРИМЕРЫ
201
[Примеры:
2 \—2/Ь
I есть-я<г<6; f(x)=x1'a(\—xr1/b(logj=^) ;
I есть—со < г •< со; /(лг)=1 + х2;
I сводится к одной точке 0, f(x) = ехр ( — *~1/2 + (1—л;)-1/2);
1 пустой интервал; /(л:) = ехр ( — л:-1+ (1 — х)~х).
Это содержит доказательство части утверждения, приведенного
в конце § 6.11.]
232. Геометрическая интерпретация неравенства Минковского*
Предположим, что точка в функциональном пространстве
определена как функция, принадлежащая к Z,2, причем две функции
определяют ту же точку, если их разность — нулевая функция. Пусть
расстояние между двумя точками fug будет
4f,g) = ]/^(f-gfdx.
Тогда (а) расстояние между двумя различными точками положительно*
и (Ъ)
4f,h)<4f,g)+4g,h).
[Если мы определим расстояние посредством
b(f,g)=(^\f-g\rdxY (г>1),
то мы получим аналогичные результаты в „функциональном
пространстве //".]
233. Кратчайшее расстояние между двумя данными точками
евклидова пространства есть прямая линия.
Кривая в пространстве дана уравнениями
x=x{t), y=y(t), z = z{t).
Предположим, что t возрастает от 0 до 1. Если допустить, что х, у, г
являются интегралами от функций, принадлежащих Z,2, то для длины
/ кривой будем иметь
/2=[ 5(Х,,+У,+ ^)1/2rf/]2=9Jt1/2(^2+y2+г'2»
по теореме 198; но это не меньше, чем
(W+(W+(W=
= (*i-*o)2 + (Ух-УоТ + (*i-*o)2-
Если имеет место равенство, то Ах' = By' = Cz\ т. е. кривая
является прямой.]
202
ИНТЕГРАЛЫ
[ГЛ. VI
234. Если 0<р<1 и
§fgdx>A^g*'dxyP
для всех g, то \fpdx^Ap.
[Ср. с теоремой 70. Если />0 для всех х, то определим g
равенством fg = fP. Если />0 в E,f = 0 в СЕ, и мера СЕ конечна,
определим g в Е равенством fg = fp, а в СЕ равенством g = G, и
рассуждаем дальше, как в доказательстве теоремы 70. Если мера
СЕ = оо, возьмем (например) g = Gex2 в СЕ. Тогда
§fPdx = J fgdx > A (\fpdx + Gp'§ ep'*2dx
y/Pr
J
E CE
и теорема снова получается переходом к пределу G->oo.]
235. Предположим, что / и р положительны, и что / имеет период
2я. Предположим, далее, что
2тс 2тс
/=• (*) = j7(* + t)p(t) dt/^p(t) dt
и что средние Шг относятся к интервалу (0,2л) с весовой функцией,
равной постоянной. Тогда
mr(F)>mr(f) (o<r<i), mr(F)^<mr(f) (r>i).
[Это может быть выведено из теоремы 204, или доказано
непосредственно (например, для/->1) следующим образом:
//(■*+')/>(<) dt
jp(t)dt
r
<
(J>(0 atf)r
1 Ыо<# [f(x+t)dx i С
В случае г = 0 см. Полна и Сеге [1, I, 56, 212].]
236. Мы будем говорить, что f(x, у, ...) и g(x,y,...) одинаково
упорядочены, если
{/(ХЬУЬ •••)- НХъУъ • • • )} {£(*!.Уъ • • • ) - ^(^2.^2. •••)}> 0,
РАЗНЫЕ ТЕОРЕМЫ И ПРИМЕРЫ
203
и обратно упорядочены, если / и — g одинаково упорядочены.
Требуется доказать, что
§...§fdxdy...§...§gdxdy...^
< j ... §efx dy...y.. §fgefx dy...,
если / и g одинаково упорядочены, и что если fug обратно
упорядочены, то имеет место обратное неравенство. Интегралы могут
быть распространены на любую общую часть областей определения
/ и g.
[Аналог теоремы 43 (для г = 1), данный по существу уже Чебы-
шевым (который рассматривает только монотонные функции от одного
переменного).]
237. Если ср и ф удовлетворяют условиям теоремы 156 и
х х
то
§fgdx<$*(f)dx + §4?(g)dx.
238. Если fug положительны, k — положительная постоянная, и
/log"1"/ и ем интегрируемы, то fg интегрируема.
[По теореме 63, kfg^fiog+f+e^-\]
239. Если / положительна, то
а а
J /(*) log j dx <2 j/ log+/ dx + ^.
о о
[Положим g = -~ log— , k = \ в неравенстве, примененном в дока-
£ X
зательстве теоремы 238.]
240. Если / положительна и принадлежит Ц0, а) и
•(*) = j/<«.
то
J/W log^ dx = J^-rf* + Па) log! ,
о о
при условии, что один из интегралов конечен.
241. Предположим, что а положительно и конечно; что В=В(а)
обозначает числа, зависящие только от а; что f(x) >0; наконец, что
х а а
F(x) = ^f(f)dt, J=§flog+fdx, K=§-ydx.
204
ИНТЕГРАЛЫ
[ГЛ. VI
Тогда: (а) если /конечно, /Стоже конечно, и K<^BJ-\- B\ (b) если/—
убывающая функция, то справедливо и обратное предложение: если К
конечно, / тоже конечно, и /< BKlog+K+B.
[По поводу двух последних теорем см. Hardy and Littlewood [8].]
242. Если / положительна и принадлежит 1(0, а) и
X
то g^L и
а а
§g(x)dx = §f(x)dx.
о о
[Интегрируем по частям, или подставим выражение для g и
переменим порядок интегрирования.]
243. Определим Шу (/), где <р — непрерывная и строго
возрастающая функция, формулой
Тогда, для того чтобы
для всех /, необходимо и достаточно, чтобы ^ была выпукла
относительно ср.
244. Для того чтобы
wtx» ...wf1 (/) < ту ... тхчл
для всех f = f(x±,дг2, ...,xw), необходимо и достаточно, чтобы каждая
функция 4>v была выпукла относительно соответствующей cpv.
245. Для того чтобы
Я?» ...Ш^НЛ < Ж*"» ... №°Ч(Л
для всех /, необходимо и достаточно, чтобы (a) #v>/?v и (b) #р. >/?v,
если p->v и подстановка, которая переводит (1, 2,..., п) в
(vlf v2, ..., vw), меняет местами р. и v.
[По поводу трех последних теорем, соответствующих теоремам
92, 93 и 137, см. Jessen [2, 3].]
246. Неравенство Гельдера может быть выведено из неравенства
(теорема 203), если положить
f(x,y)=ff(y) (о <*<-£■), f(x,y) = rf(y) (±<x<l)
[См. Jessen [3] ]
РАЗНЫЕ ТЕОРЕМЫ И ПРИМЕРЫ
205
247. Если (a) y(x,t) положительна, непрерывна и выпукла
относительно х для *i < х < дг2, *>0, (Ь) /?(0>0 и (с) интеграл
I(x)=^(xj)p(t)dt
конечен для х = х\ и х = дг2, то 1(х) — непрерывная и выпуклая
функция для Xi < х < *2-
[Что функция I (х) ограничена и выпукла, следует непосредственно
из выпуклости ср; что она непрерывна — из теоремы 111.]
248. Если f(x) и у(х) положительны и у(х) выпукла для
положительных х и
I(x)=x[^{f(t)jx}dt
конечен для х = х± и х = х2, то функция 1(х) непрерывна и выпукла
для Xi<*<x2.
[По теореме 119 ху(\/х) и
f{t)~^{f(t)lx}
выпуклы, и мы можем применить теорему 247. Более общие
результаты могут быть выведены из теоремы 120.]
249. Для того чтобы имело место неравенство
и и
для каждой выпуклой и непрерывной функции <р, необходимо и
достаточно, чтобы
и и
§g(x)dx=§f(x)dx
а
Ъ
^(g(x)-yfdxK^{f{x)-yfdx
а
для всех у.
[Здесь я+, как в § 6.1, означает тах(я, 0).]
250. Если / и g—функции возрастающие, то эквивалентным
условием является
ь ь
§g(x)dx<§f(x)dx
для а < £ < Ь.
206
ИНТЕГРАЛЫ
[ГЛ. VI
[По поводу двух последних теорем, содержащих интегральные
аналоги частей теоремы 108, см. Hardy, Littlewood and Polya [2].]
251. Если fitt), fa(t)y ..., fi(t) действительны и интегрируемы
в (0,1), то либо (i) существует функция х (t), такая что
1 1
J/i(0*(/)<«>0, ..., §fi(t)x(t)dt>09
о о
либо (и) существуют неотрицательные числа уъ у2, .. .9уг, не все
равные нулю, такие, что
J>l/l«+J>2/2«+ • • • +yiflW= 0.
252. Если /i(0» /2(0»«"i /m(0 действительны и непрерывны
в (0,1), то либо (i) существуют действительные числа хь x^,...,xm
такие, что
Х±Ш + **/*(') + • • • +*mfmW
неотрицательно для всех, и положительно для некоторых t в (ОД),
либо (и) существует положительная и непрерывная функция y(f)
такая, что
1 1
§fi(t)y(t)dt = 0, ..., §fm(t)y(t)dt = 0.
о о
[Теоремы 251 и 252 являются интегральными аналогами одной
важной теоремы Stiemke [1], касающейся систем линейных
неравенств. Предположим, что ах^(к = 1, 2, ..., /; [х = 1, 2, ..., т)
представляют таблицу с / строками и т столбцами, и что
L\(x) = a\\xi + а\ъхъ + • • • + а\тХт,
М^у) = «1^1 + а^у2 + • • • + а>%чУь
и рассмотрим две задачи:
(i) найти действительную последовательность (х), для которой
AW>0, /*(*)><>,...,£,(*)><>;
(ii) найти неотрицательную и ненулевую последовательность (у),
для которой
М±(у) = 0, М2(у) = 09...,Мт(у) = 0.
Так как
ZyL(x) = %xM(y)t
то обе задачи не могут быть одновременно разрешимы для одной и
той же таблицы (я), но теорема Стимке утверждает, что одна из
них всегда разрешима, каковы бы ни были а.
Теоремы 251 и 252 являются аналогами теоремы Стимке, в
которых т столбцов или / строк заменены непрерывной
бесконечностью столбцов или строк. Мы исключили эти теоремы и
дальнейшее рассмотрение теории систем линейных неравенств из нашей
программы только из-за необходимых для них алгебраического и
геометрического введения. Их можно найти у Хаара и Динеса:
Нааг [1], Dines [1].J