Text
                    М.Кац
СТАТИСТИЧЕСКАЯ НЕЗАВИСИМОСТЬ В ТЕОРИИ ВЕРОЯТНОСТЕЙ,
АНАЛИЗЕ И ТЕОРИИ ЧИСЕЛ
В книге излагаются в очень доступной и увлекательной форме применения
некоторых идей теории вероятностей в других областях математики. Основная
часть книги посвящена понятию статистической независимости. Автору удалось
показать, как это понятие возникает в разных видах в различных математических
дисциплинах.
Книга будет полезной и интересной для студентов, она представит
несомненный интерес также для специалистов—математиков, физиков и
инженеров, занимающихся приложениями теории вероятностей.
ОГЛАВЛЕНИЕ
Глава 1. ОТ ВИЕТА К ПОНЯТИЮ 13
СТАТИСТИЧЕСКОЙ
НЕЗАВИСИМОСТИ
1. Формула Виета 13
2. Другой взгляд на формулу Виета 14
3. Случайность или начало чего-либо 17
более глубокого?
flY 1 1 19
4. — =—...— (праз)
2 2 2 ^ Р ;
5. Герб или решетка?
6. Независимость и «независимость»
Задачи
Глава 2. БОРЕЛБ И ПОСЛЕ ПЕГО
1. «Законы больших чисел»
2. Борель и «нормальные числа»
Задачи
3. «Герб или решетка»—более
абстрактное изложение
4. В чем ценность абстракции?
5. Пример 1. Сходимость ряда со
случайными знаками
6. Пример 2. Расходимость ряда со
случайными знаками
Задачи
Литература
Глава 3. ПОРМАЛЬНЫЙ ЗАКОП
1. Муавр
2. Основная идея метода
3. Метод Маркова становится
строгим
Задачи
4. Более внимательный взгляд на
метод
Задачи
21
24
26
29
29
32
36
40
43
45
53
57
58
60
60
61
63
66
67
70
5. Закон прпроды или 73
математическая теорема?
Задачи 81
Литература 81
Глава 4. ПРОСТЫЕ ЧИСЛА 82
«ИГРАЮТ В АЗАРТНУЮ
ИГРУ»
1. Теоретико-числовые фупкции, 82
плотность, независимость
2. Статистика значений ф-фупкций 83
Эйлера
Задачи 94
3. Другое применение 97
4. Почти каждое целое т имеет 106
приближенно log log m простых
делителей
Задачи ПО
5. Пормальный закон в теории чисел 110
Задачи 116
Литература 116
Глава 5. ОТ КИНЕТИЧЕСКОЙ 118
ТЕОРИИ К ПЕПРЕРБШНЫМ
ДРОБЯМ
1. Парадоксы кинетической теории 118
2. Предварительные сведения 119
3. Ответ Больпмана 123
4. Абстрактное изложение 125
5. Эргодическая теорема и 130
непрерывные дроби
Задачи 134
Литература 135
ДОБАВЛЕНИЕ Ю. В. Прохоров 136


ПРЕДИСЛОВИЕ К РУССКОМУ ИЗДАНИЮ Издательство иностранной литературы любезно предложило мне написать предисловие к русскому пере- переводу моей маленькой монографии «Статистическая неза- независимость в теории вероятностей, анализе и теории чисел», и я с большим удовольствием выполняю эту просьбу. Когда переводится твоя работа — это всегда нриятно. В особенности приятно, когда переводится на русский язык работа, связанная с теорией вероятностей. Тогда чувствуешь, что твои труды становятся доступными русским читателям и что они продолжают великие традиции Чебышева, Маркова, Ляпунова, Бернштейна и Хинчина, блестяще развиваемые Колмогоровым и мно- многими его сотрудниками и учениками. В предисловии к английскому изданию я указал цели, с которыми нанисана эта книга. Я ничего не могу больше добавить, хочу только еще раз подчеркнуть, что книга написана в основном для молодежи, стоящей па пороге огромного и удивительного мира математики.
С ПРЕДИСЛОВИЕ Многие идеи и способы изложения были задуманы мной, когда я был студентом, и я попытался поделиться с читателями моими собственными волнениями на пороге этого мира. То, что теперь я могу поделиться ими с чита- читателями в Советском Союзе, является для меня источни- источником большой радости и удовлетворения. Я считаю своим очень приятным долгом поблагода- поблагодарить профессора Прохорова за перевод, а также за добавление и примечания к моей книге. Любой автор может только мечтать, чтобы его книгу переводил и редактировал такой известный и высококвалифициро- высококвалифицированный специалист. М. Кац Нью-Йорк, июль 1962 г.
ПРЕДИСЛОВИЕ АВТОРА Во время сессии Американского математического общества, происходившей летом 1955 года, мне была предоставлена возможность прочитать небольшой цикл лекций на чтениях в честь Хедрика (Hedrick Lectures). Я был весьма обрадован, когда несколько позже про- профессор Т. Радо от имени комитета по изданию серии «Cams Monographs» любезно попросил меня изложить мои лекции в форме монографии. Через некоторое время я удостоился чести быть при- приглашенным Хаверфордским колледжем прочитать ряд лекций в этом колледже. Это приглашение дало мне благоприятную возможность испытать задуманную монографию на «живой» аудитории, и настоящая книга является лишь незначительно измененным текстом моих лекций, читанных в Хаверфордском колледже в течение весеннего семестра 1958 года. Как и в нервоначальных лекциях, так и в этом рас- расширенном варианте моей основной целью было показать, что: (а) крайне простые наблюдения часто являются отправной точкой обширных и плодотворных исследова-
8 ПРЕДИСЛОВИЕ АВТОРА ний и (б) многие, на вид не связанные, выводы в действи- действительности оказываются вариациями одной и той же простой темы. За исключением последней главы, где я имел дело с эффектным применением эргодической теоремы к не- непрерывным дробям, книга посвящена понятию стати- статистической независимости. Это понятие возникло в теории вероятностей, и дол- долгое время им пользовались, не понимая четко его сути, что вызвало подозрение в некорректности этого мате- математического понятия. Теперь мы знаем, как определять статистическую независимость в более общих и отвлеченных терминах. Однако современное стремление к общности и отвлечен- отвлеченности приводит не только к тому, что от внимания ускользает простота первоначальной идеи, но и к тому, что становится неясной возможность применения ве- вероятностных идей вне сферы теории вероятно- вероятностей. На последующих страницах я попытался спасти статистическую независимость от этой опасности, показав как в своей простейшей форме она возникает в различных контекстах в нескольких математических дисциплинах. Что касается степени подготовленности читателей книги, то я предполагаю знакомство с теорией меры и интеграла Лебега, элементарной теорией интегралов Фурье и начальными основами теории чисел. Так как я не хотел предполагать большего, а также не хотел загромождать рассказ слишком многими техническими
ПРЕДИСЛОВИЕ АВТОРА 9 деталями, я опустил доказательства некоторых утвер- утверждений. Я прошу простить мне эти пропуски и надеюсь, что читатель достаточно заинтересуется предметом, чтобы восполнить имеющиеся пробелы. Для этого я прила- прилагаю небольшую библиографию, которая не претендует на полноту. В книгу я включил также некоторое количество задач. Эти задачи большей частью довольно сложны, и читатель не должен чувствовать себя обескураженным, если он не сумеет решить их без значительного усилия. Я хочу поблагодарить профессоров Хаверфордского колледжа К. Окли и Р. Уиснера за превосходное сотруд- сотрудничество и за превращение моего путешествия от Итаки до Хаверфорда в истинное удовольствие. Я был счастлив иметь в числе своих слушателей профессора Пенсильванского университета Г. Раде- махера и профессора Джона Окстоби из Брин-Марского колледжа. Их критика, советы и постоянная поддержка поистине неоценимы, и мой долг им велик. Мои коллеги по Корнелльскому университету, про- профессора X. Уидом и М. Шрейбер прочли рукопись и предложили большое количество изменений и усо- усовершенствований. Поблагодарить их за помощь я счи- считаю удовольствием. Я приношу благодарность также студептам Хавер- Хаверфордского и Брин-Марского колледжей, которые высту- выступили в качестве «подопытных морских свинок», и осо- особенно Дж. Райлу, составившему библиографию и читав- читавшему корректуру рукописи.
10 ПРЕДИСЛОВИЕ АВТОРА Наконец, не в меньшей степени, я хочу выразить благодарность м-сс Аксельсон из Хаверфордского кол- колледжа и м-с Мартин из Математического отделения Корнелльского университета за решение часто нераз- неразрешимой задачи перепечатки рукописи по моим почти неразборчивым записям. Марк Кац Итака, Нью-Йорк, сентябрь 1959 г.
Моему учителю профессору Гуго Штеингаузу
Глава 1 ОТ ВИЕТА К ПОНЯТИЮ СТАТИСТИЧЕСКОЙ НЕЗАВИСИМОСТИ 1. Формула Виета. Мы начнем с простой тригоно- тригонометрии. Запишем sin х = 2 sin у cos -к- = 22 sin -т- cos -г cos -к- = = 23sin-|-cos-|-cosycos-|- = fe=i Из элементарного анализа мы знаем, что при хфО sin Jn 1 ж 1=Пт f- = l^ П-+0О _?_ и, следовательно, nsin-^- = a;. A.2)
14 ГЛАВА 1 Сопоставляя A.2) с A.1), получаем со sin ж тт х —= П cov Особенно интересен один частный случай соотноше- соотношения A.3). Полагая ж = я/2, находим 2 п Y2V2+VT m-^ 2 2 ••" n=i A.4) что является классической формулой, принадлежащей Виету. 2. Другой взгляд на формулу Виета. До сих пор все было легким и хорошо знакомым. Рассмотрим теперь A.3) с другой точки зрения. Известно, что любое действительное число t, 0< < (< 1, может быть однозначно представлено в виде где каждая из величин е есть или 0, или 1. Это известное двоичное разложение t, и чтобы обес- обеспечить единственность, условимся записывать обрываю- обрывающиеся разложения в форме, в которой все двоичные цифры, начиная с некоторого места, равны 0. Так, на- например, запишем l_± + J_4--^4--°- + 4 2 22 ~ 23 "• 24
ОТ ВИЕТА К ПОНЯТИЮ СТАТИСТИЧЕСКОЙ НЕЗАВИСИМОСТИ 15 а не A_A + _o_+± + J_ + 4~2T2aT2sT2)T"" Двоичные цифры ъг являются, конечно, функциями от t, поэтому представление B.1) более точно должно выглядеть как ei(t) ea(Q 88@ . ,9 „. г— g I 2^~ "¦ 2* г • • • • У^-ч При нашем соглашении относительно записи обры- обрывающихся разложений графики функций ех(<), е2@, е3(<), . . . выглядят следующим образом: о i ' * i i i t 0} HUH' Удобнее ввести функции rh(t), определяемые равен- равенствами rh@ = l-2ek(Q, fc=l, 2, 3, ... , B.3) и имеющие следующее графическое изображение: 10 10 Эти функции, впервые введенные и изученные Г. Раде- махером, называются функциями Радемахера. В тер-
16 ГЛАВА 1 минах функций rk (t) мы можем переписать представ- представление B.2) в виде -*= 2 "^ B-4) Заметим теперь, что 1 При этом формула A.3) превратится в h=l ft=l ft=i О и, в частности, будет иметь место равенство \ П exp (te^U) Л= П 5 (# О fe=l fe=l О Интеграл от произведения равен произведению инте- интегралов!
ОТ"ВИЕТА К ПОНЯТИЮ СТАТИСТИЧЕСКОЙ НЕЗАВИСИМОСТИ 17 3. Случайность или начало чего-либо более глубо- глубокого? Можем ли мы рассматривать равенство B.5) как случайное совпадение? Конечно нет, до тех пор, пока мы не исследуем вопрос более тщательно. Взглянем на функцию Это ступенчатая функция, которая постоянна на ин- интервалах (JL s+i Л с-о 1 2" — \ \ 2П ' 2П у' ~ ' " " '' и значениями которой являются числа ± Cj ± С2 ± . . . J- Сп. Каждая последовательность (длины п), состоящая из + 1 и — 1, соответствует одному и только одному ин- интервалу (s/2n, (s+l)/2"). Таким образом, где внешняя сумма справа берется по всем возможным последовательностям (длины и) из +1 и — 1. Теперь
18 ГЛАВА 1 и, следовательно, In п п 1 $ ехр [ i ^ chrk (t) ] dt = Д cos ck = П j eic"r"@ dt. 0 1 ft=l h=1 0 C.1) Полагая получаем i О 1 fc=l и так как причем сходимость в левой части равномерна на @, 1), то мы имеем 1 1 п sin х С . Р /*. х^ ''fe (t) Л ___ = ^ егХ A- о Л = !im ^ ехр ^ 1Ж ^ -^- J Л = О 0 1 п оэ = НтДсо8^ = Дсоз-|г.
ОТ ВИЕТАК ПОНЯТИЮ СТАТИСТИЧЕСКОЙ НЕЗАВИСИМОСТИ 19 Таким образом, мы установили другое доказатель- доказательство формулы A.3). Лучше ли оно, чем доказательство, данное в п. 1? Данное доказательство более сложно, но в то же время более поучительно, так как оно как-то связы- связывает формулу Виета с двоичными цифрами. Какое же свойство двоичных цифр нриводит к уснеху? 4. (-о") = "Т' ' "Т ('* Раз)- Рассмотрим множество тех t, для которых Одного взгляда на графики rv r2 и г3 достаточно, чтобы установить, что это множество (за исключе- исключением, быть может, концевых точек) — нросто интервал \ 8 ' 8 )• Очевидно, что длина (или мера) этого интервала 1 равна -g- и 1_1 А. 1 8 ~ 2 " 2 " 2 - Это тривиальное наблюдение может быть записано в следующей форме: ц{г1@=+1, rs(Q=-1, г,@=-1} = где \i обозначает меру (длину) множества, определяемо- определяемого выражением внутри скобок.
20 ГЛАВА 1 Читатель без труда сможет распространить это наблюдение на случай произвольного числа функций г. Он получит следующий результат: если бх, ...,бп — последовательность, состоящая из +1 и — 1, то = И W (*) = бх} |i {г, (t) = б2} ... li {rn (t) = 6J. Может показаться, что мы всего лишь усложненным способом записали равенство ~ 2 л 2 но в действительности это значительно больше. Полу- Полученный результат выражает глубокое свойство функций rh (t) (и, следовательно, двоичных цифр) и служит отправной точкой обширных и плодотворных исследо- вапий. Именно это свойство лежит в основе доказа- доказательства п. 3. Формула C.1) может быть теперь дока- доказана следующим образом: 1 п ехр Г i 2 1
ОТ ВИЕТА К ПОНЯТИЮ СТАТИСТИЧЕСКОЙ НЕЗАВИСИМОСТИ 21 = 2 ft=l 6ft h=l 6 5. Герб или решетка? Элементарное исследование опыта с бросанием монеты начинается с двух пред- предположений: а) монета симметрична; б) последовательные бросания монеты независимы. Первое предположение означает, что в каждом отдель- отдельном бросании исходы Н (герб) и Т (решетка) равно- равновероятны.1), т. е. каждому из них приписывается «вероятность» -к-. Второе предположение позволяет при- Li менить «правило умножения вероятностей». Это правило, грубо говоря, таково: если события At, ..., Ап незави- независимы, то вероятность их совместного появления равна произведению вероятностей появления отдельных собы- событий. Другими словами, Вер. {Аг vi А2 ж А3 ... и Ап} = -Вер. {А,} Вер. {Л2} ... Вер. {Ап}. E.1) Н и Т от английских «head» и «tail».— Прим. перев.
22 ГЛАВА 1 Примененное к независимым бросаниям симметричной монеты, это правило позволяет сделать заключение о том, что вероятность появления последовательности (длины п), состоящей из альтернативных исходов Н и Т (например, ННТТ. . .Т), равна Aviv yl-A 2 А 2 2 2п ' Это напоминает выводы п. 4, и мы можем использовать функции rk (t) в качестве модели для опыта с бросанием монеты. Для достижения этой цели составим следующий словарь терминов: символ Н + 1 символ Т — 1 к-е бросание (к=1,2, ...) rk(t) (A = l,2, ...) событие некоторое множе- множество значений t вероятность события мера соответству- соответствующего множества значений t Чтобы понять, как применять этот словарь, рассмотрим следующую задачу. Найти вероятность того, что при п независимых бросаниях симметричной монеты герб вы- выпадает точно I раз. Используя словарь, мы переведем задачу, и она будет читаться в новой форме так:
ОТ ВИЕТА К ПОНЯТИЮ СТАТИСТИЧЕСКОЙ НЕЗАВИСИМОСТИ 23 Найти меру множества точек t, таких, что из п чисел r1(t), r2(t), ...,rn(t) ровно I равны-)-1. Мы можем решить эту задачу (не прибегая к обычной ком- комбинаторике) способом, с которым мы еще много раз встретимся при различных обстоятельствах впоследствии: Прежде всего заметим следующее: условие, состоя- состоящее в том, что среди r^t), . . .,rn(t) ровно I равны 1, эквивалентно условию ri(*) + r2(t)-\ \-rn (t) = 21 —п. E.2) Далее отметим, что для целого т 2я |1 тга = 0 гЫх dx = I ' ' E.3) ^v/j Т7Ь -у— V/j V и, следовательно, функция 2я 1 $ +rn (')-(«-«,] rfa. -E 4) о равна 1, если удовлетворяется E.2), и равна 0 в про- противном случае. Таким образом, 1 1 2я 1 о о 2я = Л С в-*B/-п)*/' Р е««[г1(о+...-н-п(О]йЛ dx
24 ГЛАВА i (последний шаг—изменение порядка интегрирования— обыкновенно оправдывается обращением к теореме Фубини. В нашем случае обоснование этого шага три- тривиально, так как сумма /^ (f)+...+ rn (t) представляет собой ступенчатую функцию). Вспомним теперь равенство C.1); с его помощью при с1 = с2 = ... = сп — х получим 2Я = ^e-ii2l-n)xcoSnxdx. E.5) о Наконец, мы оставим в качестве упражнения доказа- доказательство того, что ИМ*)+ ¦¦•+rn @ = 2Z-n} = ^-(^). E.6) 6. Независимость и «независимость». Понятие неза- независимости, хотя и является центральным по важности в теории вероятностей, не есть чисто математическое понятие. Правило умножения вероятностей независи- независимых событий представляет собой попытку формализовать это понятие и на этой основе построить некоторое исчисление. При этом возникает склонность рассматри- рассматривать события, которые кажутся не связанными, как независимые друг от друга. Так, физик, рассматривая события, происходящие в двух удаленных друг от дру- друга пробах газа, будет считать их независимыми (как может быть иначе, если одна проба взята, скажем
ОТ ВИЕТА К ПОНЯТИЮ СТАТИСТИЧЕСКОЙ НЕЗАВИСИМОСТИ 25 в Бисмарке, Северная Дакота, а другая—в Вашингто- Вашингтоне, округ Колумбия?) и радостно обратится к правилу умножения вероятностей. К сожалению, действуя таким образом, он может (непреднамеренно и непроизвольно) создать впечатле- ние,5что сказанное им—строгое логическое заключе- заключение. В действительности то, о чем говорилось, является определением независимости, объединяемым с убежде- убеждением (основанным, несомненно, на наблюдениях и опы- опыте), что это определение применимо в некоторых слу- случаях. Существует, таким образом, независимость в рас- расплывчатом интуитивном нонимании, и «независимость» в том узком, но точно определенном смысле, что при- применимо правило умножения вероятностей. Длительное время основным мотивом и движущей си- силой развития теории вероятностей были неопределен- неопределенные интуитивные представления. И в то время, как создавался впечатляющий фор- формализм, математики (за очень немногим исключением) оставались в стороне, так как не очень ясно понимали, к каким объектам формализм применим1). г) Предположим,- что книга по дифферепциальным уравне- уравнениям написана исключительно в терминах масс, сил, ускорений и попадает в руки кого-нибудь, кто никогда не слышал о ме- механике. Богатое чисто математическое содержание такой кни- книги могло бы быть в значительной степени потеряно для этого гипотетического читателя.
26 ГЛАВА 1 Затем в 1909 г. Э. Борель заметил, что двоичные цифры ek (t) [или, что эквивалентно, функции Радема- хера rh (t)] являются «независимыми» [см. D.1)]. Наконец, появились точно определенные объекты, к которым теория вероятностей для независимых со- событий могла быть применена без опасности обращения с монетами, событиями, бросаниями и экспериментами. Появление классического мемуара Бореля «Sur les probabilites denombrables et leurs applications arithme- tiques» отметило начало современной теории вероят- вероятностей, и в следующей главе мы будем обсуждать некоторые из нанравлений, по которым эта теория раз- развивается. ЗАДАЧИ 1. Записать троичное разложение t, O^i^l, в виде ,_., % @ 1 4i(*) ¦ ч»@ ¦ 3 ~*~ З2 З3 ~г'" (каждое r\k может принимать значения 0, 1 и 2) и доказать, что величины т| независимы. 2. Доказать, что оо 1 -(-2 COS sinx тт 3fe и обобщить это соотношение.
ОТ ВИЕТА К ПОНЯТИЮ СТАТИСТИЧЕСКОЙ НЕЗАВИСИМОСТИ 27 3. Показать, что если kt < к2 < ... < ks, то 1 4. Пусть число In (четное, положительное) записано в двоичной системе: Зададим функции wn(t) (функции Уолша—Качмаша) следую- следующим образом: Доказать, что I (а) \ wm(t)wn(t)dt~6m,n; (б) если /@ — интегрируема и 1 \ f(t)wn(t)dt = O, n=0, 1, 2, . то /(г) = 0 почти всюду; 1 1 2П (в) ft=0 5. Используя формулу , , 1 dtds = i. 1 — COS ZX At,
28 ГЛАВА 1 доказать сначала, что In со 1 —cosna; l/Vn ± P 1: я J - cosna; а затем, что где 1 n 0 i Л= — -i Замечание: неравенство Шварца вместе с результатом задачи 3 при s=2 дает i п О 1
Глава 2 БОРЕЛЬ И ПОСЛЕ НЕГО 1. «Законы больших чисел». Все вы имеете пред- представление о том, что если играть в безобидную игру, то в конце концов маловероятно, чтобы вы разбога- разбогатели. «Закон средних позаботится об этом» —вот что разумно нодсказывается в этой и подобных ситуациях. Что же это за «закон средних»? Является ли он чем-то вроде физического закона или это есть чисто математическое утверждение? Большей частью все же верно последнее, хотя этот закон и хорошо согласует- согласуется с экспериментальными данными. Давайте забудем об экспериментальной стороне проблемы и сконцен- сконцентрируем внимание на математических вопросах. Пред- Предположим, что я бросаю симметричную монету, выиг- выигрывая доллар каждый раз, когда появляется Н и про- проигрывая доллар всякий раз при выпадении Т. Что я могу сказать о своем выигрыше после п бросаний? Используя наш словарь п. 4 гл. 1, мы можем пред- представить этот выигрыш так: .-+Гп @- A-1) Очевиден интерес игрока к следующему вопросу: каковы его шансы на та, что после п бросаний мо-
30 ГЛАВА 2 неты его выигрыш превзойдет заданное число Ап. Согласно нашему словарю, это эквивалентно задаче определения меры множества точек t, для которых ri(t) + r2(t)+...+rn(t)>An. A.2) Если действительно маловероятно то, что я разбога- разбогатею в этой игре, то при Ап «достаточно большом» мера множества, онределенного A.2), будет «мала». (По тем же соображениям будет ненравдонодобен нроигрыш больший, чем Ап.) Мы придадим всем этим выводам необходимую точность, доказав следующую теорему: При любом е > 0 ..+rn(t)|>en} = 0. A.3) Очевидный подход может быть основан на формуле E.6) гл. 1. Действительно, мы имеем = 2 и |2г-п|>еп 2" V I и все сводится к доказательству того, что при любом и- 2 К")-0- <'-4> | 21п\ >8 | 21—п\ >8
БОРЕЛЬ И ПОСЛЕ НЕГО 31 Попытайтесь это сделать! Это будет не трудно, но и не очень легко, если следовать естественному влече- влечению и использовать формулу Стирлинга. Если вы добьетесь успеха, то этим вы повторите первоначаль- первоначальное доказательство Бернулли. Однако существует и лучший и более легкий способ, принадлежащий Чебы- шеву. Вы просто записываете 1 \(r1(t)+...+rn(t))*dt> (rl(t)+...+rn(t)Jdt> >E*ny{\r1(t)+...+rn{t)\>en}. A.5) Если вы решили задачу 3 в конце гл. 1, то вы сможете получить 1 \{ri(t)+...+rn(t))*dt = n A.6) о и, используя A.5), М1 {I ri @ + • • • 4"т что доказывает A.3) «с большим запасом».
32 ГЛАВА 2 Запомните этот изящный прием Чебышева; мы еще с ним встретимся! Утверждение A.3) дает простейший пример того, что в специальных терминах называется «слабым за- законом больших чисел» х). Прилагательное «слабый» не имеет намерением умалить значение, но употребляется для различения с другим законом больших чисел, на- называемым обыкновенно «усиленным законом». Харак- Характеристика «усиленный» не имеет целью превозношение этого закона; просто для случая игры в орлянку из него вытекает «слабый закон», и потому он сильнее в логическом смысле. Оба закона были довольно сильно обобщены, и в своей окончательной форме ни один из них не влечет за собой другого. Это, однако, технические вопросы, которые нас в данном случае не интересуют. Математическое содержание слабого, закона больших чисел относитель- относительно бедно. В форме A.4) он превращается в занима- занимательную теорему о биномиальных коэффициентах. Может ли тогда он быть выражением таинственного «закона средних», упоминавшегося выше? Боюсь, что так. Это по существу все, что мы можем надеяться получить от чисто математической теории. 2. Борель и «нормальные числа». Другой закон больших чисел был найден Борелем. Борель доказал, что для почти всех t (т. е. для всех точек t, исклю- х) «the weak law of large numbers». В русской терминологии прилагательное «слабый» обычно опускают. — Прим. перев.
БОРЕЛЬ И ПОСЛЕ НЕГО 33 чая множество лебеговой меры 0) lim^ п —^— = 0. B.1) Доказательство несложно и основано на хорошо извест- известной теореме из теории меры и интеграла Лебега. Теорема, о которой идет речь, такова: Если {/n (t)} — последовательность неотрицательных интегрируемых по Лебегу функций, то из сходимости со 1 2 \tn(t)dt B.2) n=l 0 следует сходимость почти всюду ряда сю 2 /Л*)- B-3) п=1 Положим (^(оу B.4) и рассмотрим о Использовав результат задачи 3 в конце гл. 1, мы без труда вычислим V 2 41
34 ГЛАВА 2 и, следовательно, со 1 п=1 О Из этого следует, что ряд п=1 сходится почти всюду и тем более у п-»оо V п J почти всюду. Этим доказало равенство B.1). Так как то B.1) эквивалентно тому, что для почти всех t lim М0+-+М0 1 B.5) П-+СО Другими словами, почти каждое число t имеет (асим- (асимптотически) одинаковое число нулей и едипиц в соот- соответствующем ему двоичном разложении! Это арифме- арифметическое содержание теоремы Бореля. Что дает теоре- теорема в вероятностном плане? Пользуясь нашим словарем, мы придем к следующему заключению. Если симмет- симметричная монета бросается неограниченно долго и если бросания независимы, то частота появления гербов
БОРЕЛЬ И ПОСЛЕ НЕГО 35 (решеток) равна V2 с вероятностью 1 (в пределе, ко- конечно). Это утверждение удовлетворяет нашим интуи- интуитивным представлениям о том, что должен говорить «закон средних», и вновь убеждает в хорошем выборе нашего словаря. Читатель, несомненно, сознает, что основание 2 в знаменателях разложения не является чем-то «не- «неприкосновенным». Если g — большее единицы целое число, то можно записать , = «!^>+«М0 + ... , о<*<1, B.6) где каждая цифра w(t) принимает теперь значения 0,1, ...,g—\. Мы предоставляем читателю доказать, что для почти всех ?@<?<1) &-4. B.7) где /"W (t) обозначает количество тех величин w, из числа п первых, которые равны к, 0</c<g —1. (Это задача 1 на стр. 36.) Из того факта, что счетное объединение множеств меры 0 снова имеет меру 0, вытекает следующее: почти все числа t, 0<!f<l, таковы, что в любой системе счисления (т. е. при любом g > 1) каждая допустимая цифра появляется с определенной (и ожи- ожидаемой!) частотой. Другими словами, почти все числа «нормальны»!
36 ГЛАВА 2 Как это часто бывает, доказать, что преобладаю- преобладающее большинство объектов обладает определенным свойством, много легче, чем указать хотя бы один такой объект. Данный случай не исключение. «Нор- «Нормальные» числа строить довольно трудно! Простейшим примером служит число (записанное в десятичной системе) 0,123456789101112131415161718192021..., где носле запятой мы последовательно записываем все положительные целые числа. Доказательство нор- нормальности этого числа никоим образом не является тривиальным. ЗАДАЧИ 1. Доказать B 7), показав сначала, что величины w неза- независимы, а затем обобщив результат задачи 3 гл. 1. 2. Пусть f(l), 0<;<<1, — непрерывная функция. Дока- Доказать, что rJlC о о Указание: сначала показать, подражая чебышевскому методу доказательства A.4), что гс-мерный объем множества, определенного неравенством г 0<Xi<l> i = u 2 п> ft ? меньше 1/12e3w.
БОРЕЛЬ И ПОСЛЕ НЕГО 37 3. «Несимметричная» монета. Пусть Tv (t), определено следующим образом: а пусть г О, О Начертить графики функций 1 и показать, что они независимы. Заметьте, что при Р=-к- получаются двоичные цифры. 4. Доказать, что мера множества, на котором e(P)(«)+.--+e<rt@=-'. 0<Z</i, равна 5. Объяснить, как функции е<Р) (<) могут быть использо- использованы при построении модели для независимых бросаний не- несимметричной монеты, где вероятность Н равна р и вероят- вероятность Т равна 7 = 1 — Р- 6. Показать, что если / (t) непрерывна, то с ,/ 3 ч о п ft=0 )—это известные полиномы Бернштейна.]
38 ГЛАВА 2 7. Используя чебышевский прием, оценить меру множе- множества, на котором и доказать, что равномерно при O^Jp^l [по определению Вп @)=/@) и ЯпA) = /A)]. (Это есть принадлежащее С. Бернштейну дока- доказательство известной теоремы Вейерштрасса о приближении непрерывных функций полиномами.) 8. Пусть f(t) удовлетворяет условию Липшица первого норядка, т. е. 1 ¦ n lim Br n->oo P AP)=f(p) где М — константа, не зависящая от tx и t2. Доказать, что Вп(р)\<^у=. 9. Пусть /@= Эта функция удовлетворяет условию Липшица первого по- порядка. Иснользовать результат задачи 7 гл. 1 для оценки снизу и таким образом показать, что порядок 1/]/" п оценки в за- задаче 8 наилучший из возможных. 10. Доказать, что для почти всех t
БОРЕЛЬ И ПОСЛЕ НЕГО 39 11. Показать, что существует возрастающая функция <pp(t), такая, что s[p)(i) = 4D>P(t)), *=1.2, ... , (величины ejj — двоичные единицы). Показать далее, что при рф~п функция фр @ является «сингулярной», т. е. любое множество положительной меры Е содержит подмножество ?j, отличающееся от Е на множество меры 0 и такое, что образ фр(?,) имеет меру 0. [См. Lomnicki Z., Ulam S., Fund. Math., 23 A934),237 —278, в частности 268—269.] 12. Доказать, что при любом в > О ряд п=1 ' сходится почти всюду и что, следовательно, неравенство п-»со у n log re выполняется почти всюду. Указание: следует заметить, что (| действительно) 1 1 о 4- о Замечание. Результат sup lim sup п-ко у п log Я
40 ГЛАВА 2 был впервые получен Харди и Литлвудом в 1914 г. довольно сложным путем. Более сильный результат, утверждающий, что почти всюду гг-ю> у п log log n был доказан в 1922 г. Хинчиным. Это значительно труднее сделать. 3. «Герб или решетка» —более абстрактное изло- изложение. Общепринятая структура статистических тео- теорий (т. е. теорий, основанных на понятии вероят- вероятности) может быть кратко описана следующим образом. Начинают с множества Q («пространства выборок»), мера (вероятность) которого принимается равной 1. В $ имеется совокупность подмножеств («элементар- («элементарных множеств» или «элементарных событий»), меры (вероятности) которых заданы. Задача состоит в том, чтобы «продолжить» эту меру на возможно более широкую совокупность подмножеств й. Правила продолжения меры следующие: 1. Если Аи А2, ...—попарно непересекающиеся (попарно несовместимые) подмножества Q (события) и если они измеримы (т. е. может быть определена их со мера), то их объединение М Ak также измеримо и й1 где [i { } — это мера, приписанная множеству в скоб- скобках.
БОРЕЛЬ И ПОСЛЕ НЕГО 41 2. Если А измеримо, то также измеримо и его до- дополнение Q — А. (Из 1 и 2 следует, что \i{Q — A} = = 1 — ^(^4), и, в частности, так как измеримость Q постулирована, то мера пустого множества равна 0.) 3. Подмножество множества меры нуль измеримо. Измеримые функции /(ш), ©?Q, определенные на Й, называются «случайными величинами» (ужасная и вводящая в заблуждение терминология, к сожале- сожалению, непоправимо теперь закренилась). Посмотрим, как включается в эту схему «герб или решетка». Пространство выборок Q в этом случае — просто мно- множество всех бесконечных последовательностей симво- символов Н и Т, т. е. последовательностей, подобных ш: НТННТТТ... . Что является элементарными событиями? Обычно это «цилиндрические множества», т. е. множества последо- последовательностей, у каждой из которых на конечном числе выбранных мест стоят одни и те же символы. Напри- Например, множество всех последовательностей, у которых третий элемент Н, седьмой— Т и одиннадцатый— Т, есть цилиндрическое множество. Какие значения меры должны быть приписаны этим множествам? Это зави- зависит, копечно, от нематематических допущений относи- относительно опытов с бросанием мопеты. Эти допущения мы должпы перевести на математический язык. Не- Независимые бросапия «симметричной монеты» перево- переводятся на этот язык сопоставлением каждому цилиндри- цилиндрическому множеству меры 1 Nft
42 ГЛАВА 2 где к — число фиксированных символов. Теперь возни- возникает важная проблема, заключающаяся в доказатель- доказательстве единственности продолжения меры. В нашем случае это может быть сделано очень просто посред- посредством сведения к единственности меры Лебега. Послед- Последнее означает, что если мера \i, определенная на @,1), удовлетворяет 1, 2 и 3 и если [г-мера любого интер- интервала равна его длине, то(х —обычная мера Лебега. Если мы будем писать 1 вместо Я и 0 вместо Т, то каждой последовательности символов Н и Т будет соответство- соответствовать (однозначно, исключая счетное множество двоично- рациональных чисел) число t, 0< t< 1, а именно число, двоичные цифры которого получаются заменой симво- символов // и Т данной последовательности единицей и нулем соответственно. Получившееся отображение имеет также то свойство, что оно переводит цилиндрические мно- множества, в объединения непересекающихся интервалов, концевые точки которых являются двоично-рациональ- двоично-рациональными числами. Кроме того, мера, приписанная нами цилиндрическому множеству, равна лебеговой мере (длине) множества, полученного при его отображении. Теперь мы довели дело до конца! Единственность продолжения может быть также доказана без использования отображения. Наиболее общая теорема такого рода была доказана Колмогоро- Колмогоровым в его книге «Основные понятия теории вероят- вероятностей» в 1933 г. Если мера на Q введена, то можно стандартным путем построить теорию интегрирования, параллель- параллельную обычной теории Лебега.
БОРЕЛЬ И ПОСЛЕ НЕГО 43 Пусть co?Q, т. е. со — последовательность Н и Т. Положим { +1, если /с-й элемент со = JET, Ajj (со) = < 1—1, если к-й элемент со = 7\ Функции Xfe (со) —«независимые случайные величины» в том смысле, что для любой последовательности б^, где каждая из величин б равна или 1, или — 1, р {X, (со) = б1; Х2 (со) = б2). . ., Хп (со) = б,.} = Ясно, что Xh (со) дают нам модель независимых броса- бросаний симметричной монеты. 4. В чем ценность абстракции? Абстрагировать — это, по-видимому, значит переходить к сути дела. Это значит освобождаться от случайных черт и сосре- сосредотачивать внимание на особо важных свойствах. Абстрактно теория игры «герб или решетка» (симмет- (симметричная монета, независимые бросания) сводится просто к изучению функций Xh (со) со свойством C.1), опре- определенных на некотором пространстве Q (с единичной мерой), где задана мера ц,, удовлетворяющая требова- требованиям 1, 2 и 3 предыдущего пункта. Не важно, чем является Q — разрешено лишь пользоваться C.1)
44 ГЛАВА 2 и элементарными свойствами 1, 2 и 3 меры. Следует, конечно, убедиться, что мы имеем дело не с матема- математическим вакуумом, т.е. объекты, о которых мы гово- говорим, могут быть определены. Это достигается тем, что в качестве Q берут «пространство выборок» и тре- требуемую меру \i строят, как это указывалось в п. 3. То обстоятельство, что реализация Х^ (со) возможна посредством функций Радемахера rh(t) (т. е. что в ка- качестве Q можно выбрать интервал @,1) с обычной мерой Лебега на нем), можно рассматривать как несу- несущественное. Отметим, что, за исключением запима- тельного доказательства формулы Виета, где мы ис- нользовали весьма специальное свойство функций Раде- Радемахера, именно что мы никогда не обращались к чему-либо, кроме как к свойству C.1) и общим свойствам меры. Однако цена, которой нридется расплатиться за неограничен- неограниченную абстракцию, в действительности значительно боль- больше. Неограниченному абстрагированию свойственна тенденция отвлекать внимание от целых областей при- применения, самое открытие которых зависит от тех черт, какие абстрактная точка зрения исключает как слу- случайные. Иллюстрации этого разбросаны по всей книге. Начнем с нескольких примеров из области, уже хорошо нам знакомой.
БОРЕЛЬ II ПОСЛЕ НЕГО 45 5. Пример 1. Сходимость ряда со случайными знаками. Какова вероятность того, что ряд оо 2 ± ck (ch действительны) со знаками, выбранными независимо и с вероятностью -т> Li каждый, сходится? Эта задача была внервые постав- поставлена в такой форме Г. Штейнгаузом в 1922 г. (и неза- независимо от него Н. Винером), которому мы обязаны также постановкой проблем, изложенных в н. 3. Штейнгауз отметил, что задача эквивалентна нахо- нахождению меры множества точек t, в которых сходится ряд Этот вопрос был тогда уже разрешен Радемахером, который доказал, что если со 24<оо, E.2) 1 то ряд E.1) сходится почти всюду. Мы могли, копечно, рассматривать вопрос сходимости ряда Ь=1 E.3) где Хк (со) обладают свойством C.1). Действительно, доказательство Колмогорова, который максимально
46 ГЛАВА 2 обобщил теорему Радемахера, использовало лишь C.1). Существует, однако, замечательное доказательство, принадлежащее Палею и Зигмунду, которое суще- существенно опирается на свойства функций Радемахера. Это доказательство мы воспроизведем здесь по причи- причинам, которые стапут понятными несколько позже. Оно основано на двух не совсем элементарных и очень важных теоремах. 1. Теорема Рисса — Фишера, которая утверждает, что если и если ф1(<)> ФгМ» ••• — ортопормальная система, определенная па множестве Е, т. е. $ф4@ <р, (*) <** = »!,. E.4) Е то существует функция f(t)?L2 (т. е. \ p(t) dt<.co), Е такая, что п lim \ ff (t) - 2 ahVh (t)Xdt = 0. E.5) 2. Фундаментальная теорема анализа, которая в своем «высшем» варианте устанавливает, что если 1 \\1(t)\dt<*>, E.6) о
БОРЕЛЬ И ПОСЛЕ НЕГО 47 то для почти каждого t0 lim * \f(t)dt=f(t0) E.7) m-юо Vm~ am J am при условии am < ?0 < Pm и lim am = lim Pm = f0. m-+oo m-+oo Далее, мы знаем, что функции Радемахера ортонормаль- ны на интервале @,1): Следовательно (по теореме Рисса —Фишера, сформули- сформулированной выше), существует функция f(t), такая, что 1 J/«(*)&< оо E.8) 1 п lim \(i(t)- ^^^(O Y dt = O. E.9) оо (Вспомним наше допущение 2 С1 < °°) 1 Пусть тенерь i0 таково, что выполняется E.7) [из E.8)
48 ГЛАВА 2 вытекает E.6)!], и пусть ат — gsr < го <—^—~ Р;п @.W) (мы исключаем возможность, когда t0 является двоично- рациональным). Мы имеем «р„-<оЧ \(т- о и, следовательно, по E.9) Заметим, что [ rk(t)dt = O, к>т, и , к<т. E.13)
БОРЕЛЬ И ПОСЛЕ НЕГО 49 Таким образом, E.11) превращается is Pm — am J 1 и, следовательно, по E.7) ряд сходится. Вышеприведенные аргументы могут быть непосред- непосредственно применены к доказательству того, что ряд оо У ск8\п2я2Н E.14) сходится ночти всюду, если 24<оо. E,15) Эта теорема естественным образом подсказывается, если заметим, что Действительно, наше доказательство основывается на трех свойствах функций Радемахера: 1) ортонормальность, 2) E.12), 3) E.13). При замене rk (t) на sin 2it 2ht свойства 1 и 2 сохра- сохраняются. Последнее же не сохраняется в точности,
50 ГЛАВА 2 однако при ft<m мы имеем \ sin 2я 2Н dt = (Pm - am) sin 2я 2% + \ (sin 2я 2''i - sin 2я 2^0) di E.16) am (sin 2я 2ht - sin 2я 2^0) dt I sin 2я 2ht — sin 2я 2!lt0 \ dt < 2я 2h {\t — to\dt< Теперь вместо мы получим pm-<
БОРКЛЬ И ПОСЛЕ НЕГО 51 а так как сп —-> 0 при п —> со (вспомните, что 2 с« < °°)> то и этого достаточно для завершения доказательства. Только что доказанная теорема о сходимости ряда со 2 ск sin 2л 24 является фактически частным случаем известной тео- теоремы Колмогорова о том, что сходимость влечет за собой сходимость почти всюду ряда оо 2 ch sin 2nnkt при условии существования числа q, для которого Колмогоров при доказательстве использовал сущест- существенным образом то, что рассматриваемый ряд является тригонометрическим. Однако, обобщив аргументацию Палея —Зигмунда, можно доказать следующую зна- значительно более общую теорему.
52 ГЛАВА 2 Если функция g (t) — периодическая с периодом 1 и если (а) \g(t)dt = O, о (б) \g(t')-g(t")\<M\t'-t"\a, 0<a<l, то сходимость 2cft влечет за собой сходимость почти всюду ряда 1 где целые числа пк таковы, что Доказательство этого утверждения из-за нескольких технических трудностей не будет здесь воспроизведено, хотя по существу никакой новой идеи, сверх принад- принадлежащей Палею и Зигмунду, не требуется. Какой вывод можно сделать из разобранного при- примера? На вид случайный факт, заключающийся в том, что rk (t) = sgn sin 2п2к'Ч, наводит на мысль, что здесь могут быть проведены аналогии между rk (t) и sm2n2h~4. Так как rk (I) имеют определенную вероятностную интернретацию, то этим открывается путь к установлению связи между игрой «герб или решетка» и математической областью,
БОРЕЛЬ И ПОСЛЕ НЕГО 53 где нет понятий случая и вероятности, монет и чего бы то ни было подобного. Могло ли это быть достиг- достигнуто, если бы мы настояли на абстрактной трактовке игры «герб или решетка»? Может быть, но я сомне- сомневаюсь. 6. Пример 2. Расходимость ряда со случайными знаками. Что происходит с рядом I ± ск, F.1) ft=i если оо 2с1 = сю? F.2) 1 На это можно ответить, что ряд F.1) расходится с вероятностью 1. Доказательство крайне просто. Заметим, во-первых, что наша задача состоит соб- собственно в определении меры множества сходимости ряда |с*М«) F.3) при условии F.2). Во-вторых, множество сходимости ряда F.3) должно иметь меру или 0, или 1 (частный случай так называемого закона нуля или единицы). Вспомним, что h J) Здесь подразумевается, что r^ (t) определены таким образом, чтобы они были периодичны с периодом 1. Другими словами, (*| 1) («)
54 ГЛАВА 2 и, следовательно, вместе с t множеству сходимости принадлежит и <+* при 1 = О, 1, 2, ... . Действительно, если t заменить на t-\-2~l, то в F.3) изменится лишь конечное число членов, а это не может повлиять на сходимость. Таким образом, характеристическая функция множества сходимости имеет произвольно малые периоды, и по известной теореме она должна быть постоянна почти всюду, причем эта константа равна или 0, или I1). х) Для ограниченной измеримой (следовательно, инте- интегрируемой по Лебегу!) функции <р (t) доказательство следую- следующее: имеем 1 2'-l (fc+D/21 (ft+l)/2; /=^ф(*)Л=2 jj ф@«» = 2' J cf(t)dt. О ft=0 fe/2' fe/2' Пусть t0 таково, что при А;/2! < t0 < (ki-\-l)/2l lim 2' 1-><х> J ftj/21 По фундаментальной теореме анализа (см. п. 5) почти каждое <о имеет такое свойство. Таким образом, <р B0) = / для почти каждого t0. Если <р (t) не предполагается ограниченной, то те же аргументы применимы к егф(*'. Это доказательство пред- предложено Гартманом и Кершнером; теорема была доказала сна- сначала более сложным способом Бурстиным. Характеристичес- Характеристическая функция множества сходимости ряда из измеримых функ- функций измерима, так как измеримо само это множество.
БОРЕЛЬ И ПОСЛЕ НЕГО 55 Мы можем предположить, что сп—->0, в противном случае утверждение нашей теоремы будет тривиальным. Допустим теперь, что F.2) выполняется, сп—>0 и ряд F.3) сходится на множестве положительной меры. По вышеприведенному замечанию он должен сходиться почти всюду. Следовательно, существует измеримая функция g(t), такая, что почти всюду limS<Vfc(*) = g@- F.4) п->со 1 Теперь в силу F.4) для каждого действительного % Ф О почти всюду П-кх> 1 По теореме Лебега об ограниченной сходимости полу- получаем 1 п 1 lim \ ехр Г i\ У. ckrh (*I dt = \ е1^') dt. F.5) Однако известно, что in lim lim \ ехр Г Ц 2 chrh (t) I dt = Д cos g cft. F.6) п-кю о i h=i Читателю предстоит самому вывести из F.2) и усло- условия сп—>0, что п lim Ц cosgch = 0. п-*а> h=l
56 ГЛАВА 2 Тогда для каждого действительного | Ф О 1 Je*W># = 0. F.7) о Выберем теперь последовательность \а~> О, но так, чтобы каждое §„?=0 (например, gii=re~1), тогда для почти каждого t и, следовательно, lim n->oo для почти каждого t. Снова по теореме Лебега о предельном переходе под знаком интеграла 1 lim { e*"ti(t)dt=l, что ввиду F.7) приводит к противоречию: 0 = 1. Поэтому ряд F.3) не может сходиться на множестве положительной меры. Следовательно, ряд должен рас- расходиться почти всюду. Этот метод доказательства существенным образом использует независимость rk (t) [см. F.6)] и, по-види- по-видимому, непосредственно неприменим к изучению ряда ft=l
БОРЕЛЬ И ПОСЛЕ НЕГО 57 при условии 24=00. 1 Однако данный метод все же можно приспособить для этой цели, но мы отложим обсуждение этого вопроса до более позднего момента. ЗАДАЧИ 1 Пусть 2j c| = oo, eft—> 0; рассмотрим ряд 1 существует, и найти его значение. (б) Пусть Fn(t), 0<;<<;i, последовательность функций, такая, что 1 1 lim \ F%(t)dt = a, Hm
58 ГЛАВА 2 Доказать тогда, что мера множества Е, на котором Fn (t) стремится к 0, не может превосходить (в) Используя (а) и (б), доказать, что при условиях дап- ной задачи ряд ет 2 ck sin 2n2k-4 h=l расходится почти всюду. 2. Следующий пример показывает, что в теореме задачи 1 синус не может быть заменен «произвольной» периодической функцией / (t) периода 1 ( подчиненной, конечно, условию 1 f(t)dt = i О Пусть / (i) = sin 2nt — in 4лt; показать, что 00 1 ' сходится всюду. ЛИТЕРАТУРА Borel E., Les probabilites-denombrables et leurs applications arithmetiques, Bend. Circ. Math, Palermo, 27A909), 247 — 271.
БОРЕЛЬ И ПОСЛЕ НЕГО 59 Cliampernowne D. G., The construction of decimals normal in the scale of ten, J. London Math. Soc, 8 A933), 254 — 260. Steinhaus H., Les probabilites denombrables et leur rapport a la theorie de la mesure, Fund. Math., 4 A922), 286 — 310. Uademacher H., Einige Satze iiber Reihen von allgemeinen Orthogonalfunktionen, Math. Ann., 87 A922), 112 — 138. К л с М., Convergence of certain gap series, Ann. Math., 44 A943). 411—415 (здесь дается ссылка на первоначальные работы Палея и Зигмунда). 11 а г t m a n Ph. and Kirshner R., The structure of monotone functions, Amer. J. Math., 59 A937), 809 — 822.
Глава 3 НОРМАЛЬНЫЙ ЗАКОН 1. Муавр. В п. 1 гл. 2 мы обсуждали «слабый закон больших чисел». Муавром был доказан более точный результат, а именно что lim ц {щ Vn<r1(t)+ ... + rn (t) < co2 Уп\ = П-УОО Читатель не встретит затруднений при интерпретации этого результата в вероятностных терминах. Элемен- Элементарное доказательство может быть основано на фор- формуле E.6) гл. 1. При этом A.1) становится экви- эквивалентным чисто комбинаторной формуле @2 Прямое использование формулы Стирлинга даст A.2), но в то же время это доказательство затемнит харак- характер теоремы. Попытки обобщить A.1) дали сильный толчок развитию аналитических методов теории вероят-
НОРМАЛЬНЫЙ ЗАКОН 61 ностей. Мощный метод был предложен Марковым, но он не сумел сделать его строгим. Около двадцати лет спустя метод был обоснован П. Леви. Марковскому методу посвящены следующие два пункта. 2. Основная идея метода. Пусть ( 1, (В. < X < (В,, g{*)=\ п B-1) I U, в противном случае. х Из элементарной теории интеграла Фурье известно, что при обычном условии, что для х = o)j и я = со2 полу- 1 „ чается значение, равное -^ . Далее, если только т1 и со2 не являются целыми кратными числа ]/п, то имеем 0 J 3 0 —oo B.3)
%2 ГЛАВА 3 Изменяя порядок интегрирования в последнем выра- выражении [в данном случае это легко обосновывается, так как сумма rx (t) + ... + rn (t) принимает только конечное число значений], мы получим ,(¦»,< < B-4) Для каждого действительного lim fcos-|=T = е"|2/2- B-5) У П/ и напрашивается вывод, что п-юо 00 . • Каковы затруднения с этим методом? Единственный шаг, требующий обоснования, — это переход к преде-
НОРМАЛЬНЫЙ ЗАКОН 63 лу под знаком интеграла при п —» оо. К сожалению, пределы интегрирования суть — оо и + °°, а функция не является абсолютно интегрируемой. Марков, который был великолепным математиком, не смог преодолеть эту трудность и отказался от этого метода! Физики, понятие строгости у которых менее точно, чем наше, так и называют метод «марковским мето- методом», тогда как математики едва ли знают о его про- происхождении. 3. Метод Маркова становится строгим. Обоснова- Обоснование марковского метода в действительности совсем просто. Оно основано на простой и широко примени- применимой идее. Исследуем сначала формулу B.2). Это обычная формула Фурье: ОО ОО YS S()e{^-X)dydl C.1) — оо —оо примененная к специальной функции B.1). Введем теперь две вспомогательные функции: gi (х) и gl (х), графики *) которых приведены ниже (е > О, 2е < ш2 — (йх). Высота обоих графиков равна 1.
64 ГЛАВА 3 Мы имеем gi(x)<g(x)<gi(r) C 2) и, следовательно, ) dt C 3) Теперь функции (у) е*Л dy и GI (I) = ^ gl (у) е'
НОРМАЛЬНЫЙ ЗАКОН 65 абсолютно интегрируемы по \ в интервале ( — оо, оо) и вследствие этого аргументация п 2 приводит к строгому выводу — СО —ОО = C.4) J = у= J gl(y)e-+l*dy. C.5) — СО Комбинируя C.4) и C.5) с C.3), получаем оо 1 р
66 ГЛАВА 3 < lim inf ц, | щ < -^ n-»oo I <limsuP[x{co1< МО+--. n-юо ^ У п *(y)e~vV2dy- C.6) Так как C.6) справедливо при любом е > 0, то мы сразу получим П-+ОО ЗАДАЧИ 1. В 1917 г. Г. Вейль доказал, что при любом иррацио- иррациональном а последовательность ап = па—[па], п = 1, 2, ..., равномерно распределена на @,1). Другими словами, если 0 < о)! < й>2 ¦< 1 и кп(щ, м2) обозначает число величине^, 1-< ¦</<га, которые попали в интервал (щ, «а), то hm Вводя периодическую функцию g(x) с периодом 1, заданную па @,1) соотношением B.1), и используя ряд Фурье вместо интеграла Фурье, доказать теорему Вейля.
НОРМАЛЬНЫЙ ЗАКОН 67 2. Использовать метод Маркова для доказательства формулы Лапласа 0J lime- У. *i\ *+<¦>! Yx < h < х+Щ Yx 4. Более внимательный взгляд на метод. Анализ материала п. 3 обнаруживает, что в действительности доказана следующая теорема. Пусть fn{t), 0< ?< 1, — последовательность изме- измеримых функций, такая, что для каждого действитель- действительного | 1 lim \ e^/n(O<ft=e-5a/2. D.1) Тогда 102 lim ,i {co1 < /n (t) < щ] = -±= \ е-*'* dy. D.2) n-»-oo 1/ ^Я J Пусть *„ И = H {/„(*)<«>}. D-3) тогда ап(со) обладает следующими свойствами: 1) <rn(-oo) = 0, an( + °°)=l; 2) an (ш) — неубывающая; 3) ffn (и) непрерывна слева (Отметим, что свойство 3 есть следствие полной адди- аддитивности меры Лебега.) Функция а (а), имеющая
68 глава :t свойства 1, 2 и 3, называется функцией распределения, Тогда ^ e*!nMdt= { e'Wcrn(co) D.4) 6 —со и наша теорема может быть сформулирована так. Если последовательность функций распределения ап (ш) такова, что для каждого действительного | lim \ ei^dan(a) = e-^2, D.5) П-+СО *' —оо ТО ^W-^W^GW-G)»,), D.6) где (Л 4 J -И/^у. D.7) ' —со Внимательный читатель заметит небольшой логический пробел. Если нам задана какая-либо последователь- последовательность функций распределения ап(а>), то последнее утверждение следует из предыдущего только тогда, когда мы можем подобрать последовательность функ- функций fn{t), 0<?<l, таких, что И {/п (*)<«>} = *„(«>). D.8) В сущности, это затруднение можно обойти, пользуясь аргументами п. 3. Однако конструкция функций /n (t) чрезвычайно проста. Действительно, мы можем взять
НОРМАЛЬНЫЙ ЗАКОН 69 и качестве fn (t) функции, обратные к функциям стп(со), имея в виду, что интервалы постоянства <тп(со) переходят в разрывы /„ (t) и разрывы ап (со) — в интер- интервалы постоянства fn(t). Мы оставляем детали чита- читателю. Заключение, что D.5) влечет за собой D.6), является специальным случаем важной общей теоре- теоремы, известной под названием теоремы непрерывности для преобразований Фурье—Стильтьеса. Эта теорема может быть сформулирована следующим образом. Если ап (со) — последовательность функций распре- распределения, такая, что для каждого действительного ? lim С е16»Лтп((в)=с(|) D.9) п-юо •) —со и с(?) непрерывна в точке | = 0, то существует един- единственная функция распределения а (со), такая, что \ еЧ»Жу(а>) = с(?) D.10) Нт а„ (со) = а (со) D.11) п-юэ при каждом to, для которого 0(со) непрерывна. Доказательство в дополнение к уже изложенным идеям использует так называемый принцип выбора Хелли и ввиду некоторых технических трудностей не может быть здесь представлено. Поэтому мы про- пропустим его, но в то же время будем свободно исполь- использовать теорему впоследствии.
70 ГЛАВА 3 ЗАДАЧИ 1. Пусть функции fn(t), 0<г<1, таковы, что при к — О, 1, 2, ... мы имеем 0, к нечетно, 1 lim V 2я О О г -оо к] , к четно. Доказать, что для каждого действительного | 1 lim \ e*fnWdt = О и, следовательно, что выполняется D.2). 2 Пусть {пт}—последовательность целых чисел, такая, что Доказать, что при /г = 0, 1, 2, ... 1 lim п-*со J V 2"C0S 2я/''г+cos 2я"^ + • • • + cos 2я»тг \ rf< = оо -75 \ *'-y'№j> — оо и, следовательно, hm »n-+oo in.
НОРМАЛЬНЫЙ ЗАКОН 71 Замечание: тем же самым способом, но используя более хитрые комбинаторные соображения, можно доказать, что если V А—с \ch\<M, lim | n-n» nh 1 Cft cos 2лл/е/ r- 1 f п @2 dy. В частности, отсюда следует, что равенство = оо влечет за собой расходимость почти всюду ^ с/; cos Inn^t (аргументы, 1 конечно, применимы и в том случае, когда косинус заменяется па синус). Как читатель может видеть, это близко связано с методом, использованным в примере 2 п. 5 гл. 2. 3 Пусть а (со) — функция распределения, и пусть С(|)= Доказать, что т 1 р lim -=г \ |e(|)|2d| равен сумме квадратов скачков функции а (со) Г->со -I .1
72 ГЛАВА i (Эта простая, но замечательная теорема принадлежит Н. Винеру.) Доказательство может основываться на том, что 1 dt. где /(<)— функция, обратная а (со) в том смысле, как это опи- описано выше. Таким образом, i i 0 0 0 и т Т^"Г" J е ~Ъ~\ 1, f(t) = f(s). Отсюда по теореме об ограниченной сходимости следует, что т lim \ \с (I) I2 dl 0 существует и равен мере множества точек (t, s) @<«, * < 0 плоскости, для которых f(t) = f(s). Это эквивалентно нашей теореме. 4. Доказать, что пе может быть константой на множестве положительной меры, за исключением случая, когда все величины с, кроме конеч- конечного числа их, равны 0
НОРМАЛЬНЫЙ ЗАКОН 73 5. Закон природы или математическая теорема? В заключение главы мы рассмотрим пример, который поучителен с точки зрения как используемых понятий, так и технических приемов. Сначала нам понадобятся три определения. 1. Относительная мера. Пусть А — множество дей- действительных чисел. Рассмотрим часть А, которая лежит в интервале ( — Г, Т), т. е. А[~\( — Т, Т). Отно- Относительная мера множества ц.д {Л} определяется как предел цв {А} = lim ^-у. {А(](-Т, Т)}, E.1) если он существует. Относительная мера не является вполне аддитивной; так, если ^4{ = (г, ? + 1), i = О, ± 1, ± 2, ... , то м то время как 2. Среднее значение функции. Среднее значение М {/(?)} функции f(t), — oo<?<oo, определяется как предел т 1 С М {/(^)} = lim -lyjr \f(t)dt, E.2) Т-юо ^J _J если он сущестпует.
74 ГЛАВА i 3. Линейная независимость действительных чисел- Действительные числа kv X2, ... называются линейно независимыми (или независимыми над полем рацио- рациональных чисел), если единственным решением(kv &2, ...) (в целых числах) уравнения &!*,! +/с2А,а+ ... =0 E.3) является /С-^ == Kq === /?д == . . . -= U. Наиболее известный пример линейно независимых чисел представляет собой последовательность logpj, logp2, logp3. ¦¦• E-4) логарифмов простых чисел (pj = 2, /J2=3, ...). Как читатель, несомненно, отметит, линейная независи- независимость величин E.4) эквивалентна теореме о единст- единственности разложения чисел на простые сомножители. Это простое, но замечательное наблюдение было сде- сделано в 1910 г. Г. Бором, для которого оно стало отправной точкой нового подхода к проблемам, свя- связанным со знаменитой ^-функцией Римана. Пусть теперь Xv %%, ... линейно независимы. Рас- Рассмотрим функцию ^ cos К ь + • • • + cos X„t ,g g. Обозначим через Ап(ю1, w2) множество, на котором -. riy cos klt-\-...-{-cos \nt ^-„ /г а со1 < у I — < оJ. (о.о У п Мы можем теперь доказать, что ця {Ап ((ov оJ)} опро
НОРМАЛЬНЫЙ ЗАКОН 75 делена и, более того, что i7e_yVid 57 rt 1' 3 l/2jt J 0I Использовав систему обозначений п. 3 этой главы, будем иметь IT -т т ГТТ COS Лг? -t" . . . -(-COS Лп? \ j. , г о\ ii ^ 0,1 \y-V) -т и т IT -т -т Напомним, что мы воспользовались сокращением
76 где обе функции Gt (?) и Gl (g) абсолютно интегри- интегрируемы в интервале ( — со, оо). (Таким образом, изме- изменение порядка интегрирования легко обосновывается.) Докажем теперь, что ( exp f Ц V2 exp f Ц V2 C0S V+ ¦ • •+COB Kt ) dt = где /0 — известная функция Бесселя. Мы проведем доказательство для п = 2, так как доказательство для произвольного п точно такое же. Мы имеем (обозначая т) = \ Y~2/y~n) L f T j T oo J = 2 -Щ^-W ^со^Мсоа'МЛ E.11) IT j ft,/=0 -T Задача состоит is том, чтобы найти г lim si- ^ cos'' Я,.« cos' A,2< dt = M {cos'1 ^г< cos1
НОРМАЛЬНЫЙ ЗАКОН 77 Вычисляем cos'' \,< cos1 X2t = — — (e h I = iL V V ( k Л ( k Л ( l Л et[Br-ft)li4Bs-I)A,a]( r=0s=0 т eiat dt — \ О, афО. Вследствие линейной независимости ^а и Х2 выражение может быть равно нулю только тогда, когда 2г = Д. и 2* = I, отсюда почти немедленно следует, что М {cos" V cos' K2t) = ±(кЛ± (\\ , E.12) если одновременно к и I четны, и равны 0 во всех других случаях. Мы можем записать E.12) в форме М {cos" V cos' K2t} =Af {cos* V) M {cos! k2t). E.13) Теперь, сопоставляя это с E.11), мы получаем = М { е^совЯ.!! J ДО { giricos V \. E.14)
78 ГЛАВА J Ясно, что 2л М {gificoeW} - JL С е11СО8°г(!в = /0(л) E.15) о и, следовательно, [по E.14)] Таким образом, формула E.10) доказана. Полагая теперь в E.8) Т—> со, мы с помощью E.9) и E.10) получаем 2л —оо T-vco -т E.16) Хорошо известно, что при r\ -> ±- со
НОРМАЛЬНЫЙ ЗАКОН 7'.) и, следовательно, при «>3 функция абсолютно интегрируема по ?. Из этого вытекает, что (при гс>3) lim-L \ е-уО ZJl •' оо и поэтому предел JL JL существует!1). Теперь E.16) может быть записано п форме со 4г \ G;a)Jnn(y^-^)dl<iiR{An((o1, co2)}< J) Для ге = 1 и га = 2 это также верно, однако доказатель- доказательство изменяется.
80 ГЛАВА 3 н легко проверяется, что lim /уj/I n-voo \- у П Доказательство E.7) может быть теперь закопчено, как в п. 3. Если мы взглянем на „ П\ — l/~O C0S V + • • • +C0S ^"* У п как на результат суперпозиции колебаний с несоиз- несоизмеримыми частотами, то теорема, содержащаяся в E.7), дает точную информацию об относительном времени, которое qn{t) проводит между (о1 и м2. То, что мм пришли здесь к нормальному закону @2 связанному обычно со случайными явлениями, может служить указанием на то, что детерминистская и вероятностная точки зрения не такие уж неприми- непримиримые, какими они кажутся с первого взгляда. Далее мы не будем останавливаться на этом вопросе, ибо это увело бы нас слишком далеко в сторону. Однако может быть уместной ссылка на Пуанкаре, который сказал (отчасти, несомненно, в шутку), что в нормаль- нормальном законе должно быть что-то таинственное, так как математики считают его законом природы, тогда как физики убеждены в том, что он является математи- математической теоремой.
НОРМАЛЬНЫЙ ЗАКОН 81 ЗАДАЧИ 1. Доказать, что если klt...,kn линейно независимы, то функции cos Я,/, ..., cos Xnt статистически независимы, т. е. для всех действительных ах, ..., ап цн {cos V <"ai. . • •, cos Xnf < а„} = [] |iR {cos Xht < ocjj. [Это, конечно, то свойство, которое лежит в основе доказа- доказательства утверждения E.7).] 2. Пусть s = a-\-it, <х>1. Рассмотрим ^-функцию Римана n=l Доказать, что при ЛИТЕРАТУРА Марков А., Исчисление вероятностей, М., 1924. Лоэв М., Теория вероятностей, ИЛ, М., 1962. Эта книга содержит в полном объеме теорию функций распреде- распределения и, в частности, указанные выше результаты П. Леви. Кае М., SteinhausH., Sur les fonctions independantes IV, Studia Math., 7 A938), 1 — 15.
Глава 4 ПРОСТЫЕ ЧИСЛА «ИГРАЮТ В АЗАРТНУЮ ИГРУ» 1. Теоретико-числовые функции, плотность, неза- независимость. Теоретико-числовая функция /(п) —это функция, заданная на множестве чисел натурального ряда 1, 2, 3, .... Среднее значение M{f(n)} функ- функции / (п) определяется как предел (если он сущест- существует) N Пусть А — некоторое множество положительных целых чисел. Обозначим A (N) количество тех его элементов, которые содержатся среди первых N чисел натураль- натурального ряда. Если существует предел ( A.2) то он называется плотностью А. Плотность анало- аналогична относительной мере (см. п. 5 гл. 3) и, подобно ей, не является вполне аддитивной. Рассмотрим целые числа, делящиеся на простое число р. Плотность множества таких чисел, очевидно, равна 1/р. Возьмем
ПРОСТЫЕ ЧИСЛА «ИГРАЮТ В АЗАРТНУЮ ИГРУ» 83 теперь множество целых чисел, которые делятся одно- одновременно на р и q{q — другое простое число). Дели- Делимость на р и q эквивалентна делимости на pq, и, следовательно, плотность нового множества равна l/pq. Так как ^ = ±-±, A.3) то мы можем истолковать это так: «события», заклю- заключающиеся в делимости на р и q, независимы. Это, конечно, выполняется для любого количества простых чисел, и "мы можем сказать, употребляя образное, но не очень точное выражение, что простые числа играют в азартную игру! Это простое, почти тривиаль- тривиальное наблюдение является источником нового направ- направления, которое существенным образом связывает тео- теорию чисел, с одной стороны, и теорию вероятностей — с другой. Мы проиллюстрируем в деталях некоторые эле- элементарные аспекты этого направления и кратко обсу- обсудим более сложные. 2. Статистика значений ф-функций Эйлера. Обо- Обозначим через ф (п) количество целых чисел, не пре- превосходящих п и взаимно простых с ним. Эта теоре- теоретико-числовая функция, впервые введенная Эйлером, имеет много применений и представляет значительный интерес сама по себе. Сразу же проверяется, что если (т, п) = 1
84 ГЛАВА 4 (т. е. т и п взаимно просты), то ф (тп) = ф (т) ф (п) B.1) и ф(р«) = р« — pa-i. B.2) Таким образом, ф(«)= П (^-Р0) B.3) р«|п или так как п= П Ра B-4) ра|п рСЧ f П (единственность разложения на простые множители !), то рта Введем теперь функции Qp (n) следующим образом: A, р п, о, pi». B'6) В терминах этих функций мы можем записать B.7)
ПРОСТЫЕ ЧИСЛА «ИГРАЮТ В АЗАРТНУЮ ИГРУ» 85 Заметим теперь, что если е} равны или 0, или 1, то D {QPl {п) = ех, еРа (п) = е2) . . ., оР({ (п) = ей} = = D {qPi (и) = ег} Z) {Qp2 (п) = е2} . . . D {QPfe (r) = е„}. B.8) Это —просто другой способ записи того факта, что «события», заключающиеся в делимости на ри р2, ...,pk, независимы (или что функции Qp{n) неза- независимы). Из свойства B.8) следует, что Поэтому мы можем предполагать, что B.10) К сожалению, B.10) невозможно вывести прямо из B.9), так как плотность D не является вполне аддитивной.
86 ГЛАВА 4 Но, с другой стороны, B.10) легко получается следующим образом. Из B.5) вытекает, что где ji (d) — функция Мёбиуса, определяемая свойствами: ) |( 2) \х, (т) = 0, если т делится на квадрат простого числа; 3) \к(т) = (— l)v, если т является произведением v различных простых чисел. После этого получаем JV N 1 ^-, ф(и) 1 ^ |*(d) Г iV 1 /<> 4О\ и, следовательно, Z s" - 11 i^1 "'?">'-5B) ~ "S5" " d=l p B.13) Обозначим »)- П 0
ПРОСТЫЕ ЧИСЛА «ИГРАЮТ В АЗАРТНУЮ ИГРУ» 87 и рассмотрим Мы, очевидно, имеем 0</h(n)-ifUl, B.15) и, кроме того, согласно B.13) и B.9), Далее, при I > 1 и потому JV JV n=l П=1 n=l
88 ГЛАВА 4 Полагая N—>co, получаем М {/¦(»))> п=1 и=1 B.18) В то же время V^Pb Объединяя последний результат с B.16) и B.18), мы получим при к—»оо формулу B.19) предложенную И. Шуром,
ПРОСТЫЕ ЧИСЛА «ИГРАЮТ В АЗАРТНУЮ ИГРУ» 89 Формально B.19) следует из цепочки равенств но так как D не является вполне аддитивной, то необходимо обоснование, данное выше. Из равенства B.7) мы имеем 1 Ф («) vi 1 С a Qp(n)\ и опять-таки, формально, V для каждого действительного
90 ГЛАВА 4 Строгое обоснование B.21) почти совпадает с тем, что дано для B.19) и предоставляется читателю. Пусть теперь Км (со) — количество целых п, не пре- превосходящих N, для которых Положим aN (со) = Заметим, что Одг (со) есть функция распределения и что е%°> daN (о) = B.23) Из равенства B.21) следует, что оо lim \ N->oo v оо B.24) Кроме того, легко показать, что с (?) непрерывна при 1 = 0. Тогда по теореме, сформулированной в конце р. 4 гл. 3, существует функция распределения а (со),
ПРОСТЫЕ ЧИСЛА «ИГРАЮТ В АЗАРТНУЮ ИГРУ» 91 такая, что e*» Ar (<d) = с (Е) « ЧЧ!))) B-25) г и в каждой точке непрерывности а (со) lim aN((o) = a((o). B.26) Теперь легко доказать, что а (а) непрерывна при каж- каждом ю. Для этого мы используем результат задачи 3 (стр. 71, гл. 3). Имеем B.27) Можно показать (см. следующую за этим пунктом задачу 1), что числа линейно независимы,
92 ГЛАВА 4 Согласно рассуждениям п. 5 гл. 3, имеем а из элементарных сведений о простых числах мы знаем, что Таким образом, получаем т lim -^ С |с(|)|2^ = 0, B.28) т-°° о и, следовательно, а («в) непрерывна при всех «в. Сум- Суммируем все сказанное.
ПРОСТЫЕ ЧИСЛА «ИГРАЮТ В АЗАРТНУЮ ИГРУ» 93 Плотность существует при каждом со, а((о) непрерывна и со 5 ^ Этот результат (впервые полученный Шёнбергом) мог быть выведен более элементарным путем и был в зна- значительной степени обобщен Эрдёшем1). Мы выбрали более длинный путь, чтобы выявить своеобразие веро- вероятностного оттенка результата и продемонстрировать взаимодействие ряда идей и методов исследования. Формула B.21) является очевидным аналогом фор- формулы с которой мы начинали. Это, так сказать, вариации одной и той же темы, и то, что тема допускает столь разнообразные вариации, есть очевидное подтвержде- подтверждение богатства ее «мелодического» содержания. J) Эрдёш доказал также замечательную теорему о том, что наша о (ш) сингулярна, т. е. а'(со) = 0 почти всюду.
94 ГЛАВА 4 ЗАДАЧИ 1. Доказать, что величины log A — A//>)), а также и log(l-\-(l/p)) линейно независимы. 2. Статистика значений функции а (п) (суммы делителей числа п). (а) Пусть <ip (га) обозначает покрзатель степени, в которой простое число р появляется (в единственном) представлении п в виде произведения степеней его простых делителей, т. е. Доказать, что функции ар (п) статистически независимы. (б) Показать, что если а (п) обозначает сумму всех дели- делителей п, то V (в) Используя то, что а (л) доказать равенство (г) Показать, что М (д) Положим
ПРОСТЫЕ ЧИСЛА «ИГРАЮТ В АЗАРТНУЮ ИГРУ» Исходя из того, что a(n) вывести неравенство >)__ TT * n) - И . , 1 , , 1 ' о (п) (e) Показать, что ,0G1) =П L^^+S (-^~Ts p X exp ig lc (ж) Используя то, что a=i , 1 / \ •
96 ГЛАВА 4 а также факт линейной независимости величин доказать, что плотность существует и непрерывна по ш. Этот результат, полученный впервые Г. Давенпортом, содержится в более общей теореме Эрдёша. Случай ш=2 представляет собой интерес, так как пока- показывает, что «избыточные числа» (т. е. числа, для которых сг(гс)>2ге), а также и «дефектные числа» (т. е. те, дяя которых сг (п) < 2и) имеют плотность. Из этого также следует, что «совершенные числа» (для которых а(п) = 2п) имеют плот- плотность, равную 0. Предполагают, что существует лишь конеч- конечное число «совершенных чисел». 3. Формула обращения. Пусть где а (со) —функция распределения. Доказать, что если и щ — точки непрерывности функции а, то 1 \ L- — С- ,e.v i& / \ w \ —«—«©^«w-' Если же или ш1, или св2 (или и та, и другая) являются точ- точками разрыва, то величины а (ш^ или а (со2) (или обе) сле- следует заменить на (+0) а (а>г~0)+ или 2
ПРОСТЫЕ ЧИСЛА «ИГРАЮТ В АЗАРТНУЮ ИГРУ» 97 соответственно. В частности, показать, что —оо р Точная, но почти бесполезная формула! 3. Другое применение. Пусть со (п) обозначает ко- количество простых делителей п с учетом их крат- кратности, т. е. со(п) = 2ар(п), C.1) v где величины ар (п) определяются, как в задаче 2 п. 2 этой главы. Пусть v (п) обозначает количество простых дели- делителей п без учета кратности, т. е. v(n) = 2QpH- C.2) Назовем разность ю(п) —v(n) эксцессом и найдем плотность целых чисел, для которых эксцесс равен к (&>0, целое), т. е. найдем dh = D{(o(n)-v(n) = k}. C.3) Излишне говорить, что существование плотности не очевидно и должно быть доказано.
98 ГЛАВА 4 Мы начнем с--формулы E.3) гл. 1 2Я A=0 '""Но,' mi 0, C'4) и где т целое, и рассмотрим N 2Я N * \ r-ihx i Xi pi((o(n)—v(n))x Дг /Q c;\ О п=1 Левая часть равенства C.5) представляет собой [ввиду C.4)] долю целых чисел n^N, для которых эксцесс равен к. Таким образом, JV 2Л 4= Нт -^г 2 2^\ ei<m<n>-v<n>-'O:'cda:, C.6) "+OD n=l 0 если предел существует. Обращаясь еще раз к принципу ограниченной схо- сходимости, мы видим из равенства C.5), что достаточно будет доказать следующее: предел N lim _L V ei(ui(n)-v(n))x _ Д/ {ei(u)(»)-v(n))xj C.7) существует для каждого действительного х.
ПРОСТЫЕ ЧИСЛА «ИГРАЮТ В АЗАРТЙУЮ ИГРУ» 99 Далее со (п) - v (п) = 2 («р И - QP Н)> р и легко заметить, что функции ар(и) — Qv(n) незави- независимы. Это позволяет предположить, что предел C.7) не только существует, но также что М /ei (со (n)-v (n)) ж| _ = М /ехр [ ix 2 (ар(п) - Qp (и)) )} = Строгое обоснование этого вывода несложно и подобно приведенному в п. 2. Возьмем сначала N 2 (M«)-eP(n)) п=1 и рассмотрим целые п, 1<и<Л7', для которых
100 ГЛАВА 4 Эти целые числа делятся на р&, но не делятся на рР+', следовательно, их количество равно [JL] Г ^ 1 [ / J L /+1J • Отсюда, таким образом, следует, что n=l P5=2 C.9) Пусть теперь Заметим, что из C.9) вытекает следующее: M{gk(n)}= 2 2 (P-1)(gr-lF C.11) Тогда N _L V eix (со (n)—v (n)) _ TV s-l N n=l ^ S («pW-QpW)] e
ПРОСТЫЕ ЧИСЛА «ИГРАЮТ В АЗАРТНУЮ ИГРУ» Ю1 и потому i_ V eix (со (n)-v (n)) _ N п=1 ix 2 (s^-QpH ti=l N n=l N n=t Так как n=l N J™ -ж 2 ехр fix 2 (аР w - Qp (»)) J =
102 ГЛАВА 4 то в силу C.11) заключаем, что расстояние каждой предельной точки последовательности N jL V егх (ю (n)-v (n)) ОТ меньше, чем 1*1 2 (р-1)* • p>ph Так как А; произвольно, отсюда сразу следует, что N Mm — у емс (ш (n)-v (n)) _ Л/ f eix (со (n)-v (n))| _ п=1 и, таким образом, C.8) обосновано. Возвращаясь назад к C.5) и C.6), мы получаем dk = D {а (п) — v (и) = к} = 2я 0 р C.14)
ПРОСТЫЕ ЧИСЛА «ИГРАЮТ В АЗАРТНУЮ ИГРУ» ДОЗ Рассмотрим теперь функцшо Она аналитическая во всей плоскости, исключая про- простые полюсы в точках z — 2, 3, 5, ... . В частности, F (z) аналитична в круге |г| < 2, и ее можно разло- разложить там в степенной ряд радиус сходимости которого равен 2. Каковы коэффициенты ak? Если мы используем известную формулу где интеграл берется но контуру |z| = l, то, подстав- подставляя z = егх, получаем ak=dh. Или в других терминах fe=0 Эта прекрасная формула была открыта (другим спосо,- бом) А. Реньи.
104 ГЛАВА 4 Хотя вывод точных формул для dk затруднителен, совсем просто определяется асимптотическое поведение dk при больших к. Действительно, F(z) может быть записана в форме где G(z) — функция, аналитическая в круге |z|<3, и А (вычет в полюсе z — 2) дается формулой Р>2 Таким образом, р>2 fe^O h=0 где радиус сходимости ряда ^}bhzh равен 3. Вследствие того что р>2 fe->00 имеем при к—> со, Р>2
ПРОСТЫЕ ЧИСЛА «ИГРАЮТ В АЗАРТНУЮ ИГРУ» Ю5 или lim Два частных случая C.16) заслуживают внимания. Полагая ъ — О, мы получим = П С1 ~^г) = Это хорошо известный результат, означающий, что плотность чисел, не делящихся на полный квадрат, равна 6/я2. Полагая z=l, получаем fe=0 В силу того что множества целых чисел, для которых со (п) — v (п) = к, взаимно не пересекаются и вместе ис- исчерпывают множество всех целых чисел, то этот ре- результат мог быть совершенно тривиальным, если бы плотность была вполне аддитивной. Так как этого нет, то тот факт, что мы тем не менее получили 2 <**= является по крайней мере приятно удивляющим.
106 ГЛАВА 4 4. Почти каждое целое т имеет приближенно log log»* простых делителей. Рассмотрим целые т, 1<то<га, для которых выполняется или v (m) < log log n—gn "j/log logn D.1) или v (m) > log log n + gn У log log n, где ?п — последовательность такая, что limgn=c». D.2) П->оо Обозначим число таких т через Кп и попробуем оце- оценить эту величину. Используем для этого чебышевский метод, объясненный в п. 1 гл. 2. Имеем 2 (v(m)-loglognJ>2'(vH-loglognJ, D.3) m=l где штрих у символа суммы указывает на то, что суммирование распространяется только на целые т, удовлетворяющие D.1). Очевидно, 2' (v (т)-log log яJ >Zng? log log « D.4) и, следовательно, в силу D.3) ~<ngl log log» 2 (v И-log log,J. D.5) m=l
ПРОСТЫЕ ЧИСЛА «ИГРАЮТ В АЗАРТНУЮ ИГРУ» 107 Остается оценить п 2 (v (т) - log log nJ = m=l n n m=l Теперь имеем v (и») = и р (бр = 6р); следовательно, п т=1 m=l D.8) Суммирование в D.7) и D.8) происходит только по простым ряд, которые меньше или равны п. Таким образом, m=l
108 ГЛАВА 4 где я(п) обозначает количество простых чисел, не пре- превосходящих п; аналогично п Л А \1 2 (' уу,\ ^ п \1 ^ ] Г) V ^ 1 j ГО=1 Р^1 Известно, что , D.11) где еп ограничено, и потому п 2 v2 (m) < и (log log nJ + In log log nen tn=l ^ + n log log n + nen 2 v (m) > и log log и + иеп — л(п). l m=l Наконец, с помощью D.6) получаем S (() tn=l + n log log и + пеп + 2 log log ил (га) и, следовательно, "•" я ^ ёп ёп log log п ^ gl log log п "• я
ПРОСТЫЕ ЧИСЛА «ИГРАЮТ В АЗАРТНУЮ ИГРУ» 109 Так как еп ограничено, я (п) < п и gn—> оо, то отсюда следует, что lim^=0. D.12) Tl->co п Ввиду того что величина log log m меняется очень медленно, полученный результат D.12) влечет за собой следующее. Если 1п обозначает количество целых чисел т, 1<, для которых имеет место или v (m) < log log m — gm "/log log m D.13) или v (m) > log log m + gm l/log log m , то lim —= 0. D.14) Доказательство предоставляется читателю (см. задачу 1 в конце этого раздела). Утверждение D.14) было впер- впервые доказано Харди и Рамануджаном в 1917 г. Именно они сформулировали его очень образно, в такой форме: почти каждое целое т имеет приближенно log log m простых делителей. Доказательство, приведенное выше, предложено П. Тураном, и оно гораздо проще перво- первоначального доказательства Харди — Рамануджана. Как читатель может заметить, прием Турана является прямым аналогом доказательства слабого закона боль- больших чисел, которое мы дали в п. 1 гл. 2. Это еще
НО ГЛАВА I один пример, когда идеи, заимствованные из одной области, приводят к плодотворным применениям в другой. ЗАДАЧИ 1. Доказать D.14). Указание: пусть 0 < а < 1; рассмотреть лишь целые числа из отрезка па < т ¦< п и показать, что в этих пределах каждое целое т, удовлетворяющее | v Н —log log то | > gm /log log m, удовлетворяет также неравенству | v (m) — log logn \ > К /log log~^ при соответствующе выбранном hn -> oo. 2. Доказать D.12) для со (то). 5. Нормальный закон в теории чисел. То обстоя- обстоятельство, что v(m), число простых делителей т, равно сумме 2ор(т) E.1) р независимых функций, подсказывает нам, что распре- распределение величин v (т) может быть дано нормальным законом. Это действительно имеет место, и в 1939 г. Эрдёш и Кац доказали следующую теорему. Пусть ^„(coj, со2) — количество целых чисел т, 1 < т < п, для которых log log П + COj >^l0g log П < . E.2)
ПРОСТЫЕ ЧИСЛА «ИГРАЮТ В АЗАРТНУЮ ИГРУ» Щ Тогда Ш2 1 • -/V. П I С01 • Си О ) J- I -,9/От /Р**О\ hm "v "—^ = - \ е-«2/2 dy. E.3) п->оо л V 2Я J Ввиду того, что величина log logn изменяется медленно (см. задачу 1 в конце п. 4), результат E.3) эквива- эквивалентен утверждению D (log log И + Oj ]/ log log П < V (n) < log log ft+ @2 2 /log log nj = -Д=г ( e-W2 dy. E.4) Теперь известно несколько различных доказательств этого результата (наилучшим, по моему мнению, яв- является недавнее доказательство, принадлежащее Реньи и Турану), но ни одно из них, к сожалению, из-за недостаточной краткости и элементарности не может быть воспроизведено здесь. Поэтому мы будем доволь- довольствоваться эвристическими аргументами, основанными на следующей классической теореме Ландау. Если Jtfe (n) обозначает количество целых чисел, не превосходящих числа п, которое имеет ровно к простых делителей, то
112 ГЛАВА 4 При к = 1 это известный закон простых чисел: при к > 1 E.5) может быть выведено из закона простых чисел с помощью совершенно элементарных соображе- соображений. Имеем ЯпК. со2)= log log n+(Ol T^log log n<ft<log log П+С02 T^log log П E.6) и, следовательно, можно предполагать, что 1 у (log Z ( ~~ log nZi (к—1)\ log log n+b>i 'Klog log n<ft<log log n+a>2 T^log log n E.7) Если мы вспомним задачу 2 (п. 3 гл. 3) и положим E.8) то получим Ш2 я т/я И1 или E.3). К несчастью, трудно сделать строгими эти весьма привлекательные доводы, так как необходимы равно- равномерные оценки остаточного члена в теореме Ландау E.5), а их нелегко получить. Интересно то, что пер-
ПРОСТЫЕ ЧИСЛА «ИГРАЮТ В АЗАРТНУЮ ИГРУ» ИЗ воначальное доказательство Харди и Рамануджана теоремы п. 4 существенно опиралось на E.5), хотя они нуждались лишь в оценках, а не в точном асим- асимптотическом результате. Теория, развитая в гл. 3, подсказывает метод доказательства E.3). Пусть Кп(со) обозначает количество целых т, 1<т<п, для кото- которых v (m) < log log n -j- со ]/log log n. Положим ".И-^. E-9) Ясно, что оп (и) является функцией распределения и что выполняется ^~щ^ 2 (v(m)-loglognJ= \ G)^anH. E.10) m=l —оо Если мы используем точную оценку n, е„->0, E.11) то в силу аргументов п. 4 lim \ co2d(T,((co) = l--7^ \ y*er*i*dy. E.12) n-юо J У Z31 О —оо —оо Мы имеем (почти тривиально!) п lim —>. : - У, (v (т) — log log n) = О
114 ГЛАВА 4 и потому оо оо lim [ со dan (со) = 0 = -L \ ye-W*dy. E.13) — СО —00 Если бы мы смогли доказать, что для каждого це- целого к > 2 оо оо lim <[ со" dan (со) = -^ С yhe~№ dy, E.14) J У 2Я J то получили бы, что оо lim \ е^м do^ (со) = е~52/2 ,\ п n->OD —со для каждого действительного | и, следовательно, о) lim а (со) = -у= \ e~v2l2dy. E.15) п->со У 2Я J —со Это в силу обозначения E.9) —не что иное, как наша теорема E.3). Доказательство E.14), безусловно, экви- эквивалентно доказательству равенства 1 ИШ WWWn)»/» 2 (V И-log log П) = m=l со 1
ПРОСТЫЕ ЧИСЛА «ИГРАЮТ В АЗАРТНУЮ ИГРУ» Ц5 а это в свою очередь зависит от асимптотических оценок сумм 1 S (Вспомните, что в п. 4 доказательство Турана было связано с оценкой Этот довольно заманчивый путь оказывается совсем не легким, однако недавно Халберстаму удалось по- получить доказательство этим методом. Данный подход, без сомнения, наиболее понятен и ближе всего по духу традиционным направлениям теории вероятно- вероятностей. Наивысшим торжеством вероятностных методов в теории чисел явилось данное Реньи и Тураном до- доказательство того, что остаточный член и Угк имеет порядок 1 То, что ошибка имеет порядок (loglogrc)" /3, было предположено Левеком по аналогии с подобной оцен- оценкой в теории вероятностей — простые числа действи- действительно играют в азартную игру!
116 ГЛАВА 4 ЗАДАЧИ 1. Показать, что E.4) выполняется, если v (re) заменить на со (п) (число простых делителей с учетом кратности). (Ука- (Указание: из того, что М{(о(п) — v(re)}<oo, вывести сначала, что плотность множества целых чисел, для которых ©(и) — — v (re) > gn, gn -+ со, равна 0.) 2. Пусть d (n) обозначает число делителей п. (а) Показать, что d (и) = П(«р (») + !)• р (Определение ар (ге) см. в задаче 2 п. 3 этой главы.) (б) Показать, что (в) Используя E.4) и указание к задаче 1, помещенное выше, доказать, что г, fnl0g log П+COl У log log n log log П+Ю2 VlOg log П D {I <d(n)<iZ > = @2 й>1 ЛИТЕРАТУРА Ссылки на работы Давенпорта, Эрдёша, Эрдёша и Каца, Халберстама, Шёнберга и Турана см. в обзорных статьях: Кае М., Probability methods in some problems of analysis and number theory, Bull. Amer. Math. Soc, 55 A949), 641 — 665.
ПРОСТЫЕ ЧИСЛА «ИГРАЮТ В АЗАРТНУЮ ИГРУ» Ш Кубилюс И. П., Вероятностные методы в теории чисел, Успехи матем. наук, 68 A956), 31—66. Renyi A., On the density of certain sequences of integers, Publ. Inst. Math. Belgrade, 8 A955), 157—162. Renyi A., Turan P., On a theorem of Erdos—Kac, Acta Arith., 4 A958), 71—84.
Глава 5 ОТ КИНЕТИЧЕСКОЙ ТЕОРИИ К НЕПРЕРЫВНЫМ ДРОБЯМ 1. Парадоксы кинетической теории. В середине девятнадцатого столетия были предприняты понытки объединения дисциплин механики и термодинамики. Основной была проблема получения второго закона термодинамики из представлений о веществе, как состоящем из частиц (атомов и молекул), которые подвержены действию сил и подчиняются законам механики. В работах Максвелла и Больцмана (и позднее Дж. У. Гиббса) при помощи этого кинетического подхода было получено одно из самых замечательных и много- многообещающих достижений науки. Однако вначале этот нодход был поколеблен двумя парадоксами. Первый, высказанный в 1876 г. Лошмидтом, заключался в том, что законы механики обратимы во времени (т. е. инвариантны относительно замены t на —t). С другой стороны, второй закон термодинамики постулирует типично необратимый процесс. Таким образом, казалось невозможным когда-либо получить второй закон, исходя из чисто механисти- механистических соображений.
ОТ КИНЕТИЧЕСКОЙ ТЕОРИИ К НЕПРЕРЫВНЫМ ДРОБЯМ Ц9 Второй парадокс, связанный с именем Цермело, является даже более решающим. Цермело использовал простую, но фундаментальную теорему Пуанкаре о том, что консервативная динами- динамическая система, удовлетворяющая некоторым широ- широким условиям, имеет следующее свойство: «почти каждое» (в некотором специальном смысле, поясняе- поясняемом ниже) первоначальное положение системы обяза- обязательно будет повторено с любой степенью точности. Это также противоречит необратимому поведению. Чтобы полностью понять эти парадоксы, рассмот- рассмотрим два резервуара, один с газом, а другой пустой. Через некоторое время соединим резервуары. Вто- Второй закон нредсказывает, что газ будет переходить из первого резервуара во второй и что количество газа в первом резервуаре будет уменьшаться монотонно по времени. Такое поведение газа устанавливает опре- определенное направление времени. С кинетической (механистической) точки зрения мы имеем дело с динамической системой, которая неспособна выявить направление времени и которая, кроме того, будет вести себя квазипериодически, как указывается теоремой Пуанкаре. Очевидно, что мы имеем здесь парадоксальное явление. 2. Предварительные сведения. Чтобы понять ответ Больцмана, потребуется небольшой экскурс в класси- классическую мехапику. Система с п степенями свободы описывается в тер- терминах п обобщенных координат qlt q2, . . ., qn и coot-
120 ГЛАВА 5 ветствующих им импульсов pv p2, . . .,рп. Для консер- консервативной динамической системы существует функция Н(Чп • • • ¦> ^п'. Ри •*•¦> Рп)> называемая функцией Га- Гамильтона, которая описывает полную энергию системы. Уравнения движения записываются в форме f = ||, i=l,2,...,», B.1) t=-i' '-1.2,...,». B-2) Причем если мы знаем начальное положение gt@) и начальные импульсы рг @), то движение [т. е. функ- функции q% (t) и pt (t)] определяется однозначно. Обычно принято изображать систему в виде точки 2/г-мерного евклидова пространства (фазового или Г-пространства), имеющей координаты ди ..., qn, Pi, ¦¦ ¦, Рп- Таким образом, в момент времени t динамическая система изображается точкой Л = (?1«, ••-,?«@, ft@, ¦¦¦^pn(t))- Теперь движение нашей системы с помощью соот- соотношения Tt(P0) = Pt B.3) определяет однопараметрическое семейство отображе- отображений. Допустим, что мы имеем множество А точек Ро, и обозначим Tt (А) множество соответствующих то- точек Pt.
ОТ КИНЕТИЧЕСКОЙ ТЕОРИИ К НЕПРЕРЫВНЫМ ДРОБЯМ 121 Лиувилль заметил (доказательство крайне просто и может быть основано на обобщении для 2и-мерного пространства хорошо известной теоремы о диверген- дивергенции), что из гамильтоновых уравнений движения B.1) и B.2) следует замечательный факт: меры Лебега множества А и Tt (А) в 2и-мерном пространстве равны! Другими словами, отображения Tt сохраняют меру, обычную меру Лебега в Г-пространстве. Уравнения B.1) и B.2) имеют еще одно важное следствие, а именно что = #(^@), ...,?„@), Л@), ...,рп@)) (сохранение энергии) и, следовательно, точка, изобра- изображающая нашу динамическую систему, обязана лежать на «поверхности постоянной энергии» й Н (ft, ...,qn, Pi, ..., рп) = const. B.4) Предположим, что поверхность постоянной энергии является компактом и достаточно «регулярна», так что применима элементарная теория поверхностных инте- интегралов. Предположим также, что на Q
122 ГЛАВА 5 Пусть В Q Q — множество на поверхности энергии такое, что иптеграл il||| (da—элемент поверхпости) определен. Мы определим меру множества В формулой J B-6) так, что (x{Q} = l. B.7 Теперь из вышеприведенной теоремы Лиувилля и простых геометрических соображений следует, что B.8) Другими словами, Tt сохраняет меру \i на Q. Формула B.6) приписывает меру только некоторым элементарным множествам (к которым применима эле- элементарная теория интегрирования по поверхности). Однако мера может быть продолжена на более широ- широкий класс множеств таким же образом, как, начиная от интервалов на действительной прямой и полагая меру интервала равной его длине, можно построить вполне аддитивную меру Лебега. В частности, множество С имеет ji-меру О, если при любом е > 0 существует конечная или счетная
ОТ КИНЕТИЧЕСКОЙ ТЕОРИИ К НЕПРЕРЫВНЫМ ДРОБЯМ 123 совокупность элементарных множеств Вг, такая, что ссивг и 2ива<в. Мы можем теперь сформулировать в точных терми- терминах теорему Пуанкаре, использованную Цермело. Если В ^-измеримо, то ночти все Рй?В (т. е. исключая множество и.-меры 0) таковы, что для неко- некоторого t (зависящего, возможно, от Ро) Tt(P0)?B. 3. Ответ Больцмана. Чтобы нонять ответ Боль- цмана, вернемся назад к нашему примеру с двумя резервуарами. Допустим, что нам известен точный вид функции Гамильтона Н(Яг, ..., qn, Pi, ..., Р„) C.1) и ее значение С при t = 0. Таким образом, мы знаем поверхность постоянной энергии (ее уравнение Н = С). Существует, очевидно, множество В точек из Q. соответствующее условию, что при t = 0 все частицы находятся в одном из двух резервуаров, и нам изве- известно, что наша система начинает движение из мно- множества В. Первое утверждение Больцмана о том, что ц-мера \ь{В} множества В «крайне» мала, соответствует нашему интуитивному представлению о том, что мы начинаем из весьма необыкновенного или редкого состояния. С другой стороны, множество R точек Q, соответ- соответствующее состояниям, при которых число частиц в двух резервуарах «почти пропорционально» объемам этих резервуаров, таково, что мера р {Щ «крайне» близка к 1.
J24 ГЛАВА 5 Конечно, эти утверждения в большой степени зави- зависят от значения выражений «крайне» и «почти», но достаточно будет сказать, что вследствие необъятности числа атомов в кубическом сантиметре (порядка 1020) вполне надежно интерпретировать «крайне», как мень- меньше, чем 100, и «почти пропорционально», как то, что отклонение от соответствующего отношения мень- меньше 100. Второе утверждение было гораздо смелее. Больцман считал, что первое утверждение влечет за собой сле- следующее: относительное время, которое фактическая кривая, описывающая движение системы, находится в В и R соответственно, «крайне» мало и «крайне» велико. Другими словами, если система находится в необык- необыкновенном состоянии, то почти немедленно оставит его (в то время как по теореме Пуанкаре она в конце концов ночти наверное вернется обратно), а если она находится в множестве, соответствующем «почти нор- нормальному» состоянию, то она останется здесь «в сущ- сущности» навсегда. Больцман получил первое утверждение правдопо- правдоподобными, но не очень строгими оценками. Для обо- обоснования второго утверждения он высказал гипотезу о том, что кривая, изображающая движение системы, проходит через каждую точку поверхности постоянной энергии. Эта гипотеза, которую Больцман назвал эргоди- ческой (Ergodenhypothese), ошибочна (исключая случай и=1, когда она тривиальна).
ОТ КИНЕТИЧЕСКОЙ ТЕОРИИ К НЕПРЕРЫВНЫМ ДРОБЯМ 125 Больцман старался спасти свое объяснение, заменив неверную эргодическую гипотезу тем, что он назвал «квазиэргодической гипотезой». Новая гипотеза посту- постулировала, что кривая движения подходит произвольно близко к каждой точке на поверхности постоянной энергии. Это хотя и очень правдоподобно, но недо- недостаточно для установления связи между относитель- относительным временем, проведенным во множестве A Q Q, и его [i-мерой ц.{-4}. Понятно, что суть дела заключается в связи между относительным временем, проведенным в А, и ц{-4}. Но что мы подразумеваем под относительным вре- временем, проведенным в А? Определение подсказывается почти непосредственно. Пусть t (т, Ро, А) обозначает время, которое кривая движения, начавшегося из Ро, пробыла в А вплоть до момента времени т. Относи- Относительное время есть тогда предел '<*'Р"А> , C.2) если он, конечно, существует. Оказывается, доказательство существования этого предела представляет реальное затруднение. Если же это сделано, то потребуется лишь дополнительное пред- предположение относительно Tt, чтобы вывеети, что пре- предел равен \i{A}. 4. Абстрактное изложение. После того как я столь подробно остановился на основах статистической меха- механики, я оставлю в стороне большую ее часть и выделю из нее чисто математическое содержание.
126 ГЛАВА 5 Вместо поверхности постоянной энергии я возьму множество Q (с полной мерой 1), на котором задана вполне аддитивная мера \i. Я допускаю теперь, что существует однопараме- трическое семейство отображений Tt множества Q на себя, сохраняющее ц-меру. Это утверждение требует некоторого разъяснения. В динамике отображения Tt являются взаимно однозначными (это непосредствен- непосредственное следствие единственности решения гамильтоновых уравнений движения). Однако нет необходимости пред- предполагать отображения Tt взаимно однозначными, если надлежащим образом определить, что значит «сохра- «сохранять меру». Соответствующее определение выглядит следующим образом. Пусть Т]1 (A) — прообраз множества А, т. е. Tt(T?(A)) = A. D.1) Отображение Tt называется сохраняющим меру, если [i{Tt1(A)} = v,{A}. D.2) Понятно, что для взаимно однозначных отображений соотношение D.2) эквивалентно обычному определению инвариантности меры, т. е. D.3) Пусть теперь Ро??2, и g(P) обозначает характери- характеристическую функцию измеримого множества А, т. е. , Р1А.
ОТ КИНЕТИЧЕСКОЙ ТЕОРИИ К НЕПРЕРЫВНЫМ ДРОБЯМ 127 Теперь ясно, что t(x, Ро, А) дается формулой Ро)) dt, D.5) о и проблема заключается в доказательстве существова- существований предела X lim ±-[g(Tt(P0))dt. D.6) Вместе с этим вариантом, где время изменяется непрерывно, удобно рассмотреть дискретный случай. Пусть Т — сохраняющее меру отображение, т. е. Vl{T-1(A)} = Vl{A}. D.7) Рассмотрим его степени (повторные отображения) Г2, Т3, .... Аналогом предела D.6) служит теперь п lim -1-2 g(Th(P0)). D.8) В 1931 г. Биркгофу удалось доказать, что пределы D.6) и D.8) существуют для почти всех Ро (в смысле [А-меры). Несколько ранее фон Нейман показал, что пределы D.6) и D.8) существуют в смысле среднего квадратического. Сейчас имеются разнообразные доказательства этих теорем, кратчайшее из них принадлежит Ф. Риссу. Мы опустим доказательство, отослав читателя к пре-
128 ГЛАВА 5 восходной брошюре Халмоша «Лекции по эргодической теории». Что можно сказать относительно предела D.8) [или D.6)]? Обозначая этот предел через h(P0), мы непосред- непосредственно видим, что эта функция ^-измеримая, ограни- ограниченная (действительно, 0</г(Р0)<1) и такая, что для почти каждого Ро h(T(P0)) = h(P0). D.9) Пусть теперь На — множество тех точек Ро, для которых ЦР0)<а, и пусть Q?T~x(Ha). Тогда T(Q)?Ha и, следовательно h{T(<?))< а. Так как для почти каждого Q h(T(Q)) = h(Q), то для всех Q, за исключением множества меры 0, выпол- выполняется h (Q) < а. Поэтому, исключая множество ц-ме- ры 0, имеем для каждого а (исключительное множество может, конечно, зависеть от а). Другими словами, множества На инвариантны (с точностью до множеств меры 0). Отображение называется «метрически транзитив- транзитивным», если инвариантными являются единственно множества или нулевой, или единичной меры.
от кинетической теории к непрерывным дробям 129 Если мы предположим, что наше отображение метри- метрически транзитивно, то все множества ffa будут иметь меру или 0, или 1 и, следовательно, h(P0) постоянна почти всюду. Значение этой постоянной легко определяется, если заметить, что из равенства п Ит 7 2 8 (Th (ро)) = h (Ро) (почта всюду) "-^ k=i следует (по теореме об ограниченной сходимости) п Ит 1 ^ \ g (Tk (Po)) dji = U (Ро) d\i. D.10) Действительно, Q ?2 (это прямое следствие того, что Т сохраняет меру), и потому Таким образом, константа равна ц{} Объединяя все это, мы можем сказать, что если Т метрически транзитивно, то для почти всех Ро п ± D.11)
130 ГЛАВА 5 Сказанное легко обобщается следующим образом. Если f{P0) ц-интегрируема, т. е. 8 и если Т метрически транзитивно, то для почти всех Ро D.12) Можно подумать, что доказанная теорема D.12) полностью реабилитирует точку зрения Больцмана. К сожалению, отображения Tt, к которым мы пришли в динамике, столь сложны, что, за исключением неко- некоторых очень простых случаев, не известно, будут ли они метрически транзитивными или нет. Это, однако, никоим образом не умаляет красоты и значительности эргодической теоремы D.12). 5. Зргодическая теорема и непрерывные дроби. Пусть х, 0 < ?< 1, — действительное число. Представим его простой ненрерывной дробью *= т-1 , E-1) где а15 а2, ... — положительные целые числа. Для величин а легко вывести формулы.
ОТ КИНЕТИЧЕСКОЙ ТЕОРИИ К НЕПРЕРЫВНЫМ ДРОБЯМ 131 Мы имеем гле [у], как обычно, обозначает наибольшее целое число, меньшее или равное у. Формулы для а постепенно все более и более услож- усложняются, однако небольшое размышление обнаруживает, что их вычисление может быть подогнано нод следу- следующую схему. Пусть тогда ), E.3) ) E-4) и т. д. Возможность применения эргодической теоремы ста- становится теперь очевидной, так как мы здесь получили степени отображения Т(х), заданного E.2). Что служит здесь пространством Q? Очевидно, интервал @,1) с исключенной точкой 0. Что служит инвариантной мерой? На это ответить труднее, однако ответ в сущности был найден уже Гауссом. Можно поступить следующим образом: пусть q(x), 0<ж<1, таково, что 1 (а) о,(ж)>0, (б) J Q(x)dx=l. E.5)
132 ГЛАВА 5 Определим \и{А} формулой E.6) Возьмем теперь интервал (а, р1), 0<а<р<1, и рассмотрим его прообраз при отображении Т (х). Имеем оо r->,P)=U (iTF'T^r) E-7) и, следовательно, со l/(h+a) \ Если \i сохраняется, то мы должны получить ft=l при всех аир. Мы не знаем, как «планомерно» подойти к реше- решению уравнения E.9). Однако легко проверить, что в^^кЬгЬ EЛ0) является решением и удовлетворяет условиям E.5). Это все, что нам требовалось, исключая проверку метрической транзитивности Т{х), а это совершенно тривиально.
ОТ КИНЕТИЧЕСКОЙ ТЕОРИИ К НЕПРЕРЫВНЫМ ДРОБЯМ 133 Если f(x) {д,-интегрируема, т. е. то по D.12) п 1 ™"+о° ft=o 6 для почти каждого х (отметим, что множества ц.-меры О совпадают с множествами обычной лебеговой меры 0). Пусть теперь f (x) — \oga1(x). E.13) Из E.12) получаем, что для почти всех х Иш(а1а2...а„I/и=:С) E.14) где С = ехр [ -.—= \ log а, (х) т^~ ) = F Vlog2 J & iv / i-\-x J о k=i Эта замечательная теорема была впервые доказана (другим путем) Хинчиным в 1935 г. Настоящее дока- доказательство предложено К. Рыл-Нар джевским.
134 ГЛАВА 5 Я легко бы мог освободить читателя от первых трех пунктов этой главы. Я мог бы начать с абстракт- абстрактного изложения п. 4 и тем самым избежать упомина- упоминания о динамике и кинетической теории. Но, сделав это, я бы уничтожил наиболее восхи- восхитительную и, по моему мнению, наиболее поучительную часть рассказа, так как путь от кинетической теории, как представлял ее себе Больцман и другие, к непре- непрерывным дробям являет собой великолепный пример часто забываемого факта, что математика не есть нечто обособленное, но что она своей мощью и красотой в значительной степени обязана другим дисциплинам. ЗАДАЧИ 1. Пусть В с Q ц-измеримо, и пусть ц {В} Ф 0. Если Т сохраняет меру (но не обязательно метрически транзи- тивно), то доказать, что для почти каждого Ро ?В существует целое п > 1, так что Тп (Ро) ? В. (Это дискретный вариант теоремы Пуанкаре; чтобы это показать, надо рассмотреть множество CczB, такое, что при Ро g С Тп {Ро) g В для л = 1, 2, .... Доказать, что С ц-измеримо и множества С, Т'1 (С), Т'2 (С), ... все попарно не пересекаются.) 2. Пусть п(Р0), Р0€В, —первое положительное целое число, такое, что Тп (р°) (/"„) ? В. Доказать, что если Т (в добавление к свойству сохранять меру) метрически тран- зитивно, то
ОТ КИНЕТИЧЕСКОЙ ТЕОРИИ К НЕПРЕРЫВНЫМ ДРОБЯМ 135 3. Пусть х, 0<я<;1, представлено непрерывной дробью: 1 х= ., i и пусть В — множество, на котором ai(x) = k (т. е. 1/(й|1)<^ < х <^ ilk). Пусть далее п (х, к) обозначает наименьшее целое число, большее 1 и такое, что a ft Показать, что log 2 3 l/fe [ (n{x 4. Пусть 0<а:^1 и Г (ж) = 2ж —[2х]. Применяя эргодн- ческую теорему, получить теорему Бореля гл. 2. ЛИТЕРАТУРА 1. R у 11-Na rdze ws ki C, On the ergodic theorems II, Stu- Studio. Math., 12 A951), 74 — 79.
ДОБАВЛЕНИЕ Ю. В. Прохоров Здесь собраны различные замечания к отдельным частям книги, которые могут оказаться полезными читателю, заинтересовавшемуся ее предметом. Литера- Литературные ссылки при этом ни в коем случае не претен- претендуют на полноту. К главе 1. Именно широкое использование понятия «независимости» выделяет теорию вероятностей из чистой теории меры (см. по этому поводу А. Н. Кол- Колмогоров, Основные понятия теории вероятностей, п. 5, гл. 1 или его же статью о теории вероятностей в книге «Математика, ее содержание, методы и зна- значение», т. 2, М., 1956, 252-284). К главе 2, п. 1. Неравенство Чебышева обладает большой общностью (например, оно использует лишь понарную независимость случайных величин — слагае- слагаемых), но дает слабую оценку для вероятностей событий типа A.2). С. Н. Бернштейном и А. Н. Колмогоровым было показано, что полное использование факта неза- независимости случайных величин позволяет получить значительно более сильные оценки (см., например, С. Н. Бернштейн, Курс теории вероятностей, изд. 4, М., 1946). В специальном случае величин гк
ДОБАВЛЕНИЕ 137 рассуждение может быть проведено следующим образом. Во-первых (ср. 1.7), при любом действительном | 1 п 1 ехр ? Ы*) + • • - + гп @1 * = П \ e%rkWdt = (ch ?)"' 0 fe=0 0 (именно здесь используется факт независимости, точ- точнее— его следствие: математическое ожидание произ- произведения независимых случайных величии равно про- произведению их математических ожидапий). Далее (ср. 1.5) при ?>0 И МО + • • • + гп (*) > еп] < е-Ь« (ch l)n < < ехр п [ - |е + -у ] • Выбирая | = е, мы придаем правой части последнего неравенства минимальное значение, равное е~пе2 (см. задачу 12 в конце п. 2, гл. 2). К п. 2. Теория вероятностей устанавливает ряд теорем о свойствах последовательностей ххи, х2и, ...,хпи,... A) независимых случайных величин, имеющих место с ве- вероятностью единица, т. е. для «почти всех» реализаций ж1: х2, . . ., хп, . .. последовательности A). Так, напри- например, если Хк = еь, то для любой s-членной цепочки As, состоящей из нулей и единиц с вероятностью единица n = o(n) B)
138 ДОБАВЛЕНИЕ lim sup - 1 = 1, C) У csn In lnn где F^ns)(t) обозначает число появлений указанной цепочки в последовательности e^f), . . ¦,en+s_1(f). Многие математики, начиная с Бореля, занимались построением и исследованием числовых последователь- последовательностей, в том или ином смысле напоминающих «типич- «типичную реализацию» последовательности A). В каком именно смысле — должно определяться используемыми методами и кругом возможных применений. Свой- Свойство B) характеризует так называемые «нормальные» последовательности двоичных знаков. Примером может служить последовательность О 1 00 01 10 11 000 001 010 011 100..., в которой подряд выписываются все комбинации двоич- двоичных знаков в порядке возрастания их длины. Заметим, что проверка свойства B) в этом и аналогичных при- примерах облегчается при использовании следующего кри- критерия: если существует такая константа С, что при всех s и Д3 то имеет место B). «Нормальные» последовательности знаков могут, однако, не обладать более тонкими свойствами последо- последовательностей независимых случайных величин. Напри-
ДОБАВЛЕНИЕ 139 мер, доказано, что для любой функции гр (п) f оо при п—>-со существует «нормальная» последователь- последовательность двоичных знаков, для которой 1 lim sup , , . -*¦•" Сведения о результатах, полученных в указанных напра- направлениях, и литературные ссылки можно найти в работе А. Г. Постникова, Арифметическое моделирование случайных процессов, Тр. Матем. ин-та АН СССР, т. 57, 1960. К п. 3. Уместно заметить, что значительная часть теории вероятностей, касающаяся распределений в про- пространствах конечного числа измерений и используемая, например, в классических вопросах математической статистики, может быть изложепа без обращения к общей теории меры. Привлечение методов общей теории меры и интеграла Лебега становится неизбеж- неизбежным, когда рассматриваются распределения в бесконеч- бесконечных произведениях пространств. К п. 4. Формулировки многих предельных теорем теории вероятностей начинаются обычно словами: рас- рассмотрим последовательность независимых случайных величин Xk, имеющих функции распределения Fh.. . . Как отмечает автор, естественно возникает вопрос о существовании такой последовательности, т. е. требуется указать такую пару: пространство Q и опре- определенную на нем меру \х и такую последовательность функций Xh (со), со ? Q, что п \i {Хп (со) < Хп} при любом
140 ДОБАВЛЕНИЕ равно Fn(%n) и Вопрос о существовании подобных последовательностей решается положительно теоремой Колмогорова, упомя- упомянутой в тексте (Основные понятия теории вероятностей, § 4, гл. 3). При этом в качестве Q берется пространство всех последовательностей сл=(х1, х2,... , хп,...) дей- действительных чисел. Любопытно отметить, что в каче- качестве (Q, \х) можно взять и отрезок 0<?<1 с обычной лебеговой мерой. При этом функции Xk(t) будут непре- непременно разрывны (как и rh(t)). Несколько сложнее обстоит дело с континуальными системами независи- независимых случайных величин. Возьмем следующий пример: для описания процесса изменения координаты малой частицы, движущейся под влиянием молекулярных толчков (броуновское движение), теория вероятностей предлагает следующую модель: приращения коорди- координаты за непересекающиеся промежутки времени пред- представляют собой независимые случайные величипы с нормальным законом распределения. Математическое ожидание смещения за время At равно 0, а диспер- дисперсия b-At. Предположим дополнительно, что (>0и что в начальный момент времени координата была равна 0. Из упомянутой теоремы Колмогорова вытекает суще- существование соответствующих Q и \л. При этом в качестве Q берется множество всех действительных функций аргу- аргумента t > 0. Однако из физических соображений жела- желательно, чтобы реализации процесса были непрерывными
ДОБАВЛЕНИЕ 141 функциями, т. е. чтобы в качестве Q выступало множе- множество всех непрерывных функций аргумента t. Дополни- Дополнительное исследование показывает, что замена множе- множества произвольных действительных функций множеством непрерывных функций возможна. При этом почти все реализации оказываются недифференцируемыми ни в од- одной точке (типа известной функции Вейерштрасса). См. Д}к. Дуб, Вероятностные процессы, ИЛ, М., 1956. К п. 5. С последовательностями независимых случай- случайных величин связан один замечательный результат (так называемый закон нуля или единицы, он упо- упоминается в тексте, в начале п. 6). Допустим, что некоторое событие таково, что его наступление опре- определяется по значениям случайных величин Xh с /с>гс, каково бы ни было п. Примером может служить событие: ряд из случайных величин сходится. Тогда вероятность такого события равна нулю или единице. В частности, как показано в пп. 5 и 6, оо со ряд 2 cftrft(?) сходится при почти всех ?, если 2С1 < °° 1 1 оо и расходится при почти всех t, если 2 сь= °° • Необ- i ходимые и достаточные условия сходимости рядов из независимых случайных величин были найдены А. Я. Хинчиным и А. Н. Колмогоровым в 1925 г. Дока- Доказательство можно найти, например, в книге М. Лоэва «Теория вероятностей», ИЛ, М., 1962. Типичными сред- средствами доказательства в общем случае являются леммы,
142 ДОБАВЛЕНИЕ n n подобные следующей: положим so = O, sn=^]chrh(t); тогда при любом е >0 { max sn>e}<2n{sjv>e}. D) l Грубо говоря, это означает, что колебания максималь- максимальной из нарастающих сумм независимых случайных величин имеют тот же порядок, что и колебапия последней суммы. Левая часть неравенства D) оче- очевидна. Правая доказывается следующим образом. Обо- Обозначим рассматриваемые события буквами А и В, так что неравенство примет вид ц(^1)< 2\i(B). Пусть к = 1, 2, ..., п и Очевидно, 1 что и требовалось доказать.
ДОБАВЛЕНИЕ 143 со Допустим теперь, что 2cft<°°- Применяя дока- 1 занное неравенство к rm(t), rmtl(t), ... и используя неравенство Чебышева, получим ц jsup ^ при т —>оо. Из этого неравенства и аналогичного, с заменой >е на < — е, вытекает утверждение о схо- оо димости ряда 2 счгъ. (*) с вероятностью единица, i Как отмечает автор, ряды по пекоторым системам ортогональных функций аналогичны рядам из незави- независимых случайных величин. Для произвольных орто- нормальных систем с \ Xh ((о) d\i — 0 верно следующее утверждение: из ОО 2og2A;< оо вытекает сходимость с вероятностью 1 2 1 ряда 2 сьХь (ю) (см- М. Лоэв, § 33). 1 В связи с некоторыми вопросами, возникающими, в частности, в теории случайных процессов, изучались
144 ДОБАВЛЕНИЕ аналитические свойства сумм функциональных рядов со случайными коэффициентами. Например, функция будет с вероятностью единица непрерывна в замкну- замкнутом круге [ср. Г. А. Хант, Случайные преобразо- преобразования Фурье, Математика, 2:6 A958), 87 — 114]. К главе 3. Теоремы о сходимости распределений сумм случайных величин к нормальному закону объ- объединяются в теории вероятностей под общим назва- названием «центральной предельной теоремы». Название достаточно полно характеризует место, занимаемое этими теоремами. Возникновение нормального закона связывают обычно со схемой сложения большого числа «равномерно малых» случайных величин. В этой связи уместно упомянуть одну теорему А. Я. Хинчина. Рассмотрим последовательность серий 2, Ь -Л-п, 1 ? • • • > -Л-п, гч независимых внутри каждой серии случайных вели- величин ( в п. 1 и 2 можно принять Хп и = - >- ¦ ) j V у п У подчиненных условию «предельной пренебрегаемости»:
ДОБАВЛЕНИЕ 145 при любом е > 0 и п —> оо max n(|Xn,fe(co)|>e)->O. E) Пусть распределения сумм Sn =Xn, i + .. • +-Xn, n схо- сходятся к предельному. Тогда этот предельный закон будет нормальным в том и только том случае, когда при п—> оо ц( max |Хп>й Последнее условие сильнее E) и, как легко пока- показать, равносильно следующему: 2n(|n,fe(co)|>e)->0 при п->со (см, Б. В. Гнеденко и А. Н. Колмогоров, Предельные теоремы для сумм независимых случай- случайных величин, М., 1949, п. 26). К п. 4. Преобразования Фурье — Стильтьеса, упо- упоминаемые в этом пункте, используются в теории вероятностей под названием характеристических функ- функций. Детальное изложение свойств характеристиче- характеристических функций имеется, например, в книге М. Лоэва. Заметим, что теорема непрерывности в несколько более узкой, чем приводимая автором формулировке, может быть доказана методом Маркова (именно, если предположить, что lim 'V eitxdan(x) = c(t), n-юо J
146 ДОБАВЛЕНИЕ где -|-ОО c(t)= ^ eitxda(x). —оо Ниже приводится вариант доказательства для этого случая, изложенный в вероятностных терминах. Пусть Ох {%) — функция распределения, рх (х) — плотность вероятности, сх (t) — характеристическая функция слу- случайной величины X. Заметим, что +СО сх (t) = \ eltx рх (х) dx —СО и, если Сх (t) абсолютно интегрируема, то рх{х) = ~ [ e~itxcx(t)dt Д*9 Ц-'ОО . , ох (х2) - ox (xj) = \ рх {x) dx = -к-, \ e- =^f cx (t) dt. Xi —oo Буквой У с теми или иными индексами будут обо- . , 1 /. *\ значаться случайные величины с ру (х) = „-г- ( l~ofc J при |ж|<2/г и py(x)=O в других случаях. Тогда | Y | = 2h и су (t) = ( -^5^— ) . Пусть теперь при п—> со
ДОБАВЛЕНИЕ 147 и каждом t функции сХп (t) —» сХо {t) и У„ не зависит отХп(п>0). Мы имеем cxn+yn (t) = схп @ • cyn (f) -* сх0 (*) • суо (t) = cXo+yo (t) и по теореме об ограниченной сходимости Выберем теперь в качестве хг и а;2(т;1<а;2) точки ненрерывности о"х0. Из неравенства о"хп (ж,) - <rxn(a;)i < ^n+rn (»я + 2/г) - a^n+yn (Ж1 ~ 2/г) видим, что lim sup [ах (ж,) - а* (a;^] < П-->-со < °xa+Y0 (хг + 2h) - ffxo+yo («1 - 2/г) < < о-хо (ж2 + 4А) - ffXo (a?! - 4А) -» аХо (ж2) - аХо (xt) при /г —»0. Отсюда и из обратного неравенства для liminf вытекает, что <*хп (х2) - аХп (xj) -> 0хо (жя) - о-х0 (ajj. Использованный здесь прием «сглаживания» распре- распределений путем добавления к случайным величинам малых независимых «поправок» впервые был исполь- использован Ляпуновым при оценке остаточного члена в центральной предельной теореме. К задаче 1 в п. 4. Утверждение является частным случаем следующей более общей теоремы (Фреше
148 ДОБАВЛЕНИЕ и Шохат): пусть при каждом & = 0, 1, 2, .,. и тг—$>оо Тогда существует такая функция а{х), что mh — + СО = \ а;'гйо(х). Если такая функция единственна, то оп(х)—>а(х) в каждой точке непрерывности а(х). Достаточное со /raft-^- имеет ненулевой 1 радиус сходимости (см. М. Лоэв). К главе 4, п. 1. а). Интересующемуся читателю можно рекомендовать решение задач о распределении значений функций натурального аргумента из кпиги Г. Полна и Г. Сегё, Задачи и теоремы из ана- анализа, ч. I, изд. 2, Гостехиздат, 1956 г. б). Одно из наиболее полных изложений вопросов так называемой «вероятностной теории чисел» имеется в монографии И. IJ. К у бил юса «Вероятностные методы в теории чисел», 2 изд., Вильнюс, 1962. В част- частности, там приведены и замечательные результаты самого И. П. Кубилюса. К п. 2. а). Для счетно-аддитивных мер имеется ряд теорем о переходе к пределу под знаком инте- интеграла.
ДОБАВЛЕНИЕ 149 Например, если ji-почти всюду /п(соL. и /п>0, то lim \ /п (со) dn = \ lim /n (со) dco. n->oo J J п-юэ Эти теоремы, вообще говоря, неприменимы в случае конечно-аддитивных мер (lim/n может даже не быть измеримым!). Этим и объясняется, как подчеркивает автор, невозможность сразу получить равенства, подоб- подобные B.10). б). Непрерывность функции а (со)=2) flog-9^- < со J С как и функции t (со) = D С ^-^- < со J j вытекает из одной общей теоремы Леви. Пусть Хи Х2, ..., Хп, ... — последовательность независимых дискретно распределенных случайных величин со сходящейся с вероятностью 1 суммой Пусть dh Функция распределения X будет непрерывна в том оо и только том случае, когда J\ dh = 0. В случае функ- функции ф(и) можно принять 0 с вероятностью 1 , log ( 1 ) с вероятностью — .
150 ДОБАВЛЕНИЕ Остается принять во внимание хорошо известное соот- соотношение Можно добавить, что распределение X может быть только или чисто абсолютно непрерывным, или чисто дискретным, или чисто сингулярным (Иессен и Винтнер); этот результат и теоремы Леви приведены в обшир- обширном мемуаре Эссеена: С. G. Esseen. Fourier analysis of distribution functions. A mathematicae study of the Laplace —Gaussian law. Ada. Math., 77A945), 1 — 125). Существование раснределения функций, подобных 2-^У и —^-, может быть установлено единообразным методом, в основу которого может быть положено следующее вспомогательное замечаниех). Назовем функцию f(n) периодической, если при некотором N и всех п f(n + N) = f(n). Легко установить наличие у всякой периодической функции раснределения D (/ (п) < со). х) Нижеследующие замечания обязаны моим беседам с А. Г. Постниковым по поводу работ Новоселова, в которых задачи о распределении значений определенного класса функ- функций натурального аргумента изучаются с помощью топологиза- ции множества натуральных чисел и пополнения его до топо- топологически полного кольца. При этом плотность продолжается в (счетно-аддитивную) меру в указанном кольце.
ДОБАВЛЕНИЕ 151 Допустим теперь, что функция f(n) такова, что при любом е > 0 можно подобрать периодическую функцию fe(n), для которой N lim w2 I/H—/e(")l<e- п=1 Тогда при любом ю, кроме, быть может, счетного чис- числа, существует D (/(!»)< (В). Доказательство можно провести методом моментов, применяя его к /(n) = arctg/(rc). Для функций /(и), удовлетворяющих условиям 2 d/n d в качестве аппроксимирующих функций можно брать S где рх, ..., ph —первые к простых чисел, а к и sh вы- выбираются в зависимости от е.
152 ДОБАВЛЕНИЕ К главе 5, п. 4 и 5. О редукции задач кинетиче- кинетической теории к задачам теории вероятностей см. А. Я. Хинчин, «Математические основания статис- статистической механики», ГИТТЛ, М. —Л., 1943, см. также М. Кае, Probability and related topics in physical sciences. N. Y. 1959. Для метрически транзитивных Т мы имеем сходи- сходимость средних вдоль траекторий к среднему по про- пространству где Eh(Ро) = /B*(Ро)), а= $/(/>«) d|i (формула 4.12). Ь В ряде случаев удается доказать, что отклонение средних «по времени» от а подчиняется в пределе нормальному закону: если / не равна ц-почти всюду постоянной, то найдется сг = сг(/)>0, такая, что оуп @2 1 С @1
ДОБАВЛЕНИЕ 153 В частности, это справедливо для следующих динами- динамических систем, встречающихся в теории чисел. В обоих случаях Q —отрезок @, 1]. Т1{х)={2х} (фигурные скобки —знак «дробной части») (последнее преобразование как раз и рассматривается в п. 5 гл. 5). Результаты М. Каца (Bull. Amer. math. Soc, 55 A949), №7 и Ann. Math., 47 A946), №1, 33-49), относящиеся к этому случаю, были обобщены И. А. Ибра- Ибрагимовым. [Теория вероятностей и ее применения, т. V, вып. 2 A960), 256-257 и ДАН СССР, 125:4 A959), 711 — 714.] Согласно И. А. Ибрагимову от f(X), 0<Х<;1, достаточно требовать выполнения двух свойств Ь) 7 (Jog Некоторые вопросы метрической теории цепных дробей хорошо изложены в книге А. Я. Хинчина «Цепные дроби», Физматгиз М., 1961.
ОГЛАВЛЕНИЕ Глава 1. ОТ ВИЕТА К ПОНЯТИЮ СТАТИСТИЧЕСКОЙ НЕЗАВИСИМОСТИ 13 1. Формула Виета 13 2. Другой взгляд на формулу Виета 14 3. Случайность или начало чего-либо более глубо- глубокого? 17 1 1 =t • • -~(и раз) 19 5. Герб или решетка? 21 6. Независимость и «независимость» 24 Задачи 26 Глава 2. БОРЕЛЬ И ПОСЛЕ НЕГО 29 1. «Законы больших чисел» 29 2. Борель и «нормальные числа» 32 Задачи 36 3. «Герб или решетка» — более абстрактное изло- изложение 40 4. В чем ценность абстракции? 43 5. Пример 1. Сходимость ряда со случайными зна- знаками 45
ОГЛАВЛЕНИЕ 155 6. Пример 2. Расходимость ряда со случайными знаками 53 Задачи 57 Литература 58 глава 3. НОРМАЛЬНЫЙ ЗАКОН 60 1. Муавр 60 2. Основная идея метода 61 3. Метод Маркова становится строгим 63 Задачи 66 4. Более внимательный взгляд на метод 67 Задачи 70 5. Закон природы или математическая теорема? 73 Задачи 81 Литература 81 Глава 4. ПРОСТЫЕ ЧИСЛА «ИГРАЮТ В АЗАРТНУЮ ИГРУ» 82 1. Теоретико-числовые функции, плотность, неза- независимость 82 2. Статистика значений ф-функций Эйлера 83 Задачи 94 3. Другое применение 97 4. Почти каждое целое т имеет приближенно log log те простых делителей 106 Задачи 110 5. Нормальный закон в теории чисел 110 Задачи 116 Литература 116
156 ОГЛАВЛЕНИЕ Глава 5. ОТ КИНЕТИЧЕСКОЙ ТЕОРИИ К НЕПРЕРЫВНЫМ ДРОБЯМ 118 1. Парадоксы кинетической теории 118 2. Предварительные сведения 119 3. Ответ Больцмана 123 4. Абстрактное изложение 125 5. Эргодическая теорема и непрерывные дроби 130 Задачи 134 Литература 135 ДОБАВЛЕНИЕ Ю. В. Прохоров 136